首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· SD入门教程二:文生图基础用法(提示词)
· AI Agent新对决:LangGraph与AutoGen的技术角力
· 微信搜狗爬虫WechatSogou - 从微信公众号获取文章的利器
· AI换脸工具:facefusion使用心得
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 深度对比丨探索LLM(大模型)部署服务的七大框架差异
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· ComfyUI 基础教程(一)环境部署和插件安装
· 铁锅炖blender+ComfyUI配置,更改模型地址
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
【全文翻译】微软166页论文解读 GPT-4V:多模态大模型的黎明
在本节的接下来的实验中,我们将使用多个选定的
视
频
帧作为输入,以测试模型在理解时间序列和
视
频
内容方面的能力。
多模态大模型
GPT-4V
文生图
SDXL
SDXL模型lora训练参数详细设置,显存占用22G,不用修脸原图直出
还没装的,去秋叶大佬
视
频
详情里找一下哈~ https://www.bilibili.com/video/BV1AL411q7Ub/?
SDXL
训练
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
包含两个核心模型:SenseVoice 负责语音识别和音
频
处理,CosyVoice 负责语音生成和控制。
asr
tts
声音
工具
【AI绘图工具】太爆炸了,AI出图速度100fps(每秒100张图片),比LCM、SDXL Turbo更快,目前No.1
colab.research.google.com/github/hewis123/stream-d/blob/main/Untitled2.ipynb 今天我就来介绍一下这个产品工具吧,我都不知道该把它归类入
视
频
工具还是图像工具
StreamDiffusion
文生图
大模型
LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
此外,OmniGen可以处理经典的计算机
视
觉任务,将其转换为图像生成任务。
大模型
研究
微信向量检索分析一体化数仓探索:OLAP For Embedding
在大模型出现之前,向量检索已经成熟并广泛应用在“推荐”、“文本/
视
频
搜索”等领域了: 向量数据库介绍: ChatGPT 掀起的大模型浪潮,embedding 在其中的核心地位,使得向量化数据库又成为时代新宠
OLAP
For
Embedding
一体化数仓
人工智能
中国首份AIGC监管文件正式实施——《生成式人工智能服务管理暂行办法》简析
亮点: 1· 作为中国首份生成式人工智能(“AIGC”)监管文件,管理办法体现了现阶段监管机构的态度,即“既要重
视
发展,也要重
视
风险”。
人工智能
开源
clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
这一步就像是为后续的分析和处理搭建好了基础框架,确保音
频
数据能够以合适的形式被模型所接受,为特征提取做好充分准备。
clone-voice
声音克隆
什么是极限、导数、微分与积分(通俗易懂)!
你的目光时而注
视
前方的道路,时而瞥向仪表盘上跳动的速度指针。
极限
导数
微分
积分
【AI绘画】入门英文名词解析
只能在线联网调用接口提交数据 获得返回结果 并不知道是怎么来的 会有很多限制 为了避免法律风险 AI绘画项目对于某些人名或者不可描述画面作了限制不允许生成 此外对于调用
频
次
文生图
AI绘画
大模型
阿里云开源通义千问多模态大模型Qwen-VL,持续推动中国大模型生态建设
8月25日消息,阿里云推出大规模
视
觉语言模型Qwen-VL,一步到位、直接开源。
大模型
ComfyUI
一文搞定 ComfyUI SDXL1.0 完整流程
如果要在一篇文章里面介绍完整的使用方法实在太麻烦了,这里我推荐几个 B站 大神的
视
频
。
文生图
comfyui
工具
20个常见AI绘画工具大汇总(含免费版哦~)
NUWA NUWA(Neural visUal World reAtion)是微软亚洲研究院开发的多模态模型,通过自然语言指令,NUWA可以实现文本、图像、
视
频
之间的生成、转换和编辑。
文生图
写作
提高写作能力的90个prompt大全
轻松的语气:“为介绍[您的产品]的短
视
频
制作一个有趣的脚本。”
prompt
写作
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
LinkSoul.AI 团队接下来的工作会把语音 -
视
觉 - 文本进一步融合,让大语言模型同时支持语音和
视
觉模态。
开源模型
<
...
13
14
15
16
17
18
19
20
21
22
...
>
1
2
4
5
6
7
8
9
100