首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 99%的人都不懂的Stable Diffusion高级功能,Negative Prompt如何正确使用?
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· Pytorch安装(保姆级教学 真·满血·GPU版)CUDA更新?torch版本?一文全搞定!
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 造梦师手记:华夏之美,SDXL时代的第一个国风模型和汉服LoRA
· Gpt写小说,常用的中文指令集「实操篇」
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
一文带你看懂OpenAI-Sora生成
视
频
的原理
举个例子,如果我们有一个补丁显示一个人正在跑
步
,模型会通过学习人类跑
步
的动态模式,来预测下一系列补丁中这个人的位置和姿态的变化。
视频生成
sora
阿里
阿里&字节发表VividTalk,只需单张照片即可根据
音
频
生成栩栩如生的人物说话头像
视
频
,支持生成高质量的说话人
视
频
,包括唇形
同
步
、表情和头部姿态等特征。
VividTalk
视频
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频
驱动唇部
同
步
模型。
MuseTalk
数字人
音频
Sora
中学生也能看懂的Sora
视
频
生成原理解读
具体到Sora的实现,这个过程开始于一段与目标
视
频
同
样时长、但是内容完全是随机噪声的
视
频
。
视频生成
sora
开源
Stability AI开源上新:3D生成引入
视
频
扩散模型
也就是说,此番登场的SV3D首次将
视
频
扩散模型应用到了3D生成领域。
sv3d
建模
换脸
Wunjo AI: 合成和克隆英语/俄语/中文语
音
,实时语
音
识别,深度换脸和唇动合成,通过文本提示更改
视
频
,分割和修饰
无论您是钻研语
音
合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散
视
频
还是
视
频
制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成
视
频
插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短
视
频
剪辑的训练,它能够调整图像生成过程,生成一系列与训练
视
频
剪辑相似的图像。
动画
视频
AnimateDiff
ChatGPT
一个完整Prompt让ChatGPT自动生成短
视
频
制作脚本
———————— 把你想象成热门短
视
频
脚本撰写的专家。
ChatGPT
Prompt
视频
下载
绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,
音
乐、
视
频
、图像、文件等!
看到网上有超赞的
视
频
、
音
乐或图片,却无法轻松地保存到自己的电脑或手机上?
AixDownloader
下载
阿里
阿里出品自动化
视
频
剪辑工具FunClip!
它依托于阿里巴巴通义实验室的FunASR Paraformer系列模型,实现了
视
频
中语
音
的自动识别。
FunClip
视频
阿里
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在
音
频
驱动的
视
频
生成领域,制作普通话
视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
Stable Diffusion
【Stable Diffusion】高效率
视
频
转AI动画!EbSynth插件全流程操作
最近小朋友开始学习跑酷,这段动画是我用他上课时候的一段练习
视
频
制作的。
AI编程
EbSynth
动画
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频
克隆声
音
的黑科技!
2、独特的
音
频
处理三
步
法
音
频
标记化(Audio tokenization) 使用 WavTokenizer 对
音
频
进行处理,每秒可处理 75 个标记
OuteTTS-0.1-350M
音频
字正腔圆,万国
同
音
,coqui-ai TTS跨语种语
音
克隆,钢铁侠讲16国语言
coqui-ai TTS实现跨语种、无需训练克隆语
音
的方法是基于Tacotron模型,该模型使用了一种
音
素输入表示来鼓励在不
同
语种之间共享模型容量。
coqui-ai
TTS
语音
AGI
字节跳动推出MagicVideo-V2:引领AI
视
频
生成新时代。
无论是创意短片、教育教程还是商业广告,MagicVideo-V2都能根据你的文字描述,生成高保真度和高分辨率的
视
频
内容,
同
时确保
视
频
的流畅运动和连贯性。
MagicVideo-V2
视频生成
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100