首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
一文带你看懂OpenAI-Sora生成
视
频
的原理
举个例子,如果我们有一个补丁显示一个人正在跑
步
,模型会通过学习人类跑
步
的动态模式,来预测下一系列补丁中这个人的位置和姿态的变化。
视频生成
sora
阿里
阿里&字节发表VividTalk,只需单张照片即可根据
音
频
生成栩栩如生的人物说话头像
视
频
,支持生成高质量的说话人
视
频
,包括唇形
同
步
、表情和头部姿态等特征。
VividTalk
视频
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频
驱动唇部
同
步
模型。
MuseTalk
数字人
音频
ChatGPT
一个完整Prompt让ChatGPT自动生成短
视
频
制作脚本
———————— 把你想象成热门短
视
频
脚本撰写的专家。
ChatGPT
Prompt
视频
Sora
中学生也能看懂的Sora
视
频
生成原理解读
具体到Sora的实现,这个过程开始于一段与目标
视
频
同
样时长、但是内容完全是随机噪声的
视
频
。
视频生成
sora
开源
Stability AI开源上新:3D生成引入
视
频
扩散模型
也就是说,此番登场的SV3D首次将
视
频
扩散模型应用到了3D生成领域。
sv3d
建模
换脸
Wunjo AI: 合成和克隆英语/俄语/中文语
音
,实时语
音
识别,深度换脸和唇动合成,通过文本提示更改
视
频
,分割和修饰
无论您是钻研语
音
合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散
视
频
还是
视
频
制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成
视
频
插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短
视
频
剪辑的训练,它能够调整图像生成过程,生成一系列与训练
视
频
剪辑相似的图像。
动画
视频
AnimateDiff
下载
绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,
音
乐、
视
频
、图像、文件等!
看到网上有超赞的
视
频
、
音
乐或图片,却无法轻松地保存到自己的电脑或手机上?
AixDownloader
下载
阿里
阿里出品自动化
视
频
剪辑工具FunClip!
它依托于阿里巴巴通义实验室的FunASR Paraformer系列模型,实现了
视
频
中语
音
的自动识别。
FunClip
视频
阿里
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在
音
频
驱动的
视
频
生成领域,制作普通话
视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
工具
开箱即用的图像增强、
视
频
增强AI工具,Upscapl、Topaz Video AI
图像和
视
频
领域使用较多的AI工具,免安装,无需会员,开箱即用!
图像增强
视频增强
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频
克隆声
音
的黑科技!
2、独特的
音
频
处理三
步
法
音
频
标记化(Audio tokenization) 使用 WavTokenizer 对
音
频
进行处理,每秒可处理 75 个标记
OuteTTS-0.1-350M
音频
Stable Diffusion
【Stable Diffusion】高效率
视
频
转AI动画!EbSynth插件全流程操作
最近小朋友开始学习跑酷,这段动画是我用他上课时候的一段练习
视
频
制作的。
AI编程
EbSynth
动画
字正腔圆,万国
同
音
,coqui-ai TTS跨语种语
音
克隆,钢铁侠讲16国语言
coqui-ai TTS实现跨语种、无需训练克隆语
音
的方法是基于Tacotron模型,该模型使用了一种
音
素输入表示来鼓励在不
同
语种之间共享模型容量。
coqui-ai
TTS
语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100