首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 万字长文,AI大模型的应用实践总结
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· ComfyUI 基础教程(一)环境部署和插件安装
· 备案通过且面向公众开放的国产精品大模型汇总,附访问链接
· 保姆级教程:Coze 打工你躺平
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI安装及生成第一张图
· Stable Diffusion 喂饭教程来啦!价值上万的模特AI换装方法
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
【开源项目】Flow Matching 语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
开源
通过声
音
生成逼真的全身形象?!Meta开源AI工具:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据
音
频
生成逼真的人物视
频
!
audio2photoreal
开源工具
开源
有感情的语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语
音
生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语
音
和视
频
介绍等应用。
ChatTTS
语音合成
大模型
“实时”语
音
翻译!AI语
音
具有“情绪”!最强开源AI大模型来了
你想把一段语
音
转成文字,或者把一段文字转成语
音
,但是你不知道怎么操作!
大模型
开源模型
语音
字正腔圆,万国同
音
,coqui-ai TTS跨语种语
音
克隆,钢铁侠讲16国语言
按照固有的思维方式,如果想要语
音
克隆首先得有克隆对象具体的语言语
音
样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语
音
克隆技术
coqui-ai
TTS
语音
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成视
频
插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视
频
剪辑的训练,它能够调整图像生成过程,生成一系列与训练视
频
剪辑相似的图像。
动画
视频
AnimateDiff
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
min_interval根据
音
频
的平均间隔调整,如果
音
频
太密集可以适当调低。
数字人
声音克隆
GPT-SoVITS
ChatGPT
一个完整Prompt让ChatGPT自动生成短视
频
制作脚本
———————— 把你想象成热门短视
频
脚本撰写的专家。
ChatGPT
Prompt
视频
语
音
克隆又又又又又升级了
早在今年6月,Meta曾经推出过VoiceBox,能直接从文本生成高质量语
音
,不需要任何
音
频
样本作为训练数据,可能是基于对
音
频
Deepfake的担忧,一向秉承开源的Meta并未向工作开放VoiceBox
Meta
语音生成
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性化
这一步就像是为后续的分析和处理搭建好了基础框架,确保
音
频
数据能够以合适的形式被模型所接受,为特征提取做好充分准备。
clone-voice
声音克隆
OpenAI
OpenAI大动作:Whisper large-v3重塑语
音
识别技术
这款最新的自动语
音
识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
Sora
一文带你看懂OpenAI-Sora生成视
频
的原理
那么,视
频
压缩网络究竟是如何做到的呢?
视频生成
sora
教程
Suno
音
乐新手指南(手把手完整版教程)
为方便更多
音
乐爱好者使用AI创作
音
乐,中国AIGC产业联盟(AIGCxChina)发起了Suno爱好者社群并编写了以下指南。
suno
歌曲
教程
开源
十大开源语
音
识别项目
这项技术在多个领域有着广泛的应用,包括但不限于语
音
助手、语
音
搜索、自动转写以及语
音
命令识别。
语音识别
开源项目
阿里
阿里出品自动化视
频
剪辑工具FunClip!
它依托于阿里巴巴通义实验室的FunASR Paraformer系列模型,实现了视
频
中语
音
的自动识别。
FunClip
视频
阿里
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100