首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 豆包MarsCode——免费AI编程助手
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 保姆级教程:Coze 打工你躺平
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· MCP服务介绍及应用场景报告-来自Manus
· AI时代,如何利用ChatGPT一分钟洗稿一篇文章?
· 技术布道 | Prompt评估与优化,让魔法打败魔法,通过大模型获得更优质的Prompt进而获得更优质的内容
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 大语言模型微调:定制自己的微调数据集
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
换脸
除了深度换脸、模拟配
音
,还能口型匹配的AI软件出现了
它的竞争对手包括语
音
克
隆
翻译应用 HeyGen 和Verbalate,以及Spotify和视觉特效工作室Monsters Aliens Robots Zombies等公司推出的新工具
AI
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
字节跳动最近推出了一款名为PersonaTalk的AI模型,这项黑科技让视
频
配
音
彻底摆脱了传统的“僵硬感”。
PersonaTalk
视频
OpenAI
基于 OpenAI Whisper 模型的实时语
音
转文字工具
今天给大家分享一款专注于
音
频
处理和创作的开源软件【WhisperLive】 什么是 WhisperLive?
WhisperLive
音频
开源软件
大模型
视
频
大模型训练相关词条解释
Sora是OpenAI公司发布的一款AI视
频
生成模型。
视频生成
sora
词条
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短视
频
火爆全网,同类型的AI短视
频
层出不穷,更有好莱坞明星说中文的短视
频
,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的AI短视
频
吧!
数字人
音视频
对于AI,我们现阶段可以有的态度
但这不妨碍我们现在开始尝试着接触他,了解他,至少在有一定认知后,不至于出现最近的那条“AI换脸、声
音
克
隆
后,被诈骗400多万元”新闻那样的事情发生。
文生图
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语
音
识别数倍加速
懂技术的小伙伴也可以寻找其他替代方案,比如语
音
转文字模型 Whisper、文字翻译 GPT、声
音
克
隆
+ 生成
音
频
so-vits-svc、生成符合
音
频
的嘴型视
频
GeneFace++dengdeng。
语音
HeyGen
开源
阿里巴巴语
音
实验室发布开源语
音
处理框架ClearerVoice-Studio,支持语
音
增强、分离、目标说话人提取
虽然
音
频
技术日新月异,但许多现有方案在复杂场景中仍难以提供稳定且高质量的
音
频
体验。
ClearerVoice-Studio
语音
开源
【开源项目】Flow Matching 语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
开源
通过声
音
生成逼真的全身形象?!Meta开源AI工具:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据
音
频
生成逼真的人物视
频
!
audio2photoreal
开源工具
开源
有感情的语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语
音
生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语
音
和视
频
介绍等应用。
ChatTTS
语音合成
大模型
“实时”语
音
翻译!AI语
音
具有“情绪”!最强开源AI大模型来了
你想把一段语
音
转成文字,或者把一段文字转成语
音
,但是你不知道怎么操作!
大模型
开源模型
语音
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成视
频
插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视
频
剪辑的训练,它能够调整图像生成过程,生成一系列与训练视
频
剪辑相似的图像。
动画
视频
AnimateDiff
GLM-4-Voice 9B——实时多语言语
音
对话 AI——几分钟内即可在本地安装
GLM-4-Voice 通过一个统一的模型
克
服了这些限制,能够直接处理和生成语
音
。
GLM-4-Voice
9B
语音
安装
数字人
数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
「闪剪智播」在使用上有一个点与其他三款产品都不同,就是它的数字人只能使用录
音
文件驱动,虽然它本身也有一个插件是文本转AI声
音
,而且声
音
库还很丰富,但合成的
音
频
却不能用于驱动数字人。
数字人
数字分身
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100