首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Trickle + Nano Banana,我给老婆 VibeCoding 了一个虚拟试衣间
· 制作可爱的表情包
· 一个完整Prompt让ChatGPT自动生成短视频制作脚本
· 如何构建基于大模型的App
· 国产视频制作之光-可灵:提示词大全整理
· 巧用这13个原则!创作ChatGPT提示词Prompt时效率提高10倍!
· 数字人直播哪家强?中国数字人平台分析大全
· 还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
· AI领域的agent是什么意思?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
字正腔圆,万国同
音
,coqui-ai TTS跨语种语
音
克隆,钢铁侠讲16国语言
按照固有的思维方式,如果想要语
音
克隆首先得有克隆对象
具
体的语言语
音
样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语
音
克隆技术
coqui-ai
TTS
语音
Flowith:革新你的
工
作方式,体验节点式 AI 的超流畅生产力
无论是内容创作者、研究人员、还是企业高管,我们都需要一个能够高效整合信息、提升
工
作效率的
工
具
。
Flowith
GPT
生产力工具
OpenAI
OpenAI大动作:Whisper large-v3重塑语
音
识别技术
这款最新的自动语
音
识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
Sora
一文带你看懂OpenAI-Sora生成视
频
的原理
OpenAI在X上发布消息 在此之前,尽管Runway、Pika、Kreadoai、Moonvalley、Pixverse等早已推出了各
具
特色的视
频
生成
工
具
,但OpenAI的Sora视
频
生成模型如同一颗新星
视频生成
sora
教程
Suno
音
乐新手指南(手把手完整版教程)
Suno是当前全球
音
乐创作领域的头部
工
具
,地位堪比GPT、Midjourney和Sora等巨头。
suno
歌曲
教程
语
音
克隆又又又又又升级了
早在今年6月,Meta曾经推出过VoiceBox,能直接从文本生成高质量语
音
,不需要任何
音
频
样本作为训练数据,可能是基于对
音
频
Deepfake的担忧,一向秉承开源的Meta并未向
工
作开放VoiceBox
Meta
语音生成
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性化
今天,就让我们一同深入了解一款备受瞩目的声
音
克隆
工
具
——clone-voice。
clone-voice
声音克隆
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
WebUI
工
具
: 集成
工
具
包括声
音
伴奏分离、自动训练集分割、中文自动语
音
识别(ASR)和文本标注,协助初学者创建训练数据集和
数字人
声音克隆
GPT-SoVITS
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
Fish Speech是一款由Fish Audio开发的开源的文本到语
音
(TTS)
工
具
,支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
Fish
Speech
本地搭建
ChatGPT
一个完整Prompt让ChatGPT自动生成短视
频
制作脚本
———————— 把你想象成热门短视
频
脚本撰写的专家。
ChatGPT
Prompt
视频
阿里
淘宝模特全体注意!阿里AnyDoor AI换装神器出来了,年度最强AIGC重制绘图
工
具
,重塑电商模特产业
但近日,阿里和港大联手推出了一个
工
具
,可以轻松实现一键换衣,更重要的是,操作简单,实现效果惊人。
AnyDoor
换装
文生图
开源
十大开源语
音
识别项目
它在大量多样化的
音
频
数据集上进行训练,作为一个多任务模型,可以执行多语言语
音
识别、语
音
翻译和口语识别。
语音识别
开源项目
实时语
音
克隆
在第一阶段,人们从几秒钟的
音
频
中创建声
音
的数字表示。
语音
克隆
Sora
中学生也能看懂的Sora视
频
生成原理解读
具
体到Sora的实现,这个过程开始于一段与目标视
频
同样时长、但是内容完全是随机噪声的视
频
。
视频生成
sora
开源
Stability AI开源上新:3D生成引入视
频
扩散模型
也就是说,此番登场的SV3D首次将视
频
扩散模型应用到了3D生成领域。
sv3d
建模
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100