首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
写作
火山写作:一款助力写作能力提升的AI助手
这是由字节跳动的火山引擎团队精心打造的AI创作辅助
工
具
,无论是修改毕业论文、精炼个人简历,还是进行全文修订、检查语法拼写错误,添加生动词汇及灵活修改等,火山写作都能为您提供全方位的协助。
火山写作
工具
文章
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性化
今天,就让我们一同深入了解一款备受瞩目的声
音
克隆
工
具
——clone-voice。
clone-voice
声音克隆
语
音
克隆又又又又又升级了
早在今年6月,Meta曾经推出过VoiceBox,能直接从文本生成高质量语
音
,不需要任何
音
频
样本作为训练数据,可能是基于对
音
频
Deepfake的担忧,一向秉承开源的Meta并未向
工
作开放VoiceBox
Meta
语音生成
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
Fish Speech是一款由Fish Audio开发的开源的文本到语
音
(TTS)
工
具
,支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
Fish
Speech
本地搭建
OpenAI
OpenAI大动作:Whisper large-v3重塑语
音
识别技术
这款最新的自动语
音
识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
Sora
一文带你看懂OpenAI-Sora生成视
频
的原理
OpenAI在X上发布消息 在此之前,尽管Runway、Pika、Kreadoai、Moonvalley、Pixverse等早已推出了各
具
特色的视
频
生成
工
具
,但OpenAI的Sora视
频
生成模型如同一颗新星
视频生成
sora
教程
Suno
音
乐新手指南(手把手完整版教程)
Suno是当前全球
音
乐创作领域的头部
工
具
,地位堪比GPT、Midjourney和Sora等巨头。
suno
歌曲
教程
开源
十大开源语
音
识别项目
它在大量多样化的
音
频
数据集上进行训练,作为一个多任务模型,可以执行多语言语
音
识别、语
音
翻译和口语识别。
语音识别
开源项目
阿里
淘宝模特全体注意!阿里AnyDoor AI换装神器出来了,年度最强AIGC重制绘图
工
具
,重塑电商模特产业
但近日,阿里和港大联手推出了一个
工
具
,可以轻松实现一键换衣,更重要的是,操作简单,实现效果惊人。
AnyDoor
换装
文生图
实时语
音
克隆
在第一阶段,人们从几秒钟的
音
频
中创建声
音
的数字表示。
语音
克隆
被高估的Pika,被低估的多模态AI
从 GPT-4V 的“惊艳亮相”,到 AI 视
频
生成
工
具
Pika 1.0 的“火爆出圈”,再到谷歌 Gemini 的“全面领先”,多模态 AI 都是其中的关键词。
大模型
多模态
Sora
中学生也能看懂的Sora视
频
生成原理解读
具
体到Sora的实现,这个过程开始于一段与目标视
频
同样时长、但是内容完全是随机噪声的视
频
。
视频生成
sora
开源
Stability AI开源上新:3D生成引入视
频
扩散模型
也就是说,此番登场的SV3D首次将视
频
扩散模型应用到了3D生成领域。
sv3d
建模
AI拟声: 5秒内克隆您的声
音
源代码: http://www.gitpp.com/godan/mockingbird MockingBird是一个人
工
智能开源项目,它可以在仅仅5秒钟内克隆你的声
音
。
声音克隆
开源
AI自动生成视
频
全流程干货
AI自动剪辑短视
频
本文
工
具
集合:https://shorturl.at/kuU78 1.
AI
视频
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100