首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 人工智能训练的灾难性遗忘以及解决方案
· SoFlu软件机器人
· AI时代,如何利用ChatGPT一分钟洗稿一篇文章?
· SD入门教程二:文生图基础用法(提示词)
· 垂直领域大模型的思考
· 微信为什么使用 SQLite 保存聊天记录!
· ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
· 令人惊艳的开源图标生成AI模型:ChartLlama (南洋理&腾讯)
· 惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
· 深入探讨:Agent全自动写作长篇小说技术原理解析
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI
换
脸:FaceFusion 3.5.0更新,解决老版本无法使用问题!
:使用来自 ddcolor 和 deoldify 的先进模型,为黑白或低
色
彩素材添加
色
彩。
FaceFusion
文生图
DeepMusic发布“和弦派”2.0:重塑AI
音
乐创作范式,赋予创作者全方位掌控
4月29日,国内领先的人工智能
音
乐服务商DeepMusic,发布了自主研发的AI
音
乐工作站——“和弦派”2.0正式版。
和弦派
DeepMusic
音乐创作
将文本
转
化为3D动画:DeepMotion推出MotionGPT,开启动画新时代!
这是一款基于生成式AI的工具,可以将文本提示无缝
转
换
为复杂的3D动画,简化了动画创作过程,同时也超越了物理障碍,使得更多不同类型的创作者和行业可以使用3D动画。
3D
动作捕捉
字正腔圆,万国同
音
,coqui-ai TTS跨语种语
音
克隆,钢铁侠讲16国语言
按照固有的思维方式,如果想要语
音
克隆首先得有克隆对象具体的语言语
音
样本,
换
句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语
音
克隆技术
coqui-ai
TTS
语音
实时语
音
克隆
项目简介 这份内容介绍了实时语
音
克隆的技术实现,作者通过将说话者验证技术
转
移到多说话人文本到语
音
合成(SV2TTS)来实现语
音
克隆。
语音
克隆
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
零样本文本到语
音
(TTS): 输入 5 秒的声
音
样本,即刻体验文本到语
音
转
换
。
数字人
声音克隆
GPT-SoVITS
教程
Roop升级版FaceFusion
换
脸AI技术使用以及部署教程
一、介绍: 前些日子比较火的
换
脸AI技术是Roop,但是Roop已经停止更新了,好像是因为团队成员用这个东西搞颜
色
吧。
FaceFusion
教程
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性化
其具体的技术流程主要包括以下几个关键步骤 : 1、数据预处理:首先,对输入的
音
频文件进行采样率
转
换
和分帧等预处理操作。
clone-voice
声音克隆
工具
FaceSwapLab,截止2023年8月最好用的一键
换
脸工具
几周前,我介绍了基于stable diffsion的一个
换
脸插件:roop(这个插件也有独立版,功能更多,甚至可以给视频
换
脸)。
一键换脸
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示
转
换
为视频。
AnimateDiff
视频
训练
OpenAI
OpenAI大动作:Whisper large-v3重塑语
音
识别技术
这款最新的自动语
音
识别模型不仅在多语言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
教程
Suno
音
乐新手指南(手把手完整版教程)
为方便更多
音
乐爱好者使用AI创作
音
乐,中国AIGC产业联盟(AIGCxChina)发起了Suno爱好者社群并编写了以下指南。
suno
歌曲
教程
开源
十大开源语
音
识别项目
Automatic Speech Recognition(ASR)是一项自动语
音
识别技术,其目标是通过计算机自动将人类口头语
音
转
录为文本。
语音识别
开源项目
Agent
为什么大佬都在说Agent是未来?
换
个角度来谈一谈
这和我们在抖
音
或者小红书上看到了内容攻略没有本质区别,其核心差异在于内容制造的效率和质量。
Agent
大模型
Stable Diffusion
Stable Diffusion教程:采样器
简单点说,前向扩散是将图片
转
换
为数据模型,而后向扩散是从数据模型生成图片。
画图
SD
采样器
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100