首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 风平智能
· 十大开源语音识别项目
· 使用ChatGPT润色出高品质文章!
· 国产视频制作之光-可灵:提示词大全整理
· 制作可爱的表情包
· 必看!ComfyUI故障应对指南,让您轻松应对每一个挑战
· 盘点字节跳动最新的AI应用
· 【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
· Midjourney AI绘画美女提示词分享一
· 爱设计PPT
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
实时语
音
克隆
项目简介 这份内容介绍了实时语
音
克隆的技术实现,作者通过将说话者验证技术转移到多说话人文本到语
音
合成(SV2TTS)来实现语
音
克隆。
语音
克隆
Stable Diffusion
Stable Diffusion 快速创作角色三
视
图
天分享分享如何通过 Stable Diffusion 快速创造出角色三
视
图。
SD
三视图
文生图
ChatGPT
ChatGPT Prompt提示词课程(斯坦福吴恩达 | OpenAl)指南篇 极简笔记
对于大模型prompt的设计,近期斯坦福吴恩达伙同OpenAl出了一套
视
频
教程(B站地址:https://www.bilibili.com/video/BV1AT41187qt?
prompt
大模型
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
Sadtalker是一个能够根据图片和
音
频
生成
视
频
的开源项目,它使用了一种叫做SadNet的神经网络,可以实现风格化的单图说话人脸动画。
数字人
解读wav2lip:探究语
音
驱动唇部动作的技术原理!
而且由于生成过程中存在伪影,GAN判别器更容易关注
视
觉伪影,从而忽略
音
频
和口型的对应关系。
wav2lip
语音
你的下一个浏览器,可以是豆包电脑版!
万万没想到,现在看B站
视
频
的打开方式,竟然可以这么AI了。
豆包
浏览器
AI拟声: 5秒内克隆您的声
音
音
频
剪辑和制作:对于
音
频
制作人员来说,MockingBird也是一个强大的工具。
声音克隆
开源
教程
AI声
音
克隆 | 最全最简教程(权威版)
,但是要收费的哈 但这些都不能指定声
音
转换,所以这里使用声
音
克隆,来将指定人声训练成模型,然后文字转
音
频
。
声音克隆
教程
语
音
识别的新拐点:OLMoASR 带来的机会
ASR,全称 Automatic Speech Recognition(自动语
音
识别),就是让机器“听懂你说话”,并把语
音
转换成文字。
OLMoASR
语音识别
Stable Diffusion
stable diffusion最全18种controlnet模型,详细教程讲解。
目前AIgc领域正在持续关注,等到年底的时候做一个最全面的
视
频
和文字讲解,现在还是在等等,目前AI领域热度确实是在持续降温,但是呢,深入了解AI的人都知道,AI的发展不是想人一样需要很长时间的积累,有时候可能就是一个算法的突破
Stable
Diffusion
文生图
controlnet
StableDiffusion
AI绘画由入门到精通:StableDiffusion精讲课程
这款软件以其独特的优势和无限的可能性,为艺术家、设计师乃至广大创意爱好者提供了前所未有的
视
觉表达工具。
SD
视频课程
AI绘画
在 WebUI 中使用 AnimateDiff 的一些问题和技巧
这两天晚上没事的时候就会尝试下AnimateDiff,发现这真的让
视
频
生成上了一个大台阶,估计是到了AI
视
频
爆发的前夜了。
AnimateDiff
SD
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
今天,介绍一个开源创新的虚拟人
视
频
生成框架:MuseV MuseV是由腾讯
音
乐娱乐的天琴实验室开源,MuseV专注于生成高质量的虚拟人
视
频
和口型同步,能够制作出具有高度一致性和自然表情的长
视
频
内容
MuseV
视频
数字人
框架
教程
用so-vits-svc-4.1进行
音
色转换的极简教程
这里要求切割后的
音
频
长度在5-15秒左右,不能太长或太短。
声音
sovits
被高估的Pika,被低估的多模态AI
例如,在医疗领域可以通过结合图像、录
音
和病历文本,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器数据,带来更智能、更安全的自动驾驶体验;在教育领域,将文本、声
音
、
视
频
相结合,呈现更具互动性的教育内容
大模型
多模态
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100