首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 13个神级Chatgpt指令,助你小说丝滑过审
· Suno音乐新手指南(手把手完整版教程)
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 阿里云王坚:中国AI不惧R2迟发!靠「群体智能」破局:算力不是瓶颈,但AI应用层急需炸开OpenAI想象围墙!不看好硅谷抢人乱象
· 造梦师手记:C站最受欢迎的大模型推出了SFW版
· AI绘画巅峰对决:Stable Diffusion 3与DALL·E 3原理深度比较
· AI写作不如意?万字长文深度剖析背后原因
· 大模型的研究新方向:混合专家模型(MoE)
· 喂饭级 AI’MWISE 启动器安装教程
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
了解Kimi必看的26个问题 | Kimi系列文(二)
了解到,目前的GenAI有文本类、视
频
类、绘图类、音
频
类、编程类、PPT、数字人、AI搜索等形式。
Kimi
大语言模型
数字人
数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
「闪剪智播」在使用上有一个点与其他三款产品都不同,就是它的数字人只能使用
录
音文件驱动,虽然它本身也有一个插件是文本转AI声音,而且声音库还很丰富,但合成的音
频
却不能用于驱动数字人。
数字人
数字分身
AI+音乐|对话 Suno CEO:破圈的音乐生成产品是如何诞生的?
Mikey:“虽然我学的是物理,但音乐始终是我的激情所在,我
录
过一张EP。
suno
音乐
人工智能
6个AI音乐软件推荐,让你学会人工智能AI作曲
在当下的应用中,AI已经可以影响音乐制作过程的各个方面,包括音乐生成、音
频
掌握等。
训练
音乐
教程
用so-vits-svc-4.1进行音色转换的极简教程!
其实歌声转换不仅仅适用于歌声,普通讲话也可以,只是歌唱的音调基本能覆盖到低、中、高全域声音类型,而正常说话可能无法做到全域覆盖,但是如果在
录
制声音的时候能够做到覆盖多种音调类型,也可以实现声音转换。
so-vits-svc
音色转换
教程
懒人福音!用AI生成会议纪要,让你的工作更高效!
会议音
频
一般有几种,手机或
录
音笔的音
频
,腾讯会议的音
频
等,那如何把音
频
转成文本呢?
会议纪要
AI工具
Stable Diffusion
Stable Diffusion|儿童绘本全流程制作分享
上次分享了一个将小说转化为视
频
的全过程的教程。
StableDiffusion
绘本
教程
AI声音克隆 | 最全最简教程(权威版)
请看自己开发 一个免费的文本转语音小工具 如果你觉得功能少,可以使用国内的魔音工坊,但是要收费的哈 但这些都不能指定声音转换,所以这里使用声音克隆,来将指定人声训练成模型,然后文字转音
频
。
声音克隆
教程
换脸
AI 换脸——Deepfacelab 下载与安装,新手教程
程序处理完成之后,在 ==workspace\data_src== 目
录
下会出现从源视
频
中提取出来的图片
Deepfacelab
换脸
开源
clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
Mel-spectrogram是一种能够有效捕捉音
频
信号
频
谱特征的工具,它将音
频
信号转换为一种更适合机器学习模型处理的图像形式,成为许多语音合成模型的标准输入形式,有助于模型更好地理解和学习声音的特征。
clone-voice
声音克隆
开源
开源免费离线语音识别神器whisper如何安装
;对于外语口语学习者,使用whisper翻译你的发音练习
录
音,可以很好的检验你的口语发音水平。
wisper
翻译
免费
开源
OpenAI 开源语音识别 Whisper 的使用体验怎么样?
一旦下载完成,所有的语音转
录
文本过程都将在您的电脑上运行,转换速度非常快。
生成式AI
写作
终极福利:15个中文AI写作提示词帮你覆盖所有主流写作场景!!!
Prompt 7视
频
脚本生成器 你是一个视
频
脚本撰写专家,根据提供的视
频
主题、关键词、视
频
类型,生成一个符合要求的视
频
脚本。
写文章
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
动态表现力:通过上下文风格化的音
频
到运动模型(ICS-A2M),MimicTalk能够「捕捉和模仿目标人物的动态说话风格」,使生成的视
频
更加生动和富有表现力。
MimicTalk
开源模型
动作识别模型有哪些
网络结构: 因为视
频
可以分为空间和时间两个部分。
动作识别
模型
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100