首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI 爆文写作:如何用GPT写出10万+?这篇五千字长文给你答案
· PPT又又有新突破了!智谱AI代码流造PPT
· 做大模型需要的环境设置
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· Suno音乐新手指南(手把手完整版教程)
· 剪映专业版智能补帧
· 换脸软件 FaceFusion 保姆级教程
· Playground v2:超越SDXL的模型来了,优于SDXL 2.5倍!
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
视频
栩栩如生,
音
色克隆,Bert-vits2文字转
语
音
打造鬼畜视频实践
语
音
素材和模型 首先我们需要渣渣辉和刘青云的原版
音
频素材,原版《扫毒》素材可以参考:https://www.bilibili.com/video/BV1R64y1F7SQ/。
Bert-vits
语音
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性
化
只需提供一段简短的
音
频样本,它就可以根据该样本生成与原始声
音
极其相似的克隆声
音
,并且支持多种
语
言,目前包括中文、英文、日
语
、韩
语
等,甚至还扩展到了法
语
、德
语
、意大利
语
等16种
语
言,为用户提供了更广泛的应用可能性
clone-voice
声音克隆
解读wav2lip:探究
语
音
驱动唇部动作的技术原理!
本文将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现
语
音
驱动唇部运动的!
wav2lip
语音
开源
网易有道强力开源中英双
语
语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
开源
从声纹模型到
语
音
合成:
音
频处理 AI 技术前沿 | 开源专题 No.45
主要功能包括: · 支持多种声
音
变
化
AI § MMVC § so-vits-svc § RVC(Retrieval-based-Voice-Conversion
AudioCraft
音频
开源
【开源项目】Flow Matching
语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
OpenAI
基于 OpenAI Whisper 模型的实时
语
音
转文字工具
· WhisperLive 是一款专注于
音
频处理和创作的开源软件,使用 OpenAI Whisper 模型将
语
音
输入转换为文本输出,可以用于转录麦克风的实时
音
频输入和预先录制的
音
频文件,为艺术家和
音
乐制作人提供了一个强大的平台
WhisperLive
音频
开源软件
ChatGPT
最受欢迎的15个ChatGPT提示词,
优
化
给ChatGPT用户,拿走不谢
我已经针对每个提示词进行
优
化
,以便ChatGPT更好地理解和执行任务。
ChatGPT
提示词
开源
开源免费离线
语
音
识别神器whisper如何安装
whisper介绍 Open AI在2022年9月21日开源了号称其英文
语
音
辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种
语
言的自动
语
音
辨识。
wisper
翻译
免费
「
语
音
转换新速度」— 探秘Whisper JAX的70倍速提升
在AI的众多分支中,
语
音
识别技术的突破性进展尤为引人瞩目。
Whisper
语音识别
大模型
大模型能自己
优
化
Prompt了,曾经那么火的提示工程要死了吗?
人类设计 prompt 的效率其实很低,效果也不如 AI 模型自己
优
化
。
prompt
大模型
提示
开源
有道开源的国产
语
音
库EmotiVoice爆火了!具有情绪控制功能的
语
音
合成引擎!
前不久小圈为大家介绍过 Coqui 文本转
语
音
(Text-to-Speech,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的
优
势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
6.2K Star!MIT出品的多
语
言
语
音
合成神器,CPU实时推理吊打商业软件!
VITS系列本身就是目前最先进的端到端TTS架构,生成质量和推理速度都很
优
秀。
MeloTTS
语音工具
提示词
精通结构
化
提示词:如何精确操控指令的作用域与
优
先级
结构
化
提示词中,用的最多的是Markdown
语
法。
提示词
结构化
开源
有感情的
语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的
语
音
生成模型,专门用于大型
语
言模型(LLM)助手的对话任务、对话
语
音
和视频介绍等应用。
ChatTTS
语音合成
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100