首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大
语
言模型应用中的
文
本
分块策略
分块的主要原因是确保我们向量化的内容的噪
音
尽可能少,并且具有
语
义相关性。
开源模型
教程
AI声
音
克隆 | 最全最简教程(权威版)
TTS 的英
文
全名是 Text To Speech,中
文
译名是“
文
本
转
语
音
”。
声音克隆
教程
GLM-4-Voice 9B——实时多
语
言
语
音
对话 AI——几分钟内即可在
本
地安装
在
本
文
中,我们将探讨为什么GLM-4-Voice值得关注,它的独特之处,以及如何在
本
地设置和开始使用它。
GLM-4-Voice
9B
语音
安装
开源
网易(TTS)EmotiVoice:开源
语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用自己喜欢的声
音
来朗读任何
文
本
,那该多好?
EmotiVoice
语音合成
字正腔圆,万国同
音
,coqui-ai TTS跨
语
种
语
音
克隆,钢铁侠讲16国
语
言
按照固有的思维方式,如果想要
语
音
克隆首先得有克隆对象具体的
语
言
语
音
样
本
,换句话说,克隆对象必须说过某一种
语
言的话才行,但现在,coqui-ai TTS V2.0版
本
做到了,真正的跨
语
种无需训练的
语
音
克隆技术
coqui-ai
TTS
语音
视频
Prompt | 抖
音
视频脚
本
复制脚
本
并访问 https://beta.elevenlabs.io/speech-synthesis 以生成
文
本
转
语
音
。
prompt
教程
用so-vits-svc-4.1进行
音
色
转
换的极简教程!
其实歌声
转
换不仅仅适用于歌声,普通讲话也可以,只是歌唱的
音
调基
本
能覆盖到低、中、高全域声
音
类型,而正常说话可能无法做到全域覆盖,但是如果在录制声
音
的时候能够做到覆盖多种
音
调类型,也可以实现声
音
转
换。
so-vits-svc
音色转换
教程
数字人
数字人之声
音
克隆:无样
本
,1分钟样
本
完美克隆声
音
,开源
零样
本
文
本
到
语
音
(TTS): 输入 5 秒的声
音
样
本
,即刻体验
文
本
到
语
音
转
换。
数字人
声音克隆
GPT-SoVITS
开源
阿里巴巴
语
音
实验室发布开源
语
音
处理框架ClearerVoice-Studio,支持
语
音
增强、分离、目标说话人提取
它集成了先进的
语
音
增强(Speech Enhancement)、
语
音
分离(Speech Separation)和
音
视频扬声器提取(Audio-Video Speaker Extraction)功能,能够在嘈杂环境中清理
音
频
ClearerVoice-Studio
语音
大模型
“实时”
语
音
翻译!AI
语
音
具有“情绪”!最强开源AI大模型来了
你想把一段
语
音
转
成
文
字,或者把一段
文
字
转
成
语
音
,但是你不知道怎么操作!
大模型
开源模型
语音
语
义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样
本
策略的学术
文
献
语
义检索
语
义索引模型的目标是:给定输入
文
本
,模型可以从海量候选召回库中快速、准确地召回一批
语
义相关
文
本
。
开源模型
实时
语
音
克隆
项目简介 这份内容介绍了实时
语
音
克隆的技术实现,作者通过将说话者验证技术
转
移到多说话人
文
本
到
语
音
合成(SV2TTS)来实现
语
音
克隆。
语音
克隆
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时
转
录应用程序,使用 OpenAI Whisper 模型将
语
音
输入
转
换为
文
本
输出。
OpenAI
Whisper
大模型
开源
十大开源
语
音
识别项目
Automatic Speech Recognition(ASR)是一项自动
语
音
识别技术,其目标是通过计算机自动将人类口头
语
音
转
录为
文
本
。
语音识别
开源项目
语
音
克隆又又又又又升级了
之前在前面的
文
章中有介绍,克隆你的声
音
,只需要你三秒的录
音
,声
音
克隆又进化了!
Meta
语音生成
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100