首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI写作不如意?万字长文深度剖析背后原因
· ChatGPT论文润色进阶指令
· Suno音乐新手指南(手把手完整版教程)
· Stable Diffusion图生图(真人转动漫)
· 2023年人工智能行业总结(精简版)
· 挑战全网,字节跳动coze平台让你免费创建ChatGPT4的机器人,不仅能免费使用DallE3,还能免费导入自己的知识库
· 性能超出预期!神秘的国产大模型 Kimi 开放 API
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
13.5K Star ! Fish
Speech
Windows本地搭建,能否达到官方的级别?强烈推荐
Fish
Speech
是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
Fish
Speech
本地搭建
工具
惊艳推荐!8款好用又免费的文本转语音TTS工具
TTS(Text-to-
Speech
)技术是一项可以将文本转换成语音的技术。
TTS
Maker
语音
开源
十大开源语音识别项目
Automatic
Speech
Recognition(ASR)是一项自动语音识别技术,其目标是通过计算机自动将人类口头语音转录为文本。
语音识别
开源项目
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
so-vits-svc是基于VITS的开源项目,VITS(Variational Inference with adversarial learning for end-to-end Text-to-
Speech
音乐
开源
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
license GPT-SoVITS模型: MIT license F5-TTS模型:源代码是 MIT License,预训练模型是 CC-BY-NC license Fish-
Speech
语音克隆
开源模型
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
它集成了先进的语音增强(
Speech
Enhancement)、语音分离(
Speech
Separation)和音视频扬声器提取(Audio-Video Speaker Extraction)功能,能够在嘈杂环境中清理音频
ClearerVoice-Studio
语音
视频
Prompt | 抖音视频脚本
复制脚本并访问 https://beta.elevenlabs.io/
speech
-synthesis 以生成文本转语音。
prompt
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
本文来自ACM 2020:A Lip Sync Expert Is All You Need for
Speech
to Lip Generation In the Wild 代码开源:https:/
wav2lip
语音
OpenAI
【语音识别】OpenAI语音力作Whisper
一、介绍 Whisper 是一系列用于自动语音识别 (automatic
speech
recognition,ASR) 的预训练模型,它由来自于 OpenAI 的 Alec Radford
语音转文字
whisper
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
基本上你需要做的就是这样: 1 import torch 2 from transformers import pipeline 3 4 pipe = pipeline("automatic-
speech
-recognition
音频
Whisper
语音
国内厂商语音识别与Whisper评测:现状与概况对比
二、评测意义与预期成果 语音识别(
speech
recognition)技术,也被称为自动语音识别(Automatic
Speech
Recognition, ASR)、电脑语音识别(Computer
语音识别
Faster-Whisper
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
近日,Google研究团队在其博客上发布了一篇文章,介绍了他们的最新研究成果:无监督语音到语音(Unsupervised
Speech
-to-
Speech
,简称USS)AI模型。
Translatotron
语音识别
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
前不久小圈为大家介绍过 Coqui 文本转语音(Text-to-
Speech
,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
Prompt
提高工作效率的 10 个高级Prompt
or content Sampleprompt: "Topic: How to write persuasively Audience: Business executives Format:
Speech
工作
大模型
GPT
prompt
提示词
开源
精通百种语言的翻译AI来了!Meta推出,免费、开源!
它是基于Meta公司之前开发的两个模型:M2M-100和Universal
Speech
Translator。
大语言模型
<
1
2
3
>
1
2
4
5
6
7
8
9
100