文章列表-AI魔法学院

文章列表

13.5K Star ! Fish Speech Windows本地搭建，能否达到官方的级别？强烈推荐

Fish Speech是一款由Fish Audio开发的开源的文本到语音（TTS）工具，支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。

Fish Speech 本地搭建

惊艳推荐！8款好用又免费的文本转语音TTS工具

TTS（Text-to-Speech）技术是一项可以将文本转换成语音的技术。

TTS Maker 语音

十大开源语音识别项目

Automatic Speech Recognition（ASR）是一项自动语音识别技术，其目标是通过计算机自动将人类口头语音转录为文本。

语音识别开源项目

胎教级SO-VITS-SVC使用教程：人工智能生成歌曲

so-vits-svc是基于VITS的开源项目，VITS（Variational Inference with adversarial learning for end-to-end Text-to-Speech

音乐

阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio，支持语音增强、分离、目标说话人提取

它集成了先进的语音增强（Speech Enhancement）、语音分离（Speech Separation）和音视频扬声器提取（Audio-Video Speaker Extraction）功能，能够在嘈杂环境中清理音频

ClearerVoice-Studio 语音

【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比，等你来评!

license GPT-SoVITS模型: MIT license F5-TTS模型:源代码是 MIT License，预训练模型是 CC-BY-NC license Fish-Speech

语音克隆开源模型

Prompt | 抖音视频脚本

复制脚本并访问 https://beta.elevenlabs.io/speech-synthesis 以生成文本转语音。

prompt

解读wav2lip：探究语音驱动唇部动作的技术原理！

本文来自ACM 2020：A Lip Sync Expert Is All You Need for Speech to Lip Generation In the Wild 代码开源：https:/

wav2lip 语音

【语音识别】OpenAI语音力作Whisper

一、介绍 Whisper 是一系列用于自动语音识别 (automatic speech recognition，ASR) 的预训练模型，它由来自于 OpenAI 的 Alec Radford

语音转文字 whisper

Insanely Fast Whisper：超快的Whisper语音识别脚本

基本上你需要做的就是这样： 1 import torch 2 from transformers import pipeline 3 4 pipe = pipeline("automatic-speech-recognition

音频 Whisper

国内厂商语音识别与Whisper评测：现状与概况对比

二、评测意义与预期成果语音识别（speech recognition）技术，也被称为自动语音识别（Automatic Speech Recognition, ASR）、电脑语音识别（Computer

语音识别 Faster-Whisper

AI“同声传译”新进展！Google发布，无监督，语音识别：Translatotron 3！

近日，Google研究团队在其博客上发布了一篇文章，介绍了他们的最新研究成果：无监督语音到语音（Unsupervised Speech-to-Speech，简称USS）AI模型。

Translatotron 语音识别

有道开源的国产语音库EmotiVoice爆火了！具有情绪控制功能的语音合成引擎！

前不久小圈为大家介绍过 Coqui 文本转语音（Text-to-Speech，TTS）模型，相比较市面上原有的开源TTS模型，Coqui 有其独特的优势，也受到了广大科技互联网爱好者的青睐

EmotiVoice 语音库

语音识别的新拐点：OLMoASR 带来的机会

ASR，全称 Automatic Speech Recognition（自动语音识别），就是让机器“听懂你说话”，并把语音转换成文字。

OLMoASR 语音识别

20个ChatGPT超实用的提示词（Prompt）

附加说明：演讲应在 15 分钟以内” 英文版："Topic: How to write persuasively Audience: Business executives Format: Speech

prompt 提示词

<12 3 >

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1