首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· 分享一个结构化AI提示词模版
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· MiniCPM 4.1 开源!代码、数学推理速度快了 3 倍!
· ChatGLM智谱清言
· 完整ChatGLM3部署教程,支持手机和车载平台部署
· 中文通用大模型评测基准发布,全方位解析评价维度,助你选出最优秀的模型!
· 用Midjourney给自己制作精美的logo或头像
· 和大模型相关的一些术语(持续更新中)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
13.5K Star ! Fish
Speech
Windows本地搭建,能否达到官方的级别?强烈推荐
Fish
Speech
是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持英语、日语、韩语、中文、法语、德语、阿拉伯语和西班牙语。
Fish
Speech
本地搭建
工具
惊艳推荐!8款好用又免费的文本转语音TTS工具
TTS(Text-to-
Speech
)技术是一项可以将文本转换成语音的技术。
TTS
Maker
语音
开源
十大开源语音识别项目
Automatic
Speech
Recognition(ASR)是一项自动语音识别技术,其目标是通过计算机自动将人类口头语音转录为文本。
语音识别
开源项目
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
so-vits-svc是基于VITS的开源项目,VITS(Variational Inference with adversarial learning for end-to-end Text-to-
Speech
音乐
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
它集成了先进的语音增强(
Speech
Enhancement)、语音分离(
Speech
Separation)和音视频扬声器提取(Audio-Video Speaker Extraction)功能,能够在嘈杂环境中清理音频
ClearerVoice-Studio
语音
开源
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
license GPT-SoVITS模型: MIT license F5-TTS模型:源代码是 MIT License,预训练模型是 CC-BY-NC license Fish-
Speech
语音克隆
开源模型
视频
Prompt | 抖音视频脚本
复制脚本并访问 https://beta.elevenlabs.io/
speech
-synthesis 以生成文本转语音。
prompt
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
本文来自ACM 2020:A Lip Sync Expert Is All You Need for
Speech
to Lip Generation In the Wild 代码开源:https:/
wav2lip
语音
OpenAI
【语音识别】OpenAI语音力作Whisper
一、介绍 Whisper 是一系列用于自动语音识别 (automatic
speech
recognition,ASR) 的预训练模型,它由来自于 OpenAI 的 Alec Radford
语音转文字
whisper
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
基本上你需要做的就是这样: 1 import torch 2 from transformers import pipeline 3 4 pipe = pipeline("automatic-
speech
-recognition
音频
Whisper
语音
国内厂商语音识别与Whisper评测:现状与概况对比
二、评测意义与预期成果 语音识别(
speech
recognition)技术,也被称为自动语音识别(Automatic
Speech
Recognition, ASR)、电脑语音识别(Computer
语音识别
Faster-Whisper
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
近日,Google研究团队在其博客上发布了一篇文章,介绍了他们的最新研究成果:无监督语音到语音(Unsupervised
Speech
-to-
Speech
,简称USS)AI模型。
Translatotron
语音识别
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
前不久小圈为大家介绍过 Coqui 文本转语音(Text-to-
Speech
,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
语音
语音识别的新拐点:OLMoASR 带来的机会
ASR,全称 Automatic
Speech
Recognition(自动语音识别),就是让机器“听懂你说话”,并把语音转换成文字。
OLMoASR
语音识别
ChatGPT
20个ChatGPT超实用的提示词(Prompt)
附加说明:演讲应在 15 分钟以内” 英文版:"Topic: How to write persuasively Audience: Business executives Format:
Speech
prompt
提示词
<
1
2
3
>
1
2
4
5
6
7
8
9
100