首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· Stable Diffusion|提示词高阶用法(二)双人同图
· AI换脸工具:facefusion使用心得
· 阿里Outfit Anyone实现真人百变换装
· 变天了,AI可以一键生成中文海报了......
· API.box
· 为你推荐开源项目:Meridian——专属个人情报站!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
视频
Wunjo AI: 合成和克隆英语/俄语/中文语
音
,实时语
音
识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
主要特征 语
音
合成:轻松将文本转换为类似人类的语
音
。
AI语音克隆
实时语音识别
开源
有道开源的国产语
音
库EmotiVoice爆火了!具有情绪控制功能的语
音
合成引擎!
接下面让我们看看这款国产语
音
库为何如何迅速的火遍大江南北的🔥!
EmotiVoice
语音库
借题发挥下最近几例声
音
克隆的应用案例
最近接连接到几个客户找我订制声
音
的案例: 1.某父亲痛失爱子,因为儿子托梦告知人是可以复活的,于是这位父亲到处寻找让人复活的办法,于是他关注到了最新的人工智能技术,开始找人咨询和学习技术,通过摸索,他知道通过
声音克隆
数字人
Stable Diffusion
小白设计师福
音
:Stable Diffusion 16款插件测评,好用不?推荐吗?
随着 Stable Diffusion 的不断进化,越来越多的开发者加入到插件开发的行列中。大家都知道网上虽然教程多,但非常碎片,一个个学习和查阅真的非常耗时,感觉每天都在烧脑。如果你是SD小白或者是小懒猫,又想快速上手使用 Stable Diffusion 插件,那么这篇文章就非常适合你了!因为这是以设计师日常应用的角度出发,从推荐指数、易上手程度、使用频率三个维度来测评。下面会附赠下载地址!
SD
插件
文生图
开发语
音
产品时设计唤醒词和命令词的技巧
在实际开发语
音
产品过程中,要达到好的语
音
识别效果,除了语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语
音
识别数倍加速
懂技术的小伙伴也可以寻找其他替代方案,比如语
音
转文字模型 Whisper、文字翻译 GPT、声
音
克隆 + 生成
音
频 so-vits-svc、生成符合
音
频的嘴型视频 GeneFace++dengdeng。
语音
HeyGen
懒人福
音
!用AI生成会议纪要,让你的工作更高效!
会议
音
频一般有几种,手机或录
音
笔的
音
频,腾讯会议的
音
频等,那如何把
音
频转成文本呢?
会议纪要
AI工具
工具
惊艳推荐!8款好用又免费的文本转语
音
TTS工具
在早期,TTS技术主要依赖于预录制的声
音
样本,通过组合这些样本来生成语
音
。
TTS
Maker
语音
数字人
一款构建AI数字人项目开源了!自动实现
音
视频同步!
本周GitHub项目圈选: 主要包含
音
视频同步、多代理框架、3D对象模型、适用于开发者的演示文档构建工具、网页程序打包、自构建CRUD应用等热点项目。
AI数字人
音视频同步
VividTalk:用一张照片和一段
音
频让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段
音
频结合起来,创造出仿佛真人在说话的视频的技术。
VividTalk
视频
剪映克隆声
音
功能详解:剪映上线5秒“AI克隆
音
色”,一堆AI公司又要进入慢性死亡了...
剪映的
音
色克隆,只能克隆自己声
音
的,而不能像一些现在市面上的开源项目一样,上传一段
音
频后,就能把那个人的声
音
克隆出来。
剪映
声音克隆
RVC和SVC声
音
模型难找?推荐这个网站
本篇文章介绍:1, 声
音
数据集训练到模型的过程 2 ,SVC和RVC声
音
模型网站推荐 一、声
音
数据集训练到模型的过程 AI声
音
模型训练是通过分析大量
音
频数据来学习声
音
特性,生成与目标声
音
相似的新
音
频
声音克隆
数字人
Python
Whisper对于中文语
音
识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语
音
做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过
Whisper
语音优化
开源
OpenAI 开源语
音
识别 Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动语
音
识别模型的软件工具,能够将
音
频或视频中的语
音
自动识别为带有时间戳的文本字幕。
生成式AI
开源
网易有道强力开源中英双语语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100