首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI虚拟主播数字人技术实现Wav2Lip
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· Suno音乐新手指南(手把手完整版教程)
· SD3 正式开源 Sora同源架构
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 一位芯片投资人的十年复盘:谁是中国的英伟达|AI光年
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 我尝试了 100 个免费 AI 工具,这些是最好的
· 深入探讨:Agent全自动写作长篇小说技术原理解析
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
工具
AI文本转
语
音
工具(TTS):MeloTTS
今天给大家介绍一个效果不错的开源文本转
语
音
工具:MeloTTS MeloTTS是一个可以把文字转换成声
音
的工具,它支持英
语
、西班牙
语
、法
语
、中文、日
语
和韩
语
等多种
语
言。
MeloTTS
语音工具
开源
阿里巴巴
语
音
实验室发布开源
语
音
处理框架ClearerVoice-Studio,支持
语
音
增强、分离、目标说话人提取
以下是几个技术亮点: 1) FRCRN 模型:还原自然
语
音
的“魔术师” FRCRN 模型擅长在移除背景噪
音
的同时保留
音
频的自然
品
质。
ClearerVoice-Studio
语音
大模型
“实时”
语
音
翻译!AI
语
音
具有“情绪”!最强开源AI大模型来了
(先别急着骂,我们先看看
产
品
) 你是否遇到过这样的情况: 你想和一个说不同
语
言的人交流,但是你不会他的
语
言!
大模型
开源模型
语音
深度解读|做出海必看的一份
产
品
报告
对于一个成功
产
品
的诞生,除了前期从零到一对
产
品
和技术契合度的探索,对
产
品
增长也是所有开发者需要在 Day 1就应该思考的问题。
工作
独家:4259款AI
产
品
关键指标排名与分析
但在这个信息过剩的世界里,如何找到真正值得您时间和金钱的AI
产
品
呢?
生成式AI
【2023.10】看目前巨头的AI原生
产
品
布局
(可以用一些
语
音
识别工具从整个回放中找到需要的
产
品
段落来看。)
大模型
产品
实时
语
音
克隆
项目简介 这份内容介绍了实时
语
音
克隆的技术实现,作者通过将说话者验证技术转移到多说话人文本到
语
音
合成(SV2TTS)来实现
语
音
克隆。
语音
克隆
开源
十大开源
语
音
识别项目
这项技术在多个领域有着广泛的应用,包括但不限于
语
音
助手、
语
音
搜索、自动转写以及
语
音
命令识别。
语音识别
开源项目
开源
语
音
、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的
语
音
识别模型,它是一种通用的
语
音
识别模型,可以用于
语
音
识别、
语
音
翻译和
语
言识别等任务。
人工智能
大模型
wisper
语
音
克隆又又又又又升级了
,时隔几个月Meta又推出了最新的
语
音
生成技术,不仅能可能声
音
,还能通过对声
音
的描述来生成独特的
音
色,同时还能通过描述来生成各种各样的
音
效,甚至能通过文字描述来编辑声
音
,整体来说,这项技术几乎囊括了现在人们对
语
音
生成技术的所有的需求
Meta
语音生成
产
品
经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
流程图是
产
品
入门必备的基本技能之一。
产品经理
流程
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音
识别技术
这款最新的自动
语
音
识别模型不仅在多
语
言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
视频
Wunjo AI: 合成和克隆英
语
/俄
语
/中文
语
音
,实时
语
音
识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
主要特征
语
音
合成:轻松将文本转换为类似人类的
语
音
。
AI语音克隆
实时语音识别
企业
快消
品
企业怎么才能用上大
语
言模型?
以ChatGPT为起点,大
语
言模型(LLM)用全面的技术创新,以及在用户和
产
业中的应用落地,再次掀起了一个AI新浪潮。
大模型
AIGC
AIGC工作流: 新时代
产
品
经理和创业者的秘密武器
如今,随着ChatGPT、Midjourney、StableDiffusion等生成模型带动起来的热潮,AI大模型正逐渐渗透到各种
产
品
和服务中,越来越多的
产
品
经理也在考虑将AIGC(AI生成内容)能力融入到自己的
产
品
中
大模型
AIGC
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100