首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI虚拟主播数字人技术实现Wav2Lip
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· Suno音乐新手指南(手把手完整版教程)
· SD3 正式开源 Sora同源架构
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 一位芯片投资人的十年复盘:谁是中国的英伟达|AI光年
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 我尝试了 100 个免费 AI 工具,这些是最好的
· 深入探讨:Agent全自动写作长篇小说技术原理解析
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
有道开源的国产
语
音
库EmotiVoice爆火了!具有情绪控制功能的
语
音
合成引擎!
前不久小圈为大家介绍过 Coqui
文
本转
语
音
(Text-to-Speech,TTS) 模型,相比较市面上原有的开源TTS模型,Coqui 有其独特的优势,也受到了广大科技互联网爱好者的青睐
EmotiVoice
语音库
生
成式AI与大
语
言模型的区别
生
成式人工智能可以被定义为专注于创建具有
生
成原创内容能力的模型,例如图像、
音
乐或
文
本。
生成式AI
大语言模型
区别
6.2K Star!MIT出品的多
语
言
语
音
合成神器,CPU实时推理吊打商业软件!
Azure一个月几千块,Google Cloud按分钟收费 免费的质量垃圾,机器味儿浓到让人怀疑人
生
中
文
支持?
MeloTTS
语音工具
开源
有感情的
语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的
语
音
生
成模型,专门用于大型
语
言模型(LLM)助手的对话任务、对话
语
音
和视频介绍等应用。
ChatTTS
语音合成
国内厂商
语
音
识别与Whisper评测:现状与概况对比
本
文
旨在通过对国内几家主要厂商的
语
音
识别技术与 Whisper 技术进行评测和对比,以期更全面地了解国内
语
音
识别技术的现状与概况。
语音识别
Faster-Whisper
RAG
RAG 2.0来了,它能成为
生
产落地的福
音
吗?
在典型的RAG系统中,通常会采用现成的通用嵌入模型来实现数据的嵌入处理,利用向量数据库进行高效的信息检索,并结合大型的黑盒
语
言模型来完成内容的
生
成。
RAG
大模型
开发
语
音
产品时设计唤醒词和命令词的技巧
在实际开发
语
音
产品过程中,要达到好的
语
音
识别效果,除了
语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
开源
生
成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的
音
频
生
成开发框架
在过去的几年里,我们看到了AI在图像、视频和
文
本
生
成方面的巨大进步。
开源模型
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
前段时间,「霉霉大秀中
文
」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英
语
」等类似视频。
语音
HeyGen
开源
GPT-4o实时
语
音
方案提供商Livekit开源voice agent:轻松处理
音
视频流
轻松访问 LiveKit WebRTC 会话并处理或
生
成
音
频、视频和数据流。
voice
agent
开源
音视频
Stable Diffusion
Stable Diffusion教程:
文
生
图
最近几天AI绘画没有什么大动作,正好有时间总结下Stable Diffusion的一些基础知识,今天就给大家再唠叨一下
文
生
图这个功能,会详细说明其中的各个参数。
文生图
Stable
Diffusion
视频
图
文
生
成短视频的方法
现在都是使用AI创作的时代,你完全可以把你想要表达的主题,用AI
生
成一个爆款的视频
文
案。
视频
ChatGPT
打造
音
乐传奇:Suno推出
音
乐
生
成模型Suno V3,让每个人都能成为作曲家
我们深信,借由科技的持续进步和创新,AI将在
音
乐
文
化中发挥无可替代的作用。
suno
歌曲
音乐
开源
OpenAI 开源
语
音
识别 Whisper 的使用体验怎么样?
这款工具具有很高的速度,能够在批量处理中大幅提高
生
产效率。
生成式AI
开源
从 GPT-4o 到 LiveKit:实时
语
音
交互的开源实现
今天我们来聊聊OpenAI 发布会提到的实时对话
语
音
技术。
GPT-4o
语音交互
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100