首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
· 拒绝996,想出海赚美元?这7个GPT方案绝对靠谱!
· 大模型微调数据选择和构造技巧
· 深度|红杉重磅发布:2024 AI 50 榜单 (全网最全)
· 阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
· Prompt屠龙术-大厂prompt工程指南解析提炼
· 还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
24年首篇离奇论文:加点噪
声
,RAG效果翻倍?
· 研究结果发现相关文档比无关文档更有害于RAG系统,并且当放置正确时,无关但噪
声
的文档实际上有助于提高系统的准确性。
RAG
检索增强
开源
网易(TTS)EmotiVoice:开源语
音
合成,支持2000多
音
色
你是否曾经想过,如果你能用自己喜欢的
声
音
来朗读任何文本,那该多好?
EmotiVoice
语音合成
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
详见 语
音
克
隆
最佳实践指南[https://docs.fish.audio/text-to-speech/voice-clone-best-practices]。
Fish
Speech
本地搭建
工具
AI文本转语
音
工具(TTS):MeloTTS
今天给大家介绍一个效果不错的开源文本转语
音
工具:MeloTTS MeloTTS是一个可以把文字转换成
声
音
的工具,它支持英语、西班牙语、法语、中文、日语和韩语等多种语言。
MeloTTS
语音工具
大模型
中国大模型融资暗战:罗曼蒂
克
的快速消亡
多位接近闫俊杰的人士表示,“闫俊杰是典型的技术宅,说话
声
音
小,可能并不擅长对外”,所以平时公司对外融资、以及一些管理、外部活动也通常由贠烨祎负责。
大模型
暗战
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
创始团队 Mikey Shulman:担任首席执行官,他曾担任Kensho的机器学习主管,麻省理工学院斯
隆
管理学院的讲师,哥伦比亚大学应用物理专业的学士学位和哈佛大学物理学专业的博士学位;
suno
音乐
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
根据官网介绍,TSAC可达到非常低的比特率,例如44.1 kHz采样率下的码率可以达到单
声
道 5.5 kb/s 或立体
声
7.5 kb/s,具有良好的感知质量。
TSAC
音频工具
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频驱动唇部同步模型。
MuseTalk
数字人
音频
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置语速、添加停顿词、口头语、笑
声
!!
torch.tensor(np.concatenate(wavs,axis=-1)) Audio(finally_wavs, rate=24_000, autoplay=True) 效果展示: 男
声
音
展示
chattts
tts
文生语音
对于AI,我们现阶段可以有的态度
但这不妨碍我们现在开始尝试着接触他,了解他,至少在有一定认知后,不至于出现最近的那条“AI换脸、
声
音
克
隆
后,被诈骗400多万元”新闻那样的事情发生。
文生图
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
它可用于转录来自麦
克
风的实时
音
频输入和预先录制的
音
频文件。
OpenAI
Whisper
大模型
RAG
24年首篇离奇论文:加点噪
声
,RAG效果翻倍?!
· 研究结果发现相关文档比无关文档更有害于RAG系统,并且当放置正确时,无关但噪
声
的文档实际上有助于提高系统的准确性。
RAG
检索
论文
人工智能
胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
/Win11/Mac/Ubuntu)上安装配置Python3.10开发环境 v3u.cn/a_id_200 so-vits-svc安装 在你自定义的目录下使用Git命令
克
隆
项目
音乐
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
只需提供一段
音
频和一个视频,PersonaTalk便能精准同步人物的口型,不仅让
声
音
和嘴型无缝贴合,还能保留视频中人物的表情和个性化说话风格,仿佛原生发
声
一般自然流畅。
PersonaTalk
视频
第一性原理以及第一性原理是怎么帮马斯
克
成为首富的
马斯
克
践行第一性原理到商业化中的最大好处就是能大幅降低成本,也是马斯
克
引以为豪的五步工作法的最大实践应用。
马斯克
商业
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100