首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI 爆文写作:如何用GPT写出10万+?这篇五千字长文给你答案
· PPT又又有新突破了!智谱AI代码流造PPT
· 做大模型需要的环境设置
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· Suno音乐新手指南(手把手完整版教程)
· 剪映专业版智能补帧
· 换脸软件 FaceFusion 保姆级教程
· Playground v2:超越SDXL的模型来了,优于SDXL 2.5倍!
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
OpenAI真的开源了!这波「实时
语
音
」操作,让万物开口说话,我爱了
就像直播里的那只麋鹿,它能听懂你的问题,然后用自然流畅的
语
音
跟你聊天,就是这个 SDK 的功劳!
OpenAI
嵌入式实时语音
SDK
ComfyUI
Fooocus,webui,comfyui
优
缺点
今天主要想讲的其实是三大主流sd ui的
优
缺点 首先fooocus看我公众号的小伙伴应该非常熟悉了,作者就是cn的制作者,也是国人。
Fooocus
webui
comfyui
文生图
ChatGPT
如何使用ChatGPT写出
优
质文章
确定主题和目的 细
化
主题:选择一个具体且明确的主题,例如,“气候变
化
对欧洲农业的影响”而不仅仅是“气候变
化
”。
ChatGPT
写作
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
语
音
识别(ASR)是指将人类的
语
音
转换为文本的技术,然而,目前的
语
音
识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的
语
言。
Translatotron
语音识别
教程
AI声
音
克隆 | 最全最简教程(权威版)
一直没有写过关于声
音
克隆的文章,所以这次补上,毕竟这个用的还真是有点多,也为后面更多的个性
化
配
音
做好准备。
声音克隆
教程
「
语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“
语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端
语
音
交互大模型
这种设计的
优
势在于减少了信息在不同模块之间传递时的损失和误差,使模型能够更好地
优
化
全局目标。
Westlake
-
Omni
语音
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
这种技术的应用不仅降低了
音
乐制作的门槛,还为
音
乐爱好者和专业人士提供了新的创作工具,从而推动了
音
乐创作的民主
化
。
suno
音乐
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI
语
音
克隆工具!
而 OpenVoice 作为一款强大的多
语
言即时
语
音
克隆AI工具,可以为用户提供高效、个性
化
的
语
音
克隆服务,是一款值得推荐的项目。
tts
文本转语音
RAG
RAG超参数调
优
食用指南
接下来将用一个完整的使用指南来展示如何对 RAG 进行超参数
优
化
,主要针对块大小和 top-K 两个参数。
rag
大模型
模型压缩:量
化
、剪枝和蒸馏
在移动智能终端品类越发多样的时代,为了让预训练
语
言模型可以顺利部署在算力和存储空间都受限的移动终端,对预训练
语
言模型的压缩是必不可少的。
BERT
语言模型
数字人
数字人:从科幻走向现实的技术革命
创建数字人需要多方面的技术支持,包括计算机图形学、动作捕捉、
语
音
合成以及人工智能算法等。
数字人
语音
ChatGPT
使用ChatGPT写出
优
质长文、文章
运用多样
化
且深入的段落结构,以吸引并维系读者的兴趣。
ChatGPT
写作
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字
化
时代,文本转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合成。
OuteTTS-0.1-350M
音频
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
然后,它可以生成听起来自然的
语
音
,以多种
语
言模仿该
语
音
,同时为用户提供对情感、口
音
、节奏和
语
调等参数的精细控制。
OpenVoice
声音克隆
开源
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100