首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· ChatGLM智谱清言
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 大模型的研究新方向:混合专家模型(MoE)
· 我去华强北走了一圈,发现这里正被另一种 AI 包围
· 还在手写Prompt?这几大网站让你秒找大模型提示词!
· SD入门教程二:文生图基础用法(提示词)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
6个最佳开源TTS引擎
· 它带有两个合成
器
:eSpeakinG合成
器
,通过声音添加技术转换元音和响亮的辅音,以完成声音。
TTS引擎
开源模型
Github
GitHub上的RPA小工具,可以将重复、繁琐的任务自动化
Pyperclip 另一个神
器
:管理剪贴板内容 Pyperclip是一个Python库,它提供了一个简单的接口来访问剪贴板功能,使开发者能够在Python程序中轻松地读取和写入剪贴板内容
RPA
自动化
ChatGPT
数学能力超ChatGPT,70B开源大模型火了:用AI微调AI,微软全华班出品
具体而言,Evol Instruction分为指令进化
器
和指令消除
器
。
开源模型
Deepseek-V2技术报告解读!全网最细!
另外,Deepseek-V2结合算法和工程,提出了资源感知专家负载均衡的方法,保证了专家并行的几个机
器
雨露均沾,不会出现有些机
器
空转,有些机
器
过度占用的情况。
Deepseek-V2
大模型
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
语音语义表示编解码
器
:将语音转换为语义标记。
MaskGCT
声音克隆
RAG
RAG 2.0来了,它能成为生产落地的福音吗?
这样的系统不仅脆弱,缺乏对特定部署领域的机
器
学习和专业化调整,而且对大量的提示高度依赖,这使得系统在运行过程中容易出现连锁性的误差。
RAG
大模型
大模型
预训练对话大模型深度解读
开源地址:github.com/microsoft/D… 3.2 Meena 由谷歌研发,基于编码
器
-解码
器
的模型结构,参数量2.6B,预训练数据341GB。
开源
17K star!30秒偷走你的声音,开源声音克隆工具
3个网站分别是:LeptonAI、MyShell和HuggingFace 当然如果你觉得自己技术能力足够,熟悉Linux, Python 和 PyTorch,并且有服务
器
资源,那可以自己在Linux
OpenVoice
声音克隆
开源
SDXL
【分享】SDXL模型最佳拍档!COMFY UI上手指南
然后,安装插件管理
器
,安装必要插件,最后导入工作流。
大模型
大模型
大模型训练为什么用A100不用4090
优化
器
所用的内存其实也很简单,如果用最经典的 Adam 优化
器
,它需要用 32 位浮点来计算,否则单纯使用 16 位浮点来计算的误差太大,模型容易不收敛。
大模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
不需要复杂的设计如持续时间模型、文本编码
器
和音素对齐,能够快速训练并实现实时因素(RTF)0.15的推理速度,显著优于当前基于扩散的TTS模型。
F5-TTS
音频克隆
工具
做自媒体消息闭塞很致命,巨好用的工具分享
编辑排版 135编辑
器
:网站,适合编辑公众号 秀米编辑
器
:网站、适合公众号 红薯编辑
器
:小程序,适合编辑小红书 设计作图 创客贴:小程序/网站/app都有
自媒体
工具
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
· EnCodec:一种高保真度神经音频编解码
器
。
AudioCraft
音频
Prompt
让 AI 更懂你的 Prompt 提示词宝藏网站-FlowGPT
比如我们现在要生成一个赛博朋克风的机
器
人,直接对 stable-diffusion-xl 说想生成一个赛博朋克风的机
器
人的结果是: generate: cyberpunk-style robot,
prompt
提示词
FlowGPT
开源
clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
Mel-spectrogram是一种能够有效捕捉音频信号频谱特征的工具,它将音频信号转换为一种更适合机
器
学习模型处理的图像形式,成为许多语音合成模型的标准输入形式,有助于模型更好地理解和学习声音的特征。
clone-voice
声音克隆
<
...
33
34
35
36
37
38
39
40
41
42
...
>
1
2
4
5
6
7
8
9
100