首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· PymuPDF4llm:PDF 提取的革命
· 高效选择:Ollama与LM Studio深度对比
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 最佳开源文生图大模型可图:安装与批量出图的完整教程
· 十大开源语音识别项目
· 5个最佳开源RPA框架
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
17K star!30秒偷走你的声音,开源声音克隆工具
3个网站分别是:LeptonAI、MyShell和HuggingFace 当然如果你觉得自己技术能力足够,熟悉Linux, Python 和 PyTorch,并且有服务
器
资源,那可以自己在Linux
OpenVoice
声音克隆
开源
SeaTable 一站式助力高校多场景数字化升级,打造高效解决方案
SeaTable 这个以智能表格+工作流+应用搭建为主要功能的新型一站式数字化平台,凭借其丰富的功能、灵活性和广泛的适用性,正逐渐嵌入到各类大学的日常运营环境中,已经成为了大学校园中不可或缺的数字化利
器
。
大模型
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
· EnCodec:一种高保真度神经音频编解码
器
。
AudioCraft
音频
RAG
RAG 2.0来了,它能成为生产落地的福音吗?
这样的系统不仅脆弱,缺乏对特定部署领域的机
器
学习和专业化调整,而且对大量的提示高度依赖,这使得系统在运行过程中容易出现连锁性的误差。
RAG
大模型
Stable Diffusion
Stable Diffusion基础:ControlNet之图片高仿
; 选择 Reference 注意这个 ControlNet 只有一个预处理
器
,
文生图
数字人
划重点!全网最全AI数字人工具合集!
· 多样选择:包括会说话的照片、换脸
器
、头像生成
器
等。
AI
数字人
Prompt
让 AI 更懂你的 Prompt 提示词宝藏网站-FlowGPT
比如我们现在要生成一个赛博朋克风的机
器
人,直接对 stable-diffusion-xl 说想生成一个赛博朋克风的机
器
人的结果是: generate: cyberpunk-style robot,
prompt
提示词
FlowGPT
开源
clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
Mel-spectrogram是一种能够有效捕捉音频信号频谱特征的工具,它将音频信号转换为一种更适合机
器
学习模型处理的图像形式,成为许多语音合成模型的标准输入形式,有助于模型更好地理解和学习声音的特征。
clone-voice
声音克隆
Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
Coze Coze是字节跳动推出的一款AI聊天机
器
人开发平台,专注于低门槛和快速构建聊天机
器
人应用。
智能体平台
对比
Stable Diffusion
99%的人都不懂的Stable Diffusion高级功能,Negative Prompt如何正确使用?
这些关键词可以被视为负向提示,因为它们可以指导生成
器
在生成图像时排除某些不需要的元素或特征。
Negative
Prompt
文生图
语音
实时语音克隆
该存储库是使用实时工作的声码
器
实现从说话者验证到多说话者文本到语音合成 (SV2TTS) 的迁移学习的实现。
语音
克隆
大模型
大模型训练为什么用A100不用4090
优化
器
所用的内存其实也很简单,如果用最经典的 Adam 优化
器
,它需要用 32 位浮点来计算,否则单纯使用 16 位浮点来计算的误差太大,模型容易不收敛。
大模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
不需要复杂的设计如持续时间模型、文本编码
器
和音素对齐,能够快速训练并实现实时因素(RTF)0.15的推理速度,显著优于当前基于扩散的TTS模型。
F5-TTS
音频克隆
工具
做自媒体消息闭塞很致命,巨好用的工具分享
编辑排版 135编辑
器
:网站,适合编辑公众号 秀米编辑
器
:网站、适合公众号 红薯编辑
器
:小程序,适合编辑小红书 设计作图 创客贴:小程序/网站/app都有
自媒体
工具
Github
GitHub上很火的RPA框架:一款用于验收测试和 RPA 的通用自动化框架robotframework
robotframework/robotframework 项目介绍 Robot Framework ® 是一个通用开源自动化框架,用于验收测试、验收测试驱动开发 (ATDD) 和机
器
人流程自动化
RPA框架
自动化
<
...
34
35
36
37
38
39
40
41
42
43
...
>
1
2
4
5
6
7
8
9
100