文章列表-AI魔法学院

文章列表

17K star！30秒偷走你的声音，开源声音克隆工具

3个网站分别是：LeptonAI、MyShell和HuggingFace 当然如果你觉得自己技术能力足够，熟悉Linux, Python 和 PyTorch，并且有服务器资源，那可以自己在Linux

OpenVoice 声音克隆开源

SeaTable 一站式助力高校多场景数字化升级，打造高效解决方案

SeaTable 这个以智能表格+工作流+应用搭建为主要功能的新型一站式数字化平台，凭借其丰富的功能、灵活性和广泛的适用性，正逐渐嵌入到各类大学的日常运营环境中，已经成为了大学校园中不可或缺的数字化利器。

大模型

从声纹模型到语音合成：音频处理 AI 技术前沿 | 开源专题 No.45

· EnCodec：一种高保真度神经音频编解码器。

AudioCraft 音频

RAG 2.0来了，它能成为生产落地的福音吗？

这样的系统不仅脆弱，缺乏对特定部署领域的机器学习和专业化调整，而且对大量的提示高度依赖，这使得系统在运行过程中容易出现连锁性的误差。

RAG 大模型

Stable Diffusion

Stable Diffusion基础：ControlNet之图片高仿

; 选择 Reference 注意这个 ControlNet 只有一个预处理器，

文生图

划重点！全网最全AI数字人工具合集！

· 多样选择：包括会说话的照片、换脸器、头像生成器等。

AI 数字人

让 AI 更懂你的 Prompt 提示词宝藏网站-FlowGPT

比如我们现在要生成一个赛博朋克风的机器人，直接对 stable-diffusion-xl 说想生成一个赛博朋克风的机器人的结果是： generate: cyberpunk-style robot,

prompt 提示词 FlowGPT

clone-voice：一键克隆声音，开源AI技术让声音创作更便捷、更个性化

Mel-spectrogram是一种能够有效捕捉音频信号频谱特征的工具，它将音频信号转换为一种更适合机器学习模型处理的图像形式，成为许多语音合成模型的标准输入形式，有助于模型更好地理解和学习声音的特征。

clone-voice 声音克隆

Coze、Dify、FastGPT：哪款智能体平台最强？深度对比分析！

Coze Coze是字节跳动推出的一款AI聊天机器人开发平台，专注于低门槛和快速构建聊天机器人应用。

智能体平台对比

Stable Diffusion

99%的人都不懂的Stable Diffusion高级功能，Negative Prompt如何正确使用?

这些关键词可以被视为负向提示，因为它们可以指导生成器在生成图像时排除某些不需要的元素或特征。

Negative Prompt 文生图

实时语音克隆

该存储库是使用实时工作的声码器实现从说话者验证到多说话者文本到语音合成 (SV2TTS) 的迁移学习的实现。

语音克隆

大模型训练为什么用A100不用4090

优化器所用的内存其实也很简单，如果用最经典的 Adam 优化器，它需要用 32 位浮点来计算，否则单纯使用 16 位浮点来计算的误差太大，模型容易不收敛。

大模型

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

不需要复杂的设计如持续时间模型、文本编码器和音素对齐，能够快速训练并实现实时因素（RTF）0.15的推理速度，显著优于当前基于扩散的TTS模型。

F5-TTS 音频克隆

做自媒体消息闭塞很致命，巨好用的工具分享

编辑排版 135编辑器：网站，适合编辑公众号秀米编辑器：网站、适合公众号红薯编辑器：小程序，适合编辑小红书设计作图创客贴：小程序/网站/app都有

自媒体工具

GitHub上很火的RPA框架：一款用于验收测试和 RPA 的通用自动化框架robotframework

robotframework/robotframework 项目介绍 Robot Framework ® 是一个通用开源自动化框架，用于验收测试、验收测试驱动开发 (ATDD) 和机器人流程自动化

RPA框架自动化

<...34 35 36 373839 40 41 42 43 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1