文章列表-AI魔法学院

文章列表

【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能！效果炸裂！手把手带你理论+实战部署推理!

, '日语男', '粤语女', '英文女', '英文男', '韩语女'; 运行结果:对应合成的音频效果展示: sft_中文女代码合成,z先生的备忘录,31秒粤语女声案例展示

asr tts 声音

关于AI声音生成的一切（语音+音乐+嘴型）

2D/3D/视频生成最近都有很多值得关注的工具，但是要输出完整的AIGC作品，肯定少不了声音。

声音

AI拟声: 5秒内克隆您的声音

你可以使用它来录制自己朗读的课文或常用单词，然后反复听取以加深记忆和练习口语。

声音克隆开源

我去，找到一个Github上非常优秀的AI项目，可控制鼠标、键盘，模拟人类操作，太丝滑，收藏～～～

通用目标：支持任意本地软件（如游戏、Office、图像/视频编辑工具）多模态输入：以截图为输入，支持键盘鼠标操作输出自主能力：内置“认知反思+技能更新”模块，能不断自我优化模块化设计

AI Agent 开源项目

划重点！全网最全AI数字人工具合集！

· 选择语音：输入文字或录制语音，让数字人“说出”你想让他/她表达的内容。

AI 数字人

Stable Diffusion

回来啦｜ Stable Diffusion 图片背景完美替换

在广告产品图、头像背景替换、图片后期处理等场景下用到的都很频繁。

Stable Diffusion 文生图

TTS它又来了！OpenVoice：一款借鉴于TTS实现的强大的AI语音克隆工具！

其核心功能是通过提供发言者的短音频片段（参考语音），实现声音的高效克隆。

tts 文本转语音

「语音转换新速度」— 探秘Whisper JAX的70倍速提升

这意味着它能够同时处理多个音频片段，大幅缩短了从语音到文本的转换时间。

Whisper 语音识别

AI生成卡通人物项目|VToonify

在本文中，我们通过引入一种新颖的 VToonify 框架来研究具有挑战性的可控高分辨率肖像视频风格转移。

AI生成卡通人物 VToonify

Roop升级版FaceFusion换脸AI技术使用以及部署教程

首先我们需要确认一个工作目录，用来存放facefusion的相关环境依赖文件。

FaceFusion 教程

换脸软件 FaceFusion 保姆级教程

FaceFusion 是由 Roop 项目的核心开发者独立发布的，它被官方描述为下一代的人脸交换和增强软件，这个软件可以用于处理图片和视频，可以运行在 GPU 和 CPU 下面。

FaceFusion 教程

从零开始学习大模型-第二章-大模型学习路线

随着技术的进步，大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及视频。

大模型学习

用so-vits-svc-4.1进行音色转换的极简教程

其实歌声转换不仅仅适用于歌声，普通讲话也可以，只是歌唱的音调基本能覆盖到低、中、高全域声音类型，而正常说话可能无法做到全域覆盖，但是如果在录制声音的时候能够做到覆盖多种音调类型，也可以实现声音转换。

声音 sovits

金融行业的AIGC应用

在面向企业的应用中，其在风险评估和信用分析方面能够深度解析财务报告和信用记录，助力精确评估信用风险。

金融大模型

精通百种语言的翻译AI来了！Meta推出，免费、开源！

这个模型可以实现近101种语言之间的文本、音频、视频等多种形式的翻译，而且只需要一个模型就可以完成所有任务。

大语言模型

<...6 7 8 91011 12 13 14 15 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1