文章列表-AI魔法学院

文章列表

国内首个！最火的MoE大模型APP来了，免费下载，人人可玩

而且还会分析面相？

MoE大模型 APPa

宁德核电推出全球参数量最大的核工业大模型｜InfoQ 独家

使用 agent 自主检索技术，实现适配核电系统的高效智能 2.

宁德核电大模型

PPT又又有新突破了！智谱AI代码流造PPT

智能体工作流：从需求到成片的“大脑” 自动规划逻辑链 markdown 输入：“生成Z世代消费趋势报告” 它会自动拆分「现象→数据→

PPT 制作 AI

我去，找到一个Github上非常优秀的AI项目，可控制鼠标、键盘，模拟人类操作，太丝滑，收藏～～～

Office、图像/视频编辑工具）多模态输入：以截图为输入，支持键盘鼠标操作输出自主能力：内置“认知反思+技能更新”模块，能不断自我优化模块化设计：兼顾高可控性和扩展性，轻松适配新环境

AI Agent 开源项目

用so-vits-svc-4.1进行音色转换的极简教程

如果是歌声的话，还需要使用特别软件进行人声分离，将伴奏声和人物干声分离，然后再对干声训练得到ta的声音模型。

声音 sovits

OpenAI 上线新功能力捧 RAG，开发者真的不需要向量数据库了？

它能够帮助开发者分担繁重的工作，并构建高质量的 AI 应用。

RAG 检索向量库

LangChain + ChatGLM2-6B 搭建私域专属知识库

总的来说，看起来效果还不错，下面跟着树先生一起来试试水~ 本文我将分 3 步带着大家一起实操一遍，并与之前 ChatGLM-6B 进行对比。

知识库

从声纹模型到语音合成：音频处理 AI 技术前沿 | 开源专题 No.45

7.2k License: Apache-2.0 ESPnet 是一个端到端的语音处理工具包，涵盖了端到端语音识别、文本转语音、语音翻译、语音增强、说话人分离等功能

AudioCraft 音频

大模型：泛化即智能，压缩即一切！

Ilya Sutskever 提出可以通过学习数据中的数学结构，即通过分布匹配来实现这一目标。

泛化大模型

FaceSwapLab，截止2023年8月最好用的一键换脸工具

基于该插件，在AI绘画的时候，可以很好的实现用一张人脸照片一键换脸，不过这个工具的缺点是部分照片不太像，需要生成较多的照片，才能找到比较合适的。

一键换脸

你要牢记的四个常用AI提示词框架：ICIO、CRISPE、BROKE、RASCEF，有助于获取更加稳定和高质量的内容

项目管理与协作：当用户需要 AI 帮助管理项目、分配任务或协调团队合作时，BROKE 框架可以提供明确的背景、角色和目标，确保项目的成功执行

大模型提示词

比GPT-4快18倍，世界最快大模型Groq登场！每秒500 token破纪录，自研LPU是英伟达GPU 10倍

实际上，搜索占据了超过四分之三的处理时间，而非内容的生成！

Groq 大模型

Fooocus更新了2.3

在高级设置里调试工具下面多了几个选项，比较常用的就是设置是否随机通配符。

fooocus 文生图

【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能！效果炸裂！手把手带你理论+实战部署推理!

高性能：与 Whisper-small(已开源) 和 Whisper-large 相比，SenseVoice-Small 的性能分别快 5 倍和 15 倍以上。

asr tts 声音

体验完阿里的EMO模型，我emo了

00:12 四、全民唱演体验全民舞王利用的是一种口唇同步的技术，这是一种让画面人物的口型与所配的语音或文字信息精确匹配的技术

EMO 文生图

<...34 35 36 373839 40 41 42 43 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1