文章列表-AI魔法学院

文章列表

必读！RAG好用的3种Router

目前开源了很多LLMs大模，虽然GPT4o一直占据第一位的宝座，但是并不是在每个领域都很强。

RAG Router

检索增强生成(RAG)有什么好的优化方案？

2）多模态RAG（文本+表格+图片）对多模态RAG而言，有三种技术路线[10]，见下图：图7 多模态RAG 如图7所示，对多模态RAG而言有三种技术路线，如下我们做个简要说明： ·&ensp

RAG 检索增强

开源大语言模型完整列表

VisualGLM-6B —— 多模态对话语言模型 VisualGLM-6B 是一个开源的，支持图像、中文和英文的多模态对话语言模型，语言模型基于 ChatGLM-6B，具有 62 亿参数；图像部分通过训练

开源模型大语言模型

说真的，SDXL究竟藏着多少秘密，也许没人知道

探索功能，线上部署，更新工作流……我只想告诉你，SDXL不是一个绘图模型那么简单，在它里面，隐藏着太多不为人知的秘密。

文生图

SeaTable 一站式助力高校多场景数字化升级，打造高效解决方案

已经在多所知名高等教育机构中得到应用和肯定。

大模型

AI绘画：stable difussion SD插件之无限抽卡神器 dynamic prompts（动态提示词）

今天带来抽卡神器：dynamic prompts（动态提示词）插件可以大幅提升抽卡的效率，结合前面的提示词合集让我们开启无限抽卡之旅吧！

AI图片

摆脱 OpenAI 依赖，8 分钟教你用开源生态构建全栈 AI 应用

摆脱对 OpenAI 的依赖，借助开源生态系统构建出全流程的 AI 应用，现在开始！

开源模型

GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装

然而，大多数模型在流利地切换语言、理解口语查询的细微差别以及提供高质量响应方面仍然面临挑战。

GLM-4-Voice 9B 语音安装

StableDiffusion

深度解析丨StableDiffusion在多个设计场景中的探索与应用

本文将深入解析StableDiffusion在多个设计场景中的探索与应用，尤其关注如何利用其制作多种商业落地案例。

文生图

斯坦福宣布前端开发要失业了？！一张截图生成代码，64%优于原网页！

随着生成型人工智能（AI）的飞速发展，多模态理解和代码生成的能力达到了前所未有的水平。

设计转代码大模型

Fastwhisper + Pyannote 实现 ASR + 说话者识别

whisper很变态，粤语效果也还不错，因此，如果实际业务中需要涉及到不同的语言，还是更推荐whisper多一点一、faster-whisper简单介绍 faster-whisper是使用

faster-whisper 语者识别 ASR

6.2K Star！MIT出品的多语言语音合成神器，CPU实时推理吊打商业软件！

开源TTS能有多好？

MeloTTS 语音工具

AI资讯速递 - 快人一步！为你填平AI领域信息差及时揭示AI领域的最新动态

在这个数字化转型的浪潮中，人工智能（AI）的发展速度之快，已经超出了大多数人的想象。

AI资讯 AI新闻

开源语音大语言模型来了！阿里基于Qwen-Chat提出Qwen-Audio!

然而，语言模型缺乏像人类一样感知非文本模态（如图像和音频）的能力。

大模型语音

多智能体开发框架怎么选型？京东 JoyAgent vs langchain LangGraph，两种Agent开发哲学的碰撞!

Agent调度模型：项目经理 vs 自由导演 🧠 这是多智能体框架的“大脑”，决定了Agent们如何思考和协作。

JoyAgent langchain LangGraph

<1 2 345 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1