文章列表-AI魔法学院

文章列表

如何提高RAG 的效果

下面笔者会根据实践的经验和收集到的信息进行汇总并记录下来。

RAG 大模型

深度｜红杉重磅发布：2024 AI 50 榜单 (全网最全)

总体而言，这类公司也增加了一倍，从三家增加到六家。

生成式AI 榜单 AI应用

RAGFlow：开源的RAG引擎，专注于深入的文档理解，支持处理各种复杂格式的非结构化数据

该项目提供了一个简化的RAG工作流，适用于各种规模的企业，通过结合使用大型语言模型（LLM）来提供基于严谨引用的真实问答能力。

RAGFlow RAG 开源

世界上最流行（github排名高）的开源移动机器人的操作系统ROS开源了！！

总的来说，TurtleBot3是一款功能强大、灵活多变的移动机器人，适用于教育、研究、产品原型和爱好应用等多种场景。

ROS 机器人开源模型

终于不用加班了！50个Claude 2高级Prompts让工作逆天提效

忙碌的你，深夜加班是日常，业绩完成却总想不开？

提示词

俄罗斯人开源了最大的文生图模型：参数量12B，比SDXL大了3倍多！

Kandinsky 2.2之后，俄罗斯AI研究团队AI Forever又开源了新的文生图模型Kandinsky-3，这个模型最特别之处时采用了一个超大的text encoder（参数量为8.6B），导致模型总参数达到了

Kandinsky-3 文生图开源模型

微软打破Decoder-Only架构！大幅降低GPU内存需求，网友：把Llama3 70B弄20GB GPU上运行

总的来说，自解码器和交叉解码器的模块设计与Transformer的解码器层类似，包含交错注意力和前馈网络子层。

Decoder-Decoder YOCO 架构

斯坦福宣布前端开发要失业了？！一张截图生成代码，64%优于原网页！

对模型进行了微调，以提高其在我们基准测试中的性能，并与商业API模型进行了比较。

设计转代码大模型

【上篇】深度解析AI大语言模型（LLM）在企业应用的关键技术与典型架构

§ 输出侧：强大的自然语言生成能力大语言模型则在语义理解的基础上，具备了强大的自然语言推理、决策与生成能力，具体表现在文本内容的总结、归纳、整理、对比、摘要、转换、创作、分析等能力与行为

大语言模型

保姆级教程：Coze 打工你躺平

最近在玩 Coze/扣子发现这事无需代码，人人都行比如，链接丢过去，工作结束，下班！

Coze 教程

来个优秀的开源人脸识别项目！

生物识别技术是一种利用人体自身特征进行身份认证的技术。

人脸识别开源项目

OCR终结了？旷视提出可以文档级OCR的多模态大模型框架Vary，支持中英文，已开源！

以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次，只需一句话命令，多模态大模型 Vary 直接端到端输出结果：无论是中英文的大段文字

OCR 手写文字识别

Sora懂不懂物理世界？

我们真实的视频是会体现真实世界的物理规律，以航行为例这意味着 AI 需要考虑到重力、浮力、碰撞以及船体结构在动态环境中的行为。

文生视频视频生成 sora

揭秘DeepSeek:一个更极致的中国技术理想主义故事

中国的7家大模型创业公司中，DeepSeek（深度求索）最不声不响，但它又总能以出其不意的方式被人记住。

DeepSeek 大模型

华为盘古画画3.0发布 | PanGu-Draw：业界最大的中文文生图模型，效果YYDS！

如图1(c)所示，结构生成器负责在较大的时间步长范围内进行早期去噪，特别是在, 其中;这个阶段的重点是建立图像的基本轮廓。

PanGu-Draw 文生图

<...9 10 11 121314 15 16 17 18 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1