文章列表-AI魔法学院

文章列表

RAG与Long-Context之争—没必要争

个人观点：如果类比做检索系统的话，RAG应该算作粗排，而Long-Context可以算是精排。

RAG Long-Context 大模型

构建开源多模态RAG系统

在这个新的冒险中，我们将深入研究使用开源大型语言多模态（LLMM）构建检索增强型生成（RAG）系统的过程。

RAG 大模型

Elasticsearch Relevance Engine---为AI变革提供高级搜索能力[ES向量搜索、常用配置参数]

当隐私是最重要的关注点时，将所有数据保留在组织的网络内，不仅至关重要，而且是强制性的。

大模型 AI编程

谈谈RAG存在的一些问题和避免方式

单次信息检索无法回答这类问题。

RAG 大模型

LLM每周速递！大模型最前沿：多模态RAG、RAG加速、大模型Agent、模型微调/对齐

LMU | 多模态RAG系统论文：https://arxiv.org/pdf/2410.21943 检索增强生成（RAG）主要解决的是大模型缺乏领域知识且容易产生幻觉的问题。

大模型研究

百万token上下文窗口也杀不死向量数据库？CPU笑了

“Claude 3、Gemini 1.5，是要把RAG（检索增强生成）给搞死了吗？”

向量数据库大模型 cpu

Prompt 策略：代码库 AI 助手的语义化搜索设计

第二部分，围绕于解决空间的实现，即通过检索增强（RAG，Retrieval Augmented Generation），来获得对应问题的答案。

prompt

Elasticsearch 中的向量搜索：设计背后的基本原理

HNSW 是向量搜索的热门选择，因为它相当简单，在向量搜索算法的比较基准上表现良好，并且支持增量插入。

向量数据库

GitHub狂飙3万star的LLM公开资料 - 大模型入门教程

3.2 构建向量存储创建向量存储是构建检索增强生成（RAG）管道的第一步。

LLM 大模型 GitHub

12个RAG常见痛点及解决方案

这里有2个解决方案 1、chunk_size和simility_top_k的超参数调优 chunk_size和similarity_top_k都是用于管理RAG模型中数据检索过程的效率和有效性的参数

RAG 大模型

更强的小型LLM：Zephyr-7B

这强调了即使在大规模的项目中，如LLAMA2-CHAT所见，收集细致的人类反馈对于对齐的重要性。

Zephyr-7B 大语言模型

PostgreSQL的三位一体——在大模型应用中结合关系型、向量和时间序列数据

在RAG应用中，如果行业知识文件被切分出几万个，那么使用时间过滤就会非常重要，比如我们只需要检索2023年3月份的合同文件，那么就可以用时序数据将目标chunk从几万个里面先挑出来，再进行向量计算。

大模型 PostgreSQL

对于大模型RAG技术的一些思考

这就导致了需要被向量化的文本段，其主题语义并不是那么明显，和自然形成的段落显示出显著的差距，从而给检索过程造成巨大的困难。

RAG 大模型

无限长的上下文，也干不掉的RAG

键值检索任务在键值检索任务中，模型需要从一组JSON格式的键值对中检索出与特定键相关联的值。

RAG 大模型

使用大模型自动回复小红书/抖音/快手评论：通过RAG 优化LLMs实现

在这里，我将讨论如何通过检索增强生成（即 RAG）来提高 LLM 的性能。

RAG 大模型自动回复

<...2 3 4 567 8 9 10 11 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1