训练魔法-AI魔法学院

dsq是一款强大的SQL分析工具，支持Excel、JSON、CSV等本地文件格式，使用标准SQL语法进行查询、分析和处理，功能全面且性能卓越，在GitHub上获得近3.5k星标。项目开源免费，安装简便，支持正则表达式、缓存、函数和脚本等高级功能，可通过命令行轻松使用，适用于各种数据处理场景。

dsq 开源项目 SQL 2024-07-16

RAG

24年首篇离奇论文：加点噪声，RAG效果翻倍？！

本文探讨了基于检索增强的语言模型（RAG）系统中信息检索组件对性能的影响。研究发现，包括不相关文档反而能提高系统准确性，强调整合检索与生成模型的重要性。通过密集检索和基于语言模型的生成器，RAG框架解决了复杂查询问题，实验表明，正确放置无关文档能提高准确率，为优化RAG系统提供了新见解。该研究为进一步发展信息检索技术以适应生成组件提供了基础。

RAG 检索论文 2024-07-15

【AI代理】扣子，开始探索多代理模式

文章总结：代理模式可增强大模型功能并规避其弱点。多代理模式则通过分配任务给多个机器人或模型，实现更精细化和准确化的处理。扣子智能体系统已上线多代理模式，并允许通过角色设定和全局跳转条件等方式优化用户体验和任务处理。多代理模式在丰富场景和精细化处理上展现出巨大潜力。

多代理模式大模型 2024-07-15

【AI代理】多代理模式之多任务分配&信息传递

文章总结了通过代理模式探索多任务分配和代理间信息传递的过程。设置了四个角色代理，包括一个总代理和三个负责不同任务的代理（刘备、关羽、张飞）。通过任务分配和代理间信息传递，模拟了群体会话场景，展示了无信息依赖和有信息依赖的多任务处理。强调了代理模式在模型差异化情况下的优势，并探讨了专用模型调优的可能性。

多任务模式分配传递 2024-07-15

Transformer

图解 Transformer——功能概览

文章简要介绍了Transformer架构在自然语言处理（NLP）领域的革命性影响。Transformer利用注意力机制显著提高了深度学习NLP模型的性能，特别是翻译模型。它改变了从序列建模的传统方法到更高效、能捕捉复杂语言模式的新框架。Transformer由编码器和解码器堆栈组成，通过自注意力和编码器-解码器注意力机制处理输入和输出序列。文章还详细解释了Transformer的训练和推理过程，包括Teacher Forcing技术，并指出了Transformer在处理长距离依赖和并行计算方面的优势，相较于RNN和CNN架构。Transformer已广泛应用于各种NLP任务，如机器翻译、文本摘要、情感分析等。

Transformer 大模型图解 2024-07-12

腾讯

为什么说腾讯22年前的这份神级PPT是立项汇报的天花板？

文章深入分析了腾讯早期一份极具价值的PPT《Avatar Business Plan》，这份PPT不仅成功推动了QQ秀业务的诞生，也展现了作者许良敏锐的市场洞察力、严谨的逻辑思考力和强大的执行力。PPT虽朴素但充满说服力，通过数据、逻辑、落地和细节的完整呈现，成为立项汇报的典范。文章还强调了成功项目背后多因素的综合作用，以及个人奋斗与历史进程的关联，进一步丰富了PPT的价值解读。

PPT 腾讯立项汇报 2024-07-12

大模型

中国大模型融资暗战：罗曼蒂克的快速消亡

本文概述了中国大模型创业公司之间的资本竞争和融资动态。月之暗面突然获得超10亿美元（后修正为8亿美元）融资，成为市场焦点，同时揭示了阿里在大模型投资上的积极策略。文章还对比了月之暗面与MiniMax两家公司的融资历程、背后关键人物、以及各自的商业模式和战略选择。此外，讨论了AI投资市场的整体趋势，包括风投机构的参与减少、巨头主导时代的到来、以及大模型创业公司商业化挑战等问题。最后，文章引用投资人的观点，预测了大模型公司投资回报的潜在路径和退出时点的可能性。

大模型暗战 2024-07-12

我如何夺冠新加坡首届 GPT-4 提示工程大赛 [译]

由新加坡政府科技局（GovTech）组织的首届 GPT-4 提示工程大赛冠军 Sheila Teo 写的《我是如何夺冠新加坡首届 GPT-4 提示工程大赛的》 Sheila 总结了 4 种提示词技巧

GPT-4 提示词 2024-07-11

RAG

无限长的上下文，也干不掉的RAG

本文《Lost in the Middle: How Language Models Use Long Contexts》通过实验探讨了语言模型在处理长文本上下文时的性能，发现模型性能会随着相关信息在上下文中的位置变化而显著下降，尤其是在需要从长上下文中间提取信息时。研究还探讨了模型架构、查询感知上下文化和指令微调的影响，并通过开放域问答案例研究提供了对现有语言模型使用长上下文的理解。这些发现对于未来长上下文模型的评估和改进具有重要意义。

RAG 大模型 2024-07-11

LLM

自己电脑上跑大语言模型（LLM）要多少内存？

文章总结了本地电脑上运行大型语言模型(LLM)时需要考虑的关键因素，包括模型名称解读（模型名+参数量）、模型精度（full precision、half precision等）、模型文件大小的计算（参数量与精度的关系）、内存需求（推断与训练时所需不同）、内存、显存与硬盘的使用情况，以及如何选择适合的模型。建议普通用户选择能跑的最大的4bit模型，并根据实际情况估算所需内存。

大语言模型运行 2024-07-11

一旦参透「第一性原理」，便洞悉所有事的本质

文章总结：第一性原理是一种深度分析的思维方式，它要求我们跳出传统思维的框架，回到问题的最基础、最核心的部分，忽略既有的假设和“常识”，从而找到创新的解决方案。要培养第一性原理思维，需学会识别和质疑现有假设，拆解问题到最基本的元素，并从根本上重新构建解决方案。通过实践如挑战权威、拆解问题、重构框架和迭代实验等步骤，我们可以提高问题解决能力。文章通过咖啡店销量下降和特斯拉电动汽车创新两个案例，展示了第一性原理在日常生活和工作中的应用及其重要性，强调了这种思维方式在创新和发展中的价值。

第一性原理大模型 2024-07-10

教程

AI声音克隆 | 最全最简教程（权威版）

本文介绍了声音克隆技术，特别是GPT-SoVITS和Bert-VITS2两个开源项目，它们分别适用于快速实现声音克隆和追求更高质量的语音合成。GPT-SoVITS因其快速训练时间和跨语言能力受到推荐，并提供了详细的教程指导如何在OpenBayes平台上使用该项目克隆声音。文章还强调了数据集质量对生成结果的重要性，并以李雪健老师的声音为例，展示了克隆声音的效果。整体而言，本文为声音克隆技术的初学者提供了一个实用且易懂的入门指南。

声音克隆教程 2024-07-10

大模型

大模型落地“诸神之战”，场景玩家先杀出重围了

今年，大模型技术在多个领域展现出惊人落地速度，特别是在家居家电行业，已能实现快速生成精美家居效果图和种草视频。这一进步得益于定制化的家居家电大模型，它融合了自然语义、视觉和视频大模型，并吸收了专业设计师的家居布置案例和家装流行色搭配数据，确保了生成内容的自然美观。该技术已帮助美的、TCL等品牌提高营销效率，降低了成本。此外，AI营销产品如“来客易”、“森易销”和“森生万物”等，分别解决了线下门店引流、线上电商运营和品牌内容管理等问题，展现了AI在营销领域的巨大潜力。这些案例表明，拥有丰富行业经验和数据的场景玩家正在快速崛起，推动AI技术在更多领域实现落地应用。

大模型文生图 2024-07-10

开源

RAGFlow是一个基于深度文档理解的开源RAG（检索增强生成）引擎，旨在通过整合检索到的信息和大型语言模型（LLM）来提升回答的质量和准确性。它支持多种文件类型，具有智能解析、可视化处理和可解释性等特点，允许用户轻松上传、管理和查询文档。RAGFlow不仅提高了知识库RAG的召回率，还提供了易于集成的API，适用于各类企业系统。此外，RAGFlow持续更新，集成新的模型和功能，以满足不同需求。部署RAGFlow需要一定的系统配置，包括Docker和适当的硬件资源。

OCR RAG 开源 2024-07-09

开源

6个最佳开源TTS引擎

本文总结了多个优秀的开源文本到语音（TTS）引擎，这些引擎基于深度学习或传统技术，支持多种语言，包括中文。文章列举的引擎如CoQuiTTS、mozillaTTS、OpenTTS、MaryTTS、eSpeak、Mimic、CMU Flite TTS、MBROLA、mandarin-tts、FCH-TTS和rhasspypiper等，各自具有独特的功能和优势，适用于不同的应用场景，如帮助视觉障碍者理解文本、在车辆中播报文本信息、模拟人声、虚拟主播和歌手等。这些开源项目有助于提升TTS技术的发展和应用。

TTS引擎开源模型 2024-07-09