文章列表-AI魔法学院

文章列表

惊艳！2.77亿参数锻造出Agent+GPT-4V模型组合，领航AI领航机器人、游戏、医疗革新，通用智能时代你准备好了吗？

这个框架利用深度学习和多模态输入（如文本、图像和动作）来训练一个智能体，使其能够在不同的环境中执行任务。

Agent+GPT-4V 大模型

大模型训练工程那些事

从而进一步指导实验管理、数据管线、算力规划、效果评估、训练框架、模型设计等。

训练工程大模型

语言大模型100K上下文窗口的秘诀

处理大型上下文长度时，原始Transformer架构的主要局限性是什么？

大模型

「Agent」通俗易懂地聊聊AI Agent（附66个开源+44个闭源Agent项目）

https://cal.ai/ 18.Camel 大规模语言模型社会“心灵”探索的代理架构。

大模型

谈谈LLM在推荐域的渗透，探索推荐新范式

现状推荐系统推荐系统发展了这么多年，只要是做过推荐系统的下面的架构大家已经耳熟能详了。

大模型

关于GPT-4在变笨，有人写了篇论文证实了这一点

后者则是逐渐变成了一个Twitter热门传说，大家讨论它的热情堪比对GPT4模型结构的全力揣测，以至于OpenAI的产品副总裁都公开说，不！

大模型

会“追问”的Agent，大模型知识库另类实践

但在提升回答的准确度方面，该方案存在一些致命的缺陷，通过分解Langchain的架构，我们可以看到（图2）：图2: Langchain + Vectorstore + LLMs 首先，在第2步

大模型

《嬛嬛朕emo啦》但马斯克！阿里这项技术开放试玩

通过使用这些弱条件，EMO框架能够在保持角色身份一致性的同时，生成具有丰富表情和自然头部运动的视频，从而在表达性和逼真度方面取得更好的效果。

音频阿里

如何使用 Megatron-LM 训练语言模型

在进入训练细节的讲解之前，让我们首先了解是什么让这个框架比其他框架更高效。

开源模型

震撼科技界：清华大学与智谱AI联手，引领中文长文智能写作新纪元！

这一进步得益于创新的数据构建技术、独到的模型训练方法以及严谨的评估流程，为AI在长篇文本创作领域的应用开辟了新天地。

写作长文本

基于Ollama本地部署Llama3指南！

模型架构 Llama 3 是一个自回归语言模型（an auto-regressive language），它使用优化的 transformer 架构。

LLama3 ollama

24年首篇离奇论文：加点噪声，RAG效果翻倍？

论文方法方法描述本文介绍了使用RAG（Retrieve and Generate）框架来解决开放域问答问题的方法。

RAG 检索增强

baichuan2 有什么好的深挖论文中涉及的知识点

在下面的章节中，将详细介绍对 vanilla Transformer 架构和训练方法所做的详细修改。

大模型

如何最简单、通俗地理解Transformer？

Transformer 架构内部应用的注意力称为自注意力（self-attention）。

Transformer 大模型

最新最全的开源中文大语言模型列表

ChatRWKV：地址：https://github.com/BlinkDL/ChatRWKV 简介：开源了一系列基于RWKV架构的Chat模型（包括英文和中文

大模型

<...15 16 17 181920 21 22 23 24 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1