开源大模型专栏-AI魔法学院

开源大模型专栏

微调大型语言模型-核心思想和方法介绍

在快速发展的人工智能领域，高效且有效地利用大型语言模型 (LLM) 变得越来越重要。但是我们可以通过许多不同的方式使用大型语言模型，如果您刚开始，这可能会让人不知所措。本质上，我们可以通过两种主要方式将预训练的大型语言模型用于新任务：上下文学习（in-context learning）和微调（finetuning）。在本文中，我们将简要介绍in-context learning的含义，然后我们将介绍微调 LLM 的各种方法。

大模型训练 2023-07-18

人工智能大语言模型微调技术：SFT 、LoRA 、Freeze 监督微调方法

在快速发展的人工智能领域，高效且有效地利用大型语言模型 (LLM) 变得越来越重要。但是我们可以通过许多不同的方式使用大型语言模型，如果您刚开始，这可能会让人不知所措。本质上，我们可以通过两种主要方式将预训练的大型语言模型用于新任务：上下文学习（in-context learning）和微调（finetuning）。在本文中，我们将介绍介绍微调 LLM 的各种方法。

大模型微调 2023-07-18

LLM大模型推理输出生成方式总结

大模型在输出结果时，会有多种方式和算法，本文列举其中几种算法，包括贪心算法、n贪心搜索/采样（greedy search/sampling）、集束搜索（beam search）、TopK采样等

大模型 2023-07-17

谈谈LLM在推荐域的渗透，探索推荐新范式

搜索慢慢的被大模型渗透，那么很自然很多人想到了推荐，但是推荐是不是真的可以被大模型渗透呢？大模型能改变推荐的范式吗？

大模型 2023-07-17

LangChain + ChatGLM2-6B 搭建私域专属知识库

最近，智谱 AI 研发团队又推出了 ChatGLM 系列的新模型 ChatGLM2-6B，是开源中英双语对话模型 ChatGLM-6B 的第二代版本，性能更强悍。本文就基于ChatGLM和Langchain搭建一个私域专属知识库

知识库 2023-07-16

如何用大语言模型构建一个知识问答系统

传统搜索系统基于关键字匹配，在面向：游戏攻略、技术图谱、知识库等业务场景时，缺少对用户问题理解和答案二次处理能力。本文探索使用大语言模型（Large Language Model, LLM），通过其对自然语言理解和生成的能力，揣摩用户意图，并对原始知识点进行汇总、整合，生成更贴切的答案。关于基本思路，验证效果和扩展方向，可以参考正文的介绍。

知识库 2023-07-14

【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践

主流的开源大语言模型主要有三个：LLaMA、ChatGLM和BLOOM。基于这三个开源模型，业界进行了指令微调或强化学习，衍生出了许多不同的大模型。下面从训练数据、tokenizer和模型结构上对这三个大语言模型进行比较。

大模型微调训练 2023-07-13

微调、训练大模型概念介绍及论文笔记：Tuning系列论文笔记

微调、训练大模型概念介绍及论文笔记：Tuning系列论文笔记

训练微调 2023-07-12

真格基金大模型能力测试问题集---垂直能力篇

我们的目标并不是提供一个学术上非常严谨完整的测试集，而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例，以及大模型出现之后学术界发现的涌现和顿悟能力，提供一个适合非技术专业人士使用的大模型能力测试集。

中文训练大模型 2023-06-28

真格基金大模型能力测试问题集---进阶篇

我们的出发点是尽量覆盖更多类型的 NLP 任务。我们的目标并不是提供一个学术上非常严谨完整的测试集，而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例，以及大模型出现之后学术界发现的涌现和顿悟能力，提供一个适合非技术专业人士使用的大模型能力测试集。

中文评测大模型 2023-06-28

真格基金大模型能力测试问题集---基础篇

我们的目标并不是提供一个学术上非常严谨完整的测试集，而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例，以及大模型出现之后学术界发现的涌现和顿悟能力，提供一个适合非技术专业人士使用的大模型能力测试集。

大模型训练中文 2023-06-28

LangChain手册（Python版）11模块：提示模板

语言模型将文本作为输入——该文本通常被称为提示。通常这不是简单的硬编码字符串，而是模板、一些示例和用户输入的组合。LangChain 提供了几个类和函数来简化提示的构建和使用。

大模型 2023-06-16

一文讲明白什么是预训练、微调和上下文学习

最近语言模型在自然语言理解和生成方面取得了显著进展。这些模型通过预训练、微调和上下文学习的组合来学习。在本文中将深入研究这三种主要方法，了解它们之间的差异，并探讨它们如何有助于语言模型的学习过程。

大模型训练 2023-06-14

企业如何更好的使用大模型？都有哪些框架和方案

原文标题：几分钟开发 AI 应用成为可能，为什么说大模型中间件是 AI 必备软件？

人工智能大模型 2023-06-13

图片拖拽神器DragGAN介绍及官方安装文档说明

拖放图像编辑是一项功能强大的技术，它涉及训练生成模型来根据用户提供的指令转换图像。该技术的一个流行实现是拖放生成器(DragGAN)，这是一个深度学习模型，当用户将图像拖放到基于web的界面中时，它可以将图像转换为另一个图像。

开源 2023-06-04

<1 2 3 456 >

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1