首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 人工智能训练的灾难性遗忘以及解决方案
· SoFlu软件机器人
· AI时代,如何利用ChatGPT一分钟洗稿一篇文章?
· SD入门教程二:文生图基础用法(提示词)
· 垂直领域大模型的思考
· 微信为什么使用 SQLite 保存聊天记录!
· ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
· 令人惊艳的开源图标生成AI模型:ChartLlama (南洋理&腾讯)
· 惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
· 深入探讨:Agent全自动写作长篇小说技术原理解析
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
开源大模型专栏
微调
微调大型语言模型-核心思想和方法介绍
在快速发展的人工智能领域,高效且有效地利用大型语言模型 (LLM) 变得越来越重要。但是我们可以通过许多不同的方式使用大型语言模型,如果您刚开始,这可能会让人不知所措。本质上,我们可以通过两种主要方式将预训练的大型语言模型用于新任务:上下文学习(in-context learning)和微调(finetuning)。在本文中,我们将简要介绍in-context learning的含义,然后我们将介绍微调 LLM 的各种方法。
大模型
训练
2023-07-18
2023-07-18
人工智能
人工智能大语言模型微调技术:SFT 、LoRA 、Freeze 监督微调方法
在快速发展的人工智能领域,高效且有效地利用大型语言模型 (LLM) 变得越来越重要。但是我们可以通过许多不同的方式使用大型语言模型,如果您刚开始,这可能会让人不知所措。本质上,我们可以通过两种主要方式将预训练的大型语言模型用于新任务:上下文学习(in-context learning)和微调(finetuning)。在本文中,我们将介绍介绍微调 LLM 的各种方法。
大模型
微调
2023-07-18
2023-07-18
大模型
LLM大模型推理输出生成方式总结
大模型在输出结果时,会有多种方式和算法,本文列举其中几种算法,包括贪心算法、n贪心搜索/采样(greedy search/sampling)、集束搜索(beam search)、TopK采样等
大模型
2023-07-17
2023-07-17
LLM
谈谈LLM在推荐域的渗透,探索推荐新范式
搜索慢慢的被大模型渗透,那么很自然很多人想到了推荐,但是推荐是不是真的可以被大模型渗透呢?大模型能改变推荐的范式吗?
大模型
2023-07-17
2023-07-17
ChatGLM
LangChain + ChatGLM2-6B 搭建私域专属知识库
最近,智谱 AI 研发团队又推出了 ChatGLM 系列的新模型 ChatGLM2-6B,是开源中英双语对话模型 ChatGLM-6B 的第二代版本,性能更强悍。本文就基于ChatGLM和Langchain搭建一个私域专属知识库
知识库
2023-07-16
2023-07-16
如何用大语言模型构建一个知识问答系统
传统搜索系统基于关键字匹配,在面向:游戏攻略、技术图谱、知识库等业务场景时,缺少对用户问题理解和答案二次处理能力。本文探索使用大语言模型(Large Language Model, LLM),通过其对自然语言理解和生成的能力,揣摩用户意图,并对原始知识点进行汇总、整合,生成更贴切的答案。关于基本思路,验证效果和扩展方向,可以参考正文的介绍。
知识库
2023-07-14
2023-07-14
ChatGLM
【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践
主流的开源大语言模型主要有三个:LLaMA、ChatGLM和BLOOM。基于这三个开源模型,业界进行了指令微调或强化学习,衍生出了许多不同的大模型。下面从训练数据、tokenizer和模型结构上对这三个大语言模型进行比较。
大模型
微调
训练
2023-07-13
2023-07-13
大模型
微调、训练大模型概念介绍及论文笔记:Tuning系列论文笔记
微调、训练大模型概念介绍及论文笔记:Tuning系列论文笔记
训练
微调
2023-07-12
2023-07-12
大模型
真格基金大模型能力测试问题集---垂直能力篇
我们的目标并不是提供一个学术上非常严谨完整的测试集,而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例,以及大模型出现之后学术界发现的涌现和顿悟能力,提供一个适合非技术专业人士使用的大模型能力测试集。
中文
训练
大模型
2023-06-28
2023-06-28
大模型
真格基金大模型能力测试问题集---进阶篇
我们的出发点是尽量覆盖更多类型的 NLP 任务。我们的目标并不是提供一个学术上非常严谨完整的测试集,而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例,以及大模型出现之后学术界发现的涌现和顿悟能力,提供一个适合非技术专业人士使用的大模型能力测试集。
中文
评测
大模型
2023-06-28
2023-06-28
大模型
真格基金大模型能力测试问题集---基础篇
我们的目标并不是提供一个学术上非常严谨完整的测试集,而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例,以及大模型出现之后学术界发现的涌现和顿悟能力,提供一个适合非技术专业人士使用的大模型能力测试集。
大模型
训练
中文
2023-06-28
2023-06-28
Python
LangChain手册(Python版)11模块:提示模板
语言模型将文本作为输入——该文本通常被称为提示。通常这不是简单的硬编码字符串,而是模板、一些示例和用户输入的组合。LangChain 提供了几个类和函数来简化提示的构建和使用。
大模型
2023-06-16
2023-06-16
微调
一文讲明白什么是预训练、微调和上下文学习
最近语言模型在自然语言理解和生成方面取得了显著进展。这些模型通过预训练、微调和上下文学习的组合来学习。在本文中将深入研究这三种主要方法,了解它们之间的差异,并探讨它们如何有助于语言模型的学习过程。
大模型
训练
2023-06-14
2023-06-14
大模型
企业如何更好的使用大模型?都有哪些框架和方案
原文标题:几分钟开发 AI 应用成为可能,为什么说大模型中间件是 AI 必备软件?
人工智能
大模型
2023-06-13
2023-06-13
RAG
图片拖拽神器DragGAN介绍及官方安装文档说明
拖放图像编辑是一项功能强大的技术,它涉及训练生成模型来根据用户提供的指令转换图像。该技术的一个流行实现是拖放生成器(DragGAN),这是一个深度学习模型,当用户将图像拖放到基于web的界面中时,它可以将图像转换为另一个图像。
开源
2023-06-04
2023-06-04
<
1
2
3
4
5
6
>
1
2
4
5
6
7
8
9
100