首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Prompt逆向工程:轻松复刻OpenAI“神级”提示词
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 阿里Qwen3系列模型惊艳亮相
· 为你推荐开源项目:Meridian——专属个人情报站!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· SD入门教程三:采样器及参数调整
· Coze多智能体(Multi-Agents)模式体验!
· Suno歌曲制作
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
详解大模型RLHF过程(配代码解读)
本篇文章涉及的代码均来自微软的deepspeed对RLHF的实现,可配合huggingface官方的博客一起食用。本文只对算法的一些有特点的关键点进行阐述,并不对整体实现进行介绍。先上一张经典的论文图。本文重点结合代码讲解奖励模型训练和强化学习训练部分。
训练
2023-07-03
2023-07-03
一文带你认识ELMo
Deep contextualized word representations获得了NAACL 2018的outstanding paper award,其方法有很大的启发意义。近几年来,预训练的word representation在NLP任务中表现出了很好的性能,已经是很多NLP任务不可或缺的一部分,论文作者认为一个好的word representation需要能建模以下两部分信息:单词的特征,如语义,语法;单词在不同语境下的变化,即一词多义。基于这样的动机,作者提出了ELMo模型。ELMo能够训练出来每个词的embedding,可以作为上下文 ...
embedding
2023-07-03
2023-07-03
什么是BERT?
BERT的全称为Bidirectional Encoder Representation from Transformers,是一个预训练的语言表征模型。它强调了不再像以往一样采用传统的单向语言模型或者把两个单向语言模型进行浅层拼接的方法进行预训练,而是采用新的masked language model(MLM),以致能生成深度的双向语言表征。BERT论文发表时提及在11个NLP(Natural Language Processing,自然语言处理)任务中获得了新的state-of-the-art的结果,令人目瞪口呆。
embedding
2023-07-03
2023-07-03
深入浅出:大语言模型中必不可少的技术——Embedding简介
本文将对embedding做一个简单的介绍,并解释为什么它在大语言模型中十分重要。本文来自DataLearner官方博客:AI大模型领域的热门技术——Embedding入门介绍以及为什么Embedding在大语言模型中很重要
embedding
2023-07-03
2023-07-03
数据库
主流向量数据库一览
随着ChatGPT的发布,人工智能的发展迎来了新的时代。 知识的存储跟表达也有了新的标准。 向量这个数学表达,在目前是人与AI交互的中间媒介。 所以我们有必要深入探讨向量数据库,并对当前主流的数据库做一些对比分析。
向量数据库
2023-07-03
2023-07-03
ChatGLM
基于本地知识的问答机器人langchain-ChatGLM
langchain-ChatGLM是一个基于本地知识的问答机器人,使用者可以自由配置本地知识,用户问题的答案也是基于本地知识生成的。github链接为:GitHub - imClumsyPanda/langchain-ChatGLM: langchain-ChatGLM, local knowledge based ChatGLM with langchain | 基于本地知识的 ChatGLM
langchain
2023-07-01
2023-07-01
LangChain 完整指南:使用大语言模型构建强大的应用程序
LangChain是一个强大的框架,旨在帮助开发人员使用语言模型构建端到端的应用程序。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) 和聊天模型提供支持的应用程序的过程。LangChain 可以轻松管理与语言模型的交互,将多个组件链接在一起,并集成额外的资源,例如 API 和数据库。
langchain
大模型
2023-07-01
2023-07-01
大模型
大模型微调经验汇总---LLM finetuning 踩坑经验之谈
大模型微调经验汇总-LLM - finetuning - 踩坑经验之谈
大模型
人工智能
2023-07-01
2023-07-01
【进阶】-文生图术语解释
文生图术语解释高级进阶篇
文生图
2023-07-01
2023-07-01
StableDiffusion
StableDiffusion常用基础参数说明
本文主要介绍StableDiffusion常用基础参数
文生图
2023-07-01
2023-07-01
Midjourney
用Midjourney给自己制作精美的logo或头像
Midjourney是一个AI艺术平台,能够帮助你快速轻松地生成独特且富有创意的logo设计。尽管它们可能并不完美,但它是一个非常好的工具,可以帮助你快速获取logo设计的灵感。
头像
logo
2023-06-29
2023-06-29
人工智能
人工智能训练的灾难性遗忘以及解决方案
人工智能为什么会产生“灾难性遗忘”?目前,解决灾难性遗忘的方案有哪些?难点在哪? 神经网络存在灾难性遗忘问题是指在进行连续训练或迁移学习时,网络会忘记之前学到的知识,导致在新任务或新数据上的性能下降。这个问题在实际模型中经常出现,对于深度学习和神经网络的应用带来了挑战。
人工智能
大模型
2023-06-29
2023-06-29
开源
Chinese-LLM开源中文大语言模型合集
自ChatGPT为代表的大语言模型(Large Language Model, LLM)出现以后,由于其惊人的类通用人工智能(AGI)的能力,掀起了新一轮自然语言处理领域的研究和应用的浪潮。尤其是以ChatGLM、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后,业界涌现了非常多基于LLM的二次微调或应用的案例。
大模型
中文
2023-06-28
2023-06-28
目前大语言模型的评测基准有哪些?
从大模型涌现之初,研究者们就千方百计地来测试模型的性能,利用人工打分,制作测试题集,利用GPT-4评估……随着越来越多的模型发布和开源,迫切需要科学、公正、开放、标准的评测基准及工具来帮助人们更深刻的理解和认识模,评估模型性能。本篇为大家介绍目前海内外较为知名的大模型测评方法。
人工智能评测
大模型
2023-06-28
2023-06-28
大模型
真格基金大模型能力测试问题集---垂直能力篇
我们的目标并不是提供一个学术上非常严谨完整的测试集,而是希望通过结合学术上已有的测试集、日常搜集的一些有意思的案例,以及大模型出现之后学术界发现的涌现和顿悟能力,提供一个适合非技术专业人士使用的大模型能力测试集。
中文
训练
大模型
2023-06-28
2023-06-28
<
...
92
93
94
95
96
97
98
99
100
101
>
1
2
4
5
6
7
8
9
100