文章列表-AI魔法学院

文章列表

Stable Diffusion

硬核解读Stable Diffusion（系列三）

但其实除了这两种，还有很多其它的研究工作，比如Adobe提出的Custom Diffusion，相比DreamBooth，它只finetune了UNet的attention模块的KV权重矩阵，同时优化一个新概念的token

Stable Diffusion 文生图

12个RAG常见痛点及解决方案

/llamaguard_pack" ) # you need HF token with write privileges for interactions

RAG 大模型

什么情况用Bert模型，什么情况用LLaMA、ChatGLM类大模型，咋选？

预训练数据集RedPajama-Data-1T已开源，包括七个子集，经过预处理后得到的token数量大致可以匹配Meta在原始LLaMA论文中报告的数量，并且数据预处理相关脚本也已开源。

大模型

了解Kimi必看的26个问题 | Kimi系列文（二）

上线即支持20万汉字的长上下文，相当于约30~40万token，远超当时Claude2的10万和GPT-4的3.2万。

Kimi 大语言模型

被高估的Pika，被低估的多模态AI

长期关注 AI 领域投资的心资本合伙人吴炳见认为，大语言模型只是 AI 版图的一部分，基础模型的第一性原理是“predict next token

大模型多模态

最详细的文本分块(Chunking)方法——可以直接影响基于LLM应用效果

如前所述，选择时应考虑内容的性质(例如短文本还是长文档)、将要使用的Embedding模型及其功能(如token限制)。

RAG 大模型

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

今年2月登场的世界最快大模型Groq，每秒500 token直接破了纪录，自研的LPU在LLM任务上比英伟达GPU性能快了10倍。

Scaling Law AI大模型

我如何夺冠新加坡首届 GPT-4 提示工程大赛 [译]

这非常关键，因为你的提示是作为一个长的 Token 序列一次性传给模型的。

GPT-4 提示词

震撼科技界：清华大学与智谱AI联手，引领中文长文智能写作新纪元！

损失计算：采用token平均损失计算策略，避免长文本样本在训练中被忽略。

写作长文本

活久见，世界上第一个被人类骗走钱的AI，刚刚出现了！

但总体来说，至少在当下，你并不是在询问某个神奇的 AI，而是在向背后的人类数据标注员提问——他们的集体知识和经验被压缩并转化成了大语言模型中的token序列。

Freysa 智能体

OpenAI的官方Prompt工程指南详解 - 看这一篇真的就够了！

其实就是总结几百页PDF文档的原理，比如让大模型总结一本书，肯定是超Token上限了嘛，所以可以使用一系列查询来总结文档的每个部分。

OpenAI Prompt 提示词

Stable Diffusion

Stable Diffusion WebUI v1.8.0重大更新！

扩展不区分大小写 · 如果扩展页面未加载，请防止应用 · 调用img2img中正确的token

SD 画图

OpenAI的官方Prompt工程指南详解 - 看这一篇真的就够了

其实就是总结几百页PDF文档的原理，比如让大模型总结一本书，肯定是超Token上限了嘛，所以可以使用一系列查询来总结文档的每个部分。

提示词 prompt

万字长文｜40万人学习过｜28个ChatGPT使用技巧，带你从入门到精通

梳理大纲再进行写作在展开这个话题之前，我们需要回顾ChatGPT的两大特点：一是它是一个不断猜测下一个单词是什么的工具，所以ChatGPT不会对自己的内容有整体的规划性；二是ChatGPT的对话有上下文的token

ChatGPT 使用技巧教程

中国大模型「顶流群聊」笔记

甚至突然有一天会发现你原来练的那些模型基本都没啥用，当技术换代或者更强的开源模型出来，过去的投入可能完全「打水漂」，比如开源模型在预训练上看了一万亿的英文 Token，你自己的模型非要再看一遍，可能毫无意义

大语言模型

<...6 7 8 9 10 11 121314 15 >

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1