文章列表-AI魔法学院

文章列表

GitHub狂飙3万star的LLM公开资料 - 大模型入门教程

2.3 预训练模型预训练是一个非常漫长且成本高昂的过程，这就是为什么这不是本课程的重点。

LLM 大模型 GitHub

Stable Diffusion

Meta发布业界最强文生图模型CM3Leon，实力碾压Stable Diffusion、Midjourney

CM3leon是第一个使用从纯文本语言模型改编的方法进行训练的多模态模型，包括大规模检索增强预训练阶段和第二个多任务监督微调(SFT)阶段。

文生图

手把手带你微调一个自己的 ChatGLM2-6B 模型

ChatGLM2-6B 使用了 GLM 的混合目标函数，经过了 1.4T 中英标识符的预训练与人类偏好对齐训练，评测结果显示，相比于初代模型，ChatGLM2-6B 在 MMLU（+23%）、

ChatGLM2-6B

开源大语言模型完整列表

基于预训练 + 持续微调的学习策略融合大规模普通文本和多种对话数据训练而成，充分利用训练语言模型语言能力和知识，高效构建强大的对话模型。

开源模型大语言模型

4种通过LLM进行文本知识图谱的构建方法对比介绍

使用LLM预训练本体（ontologies） LLM似乎已经接受了各种标准本体(如SCHEMA)的预先培训。

知识图谱大模型

马斯克怒告OpenAI案解密：Ilya看到了什么？125万亿参数Q*细节曝光，53页PDF全网疯转

Ilya做出的突破，使OpenAI不再受限于获取足够的高质量数据来训练新模型，而这，正是开发下一代模型的主要障碍。

OpenAI 大模型

从零开始学习大模型-第一章-大模型简介

数据需求高：为了有效训练这些模型，需要大量的训练数据。

大模型从零开始

BGE M3-Embedding：智源最新发布的text embedding模型，多语言检索效果超过微软跟openai

2 BGE M3-Embedding 2.1 训练数据构建 M3-Embedding的训练用了非常庞大且多样化的多语言数据集，

BGE M3-Embedding 多语音检索

百川智能正式发布130亿参数通用大语言模型百川大模型（Baichuan-13B-Base）

Baichuan-13B 有如下几个特点: 更大尺寸、更多数据:Baichuan-13B 在 Baichuan-7B 的基础上进一步扩大参数量到130亿，并且在高质量的语料上训练了1.4万亿 tokens

大模型中文

CodeGeeX2来了!效果超LLaMA2-70B

由于代码安全性，很难使用 Github Copilot 去 AI 生成，发现清华发布了「CodeGeeX2」，基于 ChatGLM2-6B 基座模型，CodeGeeX2-6B 进一步经过了 600B 代码数据预训练

CodeGeeX2 开源模型

惊艳！2.77亿参数锻造出Agent+GPT-4V模型组合，领航AI领航机器人、游戏、医疗革新，通用智能时代你准备好了吗？

2.77亿参数、1340万帧视频训练数据，背后蕴含着怎样的技术秘密？

Agent+GPT-4V 大模型

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

不需要复杂的设计如持续时间模型、文本编码器和音素对齐，能够快速训练并实现实时因素（RTF）0.15的推理速度，显著优于当前基于扩散的TTS模型。

F5-TTS 音频克隆

Stable Diffusion

AI绘画巅峰对决：Stable Diffusion 3与DALL·E 3原理深度比较

通过这张地图和路线，我们可以更轻松地训练生成模型，让它学习从噪声中生成出我们想要的数据。

Stable Diffusion DALL·E

语言大模型100K上下文窗口的秘诀

由于n、d相关的二次复杂度，在巨型语料库上训练Vanilla Transformer，并且只在较大的上下文长度上训练是不可行的。

大模型

HalluQA: 测测中文大模型有没有一本正经胡说八道

第一类幻觉是模型会错误地模仿预训练语料中的行为或判断，而这些行为或判断是与真实世界不一致的。

大模型中文大模型幻觉

<...13 14 15 161718 19 20 21 22 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1