文章列表-AI魔法学院

文章列表

Yi技术报告细节分享

写在前面 Yi模型很早就发布了，但技术报告昨天才出来。

Yi模型大模型

零一万物API开放平台出场！通用Chat多模态通通开放，还有200K超长上下文版本

另一大亮点，是Yi-VL-Plus强大的多模态能力。

零一万物 YI 李开复

图解大模型训练之：张量模型并行(TP)，Megatron-LM

backward：假定现在我们要对 Wi 求梯度，则可推出 ∂L∂Wi=∂L∂Y∗∂Y∂Yi

开源模型

弱智吧竟成最佳中文AI训练数据？！中科院等：8项测试第一，远超知乎豆瓣小红书

分别用各种数据集训练零一万物Yi系列开源大模型，在BELLE-Eval测试集上使用GPT-4评分得到结果。

弱智吧训练数据集

大模型评测新思路：弱智吧精华问题大全

实验结果该研究在不同数据源的数据集上对 Yi 系列模型（Young et al., 2024）和 Qwen-72B（Bai et al., 2023）模型进行了微调，以分析数据源对模型跨领域知识能力的影响

弱智吧训练数据集

新测试基准发布，最强开源Llama 3尴尬了

但令人惊讶的是，它更喜欢几种开放模型如Mixtral和零一万物Yi，甚至对GPT-3.5的评分都有明显提高。

Llama 3 大模型开源

GGUF格式详解

很多模型模型，如Yi-34B、Llama2-70B等模型都有对应的GGUF版本，这些版本都模型除了文件名多了GGUF外，其它与原有的模型名称完全一致。

GGUF 大模型

元象首个多模态大模型 XVERSE-V 开源，刷新权威大模型榜单，支持任意宽高比输入

XVERSE-V 性能优异，在多项权威多模态评测中超过零一万物Yi-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型，在综合能力测评MMBench中超过了谷歌

XVERSE-V 多模态大模型

AI Agents大爆发：软件2.0雏形初现，OpenAI的下一步

其中人类反馈数据是一个集合 Dh = {(x,yi,ri,zi)1=1}，其中 x 是提示，每个 yi 代表一个模型补全，ri 是人类对 yi 的评分，ri、yi、zi 是相互对应的关系，zi 代表人类对模型输出提供的事后反馈

agent

中文OCR超越GPT-4V，参数量仅2B，面壁小钢炮拿出了第二弹

其中在 OpenCompass 榜单中，综合 11 个主流评测基准的结果表明，MiniCPM-V 2.0 的通用多模态能力超越了 Qwen-VL-Chat-10B、CogVLM-Chat-17B 和 Yi-VL

MiniCPM 大模型

46.6k星星！最强开源AI集合系统，一键部署全网AI工具都能直接用，UI简直是视觉盛宴！

01.AI（Yi Model）：集成01.AI模型，系列API具有快速推理速度。

AI开源集合

ViTPose+：迈向通用身体姿态估计的视觉Transformer基础模型

[5] Tsung-Yi Lin, Michael Maire, Serge Belongie, James Hays, Pietro Perona, Deva Ramanan, Piotr

ViTPose+Transformer 身体姿态

投资人逃离大模型

旗下大模型产品包括‌Yi-34B、‌Yi-Lightning、‌Yi-Large等。

大模型

回望做大模型一年后的感悟

大模型应该分为两类，一类是从头开始训练的基础模型，比如：Yi、QWen、Baichuan、ChatGLM、DeepSeek等等；另一类是continue pretraining和sft类别的模型。

大模型感悟

微软Phi-3、Mixtral 8x22B等小模型过拟合，三分之二存在数据污染

还有其他模型系列，如 Yi、Xwin、Gemma 和 CodeLlama 也在较小程度上显示出这种模式。

过拟合小模型

<12 >

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1