首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 测评了8个国产AI大模型,差点崩溃……
· 腾讯开源混元AI绘画大模型
· 实测:本地跑llama3:70B需要什么配置
· 豆包MarsCode——免费AI编程助手
· 变天了,AI可以一键生成中文海报了......
· 如何改善你的回测方法,提高策略的未来收益
· BaiChuan百川
· LangChain + ChatGLM2-6B 搭建私域专属知识库
· 解读:一个数学在线教育网站如何做到一千万月访问量
· 这个能写出10W+爆款文章的ChatGPT提示词,你敢用吗?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Yi
技术报告细节分享
写在前面
Yi
模型很早就发布了,但技术报告昨天才出来。
Yi模型
大模型
零一万物
零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
另一大亮点,是
Yi
-VL-Plus强大的多模态能力。
零一万物
YI
李开复
大模型
图解大模型训练之:张量模型并行(TP),Megatron-LM
backward:假定现在我们要对 Wi 求梯度,则可推出 ∂L∂Wi=∂L∂Y∗∂Y∂
Yi
开源模型
知乎
弱智吧竟成最佳中文AI训练数据?!中科院等:8项测试第一,远超知乎豆瓣小红书
分别用各种数据集训练零一万物
Yi
系列开源大模型,在BELLE-Eval测试集上使用GPT-4评分得到结果。
弱智吧
训练数据集
大模型
大模型评测新思路:弱智吧精华问题大全
实验结果 该研究在不同数据源的数据集上对
Yi
系列模型(Young et al., 2024)和 Qwen-72B(Bai et al., 2023)模型进行了微调,以分析数据源对模型跨领域知识能力的影响
弱智吧
训练数据集
开源
新测试基准发布,最强开源Llama 3尴尬了
但令人惊讶的是,它更喜欢几种开放模型如Mixtral和零一万物
Yi
,甚至对GPT-3.5的评分都有明显提高。
Llama
3
大模型
开源
GGUF格式详解
很多模型模型,如
Yi
-34B、Llama2-70B等模型都有对应的GGUF版本,这些版本都模型除了文件名多了GGUF外,其它与原有的模型名称完全一致。
GGUF
大模型
大模型
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
XVERSE-V 性能优异,在多项权威多模态评测中超过零一万物
Yi
-VL-34B、面壁智能OmniLMM-12B及深度求索DeepSeek-VL-7B等开源模型,在综合能力测评MMBench中超过了谷歌
XVERSE-V
多模态大模型
OpenAI
AI Agents大爆发:软件2.0雏形初现,OpenAI的下一步
其中人类反馈数据是一个集合 Dh = {(x,
yi
,ri,zi)1=1},其中 x 是提示,每个
yi
代表一个模型补全,ri 是人类对
yi
的评分,ri、
yi
、zi 是相互对应的关系,zi 代表人类对模型输出提供的事后反馈
agent
OCR
中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
其中在 OpenCompass 榜单中,综合 11 个主流评测基准的结果表明,MiniCPM-V 2.0 的通用多模态能力超越了 Qwen-VL-Chat-10B、CogVLM-Chat-17B 和
Yi
-VL
MiniCPM
大模型
开源
46.6k星星!最强开源AI集合系统,一键部署全网AI工具都能直接用,UI简直是视觉盛宴!
01.AI(
Yi
Model):集成01.AI模型,系列API具有快速推理速度。
AI开源
集合
Transformer
ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
[5] Tsung-
Yi
Lin, Michael Maire, Serge Belongie, James Hays, Pietro Perona, Deva Ramanan, Piotr
ViTPose+
Transformer
身体姿态
大模型
投资人逃离大模型
旗下大模型产品包括
Yi
-34B、
Yi
-Lightning、
Yi
-Large等。
大模型
大模型
回望做大模型一年后的感悟
大模型应该分为两类,一类是从头开始训练的基础模型,比如:
Yi
、QWen、Baichuan、ChatGLM、DeepSeek等等;另一类是continue pretraining和sft类别的模型。
大模型
感悟
微软
微软Phi-3、Mixtral 8x22B等小模型过拟合,三分之二存在数据污染
还有其他模型系列,如
Yi
、Xwin、Gemma 和 CodeLlama 也在较小程度上显示出这种模式。
过拟合
小模型
<
1
2
>
1
2
4
5
6
7
8
9
100