首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 我去,找到一个Github上非常优秀的AI项目,可控制鼠标、键盘,模拟人类操作,太丝滑,收藏~~~
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 阿里云王坚:中国AI不惧R2迟发!靠「群体智能」破局:算力不是瓶颈,但AI应用层急需炸开OpenAI想象围墙!不看好硅谷抢人乱象
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· Suno音乐新手指南(手把手完整版教程)
· 开源大模型部署及推理所需显卡成本必读:也看大模型参数与显卡大小的大致映射策略
· 通往AGI之路,提示词入门
· RAG超参数调优食用指南
· 大模型评测新思路:弱智吧精华问题大全
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
大模型微调应用实践,没那么简单,看看曾经踩过的坑
=INFONCCL_SOCKET_IFNAME=eth0NCCL_P2P_DISABLE=1 多机
训
练
效率不如单机: 多机
训
练
可以跑起来,但是在多机上模型
训
练
的速度比单机上还慢。
大模型
ChatGPT
迄今为止,最强ChatGPT写论文技巧,总共6步,手把手告诉你!
这就是业内人常说的,
训
练
ChatGPT。
chatgpt
提示词
RAG
RAG 修炼手册|一文讲透 RAG 背后的技术
它通过
训
练
语料库来学习单词之间的语义和语法关系,将单词映射到高维空间中的稠密向量。
RAG
Embedding
大模型
中文通用大模型最全汇总
;第一步:先在42G中文预料上进行
训
练
;后续将会加大
训
练
规模;Chinese-LlaMA2-chat: 对Chinese-LlaMA2进行指令微调和多轮对话微调,以适应各种应用场景和多轮对话交互。
大模型
开源模型
大模型
大模型时代-行业落地的再思考
通用大模型指的是模型
训
练
的时候是用了大量的通用数据的。
大模型
ChatGPT
2万字大模型调研:横向对比文心一言、百川、Minimax、通义千问、讯飞星火、ChatGPT
、
训
练
卡顿、无
训
练
日志 略 2023-9-27
大模型
调研
Prompt
自动优化Prompt:Automatic Prompt Engineering的3种方法
给定一个
训
练
集,定义好评价指标,运行automatic prompt engineering框架之后,将自动得到能取得最佳效果的prompt。
prompt
大模型
下载
8个常用中文OCR数据集,附下载链接
该数据集由两部分构成:
训
练
集、测试集。
OCR
盘古
华为盘古画画3.0发布 | PanGu-Draw:业界最大的中文文生图模型,效果YYDS!
图1显示了两种现有的
训
练
策略:(a)级联
训
练
,使用三个模型来逐步提高分辨率,数据效率高,但
训
练
和推理时间增加了三倍。
PanGu-Draw
文生图
RAG
必读!RAG好用的3种Router
kNN路由器(kNN-Router):kNN路由器使用句子变换器对
训
练
查询进行编码,并根据余弦相似度找到与测试查询最接近的
训
练
查询
RAG
Router
大模型
大模型微调方法总结
但是随着预
训
练
语言模型越来越大,这个范式存在以下问题: ● 当我们 finetune 大模型时,由于
训
练
成本太高,不太可能重新
训
练
所有模型参数 ● 以前的方法(论文发表于 2021 年)都或多或少有其它性能问题
开源模型
用户意图对齐,无需人工标注,Zephyr-7B 超越 Llama2-Chat-70B
此方法的优势包括较短的
训
练
时间和无需额外采样,为开放大型语言模型(LLMs)的发展和微调提供了新方向。
小型语言模型
Zephyr-7B
心理
心理健康AI应用空白:LLM评估基准震撼出炉(附Prompt模板)
局限性 语言特定
训
练
的重要性和心理诊断及咨询场景的专门
训
练
需求凸显了现有模型的局限性。
大模型
心理
大模型
垂直领域大模型的一些思考及开源模型汇总
训
练
方法:基于Llama-7B模型,采用Lora方法进行模型
训
练
。
垂直领域
大模型
开源模型
汇总
微调
大语言模型综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>
训
练
数据以英文为主,不包含中韩日文,所有
训
练
数据都是开源的,分词之后大约有1400B的tokens。
大模型
<
...
14
15
16
17
18
19
20
21
22
23
...
>
1
2
4
5
6
7
8
9
100