首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· PPT又又有新突破了!智谱AI代码流造PPT
· 全球六大主流自动PPT制作工具
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 【爆肝整理】500+ AI 最佳提示词
· 超详细的 Stable Diffusion ComfyUI 基础教程(一):安装与常用插件
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
最透彻的大模型PPO原理和源码解读
(1)实际收益优化 我们原始的实际收益为,但是当我们在actor_loss中引入“优势”的概念时,“优势”中刻画了更为丰富的实时收益
信
息,所以,我们将实际收益优化为: (2)预估收益优化 我们原始的预估收益为
PPO
大模型
源码解读
微调
大语言模型综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>
作者认为,这种方法可以更有效的微调专注于高级语义
信
息的语言表示。
大模型
<
...
69
70
71
72
73
74
75
76
77
78
>
1
2
4
5
6
7
8
9
100