首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· Suno音乐新手指南(手把手完整版教程)
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· SD的老舅ComfyUI来了,节点式工作流,分部控制出图
· 6个AI音乐软件推荐,让你学会人工智能AI作曲
· WeChaty:强大的微信个人号机器人SDK
· AI声音克隆 | 最全最简教程(权威版)
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 4K star!录屏好帮手,超酷的实时按键显示工具
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
工具
FFmpeg之父新作——音频压缩工具 TSAC
Training tricks 1)GAN RVQGAN顾名思义是基于GAN的网络结果,因此在
训
练
过程中除了
训
练
encoder-decoder的生成器之外,还需要
训
练
对应的判别器
TSAC
音频工具
大模型
中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生
早在去年五月中旬,经过数十版模型
训
练
与优化,中国电信就完成了百亿参数星辰AI大模型稳定版本的
训
练
。
开源大模型
电信
Stable Diffusion
Stable Diffusion 和 Midjourney的优劣势比较,如何选择?
③有一定的使用难度:SD的界面有很多内容,如采样方式等,上手很简单,但想玩好以及
训
练
自己的模型等都需要比较复杂的学习过程。
文生图
零一万物
零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
去年11月,零一万物就正式开源发布了首款预
训
练
大模型Yi-34B,当时的模型已经能处理200K上下文窗口,约等同于20万字文本。
零一万物
YI
李开复
Stable Diffusion
深入浅出学习Stable diffusion之线稿转效果图
的左上角我们看到秋叶包中加载的暂时只有一个anything的模型,这是一个大体模型,就是很多风格集中在一起的模型,不论是景观、建筑、动漫人物还是什么,但是当你需要出独特的风格图时候就需要更优化的模型,你可以自己
训
练
模型
Stable
Diffusion
文生图
大模型
大模型
百川智能RAG方案总结:搜索出生的百川智能大模型RAG爬坑之路
行业大模型解决方案有后
训
练
(Post-Train)和有监督微调(SFT),但是仍然无法解决大模型落地的幻觉和实效性问题。
RAG
大模型
教程
保姆级教程:手把手教你创建GPTs角色应用
首先,向GPTs描述你的需求:创建一个能帮助理解猫咪行为、提供
训
练
技巧和互动小知识的助手。
GPTs
教程
语音
实时语音克隆
建议使用 GPU 来进行
训
练
和推理速度,但这不是强制性的。
语音
克隆
再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」
但是这些方法对于不在
训
练
数据内的新图象,泛化性较差,或者需要输入多个图像,在近一个小时后,才能等到生成结果。
Anydoor
文生图
Transformer
ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
为了探索使用ImageNet数据进行预
训
练
是否是不可避免的,ViTPose探索了能否只使用姿态估计数据 (MS COCO和AI Challenger数据)进行预
训
练
。
ViTPose+
Transformer
身体姿态
RAG
LLM应用架构之检索增强(RAG)的缘起与架构介绍
从上图可以看到,参数规模和
训
练
的token数是正相关的,以gpt3为例,它有1750亿参数,其
训
练
的token量达到了2000亿,据说包含了全球所有公开的文本信息,自然它能什么都懂就不奇怪了。
LLM
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语音交互大模型
三、Westlake - Omni 的
训
练
与优化 1.
Westlake
-
Omni
语音
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
确实,在 400M 图像文本对
训
练
的 CLIP 有很强的视觉文本对齐能力,可以覆盖多数日常任务下的图像编码。
OCR
手写
文字识别
LLM
自己电脑上跑大语言模型(LLM)要多少内存?
如果我要
训
练
模型呢?
大语言模型
运行
CodeGeeX:Tab一下,代码自动生成
(相关链接,见文末) 一、原理 模型 CodeGeeX是一个基于transformers的大规模预
训
练
编程语言模型。
大模型
<
...
16
17
18
19
20
21
22
23
24
25
...
>
1
2
4
5
6
7
8
9
100