首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· SD入门教程二:文生图基础用法(提示词)
· 大模型评测新思路:弱智吧精华问题大全
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 免费ChatGPT中文版
· SD入门教程四:图生图基础用法
· 盘点字节跳动最新的AI应用
· Suno音乐新手指南(手把手完整版教程)
· 手把手教你用上SDXL——SDXL 1.0 模型资源/comfyUI中文一键包下载
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
Stable Diffusion 文生图全网最细详解
并不是越高越好 来看看效果 会发现步数到了60其实也还好, 但同时需要考虑到性价比,步数越高也就意味着耗费的资源会越多,对
机
器
的配置会更高。
文生图
SD
大规模训练系列之技术挑战
P:模型参数量,单位为Billion 当优化
器
是SGD时,占用大小为: MS_FP16 = 2P(FP16参数)+2P(FP16梯度)+8P(FP32的参数、动量) = **12P*
开源模型
微软
微软打破Decoder-Only架构!大幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行
自解码
器
利用高效自注意力(efficient self-attention)
机
制来获取键值(KV)缓存: 接收输入序列的嵌入表示,并使用高效自注意力来生成中间向量表示;使用因果掩码(causal
Decoder-Decoder
YOCO
架构
ComfyUI
再见了ComfyUI,WebUI也有了工作流
在
AI
绘画领域,Stable Diffsion是最受欢迎的,因为它是开源软件。
ComfyUI
WebUI
文生图
ChatGLM
LangChain + ChatGLM2-6B 搭建私域专属知识库
ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预训练与
人
类偏好对齐训练,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(
知识库
工具
忘了stable diffsion的英文提示词吧,这个工具点点鼠标就可以了
如果网络不稳定可以增加代理: https://ghproxy.com/https://github.com/thisjam/sd-webui-oldsix-prompt 2、插件的使用 安装成功后,重启启动
器
,
stable
diffsion
提示词
Prompt
80多个罕见的论文prompt,让你起飞!
在[特定学科,例如“
天
体物理学”]的范围内,我希望加强这一主张:[将您的短语粘贴到此处]。
prompt
提示词
论文
大模型
8G显存一键训练,解锁Llama2隐藏能力!XTuner带你玩转大模型
自 ChatGPT 发布以来,大模型的强大让
人
们看见了通用
人
工智能的曙光,各个科技大厂也纷纷开源自家的大语言模型。
大模型
LLM
【一步一步引导】从零详细地梳理一个完整的 LLM 训练流程
1.预训练阶段(Pretraining Stage) 工欲善其事,必先利其
器
。
大模型
训练
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
但是近期,网易有道
AI
算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。
EmotiVoice
语音库
大模型
最佳开源文生图大模型可图:安装与批量出图的完整教程
在
机
器
测评上,Kolors 获得了最高的 MPS 分数,这与
人
工评估的结果一致。
可图
kolors
RAG
必读!RAG好用的3种Router
MoE架构包含一组专家模型,这些模型被训练以专门处理不同的数据区域,同时还有一个门控网络模型,负责确定每个专家对最终预测的贡献 · LM路由方法可以视为MoE架构的一种特殊情况,其中预测路由模型充当门控
机
制
RAG
Router
开源
中文开源OCR框架对比及介绍
金钱成本则基本没有(除了电费),如果大批量的跑字符识别可能需要搭建GPU服务
器
,这个花费就因
人
而异了。
OCR
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
实验发现,相较于基于像素的
人
脸重建方法,这个专家判别
器
在口型同步判别任务上更精准。
wav2lip
语音
大模型
微调百川Baichuan-13B保姆式教程,手把手教你训练百亿大模型
更高效的推理:为了支持更广大用户的使用,本次同时开源了 int8 和 int4 的量化版本,相对非量化版本在几乎没有效果损失的情况下大大降低了部署的
机
器
资源门槛,可以部署在如 Nvidia 3090 这样的消费级显卡上
大模型
微调
<
...
73
74
75
76
77
78
79
80
81
82
...
>
1
2
4
5
6
7
8
9
100