首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· Suno音乐新手指南(手把手完整版教程)
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· SD的老舅ComfyUI来了,节点式工作流,分部控制出图
· 6个AI音乐软件推荐,让你学会人工智能AI作曲
· WeChaty:强大的微信个人号机器人SDK
· AI声音克隆 | 最全最简教程(权威版)
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 4K star!录屏好帮手,超酷的实时按键显示工具
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
Stable Diffusion
生
成
图
片参数查看与抹除
这篇
文
章就来专门分享如何查看和抹除
图
片的参数。
文生图
Stable
Diffusion
Transformer
TrOCR——基于transformer
模
型
的OCR手写
文
字识别
第二步,我们将
图
像输入到 TrOCR
模
型
,该
模
型
经过
图
像编码器,编码器主要包括多头注意力机制与feed forward 前馈神经网络 第三步便是我们的解码器部分,解码器的输入是标准的
文
本
OCR
手写
文字识别
中
文
通用大
模
型
最全汇总
,对比原版 LLaMA,该
模
型
在中
文
理解能力和
生
成能力方面均获得较大提升,在众多下游任务中均取得了突出的成绩。
大模型
开源模型
儿童
中
文
儿童情感陪伴大
模
型
中
文
儿童情感陪伴大
模
型
-巧板 - 旨在构建一个面向儿童情感陪伴的大
模
型
参考
文
献: [1]http://github.com/HIT-SCIR-SC/QiaoBan 出自:https://
大模型
手把手教你用 SD
生
成
文
字形状的光线,用来做营销宣传
图
非常有效
昨天类似这种
文
字光效或者将
文
字合成在衣服上的
图
好像又火了,很多朋友在问怎么做,其实就是ControlNet的简单应用,比如
模
拟光线照射
文
字的,之前用来调整自然光线的角度和范围这次不过是将原来
模
拟光照的
图
变成了
文
字了
图像文字
ControlNet
Stable
Diffusion
九问中国大
模
型
掌门人,万字长
文
详解大
模
型
进度趋势
二是海外大
模
型
的原
生
中
文
能力不佳,中国的大
模
型
对中
文
理解能力一定是更强的。
大模型
详解
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生
成视频插件
AnimateDiff介绍 AnimateDiff采用控制
模
块来影响Stable Diffusion
模
型
,通过大量短视频剪辑的训练,它能够调整
图
像
生
成过程,
生
成一系列与训练视频剪辑相似的
图
像。
动画
视频
AnimateDiff
开源
Stability AI开源上新:3D
生
成引入视频扩散
模
型
也就是说,此番登场的SV3D首次将视频扩散
模
型
应用到了3D
生
成领域。
sv3d
建模
开源
OCR终结了?旷视提出可以
文
档级OCR的多
模
态大
模
型
框架Vary,支持中英
文
,已开源!
以往这一任务需要
文
本识别、布局检测和排序、公式表格处理、
文
本清洗等多个步骤—— 这一次,只需一句话命令,多
模
态大
模
型
Vary 直接端到端输出结果: 无论是中英
文
的大段
文
字
OCR
手写
文字识别
开源
研究人员开源中
文
文
本嵌入
模
型
,填补中
文
向量
文
本检索领域的空白
由于 GPT 使用的 Transformer
模
型
的自身特性,导致
模
型
只能从固定长度的上下
文
中
生
成
文
本。
GPT
Sora
OpenAI视频
模
型
Sora的推理
生
成成本多高?
我们折中一下,假设为 20B 的
模
型
大小。
Sora
推理
算力
语言大
模
型
100K上下
文
窗口的秘诀
上下
文
窗口(context window)是指语言
模
型
在进行预测或
生
成
文
本时,所考虑的前一个词元(token)或
文
本片段的大小范围。
大模型
开源
Chinese-LLM开源中
文
大语言
模
型
合集
、中
文
和英
文
的多
模
态对话语言
模
型
,语言
模
型
基于 ChatGLM-6B,具有 62 亿参数;
图
像部分通过训练 BLIP2-Qformer 构建起视觉
模
型
与语言
模
型
的桥梁,整体
模
型
共78亿参数。
大模型
中文
万字长
文
-大语言
模
型
指令调优综述
作者结合了两个大规
模
预训练
模
型
的能力,一个语言
模
型
GPT-3 (Brown et al.,2020b)和一个
文
本到
图
像
模
型
Stable Diffusion(Rombach et al., 2022),
大语言模型
开源
最强国产开源多
模
态大
模
型
MiniCPM-V:可识别
图
片、视频,还可在端侧部署
MiniCPM-V是面向
图
文
理解的端侧多
模
态大
模
型
系列。
minicpm
面壁
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100