首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· Suno音乐新手指南(手把手完整版教程)
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 人工智能训练的灾难性遗忘以及解决方案
· 5个最佳开源RPA框架!
· 性能超出预期!神秘的国产大模型 Kimi 开放 API
· Agent具体实现
· Midjourney AI绘画美女提示词分享一
· 盘点字节跳动最新的AI应用
· AI自动生成视频全流程干货
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI国力战争:GPU是明线,HBM是暗线
根据行业协会的定义,DRAM可以分为三种:1)主要用在电脑、服务器中的标准DDR,也就是常说的内存条;2)手机和汽车等移动终端领域的LPDDR系列;3)用在数据密
集
型场景的图形类DDR,HBM正是在这一分类下
GPU
HBM
大模型
如何将 GPT 幻觉发生率从 20% 以上降低到 2% 以下
一种常见的方法是使用微调来提高模型在特定领域数据
集
上的准确性。
大模型
详解 Diffusion (扩散) 模型
现在想象一下,将一小滴油漆滴入一杯水中,油漆的密度将
集
中在一个位置,但随着时间的推移,该滴将扩散到水中直至达到平衡。
Diffusion
开源模型
大模型
腾讯开源混元AI绘画大模型
为了全面比较混元大模型的生成能力,团队构建了一个4维测试
集
,包括文本-图像一致性、排除AI伪影、主体清晰度、美学。
腾讯
混元
文生图
ChatGPT
三个大模型(ChatGPT,文心一言,Baichuan-13B),帮我生成中医《本草纲目》的训练数据
小结一下:这三个模型都能帮我们完成一些简单的文本预处理
工
作,可能要把问题描述清楚后,效果会更好 二、生成最终的训练JSON数据体验 下面,用处理好的文本生成类似对话的JSON格式吧,先看下它们的one-shot
大模型
ComfyUI
ComfyUI官方使用手册【官网直译+关键补充】
输入(inputs)包括图片(image),这是需要被模糊化的像素图像,高斯半径(blur_radius),以及高斯的西格玛(sigma),西格玛越小,核就越
集
中在中心像素。
文生图
图生图
comfyui
RAG
LangChain: LLM 应用聚焦的两大方向,RAG 和 Agents
embedding 方式 · 65 个不同大模型的支持 LLM 大模型外挂涉及到的组件数量
具
体的数字无需关注
大模型
CodeGeeX2来了!效果超LLaMA2-70B
进一步经过了 600B 代码数据预训练,相比上一代,能力有全面提升, 不同于一代,CodeGeeX2是基于ChatGLM2架构加入代码预训练实现,在代码能力上全面提升,HumanEval-X 评测
集
的六种编程语言均大幅提升
CodeGeeX2
开源模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
F5-TTS在公共的100K小时多语言数据
集
上进行训练,展现出高自然性和表现力的零样本能力、无缝代码切换能力和速度控制效率。
F5-TTS
音频克隆
Stable Diffusion
深入浅出学习Stable diffusion之线稿转效果图
进入正题: 在sd的左上角我们看到秋叶包中加载的暂时只有一个anything的模型,这是一个大体模型,就是很多风格
集
中在一起的模型,不论是景观、建筑、动漫人物还是什么,但是当你需要出独特的风格图时候就需要更优化的模型
Stable
Diffusion
文生图
大模型
大模型
无限逼近真人效果的“超真实人像大模型”,或许它才是你一直在寻找的真爱!
DeepFloyd I是一种新颖的开源文本到图像模型,
具
有高度的照片真实性和语言理解能力。
大模型
文生图
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
但是对于密
集
和细粒度感知任务,比如文档级别的 OCR、Chart 理解,特别是在非英文场景,CLIP 表现出了明显的编码低效和 out-of-vocabulary 问题。
OCR
手写
文字识别
RAG
LangChain - RAG: 拿什么「降伏」PDF 中的 Table 类型数据
framework for your Retrieval Augmented Generation (RAG) pipelines) 库,我们看到 LangSmith 也针对 Ragas 做了一些
集
成方面的优化
大模型
LangChain
RAG
提示词
45个 DALL-E 3 使用案例 (附提示词) ,人人都是设计师
掌握了这个
工
具
,你就拥有了一个免费的设计师。
文生图
Transformer
TrOCR——基于transformer模型的OCR手写文字识别
该数据
集
包括数亿张打印文本行的图像。
OCR
手写
文字识别
<
...
64
65
66
67
68
69
70
71
72
73
...
>
1
2
4
5
6
7
8
9
100