首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 为你推荐开源项目:Meridian——专属个人情报站!
· Midjourney AI绘画美女提示词分享一
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· AI换脸:FaceFusion和Roop在线版修复,支持手机,平板,低配电脑!
· 【ComfyUI】使用ComfyUI玩SDXL的正确打开方式
· Sora懂不懂物理世界?
· 社区供稿|GPT-4 与国产模型,大!横!评!
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 变天了,AI可以一键生成中文海报了......
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让
图
片和视频焕发新生!
一个静态
图
片转视频的项目。
阿里云
视频
音频
教育
解
读:一个数学在线教育网站如何做到一千万月访问量
老外的乘法表有意思,是一个正方形,这里也提醒我们出海做网站时,需要了
解
当地的文化,不能按照国内的理
解
去做。
访问量
大模型
【全文翻译】微软166页论文
解
读 GPT-4V:多模态大模型的黎明
医学
图
像理
解
。
多模态大模型
GPT-4V
文生图
开源
PhotoMaker:腾讯最新开源,根据照片生成该人物各种风格
图
片,项目可落地!
项目简介 PhotoMaker是腾讯最近开源的照片生成工具,这是一种高效的个性化文本到
图
像生成方法。
PhotoMaker
文生图
工具
鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
值得注意的是,他们这里强调了,他们不会进行人脸检测,但上传的
图
片人脸已经要占据
图
片大部分。
PhotoMaker
图生图
微调
四种微调技术详
解
:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
这一阶段的目标是使模型获取通用的语言理
解
和推理能力。
大模型
清华
图
片生成速度最高提升10倍!可以做到“实时”生成!清华推出LCM/LCM-LoRA!
近年来,随着SD和Midjourney的火热,文本到
图
像生成(Text-to-Image Generation)的研究取得了令人瞩目的进展,让我们能够用自然语言指导AI创造出各种各样的
图
像。
LCM/LCM-LoRA
文生图
斯坦福宣布前端开发要失业了?!一张截
图
生成代码,64%优于原网页!
随着生成型人工智能(AI)的飞速发展,多模态理
解
和代码生成的能力达到了前所未有的水平。
设计转代码
大模型
手把手教你用 SD 生成文字形状的光线,用来做营销宣传
图
非常有效
昨天类似这种文字光效或者将文字合成在衣服上的
图
好像又火了,很多朋友在问怎么做,其实就是ControlNet的简单应用,比如模拟光线照射文字的,之前用来调整自然光线的角度和范围这次不过是将原来模拟光照的
图
变成了文字了
图像文字
ControlNet
Stable
Diffusion
Transformer
万字长文震撼来袭!揭秘Transformer——吐血
解
读自注意力机制的革命性突破
Transformer遵循这种总体架构,使用堆叠的自注意力机制和逐点、全连接层,分别用于编码器和
解
码器,如
图
1的左半部分和右半部分所示。
Transformer
大模型
免训练!单
图
秒级别生成AI写真,人像生成进入无需训练的单阶段时代
面对这一问题,FaceChain 给出了
解
决方案:无需大量数据,无需训练等待,甚至无需训练,只需要一张
图
片 10 秒钟即可立即生成 AI 写真!
FaceChain
FACT
文生图
Sora
探索Sora的魔法世界:功能展示、原理
解
析、未来市场影响大猜想!
这标志着我们如何理
解
和创造虚拟世界的方式即将迎来根本性的变革。
视频生成
sora
ComfyUI
免费的文本生成视频
解
决方案:AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI
AnimateDiff 是一个基于 Stable Diffusion 模型的文本生成视频插件,它通过控制模块影响
图
像生成过程,使得生成的
图
像序列具有与训练视频剪辑相似的特征。
视频生成
文生视频
一文彻底搞懂多模态 - 多模态推理
接下来分两部分:知识
图
谱推理、多模态推理任务,一起来深入了
解
多模态应用:多模态推理。
多模态推理
大模型
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
然而,语言模型缺乏像人类一样感知非文本模态(如
图
像和音频)的能力。
大模型
语音
<
...
11
12
13
14
15
16
17
18
19
20
...
>
1
2
4
5
6
7
8
9
100