首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 为你推荐开源项目:Meridian——专属个人情报站!
· GenColor.ai
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 6个最佳开源TTS引擎
· Suno音乐新手指南(手把手完整版教程)
· AI换脸工具:facefusion使用心得
· ChatGLM智谱清言
· MCP服务介绍及应用场景报告-来自Manus
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ComfyUI
从零开始:构建你的首个ComfyUI工作流
这种节点式界面其实广泛的存在于各种专业的生产力工具中,例如 Blender、虚
幻
引擎、达芬奇等。
comfyui
文生图
工作流程
大模型
【全文翻译】微软166页论文解读 GPT-4V:多模态大模型的黎明
考虑到视
觉
在人类感官中的主导地位[30, 55],许多 LMM 研究从扩展视
觉
能力开始。
多模态大模型
GPT-4V
文生图
赚钱
你还在为钱发愁?2023年十大赚钱GPT Prompts高级指南!(国际版)
使用Deck Robot制作相应的
幻
灯片。”
prompt
开源
「Agent」通俗易懂地聊聊AI Agent(附66个开源+44个闭源Agent项目)
以下是LLM的一些缺点: 1)会产生
幻
觉
。
大模型
OpenAI
马斯克怒告OpenAI案解密:Ilya看到了什么?125万亿参数Q*细节曝光,53页PDF全网疯转
但直
觉
告诉我们应该不只如此。
OpenAI
大模型
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
LinkSoul.AI 团队接下来的工作会把语音 - 视
觉
- 文本进一步融合,让大语言模型同时支持语音和视
觉
模态。
开源模型
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
这为前端开发带来了一场自动化革命,其中多模态大型语言模型(LLMs)有望直接将视
觉
设计转换为代码实现。
设计转代码
大模型
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
背后原理 目前的多模态大模型几乎都是用 CLIP 作为 Vision Encoder 或者说视
觉
词表。
OCR
手写
文字识别
SDXL
总结些SDXL出人像时遇到的困难
所以我出的图,最多是能做到眼含泪水的感
觉
。
文生图
SDXL
大模型
MindChat心理大模型
学习 轮数 用户 MindChat 1 总感
觉
自己学习很差, 想努力
心理大模型
全球生成式 AI 应用全景图
生成式AI 应用与多模态模型 在语言大模型和多模态多模态大模型快速取得质变的同时,视
觉
领域的基础大模型Vision Transformer(VIT)在&
大模型
【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
Abstract(此部分翻译为主) 当前的计算机视
觉
(CV)模型通常被训练用于预测有限的物体类别。
OpenAI
自然语言监督
【AI绘画】入门英文名词解析
Image、Inpainting(图像修复)、Textural Inversion(神经网络文本学习),而无须专业的集群GPU来进行深度学习才能使用)操作简单,出图快,平均10-20秒,画人物很强,西方魔
幻
风格
文生图
AI绘画
Stable Diffusion
读取大脑重建高清视频,Stable Diffusion还能这么用
从大脑活动中重建人类视
觉
任务,尤其是功能磁共振成像技术(fMRI)这种非侵入式方法,一直是受到学界较多的关注。
stablediffusion
VividTalk:用一张照片和一段音频让人物栩栩如生地说话
这一过程不仅保证了运动的平滑性,也保持了视
觉
的连贯性和逼真度。
VividTalk
视频
<
...
14
15
16
17
18
19
20
21
22
23
...
>
1
2
4
5
6
7
8
9
100