首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI虚拟主播数字人技术实现Wav2Lip
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· Suno音乐新手指南(手把手完整版教程)
· SD3 正式开源 Sora同源架构
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 一位芯片投资人的十年复盘:谁是中国的英伟达|AI光年
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 我尝试了 100 个免费 AI 工具,这些是最好的
· 深入探讨:Agent全自动写作长篇小说技术原理解析
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
说真的,学会用SD做电商
图
,你才是真的入了门
在开始之前,我们先捋一捋制作思路: 从一张真实产品
图
开始——分割背景和产品——替换背景——调整尺寸和文字 拍摄真实产品
图
别看一些MJ教程中用提示词出产品
图
,绕不开的问题是随机性太大。
文生图
SD
电商
大模型
使用知识
图
谱提高RAG的能力,减少大模型幻觉
例如,一个知识
图
可以根据边缘
标
签告诉你“巴黎”是“法国”的首都。
RAG
大语言模型
一个令人惊艳的
图
片高清化重绘神器:SUPIR来了!
今天给大家分享一个将模糊
图
片还原为照片级高清
图
像的AI项目:SUPIR。
SUPIR
文生图
OCR
完全指南——使用python提取PDF中的文本信息(包括表格和
图
片OCR)
文档的布局(Layout)分析
图
3:布局分析,理解什么是LOGO,什么是
标
题,什么是表格等 对于初步分析,我们使用PDFMiner的Python库将文档对象中的文本分离为多个页面对象
大语言模型
python
Stable Diffusion
张嘴就能生
图
?这已经不是科技,这是魔法!(Stable Diffusion进阶篇:SDXL-Turbo)
https://youtu.be/adDyTzBdUcg 其生
图
的速度远远超过了传统生成的速度,都什么年代还在边等
图
边打星穹铁道?
SDXL-Turbo
文生图
阿里
体验完阿里的EMO模型,我emo了
简单来说,EMO(Emote Portrait Alive)是一个AI肖像视频生成系统,能够通过输入单一的参考
图
像,生成具有一定表现力的面部
标
签和各种头部姿态。
EMO
文生图
StableDiffusion
StableDiffusion模型推荐系列(功能型)
接下来是
图
标
设计。
StableDiffusion
文生图
视频
开箱即用的
图
像增强、视频增强AI工具,Upscapl、Topaz Video AI
Upscapl专注于
图
像增强、
图
片放大;Topaz Video AI专注于视频画质提升、防抖、补帧、慢放等;软件下载链接详见功能介绍,快来试试吧!
图像增强
视频增强
Stable Diffusion
Meta发布业界最强文生
图
模型CM3Leon,实力碾压Stable Diffusion、Midjourney
将大规模多任务指令调优应用于CM3leon,用于
图
像和文本生成,显著提高了
图
像
标
题生成、视觉问答、基于文本的编辑和条件
图
像生成等任务的性能。
文生图
一招让你的 AI
图
像更惊艳!DALL-E 3 自定义指令魔法
图
像
标
识: - 为每张
图
片指定一个独特的
标
识符。
DALL-E3
文生图
健康
教小朋友学习AI绘画的同时避免生成不健康
图
片
有朋友咨询,为了避免输在起跑线上,想教小朋友学AI绘画,但又不想让孩子接触到不健康
图
片,有没有办法解决。
小朋友
绘画
企业
大语言模型LLM和知识
图
谱KG增强的企业搜索应用
LLM和KG增强的企业搜索应用 比如,我们将LLM、知识
图
谱以及传统搜索能力有效融合,以LLM实现面向用户查询的理解和对来源数据存储的查询转换,以非侵入式查询文档
开源模型
60.2K Star!别再熬夜写样式了!Screenshot-to-Code:截个
图
,代码全搞定!!
· • SVG:直接导出矢量
图
,适合 Logo、
图
标
等场景。
Screenshot-to-Code
代码
教程
Markdown 介绍及使用教程
[](
图
片链接地址)表示插入
图
片 效果如下: 一、
标
题 这是最为常用的格式,在平时常用的的文本编辑器中大多是这样实现的:输入文本、选中文本、设置
标
题格式。
编程
一文彻底搞懂多模态 - 多模态推理
多模态推理的目
标
是从不同模态的信息中获取更全面、更准确的理解和知识,以支持各种任务,包括视觉问答、视觉常识推理、视觉语言导航等。
多模态推理
大模型
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100