首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 制作可爱的表情包
· 微软打破Decoder-Only架构!大幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行
· BaiChuan百川
· 【揭秘】BELLE大模型:一个集合训练、数据、模型、APP的超级神器,让每个人都能拥有自己的“大模型”!
· BypassGPT-AI文本人性化
· 第3期 SDXL和SD的10大区别!你知道几个?
· Suno音乐新手指南(手把手完整版教程)
· humanize.im
· 大模型高效微调:🤗 PEFT 使用案例
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
爆火「
视
频版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
(ControlNet实现了根据提示词精准控制
图
像元素改变,如人物动作、
图
像结构等) 根据给到的提示词,它仅改变
视
频的画风,而且是针对完整
视
频。
ControlNet
教程
SD入门教程二:文生
图
基础用法(提示词)
精准表达你的意
图
才是最重要的,而不是堆积非常多无用的词语。
SD
prompt
文生图
提示词
教程
SD入门教程五:后期处理
图
片高清放大
· R-ESRGAN_4X:通常用于需要高清晰度放大的场景,如摄影、
视
频增强、医学成像等领域。
SD
入门教程
修复
谷歌
让Cursor免费使用谷歌最新
图
像编辑模型#Nano Banana MCP
最近谷歌的新模型nano-banana非常火,速度快,一致性也不错,我把这个模型制作成了MCP,主要提供两个工具:生
图
和编辑
图
像。
Nano
Banana
MCP
文生图
Stable Diffusion
【Stable Diffusion】SD迎来动画革命,AnimateDiff快速出
图
参数可以按照正常出
图
的思路设置,尺寸512x512,根据电脑配置量力而行。
文生图
开源模型
Sora
OpenAI Sora
视
频生成模型技术报告中英全文+总结+影响分析
我们利用了一种在
视
频和
图
像潜码的时空块上操作的变压器架构。
sora
openai
视频生成
StableDiffusion
AI绘画由入门到精通:StableDiffusion精讲课程
这款软件以其独特的优势和无限的可能性,为艺术家、设计师乃至广大创意爱好者提供了前所未有的
视
觉表达工具。
SD
视频课程
AI绘画
大模型
OCR终结了?旷
视
提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
背后原理 目前的多模态大模型几乎都是用 CLIP 作为 Vision Encoder 或者说
视
觉词表。
OCR
手写
文字识别
ChatGPT
Ollama的本地化又一
图
形工具ChatOllama,让你轻松玩转ollama,ChatGPT
ChatOllama是一款ollama
图
形化管理工具,集成了ollama,OpenAI,可以实现ollama的模型管理,系统指令管理,知识库管理,AI聊天等功能,功能方面与Open WebUI类似,作者在不断改进优化功能
ChatOllama
安装
Stable Diffusion
AnimateDiff:一篇文章教你学会用Stable Diffusion制作GIF动
图
这是一个AnimateDiff介绍教程,这个工具可让您使用Stable Diffusion创建令人惊叹的 GIF 动画,这是目前为止最好的文本生成
视
频(Text-to-video)人工智能工具之一。
AnimateDiff
视频
训练
DALL-E 3 不只是文生
图
!10 个案例颠覆认知
你只需要告诉 DALL-E 3 你的想法,并让它把想法可
视
化即可。
DALL-E
3
文生图
大模型
图
解大模型训练之:张量模型并行(TP),Megatron-LM
则每次forward的过程如下: 为画
图
方便,
图
中所绘是b=1时的情况。
开源模型
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像
视
频
简介 一次性音频驱动的说话头生成旨在通过音频作为输入信号来驱动任意面部
图
像,并具有广泛的应用场景,如虚拟化身、
视
觉配音和
视
频会议。
VividTalk
视频
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型
视
频往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声音不是他发出来的,以至于大家看对口型
视
频的时候,会有一种割裂感。
Loopy
视频
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
Stable Diffusion是一个能够根据文本描述生成高质量
图
片的深度学习模型,它使用了一种叫做潜在扩散模型的生成网络架构,可以在普通的GPU上运行,还可以加载各种出
图
模型以及动画模型。
数字人
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100