首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· AI异常值案例库第2期,5个灵感案例,新型流量获客法和产品形态
· Fooocus制作从小到老图
· 【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· Stable Diffusion | 常见问题清点汇总
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI Comic Factory:AI(连环)漫画生成器
项目目前使用Llama-2 70b
作
为LLM,有三种选项:使用Inference API模型、使用Inference Endpoint URL、或自行修改代码以使用其他LLM系统。
生成式AI
工具
免费文生图工具StableDiffusion喂饭级使用教程
www.bilibili.com/video/BV17d4y1C73R 星空一键整合包: https://www.bilibili.com/video/BV16j411A7BL 注:星空的东西很全,但是
视
频
讲的不是很清楚
文生图
SD
万字长文-大语言模型指令调优综述
Video-LLaMA (Zhang et al., 2023b)是一个多模态框架,它增强了大型语言模型的理解
视
频
中的
视
觉和听觉内容的能力。
大语言模型
开源
OpenAI 开源语音识别 Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动语音识别模型的软件工具,能够将音
频
或
视
频
中的语音自动识别为带有时间戳的文本字幕。
生成式AI
DALL-E 3 不只是文生图!10 个案例颠覆认知
在舞台的两侧,将有两个大型 LED 屏幕显示演示文稿和
视
频
。
DALL-E
3
文生图
开源
开源免费离线语音识别神器whisper如何安装
whisper的日常用途 whisper的核心功能语音识别,对于学生党和工
作
党来说,可以帮助我们更快捷的将会议、讲座、课堂录音整理成文字稿;对于影
视
爱好者,可以将无字幕的资源自动生成字幕,不用再苦苦等待各大字幕组的字幕资源
wisper
翻译
免费
清华
图片生成速度最高提升10倍!可以做到“实时”生成!清华推出LCM/LCM-LoRA!
近年来,随着SD和Midjourney的火热,文本到图像生成(Text-to-Image Generation)的研究取得了令人瞩目的进展,让我们能够用自然语言指导AI
创
造出各种各样的图像。
LCM/LCM-LoRA
文生图
大模型
从零开始了解AI大模型 - 技术篇:万字深度好文人话说大模型技术
ChatGPT的惊世之举,让大家见识到通用人工智能的辉煌崛起,也让AI在文本
创
作
、摘要提炼、多轮对话甚至代码生成等领域迈向了一个质的飞跃。
大模型
【AI绘画】入门英文名词解析
此外对于调用
频
次 数量也有限制 限于GPU算力费用 很多可能一开始免费 后续就开始收费 以充值点数或以按月订阅(subscribe)的形式(大部分其他AI绘画都是这种形式) *******
文生图
AI绘画
大模型
大模型应用中大部分人真正需要去关心的核心——Embedding
向量Embedding非常灵活,包括音
频
、
视
频
、文本和图像都可以表示为向量Embedding。
大模型
大模型
投资人逃离大模型
依图科技:“天问”大模型是上海依图网络科技有限公司在2023年底首发的一款多模态大模型,是
视
频
监控领域内第一个商用发布的大模型产品,基于先进的Transformer架构,具有会思考、可对话、能进化的三大特点
大模型
大模型
中国大模型「顶流群聊」笔记
8 月 23 号,西溪论道参会者合影看得出来,阿里云
作
为算力基础设施层应该如何与这几个层面连接与共
创
,如何支持各个层面的
创
业者做好大模型用好大模型,这是张勇最关心的话题。
大语言模型
将任意文本转换为知识图谱
这些信息通常存储在图形数据库中并可
视
化为图形结构,从而产生了知识“图形”一词。
知识图谱
转换
文本
一网打尽 | 掌握64个策划思维模型,逆转职业寒冬!(高清图+模型详解)
“浏览”包括图文阅读、直播观看、短
视
频
播放。
策划思维模型
方法论
ComfyUI
ComfyUI官方使用手册【官网直译+关键补充】
信息:当常规 VAE 解码节点由于 VRAM(
视
频
随机存取存储器)不足而失败时,comfy(一种软件)将自动使用瓦片式实现进行重试。
文生图
图生图
comfyui
<
...
26
27
28
29
30
31
32
33
34
35
...
>
1
2
4
5
6
7
8
9
100