首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 为你推荐开源项目:Meridian——专属个人情报站!
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 无显卡+纯本地跑Qwen1.5版模型!0基础闭眼部署指南!适用绝大部分开源模型!llama2+Mistral+Zephyr通杀!
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 秘塔AI搜索
· 国产视频制作之光-可灵:提示词大全整理
· M3E 可能是最强大的开源中文嵌入模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
通俗易懂地解释OpenAI Sora
视
频生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
另外值得一提的是,OpenAI Sora模型还可以直接生成
图
片,也就是说,它是一个以
视
频生成为核心的多能力模型。
sora
视频生成
开源
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
我愿称之为,最具有“电
视
剧质感”的AI
视
频大模型。
sora
视频生成
DALL-E 3 不只是文生
图
!10 个案例颠覆认知
DALL-E 通过4张
图
片展示了公司活动现场的效果,并做出了以下说明: 以下是企业活动的可
视
化设置: 主厅:这张
图
片展示了会议中心宽敞的主厅。
DALL-E
3
文生图
大模型
图
解大模型训练之:张量模型并行(TP),Megatron-LM
全文结构如下: 一、切分权重的两种方法 二、MLP层
三
、self-attention层 四、Embedding层 五、Cross-entropy层 六、经典并行:TP + DP (Megatron
开源模型
ComfyUI
SD的老舅ComfyUI来了,节点式工作流,分部控制出
图
方便大家看,我把板块调整为竖版,有一定SD基础的同学可以看到这其实就是SD的界面板块打散: ComfyUI有以下特点: 优点: 1.上限高,更适合复杂长线的大型工作 2模块化工作流 3.可
视
化
文生图
comfyui
提示词
好看的
图
片不知道怎么写提示词?用AI读出来
所谓反推,就是能够根据
图
片,倒推出这张
图
片的提示词。
文生图
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目
三
”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
人物动作
视
频生成框架Animate Anyone可基于单张
图
和动作序列,输出稳定、可控的人物动作
视
频;人物换装
视
频生成框架Outfit Anyone是基于服饰
图
和人物形象;人物
视
频角色替换框架Motionshop
通义
文生视频
工具
免费文生
图
工具StableDiffusion喂饭级使用教程
www.bilibili.com/video/BV17d4y1C73R 星空一键整合包: https://www.bilibili.com/video/BV16j411A7BL 注:星空的东西很全,但是
视
频讲的不是很清楚
文生图
SD
大模型
AI大模型LLM可以帮助企业做什么?
“ AI大模型为企业带来
三
大价值:一是提升效率。
大模型
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像
视
频
在3DMM中,
三
维脸型可以表示为: 数据预处理。
VividTalk
视频
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型
视
频往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声音不是他发出来的,以至于大家看对口型
视
频的时候,会有一种割裂感。
Loopy
视频
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
Stable Diffusion是一个能够根据文本描述生成高质量
图
片的深度学习模型,它使用了一种叫做潜在扩散模型的生成网络架构,可以在普通的GPU上运行,还可以加载各种出
图
模型以及动画模型。
数字人
耗时7天,终于把15种ControlNet模型搞明白了
这篇文章是SD
三
部曲的第
三
篇——「ControlNet的终极攻略」 前面我们说到如果想真正把SD应用起来,最重要的两个功能是:Lora和ControlNet Lora负责把想要画面的“主体”或“场景
文生图
VividTalk:用一张照片和一段音频让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段音频结合起来,创造出仿佛真人在说话的
视
频的技术。
VividTalk
视频
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
只需提供一段音频和一个
视
频,PersonaTalk便能精准同步人物的口型,不仅让声音和嘴型无缝贴合,还能保留
视
频中人物的表情和个性化说话风格,仿佛原生发声一般自然流畅。
PersonaTalk
视频
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100