首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· StableDiffusion模型推荐系列(全能型)
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 一个让GPT重复自问自答的Prompt
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 一个完整Prompt让ChatGPT自动生成短视频制作脚本
· 来个优秀的开源人脸识别项目!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
生成式AI与大语言模型的区别
此外,转换器架构(由ChatGPT中的T表
示
)是这项技术的关键元素。
生成式AI
大语言模型
区别
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现
图
片说话(如下
图
的蒙娜丽莎)、视频融合语音(这里的核心都是人物口型与音频中的语音唇形同步)。
数字人
视频
Prompt
一个让GPT重复自问自答的Prompt
然后以下面的模式继续回答和
提
问。
prompt
大模型
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
多模态大模型综合评测 1 融合整体和局部的高清
图
像表
示
传统的多模态模型的
图
像表
示
只有整体,XVERSE-V 创新性地采用了融合整体和局部的策略,支持输入任意宽高比的
图
像
XVERSE-V
多模态大模型
阿里
阿里出品自动化视频剪辑工具FunClip!
FunClip的特色功能包括集成高精度的中文ASR模型、支持热
词
定制化、说话人识别,以及
提
供Gradio交互界面,大大简化了视频剪辑的复杂度。
FunClip
视频
阿里
Google
Google 模型解读 | MoveNet-SinglePose:自底向上做单人姿态估计
模型 Backbone MoveNet整体的结构如上所
示
,Backbone部分是比较经典的带三层deconv的MobileNetv2,并且使用了残差连接来获取浅层特征,这个结构我已经在各种工程和学术论文中都见到了
MoveNet-SinglePose
Google
模型
为什么说AI现在还不行!
也正因此最近写了几篇文章都在
提
应该以一种更加理性的态度来看待AI的进展,甚至设想了一种测试智能程度的方式:
图
灵测试2.0。
大模型
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工作流程
图
Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
Transformer
如何最简单、通俗地理解Transformer?
由此,权重通过softmax函数计算得出: 下
图
直观描述注意力如何作用在一系列单
词
上。
Transformer
大模型
Sora
Sora物理悖谬的几何解释
用这种方法,Sora可以为所有的训练视频数据添加高度描述性的字幕,从而
提
高了训练集的质量,进一步
提
升系统性能。
Sora
解释
Stable Diffusion
OpenAI救了Stable Diffusion!开源Dall·E3同款解码器,来自Ilya宋飏等
它能让
图
像生成质量更高、更稳定,比如多人脸、带文字
图
像以及线条控制方面。
SD
文生图
DALLE
Stable Diffusion
Stable diffusion又一个电商换装/换模特辅助插件
今天继续玩换装 分享一款辅助插件 Inpaint anything 这个插件结合了 segment anything 进行蒙版
提
取 在segment anything
Stable
diffusion
文生图
换脸
全新换脸工具ReActor,比roop更强!
右边的选项的意思是自动识别
画
面中人物中的性别进行替换。
ReActor
SD
文生图
ComfyUI
如何拥有你的卡通形象?ComfyUI-workflow
CN-Openpose 使用Openpose传达角色的姿势,
图
片大小将按比例缩放至最大边长800像素,避免
图
片过大。
ComfyUI-workflow
文生图
Stable Diffusion
Stable Diffusion高精度换脸
二、实操案例 1.
图
生
图
示
例(局部重绘) 操作步骤一:初版换脸 Stable Diffusion 模型:BRA_V4_2.safetensors
Stable
Diffusion
文生图
<
...
43
44
45
46
47
48
49
50
51
52
...
>
1
2
4
5
6
7
8
9
100