首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 万字长文,AI大模型的应用实践总结
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· ComfyUI 基础教程(一)环境部署和插件安装
· 备案通过且面向公众开放的国产精品大模型汇总,附访问链接
· 保姆级教程:Coze 打工你躺平
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI安装及生成第一张图
· Stable Diffusion 喂饭教程来啦!价值上万的模特AI换装方法
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
工具
再次重点介绍!!!这款国内的AI制作
视
频
工具
之前介绍过一款图片生成
视
频
的工具-Flow Photo,99%的人不知道的一款国内的AI制作
视
频
工具。
Flow
Photo
视频
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类
视
频
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类
视
频
生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
MagicPose
视频
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音
视
频
流
轻松访问 LiveKit WebRTC 会话并处理或生成音
频
、
视
频
和数据流。
voice
agent
开源
音视频
教程
用AI做郭德纲说英文相声的爆款
视
频
(详细教程)
郭德纲用英文说相声的短
视
频
火爆全网,单条
视
频
点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把
视
频
翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
开源
爆火「
视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
“
视
频
版ControlNet”来了!
ControlNet
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/
视
频
/音
频
/文本
在
视
频
对齐领域,作者从开源和内部来源获取
视
频
数据。
Baichuan-Omni
多模态大模型
Roop参数说明,ROOP->StyleGAN演示!
因为这个
视
频
刚好有很多张脸,然后又是多角度60帧4K的动态
视
频
,所以我觉得非常适合拿来测试ROOP。
视频
StyleGAN
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音
频
生成栩栩如生的人物说话头像
视
频
它通过先进的音
频
到3D网格映射技术和网格到
视
频
的转换技术,实现了高质量、逼真的音
频
驱动的说话头像
视
频
生成。
VividTalk
视频
Sora
OpenAI Sora
视
频
生成模型技术报告中英全文+总结+影响分析
•目前当红的短
视
频
推荐的形态可能会发生改变——从系统根据用户喜好推荐短
视
频
,变成针对性生成短
视
频
?
sora
openai
视频生成
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、
视
频
,还可在端侧部署
总参数量 8B,单图、多图和
视
频
理解性能超越了 GPT-4V。
minicpm
面壁
语音
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜
视
频
实践
本次让我们基于Bert-vits2项目来克隆渣渣辉和刘青云的声音,打造一款时下热搜榜一的“青岛啤酒”鬼畜
视
频
。
Bert-vits
语音
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型
视
频
往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声音不是他发出来的,以至于大家看对口型
视
频
的时候,会有一种割裂感。
Loopy
视频
VividTalk:用一张照片和一段音
频
让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段音
频
结合起来,创造出仿佛真人在说话的
视
频
的技术。
VividTalk
视频
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
只需提供一段音
频
和一个
视
频
,PersonaTalk便能精准同步人物的口型,不仅让声音和嘴型无缝贴合,还能保留
视
频
中人物的表情和个性化说话风格,仿佛原生发声一般自然流畅。
PersonaTalk
视频
Sora
快手版Sora「可灵」开放测试:生成超120s
视
频
,更懂物理,复杂运动也能精准建模
与
视
频
一同曝光的,是一款名为「可灵」全新国产
视
频
生成大模型。
可灵
快手
文生视频
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100