首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
· 拒绝996,想出海赚美元?这7个GPT方案绝对靠谱!
· 大模型微调数据选择和构造技巧
· 深度|红杉重磅发布:2024 AI 50 榜单 (全网最全)
· 阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
· Prompt屠龙术-大厂prompt工程指南解析提炼
· 还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
解读OpenAI Sora文生视
频
技术原理
OpenAI Sora文生视
频
(图像看作单帧视
频
)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗级的更新。
sora
工具
FFmpeg之父新作——音
频
压缩工具 TSAC
前两天FFmpeg作者Fabrice Bellard在个人主页发布了一款音
频
压缩工具TSAC。
TSAC
音频工具
开源
GitHub星数暴涨,AIPC的开源实现,用AI记
录
电脑一整天的使用太简单了,功能非常多!
项目简介 ScreenPipe 在你的计算机上 7*24小时 全天候记
录
你的电脑屏幕和麦克风,数据由用户自行掌控,确保隐私和安全,并且把记
录
的数据连接到大模型
AIPC
ScreenPipe
开源
大模型
视
频
大模型训练相关词条解释
Sora是OpenAI公司发布的一款AI视
频
生成模型。
视频生成
sora
词条
ChatGPT
一个完整Prompt让ChatGPT自动生成短视
频
制作脚本
———————— 把你想象成热门短视
频
脚本撰写的专家。
ChatGPT
Prompt
视频
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音
频
生成栩栩如生的人物说话头像视
频
它通过先进的音
频
到3D网格映射技术和网格到视
频
的转换技术,实现了高质量、逼真的音
频
驱动的说话头像视
频
生成。
VividTalk
视频
开源
语音、视
频
转文字神器:开源whisper介绍
用法 直接使用whisper指令识别音
频
和视
频
文件为文本,如: whisper video.mp4 这里需要重点说明的是,默认会生成5个文件,文件名和你的源文件一样,但扩展名分别是:.json
人工智能
大模型
wisper
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成视
频
插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视
频
剪辑的训练,它能够调整图像生成过程,生成一系列与训练视
频
剪辑相似的图像。
动画
视频
AnimateDiff
Sora
一文带你看懂OpenAI-Sora生成视
频
的原理
这就是视
频
压缩网络闪亮登场的时刻,它能够在不牺牲视
频
质量的前提下,极大地减少数据的大小。
视频生成
sora
工具
开箱即用的图像增强、视
频
增强AI工具,Upscapl、Topaz Video AI
图像和视
频
领域使用较多的AI工具,免安装,无需会员,开箱即用!
图像增强
视频增强
阿里
阿里出品自动化视
频
剪辑工具FunClip!
FunClip让用户能够根据识别结果,轻松选择文本片段或特定说话人,从而快速裁剪出所需视
频
片段。
FunClip
视频
阿里
OpenAI
【语音识别】OpenAI语音力作Whisper
与Wav2Vec 2.0等前作不同,以往的模型都是在未标注的音
频
数据上预训练的,而 Whisper 是在大量的已标注音
频
转
录
数据上预训练的。
语音转文字
whisper
VividTalk:用一张照片和一段音
频
让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段音
频
结合起来,创造出仿佛真人在说话的视
频
的技术。
VividTalk
视频
Stable Diffusion
[Stable Diffusion]AnimateDiff :最稳定的文本生成视
频
插件
在小视
频
风靡的时代,稳定的文本生成短视
频
成为了迫切需求。
AnimateDiff
视频
训练
Sora
中学生也能看懂的Sora视
频
生成原理解读
其次,这种方法极大地提高了处理视
频
的灵活性,使得Sora能够生成具有复杂动态的高质量视
频
,而这对于传统视
频
生成技术来说是一个巨大的挑战。
视频生成
sora
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100