首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
· 拒绝996,想出海赚美元?这7个GPT方案绝对靠谱!
· 大模型微调数据选择和构造技巧
· 深度|红杉重磅发布:2024 AI 50 榜单 (全网最全)
· 阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
· Prompt屠龙术-大厂prompt工程指南解析提炼
· 还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
Sora懂不懂物理世界?
Sora的基本原理 Sora的训练集为短视
频
集,每个样本是一个短视
频
,Sora将其编码到数据空间进行降维,然后在隐空间中将特征向量切割成补丁,加上时间顺序,构成时空补丁,亦即时空令牌(time-space
文生视频
视频生成
sora
AI音乐热潮下,“神曲工作室”率先失业
“普通人肯定记不住你今天刷了多少视
频
,听到了多少BGM。
音乐
音频
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片音
频
可以生成,而用自己的图片、音
频
生成视
频
就不行。
SadTalke
Agent
聊聊我对AI Agents技术的一些看法
最近这几个月,Agent 这一概念可谓火出天际,从 AutoGPT 一周 6 万 star 刷新 Github 涨星速度记
录
开始,AI Agent 项目如雨后春笋开始在各大技术平台涌现。
AI
Agents
大模型
工具
TTS,一个奇妙的AI工具
在自媒体盛行的今天,很多人尝试制作视
频
发到自媒体平台上,通过获得流量的方式实现直接或间接变现。
TTS
文本转语音
LLM
ChatPDF | LLM文档对话 | pdf解析关键问题
在此记
录
一些难题和解决方案,首先讲解主要思想,其次以问题+回答的形式展开。
大模型
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短视
频
火爆全网,同类型的AI短视
频
层出不穷,更有好莱坞明星说中文的短视
频
,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的AI短视
频
吧!
数字人
音视频
教程
爆火的“女孩的一生”,plus版教程它来了
嘿,动画和视
频
制作的小伙伴们,今天我们来聊聊怎样用animatediff和LCM(Lower Complexity Model)来制作超炫酷的视
频
。
动画
视频
AnimateDiff
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示转换为视
频
。
AnimateDiff
视频
训练
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的音
频
驱动唇部同步模型。
MuseTalk
数字人
音频
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
不管是唱歌视
频
,还是讲话视
频
,只要提供一张肖像照片,外加一段音
频
,算法就会自动生成一段口型完全能对上、画面生动的视
频
出来。
EMO
阿里
全民演唱
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
,即便通过视
频
扩展等手段,最多也只能生成十几秒的视
频
。
视频生成
sora
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
前段时间,「霉霉大秀中文」的视
频
在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似视
频
。
语音
HeyGen
换脸
Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改视
频
,分割和修饰
无论您是钻研语音合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散视
频
还是视
频
制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工作流程图
音视频
Flow
Matching
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100