首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI Agent的数字化革命:超越文本,走向自主决策与交互
· 推荐一个自动生成复杂提示词的模版:思考链(CoT)如何通过分步推理提升AI任务准确性 | 示例详解
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· MCI-GRU:在真实金融交易中验证有效的股票价格预测模型
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 用so-vits-svc-4.1进行音色转换的极简教程!
· ChatGLM3在线搜索功能升级
· 巧用这13个原则!创作ChatGPT提示词Prompt时效率提高10倍!
· 50张图“毒倒”Stable Diffusion,汽车和牛都分不清了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
工具
再次重点介绍!!!这款国内的AI制作
视
频工具
之前介绍过一款图片生成
视
频的工具-Flow Photo,99%的人不知道的一款国内的AI制作
视
频工具。
Flow
Photo
视频
Transformer
ViTPose+:迈向通用身体姿态估计的
视
觉Transformer基础模型
目前,
视
觉transformer已经在识别、检测、分割等多个
视
觉任务上展现出来很好的性能。
ViTPose+
Transformer
身体姿态
Roop参数说明,ROOP->StyleGAN演示!
因为这个
视
频刚好有很多张脸,然后又是多
角
度60帧4K的动态
视
频,所以我觉得非常适合拿来测试ROOP。
视频
StyleGAN
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类
视
频
具体来说,我们的目标是生成由新颖的姿势序列驱动的任何目标身份的人舞
视
频,同时保持身份不变。
MagicPose
视频
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音
视
频流
轻松访问 LiveKit WebRTC 会话并处理或生成音频、
视
频和数据流。
voice
agent
开源
音视频
教程
用AI做郭德纲说英文相声的爆款
视
频(详细教程)
郭德纲用英文说相声的短
视
频火爆全网,单条
视
频点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把
视
频翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
心理
万字长文,大语言模型如何宣告心理学的死亡?
每一个幽灵都暗指传统心理学曾经忽略的问题,本文将从大语言模型的
视
角
提供新的见解。
大语音模型
Agent
十篇高质量的AI-Agents相关论文,让AI教你认识AI-Agents
,基于 LLM的AI Agents是AGI领域接下来重要的发展方向,使得很多原本嘲笑Auto-GPT开发者,开始更多开始正
视
基于LLM驱动的AI-Agents系统。
开源模型
开源
爆火「
视
频版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
“
视
频版ControlNet”来了!
ControlNet
Sora
OpenAI Sora
视
频生成模型技术报告中英全文+总结+影响分析
但是从另一个
角
度将,创作门槛降低之后故事的竞争将异常激烈。
sora
openai
视频生成
大模型
OCR终结了?旷
视
提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
背后原理 目前的多模态大模型几乎都是用 CLIP 作为 Vision Encoder 或者说
视
觉词表。
OCR
手写
文字识别
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像
视
频
它通过先进的音频到3D网格映射技术和网格到
视
频的转换技术,实现了高质量、逼真的音频驱动的说话头像
视
频生成。
VividTalk
视频
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型
视
频往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声音不是他发出来的,以至于大家看对口型
视
频的时候,会有一种割裂感。
Loopy
视频
语音
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜
视
频实践
本次让我们基于Bert-vits2项目来克隆渣渣辉和刘青云的声音,打造一款时下热搜榜一的“青岛啤酒”鬼畜
视
频。
Bert-vits
语音
Sora
通俗易懂地解释OpenAI Sora
视
频生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
Sora生成的
视
频与此前其它平台生成的
视
频到底有哪些区别?
sora
视频生成
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100