首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 万字长文,AI大模型的应用实践总结
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· ComfyUI 基础教程(一)环境部署和插件安装
· 备案通过且面向公众开放的国产精品大模型汇总,附访问链接
· 保姆级教程:Coze 打工你躺平
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI安装及生成第一张图
· Stable Diffusion 喂饭教程来啦!价值上万的模特AI换装方法
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
有感情的语音合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语音生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语音和
视
频
介绍等应用。
ChatTTS
语音合成
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
Sadtalker是一个能够根据图片和音
频
生成
视
频
的开源项目,它使用了一种叫做SadNet的神经网络,可以实现风格化的单图说话人脸动画。
数字人
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
今天,介绍一个开源创新的虚拟人
视
频
生成框架:MuseV MuseV是由腾讯音乐娱乐的天琴实验室开源,MuseV专注于生成高质量的虚拟人
视
频
和口型同步,能够制作出具有高度一致性和自然表情的长
视
频
内容
MuseV
视频
数字人
框架
StableDiffusion
AI绘画由入门到精通:StableDiffusion精讲课程
这款软件以其独特的优势和无限的可能性,为艺术家、设计师乃至广大创意爱好者提供了前所未有的
视
觉表达工具。
SD
视频课程
AI绘画
在 WebUI 中使用 AnimateDiff 的一些问题和技巧
这两天晚上没事的时候就会尝试下AnimateDiff,发现这真的让
视
频
生成上了一个大台阶,估计是到了AI
视
频
爆发的前夜了。
AnimateDiff
SD
开源
通过声音生成逼真的全身形象?!Meta开源AI工具:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据音
频
生成逼真的人物
视
频
!
audio2photoreal
开源工具
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
.01 概述 在日常生活和工作中,你是否常因嘈杂的环境、重叠的对话或音
视
频
信号的混杂而感到沟通困难?
ClearerVoice-Studio
语音
Sora
Sora物理悖谬的几何解释
所示,Sora的训练集为短
视
频
集,每个样本是一个短
视
频
,同类的短
视
频
构成一个数据流形。
Sora
解释
开源
微软最强全自动数据可
视
化工具!现已开源
8.14,微软开源了之前已经发布的全自动数据可
视
化工具 LIDA。
大模型
一文搞懂贝叶斯定理有什么用
在统计学里,长期以来,有
频
率学派和贝叶斯学派两大学派,他们互相鄙
视
对方,就像华山派的气宗与剑宗之争。
贝叶斯定理
Stable Diffusion
Stable Diffusion|儿童绘本全流程制作分享
上次分享了一个将小说转化为
视
频
的全过程的教程。
StableDiffusion
绘本
教程
openpose原理及安装教程(姿态识别)
OpenPose是一个用于实时多人姿态估计的开源库,它可以检测图像或
视
频
中的人体关键点,并且能够识别不同的身体部位和动作。
行为识别
姿态识别
Transformer
ViTPose+:迈向通用身体姿态估计的
视
觉Transformer基础模型
目前,
视
觉transformer已经在识别、检测、分割等多个
视
觉任务上展现出来很好的性能。
ViTPose+
Transformer
身体姿态
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音
频
克隆声音的黑科技!
2、独特的音
频
处理三步法 音
频
标记化(Audio tokenization) 使用 WavTokenizer 对音
频
进行处理,每秒可处理 75 个标记
OuteTTS-0.1-350M
音频
换脸
AI 换脸——Deepfacelab 下载与安装,新手教程
AI 换脸越来越火,换脸的
视
频
到处都是,那种还是那种的都有。
Deepfacelab
换脸
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100