首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
然后,它可以生成听起来自然的语
音
,以多种语言模仿该语
音
,
同
时为用户提供对情感、口
音
、节奏和语调等参数的精细控制。
OpenVoice
声音克隆
开源
AI资讯速递 - 快人一
步
!为你填平AI领域信息差及时揭示AI领域的最新动态
AI能够制作
视
频
吗?
AI资讯
AI新闻
在 WebUI 中使用 AnimateDiff 的一些问题和技巧
这两天晚上没事的时候就会尝试下AnimateDiff,发现这真的让
视
频
生成上了一个大台阶,估计是到了AI
视
频
爆发的前夜了。
AnimateDiff
SD
Prompt
营销Prompt:三分钟生成百篇营销文案,领先99%的
同
行!
今天我们就来聊聊在企业营销经营中,我们会用到的那些Prompt,以帮助你在营销中,领先99%的
同
行。
写作
营销
prompt
大模型
从零开始学习大模型-第二章-大模型学习路线
随着技术的进
步
,大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及
视
频
。
大模型
学习
Stable Diffusion
Stable Diffusion | SD腾讯云3
步
部署,全程五分钟,附价格费用清单
昨天分享的阿里云部署SD,得到不少朋友的关注,那不得不看看腾讯云部署了,流程和界面几乎都是一样的,逻辑是一样,唯一不
同
的是,腾讯云云盘没有试用,需要自己购买。
下载
开源模型
OpenAI
基于 OpenAI Whisper 模型的实时语
音
转文字工具
· WhisperLive 是一款专注于
音
频
处理和创作的开源软件,使用 OpenAI Whisper 模型将语
音
输入转换为文本输出,可以用于转录麦克风的实时
音
频
输入和预先录制的
音
频
文件,为艺术家和
音
乐制作人提供了一个强大的平台
WhisperLive
音频
开源软件
开源
F5-TTS:上海交大开源超逼真声
音
克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
音
频
克隆的开源项目很多,但是每次项目里要用的时候,总还是惦记着11labs的api。
F5-TTS
音频克隆
Sora
Sora物理悖谬的几何解释
所示,Sora的训练集为短
视
频
集,每个样本是一个短
视
频
,
同
类的短
视
频
构成一个数据流形。
Sora
解释
开源
只需四
步
就能构建自己的Agent!达摩院新开源框架小白也能用
写一篇关于Vision Pro VR眼镜的20字宣传文案,并用女声读出来,
同
时生成个
视
频
看看。
大模型
教程
openpose原理及安装教程(姿态识别)
OpenPose是一个用于实时多人姿态估计的开源库,它可以检测图像或
视
频
中的人体关键点,并且能够识别不
同
的身体部位和动作。
行为识别
姿态识别
大模型
“实时”语
音
翻译!AI语
音
具有“情绪”!最强开源AI大模型来了
(先别急着骂,我们先看看产品) 你是否遇到过这样的情况: 你想和一个说不
同
语言的人交流,但是你不会他的语言!
大模型
开源模型
语音
【提前体验GPT-5】吴恩达AI智能体工作流详细解读
当时他只是文本简单介绍了一下,现在他在斯坦福大学对此内容的演讲
视
频
已经发布。
GPT-5
智能体
AI绘画Stable-Diffusion风格化实战
在社交软件和短
视
频
平台上,我们时常能看到各种特色鲜明的
视
觉效果,比如卡通化的图片和中国风的
视
频
剪辑。
Stable-Diffusion
文生图
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
首先从数据开始: 如果你想克隆一个人的声
音
,你可以找到一段这个人的演讲录
音
,或者
视
频
,当然不
同
资源需要不
同
的处理 如果是
视
频
,可以使用 人声分离,如下图,点击这个就会弹出
数字人
声音克隆
GPT-SoVITS
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100