首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
实时语
音
克隆
SV2TTS使用深度学习框架,分为三个阶段,通过
音
频
创建声
音
的数字表示,然后用这个表示来合成任意文本的语
音
。
语音
克隆
大模型
中文原生文生图大模型来了!腾讯混元推出,Sora
同
架构
升级后的混元文生图大模型采用了与 sora 一致的DiT架构,不仅可支持文生图,也可作为
视
频
等多模态
视
觉生成的基础。
文生图
混元
腾讯
写作
AI写作:一
步
到位,如何用 AI 生成整篇文章?做自媒体必看!
一、短内容 如果要写的内容比较简短,比如小红书文案、短
视
频
稿。
结构化提示词
写作
Stable Diffusion
Stable Diffusion 快速创作角色三
视
图
天分享分享如何通过 Stable Diffusion 快速创造出角色三
视
图。
SD
三视图
文生图
你的下一个浏览器,可以是豆包电脑版!
万万没想到,现在看B站
视
频
的打开方式,竟然可以这么AI了。
豆包
浏览器
Stable Diffusion
Stable Diffusion | SD阿里云3
步
部署,全程五分钟,免费试用三个月,电脑无需升级配置
别看到阿里云之类的就感觉陌生,敬而远之,其实也没有那么复杂,三
步
就完事了,这里就来拆解一下。
下载
AI拟声: 5秒内克隆您的声
音
这种独特的能力使得MockingBird在许多不
同
的领域中具有广泛的应用场景。
声音克隆
开源
StableDiffusion
AI绘画由入门到精通:StableDiffusion精讲课程
这款软件以其独特的优势和无限的可能性,为艺术家、设计师乃至广大创意爱好者提供了前所未有的
视
觉表达工具。
SD
视频课程
AI绘画
教程
AI声
音
克隆 | 最全最简教程(权威版)
,但是要收费的哈 但这些都不能指定声
音
转换,所以这里使用声
音
克隆,来将指定人声训练成模型,然后文字转
音
频
。
声音克隆
教程
大模型
中文版开源Llama 2
同
时有了语言、多模态大模型,完全可商用
多模态模型提供了不
同
模态之间信息交互的渠道,使得
视
觉信息、语
音
信息等能和文本语义信息互为补充,让大语言模型能听到世界、看到世界,从而向 GI 又前进一
步
。
开源模型
Ollama最新更新v0.1.33,实现了多并发可
同
时与多个模型聊天对话!
现在,多用户可以在
同
一台宿主机上与LLMs进行互动,实现
同
时聊天对话。
ollama
语言大模型
聊天
解读wav2lip:探究语
音
驱动唇部动作的技术原理!
,通常无法准确地合成口型,导致生成的
视
频
与
音
频
不
同
步
,主要原因包括两方面: (1)传统的基于像素的人脸重建损失无法准约束
音
频
-口型
同
步
:因为面部重建损失是基于整个图像计算的,而唇部区域只占整个图像的很小一部分
wav2lip
语音
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
Sadtalker是一个能够根据图片和
音
频
生成
视
频
的开源项目,它使用了一种叫做SadNet的神经网络,可以实现风格化的单图说话人脸动画。
数字人
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
今天,介绍一个开源创新的虚拟人
视
频
生成框架:MuseV MuseV是由腾讯
音
乐娱乐的天琴实验室开源,MuseV专注于生成高质量的虚拟人
视
频
和口型
同
步
,能够制作出具有高度一致性和自然表情的长
视
频
内容
MuseV
视频
数字人
框架
打造
音
乐传奇:Suno推出
音
乐生成模型Suno V3,让每个人都能成为作曲家
虽Suno V3在
音
乐创作领域实实在在地亮眼,但AI在
音
乐行业应用仍处起
步
阶段。
suno
歌曲
音乐
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100