首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 大模型:泛化即智能,压缩即一切
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 必看!阿里通义千问完整技术报告
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成。
· 详解Stable Diffusion提示词prompt语法
· 你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
一张图看懂IT人的江湖地位
本文
转
自公众号特大号 大模型江湖地位篇 不包括非国产大模型 公有云服务商江湖地位篇 仅代表国内市场地位与表现
工作
如何从零开始,打造一家AI驱动的公司?
基本功能包括: · 生成定制化电子邮件、产品描述、摘要等 · · 自动将日期等非结构化数据
转
换
为结构化数据
大模型
打造公司
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
MagicPose:现实的人类姿势和面部表情重新定位与身份意识扩散 摘要 在这项工作中,我们提出了MagicPose,这是一种基于扩散的模型,用于在具有挑战性的人舞视频中进行2D人体动作和面部表情的
转
移
MagicPose
视频
Agent
Coze多智能体(Multi-Agents)模式体验!
在这次创建过程中我会用到”添加智能体“、”配置智能体“、”全局跳
转
条件“功能,下面详细说明。
Coze
多智能体
人工智能
2023年人工智能行业总结(精简版)
在这一过程中,山姆奥特曼的命运也发生了
转
折。
人工智能
行业总结
万字长文-大语言模型指令调优综述
在这种方法中,通过使用模板将文本标签对
转
换
为(指令、输出)对。
大语言模型
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
一个静态图片
转
视频的项目。
阿里云
视频
音频
大模型
大模型实践总结
但是进行模型训练之前需要先进行模型格式
转
换
,将HF格式
转
换
为Alpa格式的模型文件,具体请参考官方代码。
大模型
训练
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
voice-changer[2] Stars: 12.4k License: NOASSERTION VC Client 是一个用于实时音频
转
换
的客户端软件
AudioCraft
音频
教你打造属于自己的AI孙燕姿,AI歌手模型使用及训练保姆级课程 #1/2 使用模型
原始声音处理 要使用模型进行推理的话你首先需要一段已经演唱好的声音垫进去,然后使用模型把原来的音色
换
成你模型训练好的音色(类似AI画图的img2img垫图)。
生成式AI
开源
Stability AI开源上新:3D生成引入视频扩散模型
相机的运动轨迹信息和扩散噪声的时间信息会一起输入到残差模块中,
转
换
为正弦位置嵌入,然后这些嵌入信息会被整合并进行线性变
换
,加入到噪声时间步长嵌入中。
sv3d
建模
工具
20个常见AI绘画工具大汇总(含免费版哦~)
改头
换
面之后,他现在可牛逼了!
文生图
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
项目简介 F5-TTS是一款基于流匹配的全非自回归文本到语音
转
换
系统。
F5-TTS
音频克隆
数字人
AI虚拟主播数字人技术实现Wav2Lip
公众所熟知知道的一个常见用例是面部交
换
的应用。
数字人
视频
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
LiveKit 支持语音、视频和数据流处理,内置了自动语音识别(ASR)和文本
转
语音(TTS)功能,简化了语音到文本和文本到语音的
转
换
过程。
GPT-4o
语音交互
<
...
12
13
14
15
16
17
18
19
20
21
...
>
1
2
4
5
6
7
8
9
100