文章列表-AI魔法学院

文章列表

世界上最流行（github排名高）的开源移动机器人的操作系统ROS开源了！！

ROBOTIS OP3 的显着变化之一是执行器方面，用 XM-430 执行器替换 MX-28 执行器。

ROS 机器人开源模型

Coze多智能体（Multi-Agents）模式体验！

在这次创建过程中我会用到”添加智能体“、”配置智能体“、”全局跳转条件“功能，下面详细说明。

Coze 多智能体

万字长文-大语言模型指令调优综述

在这种方法中，通过使用模板将文本标签对转换为(指令、输出)对。

大语言模型

VividTalk：用一张照片和一段音频让人物栩栩如生地说话

网格到视频的转换：利用双分支运动-VAE和生成器，VividTalk将3D网格运动转化为2D视频。

VividTalk 视频

如何从零开始，打造一家AI驱动的公司？

基本功能包括： · 生成定制化电子邮件、产品描述、摘要等 · · 自动将日期等非结构化数据转换为结构化数据

大模型打造公司

一张图看懂IT人的江湖地位

本文转自公众号特大号大模型江湖地位篇不包括非国产大模型公有云服务商江湖地位篇仅代表国内市场地位与表现

工作

超越Animate Anyone! 南加大&字节提出MagicPose，不需任何微调就可生成逼真的人类视频

MagicPose:现实的人类姿势和面部表情重新定位与身份意识扩散摘要在这项工作中，我们提出了MagicPose，这是一种基于扩散的模型，用于在具有挑战性的人舞视频中进行2D人体动作和面部表情的转移

MagicPose 视频

大模型实践总结

但是进行模型训练之前需要先进行模型格式转换，将HF格式转换为Alpa格式的模型文件，具体请参考官方代码。

大模型训练

Stability AI开源上新：3D生成引入视频扩散模型

相机的运动轨迹信息和扩散噪声的时间信息会一起输入到残差模块中，转换为正弦位置嵌入，然后这些嵌入信息会被整合并进行线性变换，加入到噪声时间步长嵌入中。

sv3d 建模

教你打造属于自己的AI孙燕姿，AI歌手模型使用及训练保姆级课程 #1/2 使用模型

原始声音处理要使用模型进行推理的话你首先需要一段已经演唱好的声音垫进去，然后使用模型把原来的音色换成你模型训练好的音色（类似AI画图的img2img垫图）。

生成式AI

阿里AI黑科技大揭秘：从通义千问到FaceChain，让图片和视频焕发新生！

一个静态图片转视频的项目。

阿里云视频音频

20个常见AI绘画工具大汇总（含免费版哦~）

改头换面之后，他现在可牛逼了！

文生图

Stable Diffusion

超级干货，自学stable diffusion，看完这篇就够了

本期将从以下4个模块逐步讲解: sd提示词怎么写 sd模型下载 sd实用插件 Control Net插件讲解 *注意：文章内的链接不可直接跳转，需自行复制到浏览器打开！

Stable Diffusion 文生图

Stable Diffusion

[Stable Diffusion]SD安装、常用模型（checkpoint、embedding、LORA）、提示词具、常用插件

通过选择对应的 Checkpoint 文件，您可以将 Stable Diffusion 模型生成的结果转换为您所选择的特定风格。

开源模型文生图图生图提示词

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

项目简介 F5-TTS是一款基于流匹配的全非自回归文本到语音转换系统。

F5-TTS 音频克隆

<...12 13 14 151617 18 19 20 21 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1