文章列表-AI魔法学院

文章列表

DALL-E 3 不只是文生图！10 个案例颠覆认知

DALL-E 通过4张图片展示了公司活动现场的效果，并做出了以下说明：以下是企业活动的可视化设置：主厅：这张图片展示了会议中心宽敞的主厅。

DALL-E 3 文生图

图解大模型训练之：张量模型并行(TP)，Megatron-LM

全文结构如下：一、切分权重的两种方法二、MLP层三、self-attention层四、Embedding层五、Cross-entropy层六、经典并行：TP + DP (Megatron

开源模型

阿里&字节发表VividTalk，只需单张照片即可根据音频生成栩栩如生的人物说话头像视频

在3DMM中，三维脸型可以表示为：数据预处理。

VividTalk 视频

数字人起飞！字节Loopy对口型功能在即梦上线可根据语境匹配表情和情绪

以往，对口型视频往往存在一个通病，那就是看似嘴型对上了，但总感觉这个声音不是他发出来的，以至于大家看对口型视频的时候，会有一种割裂感。

Loopy 视频

如何免费打造自己的数字人主播：StableDiffusion插件SadTalker打造本地数字人主播

Stable Diffusion是一个能够根据文本描述生成高质量图片的深度学习模型，它使用了一种叫做潜在扩散模型的生成网络架构，可以在普通的GPU上运行，还可以加载各种出图模型以及动画模型。

数字人

免费文生图工具StableDiffusion喂饭级使用教程

www.bilibili.com/video/BV17d4y1C73R 星空一键整合包： https://www.bilibili.com/video/BV16j411A7BL 注：星空的东西很全，但是视频讲的不是很清楚

文生图 SD

阿里通义实验室薄列峰：从兵马俑跳“科目三”到照片唱歌，四大框架让AI生成的人物活起来丨GenAICon 2024

人物动作视频生成框架Animate Anyone可基于单张图和动作序列，输出稳定、可控的人物动作视频；人物换装视频生成框架Outfit Anyone是基于服饰图和人物形象；人物视频角色替换框架Motionshop

通义文生视频

AI大模型LLM可以帮助企业做什么？

“ AI大模型为企业带来三大价值：一是提升效率。

大模型

耗时7天，终于把15种ControlNet模型搞明白了

这篇文章是SD三部曲的第三篇——「ControlNet的终极攻略」前面我们说到如果想真正把SD应用起来，最重要的两个功能是：Lora和ControlNet Lora负责把想要画面的“主体”或“场景

文生图

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践

本次让我们基于Bert-vits2项目来克隆渣渣辉和刘青云的声音，打造一款时下热搜榜一的“青岛啤酒”鬼畜视频。

Bert-vits 语音

SD的老舅ComfyUI来了，节点式工作流，分部控制出图

方便大家看，我把板块调整为竖版，有一定SD基础的同学可以看到这其实就是SD的界面板块打散： ComfyUI有以下特点：优点： 1.上限高，更适合复杂长线的大型工作 2模块化工作流 3.可视化

文生图 comfyui

好看的图片不知道怎么写提示词？用AI读出来

所谓反推，就是能够根据图片，倒推出这张图片的提示词。

文生图

【工具书】文生图Midjourney最全prompt提示词分类对照表

图像优化大师作品 masterpiece 最好画质 best quality 更高质量 official art, extremely

提示词 prompt 文生图

通俗易懂地解释OpenAI Sora视频生成的特点有哪些？它与此前的Runway Gen2、Pika有什么区别？以及缺点是什么？

另外值得一提的是，OpenAI Sora模型还可以直接生成图片，也就是说，它是一个以视频生成为核心的多能力模型。

sora 视频生成

【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践

目前，主流的开源大语言模型主要有三个：LLaMA、ChatGLM和BLOOM。

大模型微调训练

<...6 7 8 91011 12 13 14 15 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1