文章列表-AI魔法学院

文章列表

腾讯悄悄开源混元版「Sora」，这就是开源领域的No.1。

而切镜完的效果，确实张力好一些。

sora 视频生成

ComfyUI官方使用手册【官网直译+关键补充】

典型的用例包括向模型添加生成某种风格的能力，或更好地生成某些主题或动作。

文生图图生图 comfyui

Stable Diffusion

Stable Diffusion高级教程 - 图生图(img2img)模式

接着我们试试完全从零画一幅画 (叫「涂鸦」更合适)，为了展示 SD 的厉害之处，我特意选择了一个「复杂」的构图，在本灵魂画手非常努力作画后，看一下生成图的效果这样的: 注意哈，因为这个模式需要上传图

Stable Diffusion 图生图

AIGC系列之一-一文理解什么是Embedding嵌入技术

4、泛化能力：在实际问题中，我们经常需要处理一些在训练数据中没有出现过的数据。

AIGC Embedding 嵌入技术

10大Midjourney描述词网站，让你Ai创作随心所欲！

加入该词可以大大改善图像的色彩对比和细节 Vivid Colors 给图片添加鲜艳的色彩，可以为你的图像增添活力

描述词文生图

用ChatGPT写论文prompt大全

这可以帮助读者更好地理解你的观点，并增加你的论文的说服力。

prompt

如何从零开始训练专属 LoRA 模型？4600字总结送给你！

优点：不用处理 tags 省时省力，过拟合的出现情况低。

训练

解读wav2lip：探究语音驱动唇部动作的技术原理！

最大间隔损失的原理是基于最大间隔分类器的思想，通过最大化类别之间的间隔来提高分类器的鲁棒性和泛化能力。

wav2lip 语音

Stable Diffusion

Stable Diffusion ComfyUI 入门感受

comfyui一直没能重现webui生成的图片直接拖动过来，就能重现出当时的节点网络和流程插件： “在AI绘图这个不成熟而又在疯狂发展的领域里面，敢于大量并持续的投入时间和精力进行开发的人们

文生图

大语言模型的拐杖——RLHF基于人类反馈的强化学习

为什么语言模型在学习世界，学习概念、人和已知过程的惊人能力要强得多，但输出的结果却并不如人们所希望的那样好，或者说不如它们本应该可以的那样好。

大模型训练

30 多年前被 Windows、Linux “灭掉”的操作系统 MS-DOS 4.0，微软在 GitHub 上开源了！

事实证明，这是一次极其幸运的运气，再加上一些精明的商业洞察力，最终使微软公司成为世界上最大的公司之一，比尔·盖茨也多年来一直是世界上最富有的人。

MS-DOS 4.0 开源模型微软

AI绘画当前的应用场景有哪些？

这可以提高蒙版创建过程的效率和准确性，从而可能获得更高质量的修复结果，同时节省时间和精力。

文生图

动作识别模型有哪些

Slow分支的帧采样更稀疏，因此会更侧重不变的语义(空间信息)，而Fast 分支的帧采样更密集且通道数更少(限制了表达能力)，因此会更侧重变化(语义)的语义。

动作识别模型

LLM Agent最常见的九种设计模式(图解+代码)

是的，就是这么简单，在论文的开头作者也提到人类智能的一项能力就是 Actions with verbal reasoning，即每次执行行动后都有一个“碎碎念(Observation”：我现在做了啥，是不是已经达到了目的

LLM Agent 图解

使用大模型自动回复小红书/抖音/快手评论：通过RAG 优化LLMs实现

大型语言模型（LLMs）已经展示出了令人印象深刻的能力，可以存储和部署大量知识以响应用户查询。

RAG 大模型自动回复

<...62 63 64 65 66 67 686970 71 >

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1