文章列表-AI魔法学院

文章介绍了五款AI数字人工具，包括HeyGen、Kreado Ai、Vidoz AI、腾讯智影和剪映数字人。这些工具可以帮助用户轻松创建具有逼真效果的数字人视频，满足不同场景的视频创作需求。文章强调了这些工具的易用性、多样性和高质量输出，并提供了相应的推荐指数。

AI 数字人 2024-05-06

大模型

全球下载量最大的AI绘画大模型，更新Lightning极速版

文章介绍了Stable Diffusion大模型推出的两种提速技术Turbo和LCM，虽然能缩短出图时间，但存在明显的画质损失。随着字节跳动团队SDXL-Lightning大模型的发布，因其画质损失小，迅速被知名大模型跟进更新。文章强调了技术迭代对硬件资源的节约和缓解高端算力卡断供情况的重要性，并展示了多个使用大模型生成的图片示例。最后提供了下载链接和出处。

Stable Diffusion 大模型提示词 2024-05-06

强！推荐一款自动化神器Autolt：不再重复工作！

本文介绍了AutoIt这款老牌实用的自动化工具，可帮助用户告别繁琐的重复性工作，提高工作效率。AutoIt是一款类似BASIC脚本语言，完全免费用于自动化Windows操作系统的脚本语言和工具集，具有语法简单易懂、功能强大、易于上手等特点。它可广泛应用于自动化测试、系统管理、软件部署等领域，并支持与其他自动化工具结合使用。文章还提供了AutoIt的安装、使用方法和实用示例，以及将脚本文件转换为可执行文件的方法。总之，AutoIt是一个非常有用的自动化工具，可以帮助用户自动化执行各种任务，提高工作效率。

Autolt 自动化 2024-05-06

换脸

换脸软件 FaceFusion 保姆级教程

本文介绍了使用FaceFusion软件进行数字人换脸的操作过程。首先，为了避免侵权，客户提出了使用换脸软件将原素材的脸型进行替换的需求。接着，文章介绍了FaceFusion软件的特点和使用方法，包括其官网地址和运行环境要求。作者尝试了使用Colab进行免费算力运行，但由于源文件较大和算力不足，最终选择了租用AutoDL平台的算力。文章详细描述了租用算力的步骤和注意事项，包括充值、选择计费方式、地区、GPU型号等。在租用算力后，作者进行了FaceFusion的安装和运行，包括添加配置、安装依赖、下载模型等步骤。最后，文章介绍了如何通过本地SSH和外网两种方式访问FaceFusion的界面，并展示了换脸后的效果。在操作过程中，作者遇到了一些问题，如模型加载失败等，但通过重新下载模型等方式解决了问题。

FaceFusion 教程 2024-05-06

ChatGPT

还在用“You are expert”这种提示词？连ChatGPT都瞧不起你，试试这些Prompt吧

本文讨论了ChatGPT在营销领域的应用，指出用户常误认为给ChatGPT加上“专家”前缀就能增强其功能，实际上这并没有任何作用。文章建议用户应明确查询的实质内容，利用权威来源并要求引用，检查AI的工作，并尝试让AI阐明分步计划、消除歧义、填补知识空白、回顾工作等策略，以获取更准确、可靠的输出。文章最后鼓励用户将ChatGPT视为协作伙伴，通过实践不断提升自身和AI的能力。

prompt 提示词 2024-05-06

大模型

百川智能RAG方案总结：搜索出生的百川智能大模型RAG爬坑之路

百川智能通过结合长上下文模型（192k）和搜索增强技术，解决了知识更新和模型幻觉的问题，实现了在5000万tokens数据集中95%的精度。主要优化包括：1) Query拓展，拆解复杂问题以提高检索质量；2) 优化检索链路，采用稀疏检索、向量检索和Rerank结合的方法提高召回率和准确率；3) 自我反省机制，通过大模型自省筛选优质内容。此外，文章还讨论了当前RAG方法的痛点以及百川的技术栈和效果。总体来说，这种结合长窗口与搜索的RAG方案可能是当前较好的一种方式，但仍需考虑成本问题。

RAG 大模型 2024-05-06

Stable Diffusion

Stable Diffusion 30种采样器全解

本文介绍了StableDiffusion中的30种采样器，分为经典采样器、DPM采样器和新增采样器三类。经典采样器中Euler和Euler a是常用的，但Euler a生成的图像具有随机性。DPM采样器中大部分是DPM算法，其中DPM++2M Karras和DPM++3M SDE Karras等被推荐。新增采样器有UniPC和Restart等。文章还解释了采样器名字中的含义，如Karras是优化算法，2M代表二阶多步算法，SDE代表随机微分方程等。最后提醒用户在WebUI中设置只保留实用的采样器。

Stable Diffusion 采样器 2024-05-06

Docker介绍及常用命令大全

Docker中的三个重要构成：Image(镜像)，Container(容器)，Repository(仓储)。Image相当于OOP中的类，Container相对于类实例，Repository是存放位置。

Docker 容器 2024-05-05

将文本转化为3D动画：DeepMotion推出MotionGPT，开启动画新时代！

DeepMotion发布了基于生成式AI的MotionGPT工具，可将文本提示转化为3D动画，无需专用硬件或技术知识。MotionGPT提供高度动态的动画创作体验，超越物理障碍，支持各类创作者和行业。测试版将于2024年冬季推出，DeepMotion致力于革新动画行业。

3D 动作捕捉 2024-05-05

RVC和SVC声音模型难找？推荐这个网站

本文介绍了AI声音模型训练过程，包括数据预处理、模型构建、训练、评估和优化，强调了高质量音频数据和计算资源的重要性。同时，推荐了SVC和RVC声音模型网站，特别是“声音模型工坊http://mxgf.cc”，该网站页面简洁大气，提供大量模型资源和在线试听功能，是AI声音模型学习和研究的优质资源平台。尽管部分优质模型收费，但网站也提供免费公开的声音数据集和声音模型供个人学习测试使用。

声音克隆数字人 2024-05-03

工具

全球六大主流自动PPT制作工具

本文介绍了全球流行的AI做PPT工具，包括Decktopus、Gamma、Beautiful.ai、MindShow、Powerpresent.ai和Tome。这些工具可以自动或辅助生成PPT，提高效率，注重美观和实用性，适合不同需求的用户。用户可以根据个人喜好和需求选择合适的工具来制作演示文稿。

自动PPT 工具 2024-04-30

提示词

零门槛的 4 大 AI 提示词法则，让你的 AI 助手秒变效率神器

本文介绍了如何使用AI提示词来更有效地与AI助手交流，解决AI使用不顺畅和个性化需求难以满足的问题。文章提供了四大基本法则来构建优质的AI提示词，包括给AI分配“岗位”和“待办事项”、拒绝笼统、提供示例和让AI用对“语气”。这些法则能帮助用户更好地指导AI完成任务，并输出符合期望的内容。此外，文章还提供了小技巧和建议，如如何与AI交流以获取提示词建议，以及推荐了一些免费的优质教程供深入学习。

提示词大模型 2024-04-30

ChatGPT

如何使用ChatGPT一天搞定论文初稿

本文介绍了ChatGPT在论文写作中的应用，包括逐步撰写长篇幅论文、利用consensus插件确保论文来源可靠性、提供选题思路、生成论文摘要和大纲，以及按章节生成论文内容。同时，提醒用户ChatGPT仅为辅助工具，不能取代人类思考，需进行人工修改和补充关键内容，如文献和数据部分。合理利用ChatGPT，可提高论文写作效率。

ChatGPT 写作 2024-04-30

Sora

微软对 Sora 进行了逆向工程分析，揭秘 Sora 的秘密

Sora，一款由 OpenAI 在 2024 年 2 月推出的创新性文转视频生成式 AI 模型，能够依据文字说明，创作出既真实又富有想象力的场景视频，展现了其在模拟现实世界方面的巨大潜能。本文基于公开技术文档和逆向工程分析，全面审视了 Sora 背后的技术背景、应用场景、当前面临的挑战以及文转视频 AI 技术的未来发展方向。文章首先回顾了 Sora 的开发历程，探索了支撑这一“数字世界构建者”的关键技术。接着，我们详细探讨了 Sora 在电影制作、教育、市场营销等多个领域内的应用潜力及其可能带来的影响。文章还深入讨论了为实现 Sora 的广泛应用需克服的主要挑战，例如保证视频生成的安全性和公正性。最后，我们展望了 Sora 乃至整个视频生成模型技术未来的发展趋势，以及这些技术进步如何开创人机互动的新方式，进而提升视频创作的效率和创新性。

Sora 微软 2024-04-30

Stable Diffusion

用 Stable Diffusion 10分钟实现电商模特换装/换模特

本文介绍了Stable Diffusion在电商设计中的应用，通过安装插件、制作蒙版、换模特和换服装等步骤，可以实现高效且自然的图像处理效果，大大降低了拍摄成本，为电商行业带来革命性的变革。文章强调了AI在电商设计领域的重要性，并展望了AI浪潮对各行业的影响。

Stable Diffusion 文生图 2024-04-30