文章列表-AI魔法学院

文章列表

ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略

常见任务有视觉问答，表格问答，图片描述以及目前火热的根据描述生成图片。

开源

从 ChatGPT 系统提示中，分享几个拿来就能用的prompt提示工程技巧

ChatGPT的强大毋庸置疑，特别是GPT4里面的数据分析、DALL.E 3图片生成等功能，以及近期推出的GPTs功能，这些官方公布的功能都是由他们自己内部的模型开发人员编写的提示词构成的。

ChatGPT prompt

解读wav2lip：探究语音驱动唇部动作的技术原理！

，通常无法准确地合成口型，导致生成的视频与音频不同步，主要原因包括两方面：（1）传统的基于像素的人脸重建损失无法准约束音频-口型同步：因为面部重建损失是基于整个图像计算的，而唇部区域只占整个图像的很小一部分

wav2lip 语音

“大模型+机器人”的现状和未来，重磅综述报告来了！

在视觉感知方面，视觉Transformer模型展现出了强大的特征提取和泛化能力。

论文机器人

自动化神器Autolt：不再重复工作

ensp; Autolt简介 Autolt是一种自动化脚本语言，旨在简化Windows图形用户界面

RPA 自动

RAGFlow：开源的RAG引擎，专注于深入的文档理解，支持处理各种复杂格式的非结构化数据

支持处理各种复杂格式的非结构化数据，包括文本、图片、扫描副本、结构化数据和网页等。

RAGFlow RAG 开源

确实很神奇! 通过 Prompt 中加入“这件事对我的事业至关重要”这样的情感激励可以提升 LLMs 的表现

尽管大型语言模型(llm)越来越被视为向人工智能迈进的一步，在许多任务中表现出令人印象深刻的表现，但llm是否能够真正掌握心理情绪刺激仍然不确定。

Prompt 大模型情感激励

ComfyUI-DDetailer脸部修复

翻看了上古时期出的图，突然老脸一红，有点惭愧。

ComfyUI 脸部修复

一文读懂AIGC产业链：AIGC的前世今生和未来展望

（民生证券《电子行业专题研究：国产AI算力芯片全景图》） AIGC产业依赖算法、数据和算力的发展 2、中游，技术层：它侧重核心技术的研发，主包括机器学习、计算机视觉、算法理论、智能语音、自然语言处理等

生成式AI

生成式AI工作流#产品经理和创业者的秘密武器

ComfyUI本质上是AIGC的Pipeline（数据处理管道）的可视化构建工具，它将Stable Diffusion的运行机制显性化的展示在我们面前。

AIGC 工作流

腾讯开源的数字人MuseTalk到底行不行？

该模型能够根据输入的音频信号，自动调整数字人物的面部图像，使其唇形与音频内容高度同步。

MuseTalk 数字人音频

基于 Kimi Chat 的 AI 渐进式阅读法

但我并不会为此感到焦虑，这些文章成了一个经过我筛选的“图书馆”，当我需要的时候，我可以在里面找到自己想要的文章进行阅读。

Kimi Chat 阅读

书生·万卷：难得的中文开源数据集

书生·万卷这个语料库，包含文本数据集、图文数据集、视频数据集三部分，数据总量超过2TB。

大模型

目前有哪些比较成功的人工智能应用？

视频：广义上的各种动态视频的文件等。

生成式AI

AI爆文写作：4招，把AI变成你的写作助手

1、找观点：拓宽视角这是我在写作中最常用到的一个技巧，比如你正在写一篇关于“写作能力是个人底层能力”的文章。

写作提示词创作

<...31 32 33 343536 37 38 39 40 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1