文章列表-AI魔法学院

文章列表

生成式AI工作流#产品经理和创业者的秘密武器

产品经理或交互设计师通常会使用Axure、Sketch或Figma等工具，投入主要的时间绘制线框图，并通过页面流程图来阐释产品的交互逻辑。

AIGC 工作流

3 个令人惊艳的 GitHub 开源项目，诞生了！

那些经 AI 之手创作的图像，艺术风格极具创意且逼真形象。

开源模型

教你打造属于自己的AI孙燕姿，AI歌手模型使用及训练保姆级课程 #1/2 使用模型

原始声音处理要使用模型进行推理的话你首先需要一段已经演唱好的声音垫进去，然后使用模型把原来的音色换成你模型训练好的音色（类似AI画图的img2img垫图）。

生成式AI

四木测评｜让教父唱《野狼disco》、恶搞《甄嬛传》，火遍全网的阿里明星项目EMO正式开放

而上传图片的限制，可能会让用户进行多次尝试——系统会校验图片像素大小、人脸清晰程度、非多人、版权风控、画风检测、不能有头部倾斜、露出手部等条件。

EMO 阿里全民演唱

大模型微调方法总结

结合图片来看，LoRA 的实现流程如下： ● 在原始预训练语言模型（PLM）旁边增加一个旁路，做一个降维再升维的操作，来模拟所谓的内在秩。

开源模型

多智能体开发框架怎么选型？京东 JoyAgent vs langchain LangGraph，两种Agent开发哲学的碰撞!

🔥 核心是状态机/有向图： LangGraph不给你现成的套路，而是提供一套“图”的语言，让你自己定义Agent的决策流程。

JoyAgent langchain LangGraph

大模型检索增强生成RAG的优化

其技术架构图大致如下[4]：基于KG+VS进行上下文增强图3中query进行KG增强是通过NL2Cypher模块实现的。

RAG 检索增强大模型

文心一言大模型使用指南

一、登录注册文心一言的官方网址如下 https://yiyan.baidu.com/welcome 点击之后，会看到如下图所示的界面，然后点击『开始体验

文心一言百度

最受欢迎的15个ChatGPT提示词，优化给ChatGPT用户，拿走不谢

[你的文本内容] 3.Midjourney提示助理：通过为提供的图像描述填充详细且有创意的描述，激发中途生成独特有趣的图像。

ChatGPT 提示词

14.6K star！最好用的OCR文字识别项目，没有之一！

项目是基于PaddleOCR开发的，支持截图识别、批量导入识别、个性化识别等功能。

Umi-OCR 开源项目文字识别

来自Microsoft Build 2023：大语言模型是如何被训练出来的

全文围绕如下的这个图展开：这幅图很好地总结了大语言模型的训练全景，主要包括四个阶段：预训练阶段：基于原始数据训练一个基础模型，得到的是一个base model，可以部署使用有监督微调阶段

大模型

AI视频新技能！这套流程教你打造视频人物和声音完美同步！

D-ID:https://studio.d-id.com/ HeyGen:https://app.heygen.com/home 如果你只需从单张图片生成与音频同步的视频，且对人物动作没有太多特殊要求

AI视频

阿里最近推出AI项目的动作太过频繁，脑子跟不上了，事出反常必有妖，盘点一下

一个静态图片转视频的项目。

阿里大模型

Comfyui一键更换人物背景！饭来了快张口！

然后上传你想要换背景的图片如果图片很小就打开通过模型放大，图片很大就右键忽略。

换背景绘画

微软研究团队：Sora核心技术及未来机会研究报告-中英对照版

图 12: 掩码扩散变换器 (MDT) 的整体架构图。

sora 论文

<...32 33 34 353637 38 39 40 41 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1