文章列表-AI魔法学院

刚上线就崩了？字节版 GPTs 征战国内市场：无需编码，快速创建 AI 聊天机器人

字节跳动旗下AI聊天机器人构建平台Coze国内版上线，提供快速创建和部署聊天机器人的工具。Coze集成了丰富插件工具和知识库，支持自定义插件和数据库记忆能力，可灵活设计工作流。平台支持无编程经验用户，可发布到飞书、微信等平台。此外，字节跳动新成立的AI部门Flow聚焦AI应用层，已推出多款AI产品，包括娱乐和工作场景的聊天机器人。Coze等产品在隐私政策中警告可能与其他“我公司内部实体”共享用户信息，但将遵守访问控制和审批流程。

字节GPTs AI聊天机器人 2024-04-10

RAG

LLM之RAG实战（五）| 高级RAG 01：使用小块检索，小块所属的大块喂给LLM，可以提高RAG性能

本文介绍了RAG（Retrieval Augmented Generation，检索增强生成）系统，它能从知识库中检索信息以生成事实、上下文相关和特定领域的内容。文章重点讨论了RAG面临的挑战和两种先进的检索方法：从小到大的检索和句子窗口检索。前者使用较小的文本块进行检索，同时保留足够的上下文信息供大语言模型合成响应；后者则将文档解析为每个块的一个句子，并在检索时使用句子窗口提供额外的上下文。这两种方法均通过LlamaIndex实现，并提供了具体的实现步骤和示例。文章最后总结了这两种方法的应用和未来的研究方向。

LLM之RAG 小块检索 2024-04-10

视频

AI自动生成视频全流程干货

本文介绍了使用AI制作视频的新技能，包括准备脚本、AI文字生成视频、Canva制作视频封面和AI自动剪辑短视频四个步骤。虽然AI将文字生成视频的本质是重组现有视频库内容，但对于特定领域仍有用。提供了详细的操作步骤和工具推荐，包括利用ChatGPT生成脚本、利用AI工具invideo的文字变视频功能、Canva制作视频封面和AI自动剪辑短视频的工具。文章还提供了工具集合的链接，方便读者自取。

AI视频生成自动生成视频 2024-04-09

微调

LLM微调经验&认知

这篇文章主要讨论了大型语言模型（LLM）的认知和训练方面。在认知方面，文章指出知识主要来自预训练阶段，指令微调主要是为了让LLM更好地输出已具备的知识。同时，文章也提到了模型学会中文后能够理解和输出一些指令微调数据集里未见过的中文词汇，但指令微调并非数据量越多越好，数据质量可能更重要。在训练方面，文章介绍了Lora框架和int8推理等相关内容，并给出了一些微调时的实用建议，如prompt和output尽量不要重复等。此外，文章还提到了模型可能更容易理解“模型语言”这一玄学现象，并讨论了预训练阶段数据量和质量的优先级问题。最后，文章还提出了一些猜想和补充，如领域微调时模型参数越大可能越难训，以及chatGLM2的max_length起飞等问题。

LLM微调经验认知 2024-04-09

开源

十大开源语音识别项目

本文介绍了十个与自动语音识别（ASR）技术相关的开源项目，包括Whisper、Massively Multilingual Speech、DeepSpeech、PaddleSpeech、ESPnet、ASRT、SpeechBrain、WeNet、MASR和FunASR。这些项目在语音识别领域具有重要意义，支持多种语言，并提供了丰富的功能和工具。此外，文章还介绍了趋动云作为领先的算力服务商，在ASR科研方面的优势和支持。这些资源和工具为ASR技术的发展提供了有力支持，促进了该领域的进步。

开源项目语音识别 2024-04-09

ChatGPT

从 ChatGPT 系统提示中，分享几个拿来就能用的prompt提示工程技巧

本文介绍了ChatGPT的GPT4和DALL.E 3等核心功能，这些功能背后的提示词是由模型开发人员编写的。文章分享了学习这些功能内部提示词可以学到prompt提示工程技巧，并提供了五个建议：使用Markdown和编号列表构建提示，迭代提示，使用英文撰写提示词并用大写突出显示单词，经常举例以巩固指示，以及让AI决定结果是否令人满意。

ChatGPT Prompt技巧 2024-04-09

RAG

RAG 领域的新宠：为什么 AI 圈都在谈论 Jina ColBERT？

在 RAG (检索增强生成)领域，选对向量模型至关重要，它基本就决定了 RAG 系统的“天花板”，也因此，向量模型的选择总是业界的热门讨论话题。

rag 大模型 2024-04-09

Stable Diffusion

SD入门教程一：Stable Diffusion 基础（技术篇）

本文介绍了Stable Diffusion的工作原理，它是一个由多个组件构成的系统，主要用于根据用户输入的Prompt生成相应的图片。整个生成过程经过三个主要步骤：Text Encoder将输入的Prompt转化为词特征向量，Image Information Creator在潜空间中对这些特征向量和一张随机图进行降噪处理，最后Image Decoder将中间产物解码成一张真正的图片。Stable Diffusion生成的图片质量高，且生成过程可以看作是“雕刻”而非简单的“生成”，整个过程中会去掉不需要的噪声，使得最终生成的图片更符合用户的指令。此外，本文还介绍了潜空间的概念以及Text Encoder的工作原理，解释了为何输入的Prompt不需要在意语法和大小写敏感的问题。

SD教程 StableDiffusion 2024-04-09

Midjourney

Midjourney 进阶关键词_摄影效果专题

Midjourney V6 在真实摄影效果的成像上目前应该无人可以竞争。经过这段时间的测试，觉得可以将摄影效果特别增设一个专题，以每日一词的方式分享给大家进行测试运用。

midjourney 文生图绘画 2024-04-09

写作

GPT让你拥有超强的写作能力！

这篇文章总结了职场中写作的重要性，并介绍了使用GPT进行写作的多个prompt，包括纠正语法错误、改善句子结构、保证风格一致性、为特定受众定制语言、提高清晰度和简洁性、检查抄袭以及丰富词汇量等。通过运用这些prompt，可以提升文本的质量和专业性，满足不同的写作需求。

GPT 写作 2024-04-09

大模型

评论能力强于GPT-4，上交开源13B评估大模型Auto-J

上海交通大学生成式人工智能实验室推出了一款全新的价值对齐评估工具Auto-J，旨在解决生成式人工智能技术在与人类价值对齐方面的挑战。该工具包含130亿参数，支持50+种真实场景的用户问询评估，可无缝切换两种评估范式，并输出详细、结构化且易读的自然语言评论。性能上，Auto-J的评估效果仅次于GPT-4，且显著优于其他开源或闭源模型，同时降低了评估成本。实验证明，Auto-J在多个任务上的表现均优于基线模型。此外，研究团队还公开了Auto-J的模型、训练和测试数据、场景定义文件和参考评估标准，以及用户问询场景分类器等资源，以促进该领域的研究和发展。

Auto-J 大模型 2024-04-08

ComfyUI

造梦师手记：ComfyUI快速量产数字小姐姐

文章描述了一个免费的“订单”任务，即帮助一个由7名女生组成的小团队将生活照转换为动漫风格，以便在演讲中更具吸引力。作者使用AI技术完成了这项任务，包括使用Face ID插件和comfyUI界面，解决了显存不足的问题。作者详细描述了Face ID插件的安装和工作流配置过程，并通过与团队成员的沟通，逐一生成了满意的动漫风格照片。最终，这些照片被团队成员用PS合成并展示在大屏幕上，效果惊艳。虽然这不是最优解，但作者认为逐张生成的方式是一个可行的解决方案。

comfyui 文生图 2024-04-08

大模型

国内AI大模型已近80个，哪个最有前途？

本文总结了大模型时代中几家有前途的公司，包括字节、百度、Moonshot和智谱，以及大厂和创业公司可能遇到的问题。字节有多模态中文私有数据、OpenAI研究科学家和大量GPU资源，百度有先发优势、高重视程度和丰富的文本数据积累。Moonshot团队专业且和谐，模型水平超过GPT-3.5。智谱有独特的商业模式和较大的融资额。大厂可能面临资源碎片化、部门墙厚、传统AI research taste阻碍等问题，而创业公司可能遭遇Founder dispute、患上大公司病、技术不够成熟就急于发布等问题。此外，买不到/租不到GPU和拉不到下一轮投资也是普遍的挑战。

大模型 2024-04-08

微调

NEFTune：在Embedding中加入噪⾳提⾼指令微调效果！

本文介绍了NEFTune技术，即在训练过程中向嵌入向量添加均匀随机噪声，以改善大型语言模型（LLM）的微调性能。研究结果显示，使用NEFTune技术可以显著提高LLM在对话任务上的性能，同时保持对其他任务性能的稳定性。NEFTune技术是一种简单而有效的正则化方法，可以缓解模型在指令微调阶段的过拟合现象，并更好地利用预训练阶段的知识内容。虽然研究还存在一些局限性，但NEFTune的成功表明了算法和正则化对LLM训练的重要性。

NEFTune 指令微调 2024-04-08

Stable Diffusion

Stable Diffusion超清放大及修复细节操作

本文介绍了使用Stable Diffusion模型进行低分辨率图片超清放大和修复细节的方法。通过具体实操案例，详细说明了生成图片、发送到图生图和后期处理的步骤，包括模型选择、参数设置和放大算法等。该方法仅需低显存即可实现高分辨率图片的生成和细节修复，操作简单，效果显著。

超清放大细节修复 2024-04-08