文章列表-AI魔法学院

文章列表

Deepseek-V2技术报告解读！全网最细！

核心优化解析在这里我们结合官方技术报告中的模型架构图辅助说明，介绍模型的核心优化点——多头隐式注意力（Multi-head Latent Attention,MLA）：

Deepseek-V2 大模型

10个大模型私有化需要关注的问题

LLM对于算力，存储都和传统架构有一定的差别，需要结合LLM的特点综合研判，它是私有化落地的第一步，对后续工作起到基础奠基作用。

开源模型

主流向量数据库一览

Go 极高的检索性能: 万亿矢量数据集的毫秒级搜索非结构化数据的极简管理丰富的API跨平台实时搜索和分析可靠：具有很高的容灾与故障转移能力高度可拓展与弹性支持混合检索统一的Lambda架构社区支持

向量数据库

AI绘画：InstantID 一键运行包和在线Colab脚本！

上面的人脸框中就会出现人脸了。

InstantID 文生图

深入浅出：大语言模型中必不可少的技术——Embedding简介

这个限制通常在几千到数万个tokens之间，具体取决于模型架构和可用的硬件资源。

embedding

Stable Diffusion

Stable Diffusion 30种采样器全解！

WebUI中设置只保留实用的采样器在【设置】选项卡下找到【采样器参数】，然后在顶部的多选框中勾选不常用的采样器。

Stable Diffusion采样器

【开源项目】Flow Matching 语音合成

/Matcha-TTS 中文实现： https://github.com/PlayVoice/Grad-TTS-Chinese （Grad-TTS-CFM，其他优化还未集成）模型架构

音视频 Flow Matching

刚上线就崩了？字节版 GPTs 征战国内市场：无需编码，快速创建 AI 聊天机器人

公开信息显示，朱文佳是业界知名的架构师，曾担任百度搜索部主任架构师，是百度网页搜索部技术副总监杨震原手下的得力干将。

Coze 聊天机器人

Midjourney | 17个常用的命令

/show 输入/show在jobid 框里输入您的图库中所生成图像的作业ID 后，你可以再次召唤和恢复自己的任何生成图像 /fast 切换快速模式，在快速模式下

文生图

让你每次都随机生成各种图片，开盲盒的感觉：SD插件之无限抽卡神器Dynamic Prompts

这些选项是可以展开的，展开到最里层，可以点击一个相关风格的提示词集合：点一下就能看见右边多了很多东西，用的时候，只要把右边的复制到提示词框里就可以，比如这样：再点生成

文生图

手把手！做Llama3的MoE专家混合模型！底层原理怎样的？做自己的MoE模型？需要多少算力？

专家混合是一种旨在提高效率和性能的架构！

MoE 专家混合模型

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

技术亮点 1、全非自回归架构：传统的文本到语音(TTS)系统多使用自回归模型，这种模型一次生成一个音频片段，处理速度较慢。

F5-TTS 音频克隆

RAG 2.0，终于把RAG做对了！

整个架构基于一个单一原则：有能力检索与请求或提示上下文语义相关、有意义的数据。

RAG 大语言模型

AI绘画：两组赛博咒语和ComfyUI使用方法！

然后就可以看到很多不同颜色的框，看起来有点复杂。

文生图

Stable Diffusion

造梦师手记：Stable Diffusion一键换脸插件

在文生图的提示词框，输入提示词： 1girl, (flowers=1.5), Issuing, plant,sunlight, outdoors, white dress, long hair,((Cinematic

AI换脸

<...32 33 34 353637 38 39 40 41 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1