文章列表-AI魔法学院

文章列表

一文彻底搞懂多模态 - 多模态推理

知识图谱推理是指基于知识图谱中的事实和关系，通过逻辑、规则、统计或机器学习等方法，从已知的信息中推断出新的信息或关系的过程。

多模态推理大模型

大模型：泛化即智能，压缩即一切

如果你认同Scaling Law定律，你就应该相信通过大量不同的数据来追求长期的模型泛化能力比短期的通过巧妙的模型微调更重要，这个想法在机器学习先驱 Rich Sutton 《苦涩的教训》中也有所体现。

大模型泛化

阿里&字节发表VividTalk，只需单张照片即可根据音频生成栩栩如生的人物说话头像视频

此外，还采用了基于多分支变压器的网络，充分利用长期音频上下文来建模与中间表示的关系。

VividTalk 视频

Comfyui工作流原理你都了解吗

“ Comfyui工作流原理 ComfyUI工作流是一个基于图形节点编辑器的工作流程，通过拖拽各种节点到画布上，连接节点之间的关系，构建一个从加载模型到生成图像的工作流程

Comfyui 工作流

24年首篇离奇论文：加点噪声，RAG效果翻倍？！

该方法包括两个主要组件：检索器和生成器。

RAG 检索论文

金融行业中 Fintech 的应用场景

违约预测就是一个项目，针对这个项目该怎么样去构造一些特征，使用之前课程里给大家介绍的机器学习的神器，XGBoost 和 LightGBM 来完成预测任务。

Fintech 金融

数学能力超ChatGPT，70B开源大模型火了：用AI微调AI，微软全华班出品

具体而言，Evol Instruction分为指令进化器和指令消除器。

开源模型

GitHub上的RPA小工具，可以将重复、繁琐的任务自动化

Pyperclip 另一个神器：管理剪贴板内容 Pyperclip是一个Python库，它提供了一个简单的接口来访问剪贴板功能，使开发者能够在Python程序中轻松地读取和写入剪贴板内容

RPA 自动化

6个最佳开源TTS引擎

· 它带有两个合成器：eSpeakinG合成器，通过声音添加技术转换元音和响亮的辅音，以完成声音。

TTS引擎开源模型

预训练对话大模型深度解读

开源地址：github.com/microsoft/D… 3.2 Meena 由谷歌研发，基于编码器-解码器的模型结构，参数量2.6B，预训练数据341GB。

Deepseek-V2技术报告解读！全网最细！

另外，Deepseek-V2结合算法和工程，提出了资源感知专家负载均衡的方法，保证了专家并行的几个机器雨露均沾，不会出现有些机器空转，有些机器过度占用的情况。

Deepseek-V2 大模型

MaskGCT：登上GitHub趋势榜榜首的TTS开源大模型

语音语义表示编解码器：将语音转换为语义标记。

MaskGCT 声音克隆

请收好这12种Prompt编写模式，让不可靠的模型生成可交付的可靠结果

1 了解这12种Prompt编写模式之前的问题首先要搞清楚人类和机器思考问题的区别，人类在思考速度、耐力很多方面无法和机器相比，但人类拥有机器所不可能发展出来的直觉，这是我们人类的优势

prompt

baichuan2 有什么好的深挖论文中涉及的知识点

为了处理包含额外空格的代码数据，我们在分词器中添加了仅包含空格的令牌。

大模型

【分享】SDXL模型最佳拍档！COMFY UI上手指南

然后，安装插件管理器，安装必要插件，最后导入工作流。

大模型

<...33 34 35 363738 39 40 41 42 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1