文章列表-AI魔法学院

文章列表

AIGC系列之一-一文理解什么是Embedding嵌入技术

Embedding层往往是神经网络的第一层，它可以训练，可以学习到对应特征的内在关系。

AIGC Embedding 嵌入技术

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

对每个数据样本（audio、text_label）依据对应语言随机从预训练语音指令表（见第三节数据部分）中选取一个指令，组成（audio，instruct，text_label）格式的数据，并在训练过程中预测

开源模型

分析过688篇大模型论文，这篇论文综述了LLM的当前挑战和应用

挑战难以理解的数据集对于 LLM 而言，其预训练数据集的规模非常大，任何个人都无法彻底阅读其中的文档或评估这些文档的质量。

开源模型

国内外开源大语言模型一览表

Stanford Alpaca 的种子任务都是英语，收集的数据也都是英文，因此训练出来的模型未对中文优化。

大模型

大模型套壳祛魅：质疑套壳，理解套壳

OpenAI 创始人之一、特斯拉前 AI 总监安德烈·卡帕西（Andrej Karpathy）在 2023 年 5 月的微软 Build 大会上透露：「预训练就是在超级计算机中使数千个 GPU 以及可能进行数月时间来处理互联网规模数据集的地方

大模型套壳

开源大模型王座易主！谷歌Gemma杀入场，笔记本可跑，可商用

70 亿参数，并提供了预训练以及针对对话、指令遵循、有用性和安全性微调的 checkpoint。

开源模型 Gemma

清华大学ChatGLM团队发布AI Agent能力评测工具AgentBench：GPT-4是全能战士，超越所有模型

清华大学KEG与数据挖掘小组（发布ChatGLM模型）发布了一个最新大模型AI Agent能力评测数据集，对当前大模型作为AI Agent的能力做了综合测评。

GPT-4

M3E 可能是最强大的开源中文嵌入模型

模型地址： https://huggingface.co/moka-ai/m3e-base M3E Models 是使用千万级 (2200w+) 的中文句对数据集进行训练的

开源模型

GitHub狂飙3万star的LLM公开资料 - 大模型入门教程

数据预处理：这涉及特征缩放和归一化、处理缺失数据、异常值检测、分类数据编码以及将数据分割为训练集、验证集和测试集。

LLM 大模型 GitHub

解读wav2lip：探究语音驱动唇部动作的技术原理！

在训练完成后，wav2lip模型根据音频信息逐帧生成一个说话的人脸视频。

wav2lip 语音

【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision

这种严格的监督训练方式限制了模型的泛化性和实用性，因为这样的模型通常还需要额外的标注数据来完成训练时未曾见过的视觉“概念”。

OpenAI 自然语言监督

自动优化Prompt：Automatic Prompt Engineering的3种方法

第二步：在训练集上打分，并保留高分prompt 打分方式有两种： Execution accuracy。

prompt 大模型

用户意图对齐，无需人工标注，Zephyr-7B 超越 Llama2-Chat-70B

首先通过dSFT进行基础的模型训练，然后通过AIF收集反馈并对模型进行评分和排序，最后通过dDPO根据这些反馈优化模型的偏好。

小型语言模型 Zephyr-7B

LLM大模型推理输出生成方式总结

参数设置：do_sample = False, num_beams = 1 缺点： 1、生成文本重复 2、不支持生成多条结果。

大模型

【重磅推荐】PaddleOCR：超越人眼识别率的AI文字识别神器！

6.训练定制：PaddleOCR支持用户根据自己的需求进行模型训练和定制，满足特定场景下的OCR需求。

PaddleOCR 文字识别

<...22 23 24 252627 28 29 30 31 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1