文章列表-AI魔法学院

文章列表

AI Agent的千亿美金问题：如何重构10亿知识工作职业，掀起软件生产革命？

一方面，OpenAI 等大模型公司会在 Agent 标准定义和模型推理能力上持续进化：11 月 OpenAI Devday 可能会踏出定义标准的第一步，当前 next token prediction

大模型 AI编程

大模型微调经验汇总---LLM finetuning 踩坑经验之谈

通过初步统计发现，LLaMA词表中仅包含很少的中文字符，所以在切词时会把中文切地更碎，需要多个byte token 才能拼成一个完整的汉字，进而导致信息密度降低。

大模型人工智能

GitHub狂飙3万star的LLM公开资料 - 大模型入门教程

2.1 LLM 架构虽然不需要深入了解Transformer架构，但了解其输入（token）和输出（logits）是很重要的。

LLM 大模型 GitHub

Stable Diffusion

硬核解读Stable Diffusion（系列一）

对于输入text，送入CLIP text encoder后得到最后的hidden states（即最后一个transformer block得到的特征），其特征维度大小为77x768（77是token的数量

StableDiffusion 文生图

图解大模型训练之：张量模型并行(TP)，Megatron-LM

其中： · b：batch_size，表示批量大小 · s：sequence_length，表示输入序列的长度 · h：hidden_size，表示每个token向量的维度

开源模型

无一幸免！OpenAI最强竞对Anthropic：“长上下文”让大模型更不安全

2023 年初，LLM 的上下文窗口约为一篇长文的大小（约 4000 个 token）。

Anthropic 大语言模型

搭建程序员自己的在线工具库 it-tools

其主要功能 Crypto工具类，生成token，哈希文本，生成UUID，文本加解密等10种功能 Converter工具类 Yaml 转化器，Json转化器，Base64字符串编码等15种功能

开源项目工具类

RAG应用中数据处理过程需要注意的事项

这个问题经常出现在朴素的分块方法中，它涉及到按字符或token分割。

RAG 大模型

3 个令人惊艳的 AI 文档神器，开源了！

后来居上的 Claude，也在该特性上持续发力，将原有大模型的 Token 上限硬生生拉到了 100K（约 7.5 万个单词）。

大模型开源模型

百川智能正式发布130亿参数通用大语言模型百川大模型（Baichuan-13B-Base）

Baichuan-inc/Baichuan-13B-Chat/ 多领域超越ChatGPT 老规矩，先提纲挈领地说一下Baichuan-13B的基本个“模”资料：中英双语大模型，130亿参数，在1.4万亿token

大模型中文

Llama 3突然来袭！开源社区再次沸腾：GPT-4级别模型可以自由访问的时代到来

架构层面，Llama 3选择了经典的仅解码（decoder-only）式Transformer架构，采用包含128K token词汇表的分词器。

meta llama3

会“追问”的Agent，大模型知识库另类实践

决策所需要的Token量级远远低于Langchain推送文档切片所需的Token量级，可以省不少钱。

大模型

Fastwhisper + Pyannote 实现 ASR + 说话者识别

spk_rec_pipeline = Pipeline.from_pretrained("pyannote/speaker-diarization-3.1", use_auth_token="your huggingface token

faster-whisper 语者识别 ASR

解读OpenAI Sora文生视频技术原理

与ChatGPT首先引入Token Embedding 思路一致，针对视觉数据的建模方法则作为构建Sora最重要的第一步。

sora

零一万物API开放平台出场！通用Chat多模态通通开放，还有200K超长上下文版本

针对数字，Yi还采用了拆分成单个token的方式来提高模型理解力；甚至对于特殊和无法识别的字符，也有专门的应对策略。

零一万物 YI 李开复

<...3 4 5 678 9 10 11 12 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1