文章列表-AI魔法学院

文章列表

解读OpenAI Sora文生视频技术原理

自然语言理解，采用DALLE3 生成视频文本描述，用GPT丰富文本prompts ，作为合成数据训练Sora, 架起了GPT 与 Sora语言空间的更精确关联，等于在Token与Patch

sora

阿里Qwen3系列模型惊艳亮相

这里的235B和30B分别是总参数量，22B和3B分别是激活参数量。

阿里 Qwen3 大模型

OmniVision - 968M：小巧精悍的视觉语言模型，释放多模态边缘计算强大潜能

训练流程优化多阶段训练策略：OmniVision - 968M采用了精心设计的三阶段训练流程。

OmniVision -968M 多模态模型

一文看懂RAG：大语言模型落地应用的未来

特别是当查询超出模型的训练数据或需要最新信息时。

rag 检索增强

最顶尖的大语言模型人才，只关心这10个挑战

基于文本的模型需要大量的文本数据，现在我们确实在担心用于训练基于文本模型的互联网数据会被耗尽。

大语言模型

大模型应用中大部分人真正需要去关心的核心——Embedding

对于像图书类型这样的类别，随着更多的类型被添加到数据集中，这种稀疏性将会呈指数级恶化。

大模型

无限逼近真人效果的“超真实人像大模型”，或许它才是你一直在寻找的真爱！

为了改进模型的性能，作者还引入了一种新的损失函数，用于在训练过程中对生成图像进行优化。

大模型文生图

国内AI大模型已近80个，哪个最有前途？

高质量数据在大模型训练中是非常关键的。

大模型

Insanely Fast Whisper：超快的Whisper语音识别脚本

最终，作者以实际测试数据展示了不同优化方式的速度对比。

音频 Whisper

从 ChatGPT 系统提示中，分享几个拿来就能用的prompt提示工程技巧

ChatGPT的强大毋庸置疑，特别是GPT4里面的数据分析、DALL.E 3图片生成等功能，以及近期推出的GPTs功能，这些官方公布的功能都是由他们自己内部的模型开发人员编写的提示词构成的。

ChatGPT prompt

Stablediffusion3论文下载-确定了Stablediffusion3与Sora的架构是一致的

我们训练的模型从带有 450M 个参数的 15 个图块到带有 8B 个参数的 38 个图块不等，并观察到验证损失随着模型大小和训练步骤的增加而平稳减少（上排）。

SD 论文

10个值得收藏的ChatGPT辅助编程技巧

你需要承认 ChatGPT 已经使用 2021 年之前的公开数据进行了训练。

编程提示词 chatgpt

被高估的Pika，被低估的多模态AI

例如，在医疗领域可以通过结合图像、录音和病历文本，提供更准确的诊断和治疗方案；在交通领域，结合图像和传感器数据，带来更智能、更安全的自动驾驶体验；在教育领域，将文本、声音、视频相结合，呈现更具互动性的教育内容

大模型多模态

AI+智能客服：大模型可落地的最成熟场景之一

模型偏见和伦理问题：AI大模型可能会从训练数据中学习到偏见，并在提供服务时无意中体现这些偏见。

ai 客服

检索增强生成(RAG)：LLM企业级应用落地的挑战与思考

包括训练语言模型时的数据过滤，在线内容审查，块列表封禁等。

大语言模型 RAG检索增强

<...33 34 35 363738 39 40 41 42 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1