文章列表-AI魔法学院

文章列表

LLM微调神器Lamini，疯狂获星1.9k，免费可用！！

并且，在 Lamini 的项目地址中有着 · 1400 个问答数据集（这是关于 Lamini 的内部工程文档，你也可以将其自定义）； · 在此数据集上运行 LLM 微调的代码；

大模型

生成式人工智能的“经济学”，The Economic Case for Generative AI

它可以根据输入的信息，生成出与之相关的文字、图片、甚至是音乐！

生成式人工智能经济学

惊艳！2.77亿参数锻造出Agent+GPT-4V模型组合，领航AI领航机器人、游戏、医疗革新，通用智能时代你准备好了吗？

2.77亿参数、1340万帧视频训练数据，背后蕴含着怎样的技术秘密？

Agent+GPT-4V 大模型

截至2023年5月份业界支持中文大语言模型开源总结及商用协议分析

OPT模型本身并没有特意针对多语言进行训练，不过他们的数据集很大，因此也能在简单的中英文翻译中获得不错的结果。

大模型

不会PS也能做神图？豆包AI绘画全解析，让你的创意秒变艺术品！

它能根据咱们输入的文字描述，很快就生成质量高、有创意的图像，不管是在啥场景下用都没问题。

Qwen3

一个产品经理的大模型观察、反思与预测

） Scaling Laws：神经网络的大力出奇迹 · 随着模型大小、数据集大小和用于训练的计算浮点数增加

工作

超越Animate Anyone! 南加大&字节提出MagicPose，不需任何微调就可生成逼真的人类视频

为此，我们提出了一种两阶段的训练策略，以分离人体动作和外观（例如面部表情、肤色和着装），包括对同一数据集的人舞姿势的外观控制块的预训练和对外观-姿势-联合控制块的精细调整。

MagicPose 视频

Nvidia发布Llama3-ChatQA-1.5: 提升对话问答和表格推理能力，平均性能超越GPT-4

相比之前的ChatQA 1.0版本，其训练方法和数据集都进行了优化，尤其增强了对表格数据和算术计算的理解能力。

Llama3-ChatQA-1.5 对话问答模型

语音识别的未来已来：深入了解faster-whisper的突破性进展

faster-whisper的核心优势在于其能够在保持原有模型准确度的同时，大幅提升处理速度，这使得它在处理大规模语音数据时更加高效。

语音识别 Faster-Whisper

只需四步就能构建自己的Agent！达摩院新开源框架小白也能用

光集成的工具就有这么多，比如NLP、语音、视觉、多模态等多种模型，以及默认集成知识检索、API检索等方案。

大模型

学会这招，一个头像变100种风格！

在 Mijdourney 里，如何根据一张图随意切换风格？

Remix 文生图

中国电信开源星辰AI大模型：央企中首个完成LLM研发和开源的选手诞生

早在去年五月中旬，经过数十版模型训练与优化，中国电信就完成了百亿参数星辰AI大模型稳定版本的训练。

开源大模型电信

用so-vits-svc-4.1进行音色转换的极简教程！

主要是因为孙燕姿的音色独特，吐词清晰，网络上存在她的大量歌曲，非常便于训练。

so-vits-svc 音色转换教程

清华智能体「XAgent」比ChatGPT4.0还好用！

数据分析：展示双环机制的有效性我们将使用一个简单的数据集iris.zip上传到XAgent，然后让XAgent分析数据集并生成一个报告。

ChatGPT 智能体 Agent

Embedding开源模型重磅玩家：北京智源人工智能研究院最新Embedding模型发布！登顶MTEB，免费商用授权！

BGE模型的训练有2个阶段：分别是预训练阶段和微调阶段。

开源模型

<...23 24 25 262728 29 30 31 32 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1