文章列表-AI魔法学院

文章列表

构建开源多模态RAG系统

在这个新的冒险中，我们将深入研究使用开源大型语言多模态（LLMM）构建检索增强型生成（RAG）系统的过程。

RAG 大模型

搞了一个Dify开源知识库

初衷：也是在机缘巧合下，感谢MAX和众多大佬的呼声支持下，临时组建了这么一个dify开源交流社区

Dify 大模型知识库

开源打败闭源？Meta即将推出开源代码生成平台Code Llama，剑指OpenAI Codex

据科技外媒 The Information 援引消息人士的说法，Meta 的代码生成 AI 模型“Code Llama”为开源项目，最快可能在本周推出。

开源模型

中国电信开源星辰AI大模型：央企中首个完成LLM研发和开源的选手诞生

没想到啊，开源大模型家族里，居然挤进来一位特别的选手：来自央企，身份为运营商。

开源大模型电信

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

可以说，AI 初创公司 LinkSoul.Al 的这些开源项目让海外开源大模型在国内的普及和推广速度与国际几乎保持了一致。

开源模型

苹果一次性开源了8个大模型！包含模型权重、训练日志和设置，OpenELM全面开源

不以开放性著称的苹果居然同时开源了大模型的权重、训练和评估框架，涵盖训练日志、多个保存点和预训练设置。

OpenELM 大模型

MaskGCT：登上GitHub趋势榜榜首的TTS开源大模型

MaskGCT已在香港中文大学（深圳）与上海人工智能实验室联合开发的开源系统Amphion发布，Amphion今天登上了Github global trending榜首！

MaskGCT 声音克隆

MiniCPM 4.1 开源！代码、数学推理速度快了 3 倍！

MiniCPM 4.1 亮点一览首个原生稀疏架构的深思考模型，通过可训练稀疏注意力创新，代码、数学推理等任务的推理速度比同尺寸开源模型快 3 倍以上。

MiniCPM 4.1 开源模型

阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio，支持语音增强、分离、目标说话人提取

Speech Enhancement）、语音分离（Speech Separation）和音视频扬声器提取（Audio-Video Speaker Extraction）功能，能够在嘈杂环境中清理音频、分离复杂声源并结合音频和视觉数据锁定目标发声者

ClearerVoice-Studio 语音

Falcon 180B 开源影响了谁？

短期的影响主要是技术层面，中长期看，对国内大模型厂商的小规格模型开源+大规格模型商用的模式会有一定的冲击，因为客户多了一个基于开源微调的选项；但即便在Falcon180B模型上微调，需要投入的软硬件资源和人力时间成本对于企业客户都是不小的开销

大模型

腾讯开源混元AI绘画大模型

最近大厂的大模型竞争激烈，百度的文心一言主打闭源和付费路线，阿里的通义千问主打开源免费路线，而腾讯的混元大模型，则不温不火。

腾讯混元文生图

书生·万卷：难得的中文开源数据集

全球最大的AI开源社区Huggingface上，已经有5万多的开源数据集了，其中涉及中文的数据集只有区区可怜的151个。

大模型

语音、视频转文字神器：开源whisper介绍

Whisper模型的训练过程非常复杂，需要大量的计算资源和时间。

人工智能大模型 wisper

腾讯开源的数字人MuseTalk到底行不行？

MuseTaIk是由腾讯团队开发的先进技术，它是一个实时高质量的音频驱动唇部同步模型。

MuseTalk 数字人音频

开源的大模型数据集

大模型的算法模型开源越来越多，大模型工程化也越来越稳定。

开源模型数据集

<1 2 345 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1