文章列表-AI魔法学院

文章列表

【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能！效果炸裂！手把手带你理论+实战部署推理!

2407.04051 理论篇: FunAudioLLM项目介绍 FunAudioLLM整体系统框架介绍 FunAudioLLM 是阿里语音团队最新开源的项目，用于改善人类与大型语言模型的自然语音交互

asr tts 声音

中国电信开源星辰AI大模型：央企中首个完成LLM研发和开源的选手诞生

据统计，在电信内部，星辰AI大模型在此任务上的有效采纳率可达85.7%，和国内其他众多大模型相比，表现相当出色。

开源大模型电信

大语言模型综述<演进，技术路线，区别，微调，实践，潜在问题与讨论>

[3]证明了在给定训练预算的情况下，即使减少模型参数量，只要增加预训练的数据大小和训练时长（更多的训练tokens数），可以达到甚至超过原始大小模型的效果。

大模型

华为盘古画画3.0发布 | PanGu-Draw：业界最大的中文文生图模型，效果YYDS！

文章地址：https://arxiv.org/pdf/2312.16486.pdf 项目地址：https://pangu-draw.github.io 00 | 导言目前的大规模扩散模型代表了条件图像合成的巨大飞跃

PanGu-Draw 文生图

最新最强开源模型Qwen3本地运行指南！Windows+ollama+chatwise轻松搞定

它支持开关深度思考能力，就像给模型配备了一个智能大脑的开关，你可以根据实际需求灵活调整。

Qwen3 开源模型

手把手带你微调一个自己的 ChatGLM2-6B 模型

ChatGLM2 6B 介绍ChatGLM2 6B 介绍 ChatGLM2-6B 是开源中英双语对话模型 ChatGLM-6B 的第二代版本，在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上

ChatGLM2-6B

Stability AI推出视频生成模型Stable Video Diffusion

Stability AI近日推出了名为Stable Video Diffusion的视频生成模型，该模型基于该公司现有的Stable Diffusion文本转图像模型，能够通过对现有图像进行动画化生成视频

Video 视频创作 SD

RAG模型的主要痛点和解决方案

- 尝试使用多向量表示、近似最近邻搜索和最大内积搜索来提高速度，而不损害准确性。

rag 大模型

对于AI，我们现阶段可以有的态度

包括AI在其他模态的技术依然不算成熟和便利，需要一定的时间来迭代和发展。

文生图

LLM native策略的内部状态是否应该结构化【2023Q3】

但他经常并不能把自己的能力量化的写下来，以及很多模糊的感受他自己也很难形容。

大模型

StableDiffusion升级版SDXL：一键运行包ComfyUI和18G模型分享！

· 模型很大，体积很大，参数很大，35/66亿。

comfyui sdxl 文生图

如何从零开始训练专属 LoRA 模型？4600字总结送给你！

本文主要介绍如何训练 LoRA 模型，LoRA 是一种轻量化的模型微调训练方法，是在原有大模型的基础上，对模型进行微调，从而能够生成特定的人物、物品或画风。

训练

再超Transformer！Google| 提出两个新模型(Griffin、Hawk)，强于Mamba，更省资源

这时，循环语言模型成为一种替代方案，它们可以将整个序列压缩为固定大小的隐藏状态，并迭代更新。

transformer 训练

国外报告90%的AI类产品公司已经实现盈利，而国内大模型和AIGC的访谈说太卷了

国内大模型行业的发展情况：行业内卷严重，商业化难题突出，技术挑战仍存。”

大模型

硬核Prompt赏析：HuggingGPT告诉你Prompt可以有多“工程”

（包括但不仅限于文生图、图生文、语音转文字、文字合成语音等），从而让LLM能驱动其他智能Agent，实现多模态能力。

提示词 prompt

<...20 21 22 232425 26 27 28 29 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1