文章列表-AI魔法学院

文章列表

Threejs: 数字人生成金色动态粒子效果

昨天的文章提到通过修改数字人的材质做全息投影仪的动态效果，今天分享一下生成金色动态粒子人的代码，效果图如下：效果中还包含多个粒子效果的动态转换，有了这个，再加上摄像头，就可以完全模拟亚运会的数字人效果了

Threejs 数字人

GLM4 开源了！！！还有多模态

【https://github.com/THUDM/GLM-4】高级功能，一应俱全多轮对话：GLM-4-9B-Chat 支持流畅的多轮对话体验。

智普 ChatGLM 多模态

体验完阿里的EMO模型，我emo了

简单来说，EMO（Emote Portrait Alive）是一个AI肖像视频生成系统，能够通过输入单一的参考图像，生成具有一定表现力的面部标签和各种头部姿态。

EMO 文生图

构建开源多模态RAG系统

本质上，RAG通过允许模型从外部来源动态检索实时信息，增强了AI响应的特异性。

RAG 大模型

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变体，相比上一代的训练数据增加了 40%，在包括推理、编码、精通性和知识测试等许多外部基准测试中展示出了优越的表现，且支持多个语种

开源模型

【提前体验GPT-5】吴恩达AI智能体工作流详细解读

这里的方法是针对一个智能体而言，吴恩达博士还提到，由此很容易让人联想到从一个智能体到多个不同功能智能体的扩展，这就是第四种设计模式的思想。

GPT-5 智能体

AI Agent / 智能体观察笔记（中）

每一个智能体的身份、职业和与其他人的关系，都包含在一个一段话的提示词之中。

大模型

对于AI，我们现阶段可以有的态度

如果想让他帮你做些更专业的更具体的更精准的，能为你所用的内容生成，你还真需要下点功夫去学习下如何与AI交流的自然语言编程。

文生图

LLM native策略的内部状态是否应该结构化【2023Q3】

2、场景1：内部状态明确如果业务的场景仍然是上述举例的订火车票，那么很明显内部状态是【明确】的。

大模型

XX来信：智能体设计模式2：Reflection

智能体工作流不是让LLM直接生成最终输出，而是多次提示LLM，使其有机会逐步构建更高质量的输出。

Reflection 智能体

来个优秀的开源人脸识别项目！

生物识别技术是一种利用人体自身特征进行身份认证的技术。

人脸识别开源项目

Kimi+扣子Coze，我零门槛制作了一个好用的智能体Agent | 智能体开发

Kimi+扣子的合作： 1.对于扣子而言，如虎添翼扣子已经是国内智能体开发功能比较完善、生态比较丰富的平台了。

Kimi 扣子Coze 大模型

最强国产开源多模态大模型MiniCPM-V：可识别图片、视频，还可在端侧部署

MiniCPM-V是面向图文理解的端侧多模态大模型系列。

minicpm 面壁

炸裂！百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本

突出多模态能力和交互体验的 GPT-4o 强调了其在实际应用中的关键作用，然而它缺乏一个高性能的开源对应物。

Baichuan-Omni 多模态大模型

被高估的Pika，被低估的多模态AI

例如，在医疗领域可以通过结合图像、录音和病历文本，提供更准确的诊断和治疗方案；在交通领域，结合图像和传感器数据，带来更智能、更安全的自动驾驶体验；在教育领域，将文本、声音、视频相结合，呈现更具互动性的教育内容

大模型多模态

<123 4 5 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1