文章列表-AI魔法学院

文章列表

微软最强全自动数据可视化工具！现已开源

会生成全部变量的摘要，包括变量的行数、最小值、最大值、标准差。

大模型

一款构建AI数字人项目开源了！自动实现音视频同步！

1、Video-Tetalking Video-ReTalking 是一个利用AI实现视频人物嘴型与输入的声音同步的创新技术。

AI数字人音视频同步

10个具有代表性的AI-Agents，将如何改变互联网/重塑Web3

而比较明确的关键共识是，基于LLM驱动的Agents实现对通用问题的自动化处理，是此次大型语言模型爆发周期中，我们所指认的，且形成共有认识的AI-Agents。

开源模型

如何用大语言模型构建一个知识问答系统

从大语言模型（Large Language Model, LLM）[2]角度而言，上面的需求是在两阶段训练模式下，面向下游场景进行适配的问题。

知识库

Dify：大模型创业开源工具，46,558 行代码，完全开源

工作流: 在画布上构建和测试功能强大的 AI 工作流程，利用以下所有功能以及更多功能。

Dify 开源工具

来自OpenAI应用研究主管关于Agent的万字长文-AI Agents介绍

另一方面，Andrej Karpathy认为普通人、创业者和极客在构建AI Agents方面相比OpenAI这样的公司更有优势，大家目前处于平等竞争的状态，因此他很期待看到这方面的成果。

Agent

大模型微调数据选择和构造技巧

大模型场景微调里面，最关键地的一个是问题是：选择什么样的数据微调？

大模型微调

整理了近期所有TTS相关的大模型

从 XTTS 到 Pheme,从OpenVoice 到 VITS，每个大模型包括源码地址，支持的语言，非常棒！

TTS 大模型

DeepSeek V3刷屏，550万元2000张卡做出的开源模型，和OpenAI几亿烧出来的一样好

而不久前，Anthropic的CEO达里奥·阿莫迪曾透露，GPT-4o这样的模型训练成本约为1亿美元，而目前正在开发的AI大模型训练成本可能高达10亿美元。

DeepSeek V3 开源模型

EverydayWechat：让微信变得更强大，引领每日生活新体验

一、简介 EverydayWechat是一个强大的Python库，旨在为微信用户提供更多便利和功能扩展。

EverydayWechat

【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能！效果炸裂！手把手带你理论+实战部署推理!

2407.04051 理论篇: FunAudioLLM项目介绍 FunAudioLLM整体系统框架介绍 FunAudioLLM 是阿里语音团队最新开源的项目，用于改善人类与大型语言模型的自然语音交互

asr tts 声音

中文对话大模型BELLE全面开源！（附：数据+模型+轻量化）

在中文对话大模型开源社区里，最近迎来了一位优秀的新成员——BELLE。

belle 训练大模型

深入浅出：大语言模型中必不可少的技术——Embedding简介

Embedding在大模型中的价值如何基于Embedding让大模型解决长文本（如PDF）的输入问题？

embedding

清华系17人，撑起中国大模型创业半壁江山

智东西8月23日报道，过去三个月，生成式AI浪潮变数丛生，国内AI大模型产业也连爆大事：6月29日美团宣布完成对AI大模型独角兽企业光年之外的收购，搜狗创始人王小川创立的AI大模型创企百川智能连发3款开源大模型

大模型

达摩院SPACE对话大模型：知识注入与知识利用

大规模语言模型过去几年 NLP 领域的重大进展，主要是大型预训练模型出现与大规模使用。

大模型

<...29 30 31 323334 35 36 37 38 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1