文章列表-AI魔法学院

文章列表

元象首个多模态大模型 XVERSE-V 开源，刷新权威大模型榜单，支持任意宽高比输入

兼顾全局的概览信息和局部的细节信息，能够识别和分析图像中的细微特征，看的更清楚，理解的更准确。

XVERSE-V 多模态大模型

语音、视频转文字神器：开源whisper介绍

OpenAI的Whisper是一种基于深度学习的语音识别模型，它是一种通用的语音识别模型，可以用于语音识别、语音翻译和语言识别等任务。

人工智能大模型 wisper

告别抑郁：10个ChatGPT提示词技巧打造你的心理健康顾问，摆脱90%的心理疾病

我将分享一些精心设计的ChatGPT提示词，这些提示词不仅包含了专业知识的精华，更指明了具体实践的路径。

心理健康提示词

耗时7天，终于把15种ControlNet模型搞明白了

，只是识别的东西有多有少我们这里就用最普通的“openpose”其他的会在后面细讲点击爆炸按钮 “ ” 就可以在图片右边看到预处理之后的人物姿势线条最后点击生成，小姐姐就摆出我们指定的姿势了

文生图

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

只是别被缅北拿去就好。

F5-TTS 音频克隆

RAG检索增强技术在知识库智能检索场景下的应用实践

这个过程类似于对文本内容进行指纹化，使其能够在向量空间中被有效地识别和检索。

知识库 RAG检索增强

开源语音大语言模型来了！阿里基于Qwen-Chat提出Qwen-Audio!

此外，我们还将语音识别与基于字级时间戳预测（SRWT）的任务结合起来进行训练，这在以前的多任务学习研究中通常被忽视。

大模型语音

从零开始用LangChain、Pinecone和LLMs搭建你自己的文档问答系统

在深入实现之前，我们先来了解一下使用语义搜索+GPT问答相比微调GPT的优势： 2.1、更广泛的知识覆盖：语义搜索 + GPT 问答主要包括两个核心步骤，首先从大量的文档中找到相关的段落，然后根据这些段落生成答案

知识库 langchain

测评了8个国产AI大模型，差点崩溃……

从自然语言处理到语音识别，从情感分析到知识问答，大模型的应用已经渗透到我们生活的方方面面。

大模型测评

QAnything：网易有道最新开源的“本地化部署知识库”AI问答系统

项目简介 "QAnything"是网易有道开发的本地知识库问答平台。

网易 RAG 知识库

链接大模型与外部知识，智源开源最强语义向量模型BGE

C-MTEB 的建设参照了同类别英文基准 MTEB [12]，总共涵盖6大类评测任务（检索、排序、句子相似度、推理、分类、聚类），涉及31个相关数据集。

embedding 语义向量

姜子牙大模型系列 | 为知识检索而生，Ziya-Reader开源，多个长文本中文任务第一

此外，基于大模型进行知识库问答、基于大模型的智能客服也是火热的创业项目。

大模型 Ziya

AI知识库总是不准？教你无脑用GPT整理结构化数据集...

随着LLM的蓬勃发展，企业、个人知识库越来越火。

GPT

4种通过LLM进行文本知识图谱的构建方法对比介绍

我们在以前的文章中已经介绍了使用大语言模型将非结构化文本转换为知识图谱。

知识图谱大模型

超越Animate Anyone! 南加大&字节提出MagicPose，不需任何微调就可生成逼真的人类视频

v=VPJe6TyrT-Y 论文阅读 MagicPose:现实的人类姿势和面部表情重新定位与身份意识扩散摘要在这项工作中，我们提出了MagicPose，这是一种基于扩散的模型

MagicPose 视频

<...4 5 6 789 10 11 12 13 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1