文章列表-AI魔法学院

文章列表

baichuan2 有什么好的深挖论文中涉及的知识点

ChatGPT 在各种领域都表现出了强大的语言能力，从随意交谈到解释复杂概念。

大模型

开源免费离线语音识别神器whisper如何安装

whisper介绍 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络，且它亦支持其它98种语言的自动语音辨识。

wisper 翻译免费

14.6K star！最好用的OCR文字识别项目，没有之一！

伙伴们，平时都会用到文字识别吧？

Umi-OCR 开源项目文字识别

OpenAI 开源语音识别 Whisper 的使用体验怎么样？

关于Buzz 　　Buzz 是一款基于 OpenAI 开源 Whisper 自动语音识别模型的软件工具，能够将音频或视频中的语音自动识别为带有时间戳的文本字幕。

生成式AI

会“追问”的Agent，大模型知识库另类实践

在实际的生产环境中，此类知识库应用可能遇到两类问题：知识型和政策型（图1）。

大模型

大模型外挂知识库优化-大模型辅助向量召回

此时的回答内容很可能是存在知识性错误，因为如果能回答正确，那就不需要召回补充额外知识了对吧。

大模型

爆肝两天！ChatGPT+提示词解决知识库目录混乱

对于职场新手可能缺乏有效的知识管理和分类技巧，导致知识库变得错综复杂。

智能分类大模型知识库

OCRmyPDF—可智能识别PDF文本和图片信息的工具

如果需要，可以在执行OCR之前对图像进行纠偏和/或清洁 •验证输入和输出文件 •在所有可用的CPU核心之间分配工作 •使用Tesseract OCR引擎识别超过

OCRmyPDF 工具

元象首个多模态大模型 XVERSE-V 开源，刷新权威大模型榜单，支持任意宽高比输入

元象今日发布多模态大模型 XVERSE-V ，支持任意宽高比图像输入，在主流评测中效果领先。

XVERSE-V 多模态大模型

如何用大语言模型构建一个知识问答系统

不要出现似是而非或无意义[1]的回答。

知识库

淘宝模特全体注意！阿里AnyDoor AI换装神器出来了，年度最强AIGC重制绘图工具，重塑电商模特产业

想象一下，在阿里的AnyDoor世界里，你可以自由穿梭于数不尽的时尚搭配中，只需几个简单步骤，你就能将任意一张图片中的元素，毫无违和感地转移到另一张图片中。

AnyDoor 换装文生图

“How to make money with GPTs” 教你集成第三方url的Action+知识库的完整版GPTs

创建一个GPT就像开始一个对话，给它指令和额外的知识，然后选择它可以执行的操作，如搜索网页、创建图像或分析数据。

GPTs 知识库

大语言模型LLM和知识图谱KG增强的企业搜索应用

搜索为LLM提供动力原因有很多，但最主要的原因是LLM带来了能够超越搜索的新功能，这意味着更多的眼球和更多的广告收入。

开源模型

两天star量破千：OpenAI的Whisper被蒸馏后，语音识别数倍加速

Whisper 是 OpenAI 研发并开源的一个自动语音识别（ASR，Automatic Speech Recognition）模型，他们通过从网络上收集了 68 万小时的多语言（

语音 HeyGen

国内厂商语音识别与Whisper评测：现状与概况对比

同时，Whisper（飞思卡尔语音识别技术）作为一项国际上也备受关注的语音识别技术，在语音识别领域也有着广泛的应用。

语音识别 Faster-Whisper

<1 2 345 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1