首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 初创企业必知的 30种商业模式(附实例)
· 大模型应用中大部分人真正需要去关心的核心——Embedding
· 【工具书】文生图Midjourney最全prompt提示词分类对照表
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 用AI为古诗词生成插画
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 聊聊AI产品做算法备案这件事
· 开源免费离线语音识别神器whisper如何安装
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
LangChain - RAG: 拿什么「降伏」PDF 中的 Table 类型数据
解决的方式不外乎针对 table 信息做专门的保存、解码、embedding 处理,如果是 image 那就只能上
OCR
了,信息保存部分 LangChain 前两个月发布的 MultiVectorRetriever
大模型
LangChain
RAG
工具
OCRmyPDF—可智能识别PDF文本和图片信息的工具
OCRmyPDF向扫描的PDF文件添加了
OCR
文本层,使它们可以被搜索或复制粘贴。
OCRmyPDF
工具
LLM
ChatPDF | LLM文档对话 | pdf解析关键问题
接下来用
OCR
工具来对标题区块提取文字即可,用上述工具都可以。
大模型
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
在多模态对齐预训练阶段,作者整理了包括图像描述、交错数据、
OCR
数据和图像文本数据的广泛训练语料库。
Baichuan-Omni
多模态大模型
金融
金融行业中 Fintech 的应用场景
场景4、智能识别
OCR
识别身份证及银行卡 在业务票据整理过程中,可以通过图像识别等技术完成数据的收集,比如通过
OCR
完成身份证的识别,银行承兑汇票,银行卡等 20231123162725 银行体系里面也有一些图像识别的任务
Fintech
金融
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
计算机视觉 任务(英文) 任务(中文) 任务说明
ocr
-detection
开源
OpenAI
OpenAI 无需向量化的 RAG 新架构设计范式剖析
4.2、保险理赔表单处理(Insurance Claim Processing) 该方案旨在数字化和验证手填保险表单,具体步骤如下: · 第一阶段(
OCR
):利用 GPT-4.1 强大的视觉
OpenAI
RAG
架构
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
它取得了优于 GPT-4o mini、Gemini 1.5 Pro 和 Claude 3.5 Sonnet等商用闭源模型的表现,并进一步优化了 MiniCPM-Llama3-V 2.5 的
OCR
minicpm
面壁
Flowith:革新你的工作方式,体验节点式 AI 的超流畅生产力
文件上传与分析:支持 PDF、DOC、EXCEL 等多种文件格式的上传和分析,内置
OCR
Flowith
GPT
生产力工具
大模型
对于大模型RAG技术的一些思考
能够对Text、Title、Figure、Figure caption、Table、Table caption、Header、Footer、Reference、Equation10类区域进行检测,统一了
OCR
RAG
大模型
RAG
Rerank——RAG中百尺竿头更进一步的神器,从原理到解决方案
· 优化内容提取的方法:从源头解决内容提取的有效性,包括文本内容、表格内容(保留制表符)和图片内容(
OCR
RAG
检索增强
开源
星标破万!小钢炮2.6登顶GitHub,Hugging Face TOP3, 燃爆开源社区!
💪 强大的
OCR
能力及其他功能。
MiniCPM-V
2.6
大模型
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
文本增强提示方法通过从原始网页中提取所有文本元素并附加到指令提示之后,减轻了模型进行
OCR
的难度。
设计转代码
大模型
开源
5个最佳开源RPA框架!
它还提供了数十个命令,如自定义代码执行,图像识别和
OCR
等。
智能自动化
大模型
RPA框架
开源
5个最佳开源RPA框架
它还提供了数十个命令,如自定义代码执行,图像识别和
OCR
等。
开源模型
智能自动化
<
1
2
3
>
1
2
4
5
6
7
8
9
100