首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 13个神级Chatgpt指令,助你小说丝滑过审
· Suno音乐新手指南(手把手完整版教程)
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 阿里云王坚:中国AI不惧R2迟发!靠「群体智能」破局:算力不是瓶颈,但AI应用层急需炸开OpenAI想象围墙!不看好硅谷抢人乱象
· 造梦师手记:C站最受欢迎的大模型推出了SFW版
· AI绘画巅峰对决:Stable Diffusion 3与DALL·E 3原理深度比较
· AI写作不如意?万字长文深度剖析背后原因
· 大模型的研究新方向:混合专家模型(MoE)
· 喂饭级 AI’MWISE 启动器安装教程
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
LangChain - RAG: 拿什么「降伏」PDF 中的 Table 类型数据
解决的方式不外乎针对 table 信息做专门的保存、解码、embedding 处理,如果是 image 那就只能上
OCR
了,信息保存部分 LangChain 前两个月发布的 MultiVectorRetriever
大模型
LangChain
RAG
工具
OCRmyPDF—可智能识别PDF文本和图片信息的工具
OCRmyPDF向扫描的PDF文件添加了
OCR
文本层,使它们可以被搜索或复制粘贴。
OCRmyPDF
工具
LLM
ChatPDF | LLM文档对话 | pdf解析关键问题
接下来用
OCR
工具来对标题区块提取文字即可,用上述工具都可以。
大模型
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
在多模态对齐预训练阶段,作者整理了包括图像描述、交错数据、
OCR
数据和图像文本数据的广泛训练语料库。
Baichuan-Omni
多模态大模型
金融
金融行业中 Fintech 的应用场景
场景4、智能识别
OCR
识别身份证及银行卡 在业务票据整理过程中,可以通过图像识别等技术完成数据的收集,比如通过
OCR
完成身份证的识别,银行承兑汇票,银行卡等 20231123162725 银行体系里面也有一些图像识别的任务
Fintech
金融
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
计算机视觉 任务(英文) 任务(中文) 任务说明
ocr
-detection
开源
OpenAI
OpenAI 无需向量化的 RAG 新架构设计范式剖析
4.2、保险理赔表单处理(Insurance Claim Processing) 该方案旨在数字化和验证手填保险表单,具体步骤如下: · 第一阶段(
OCR
):利用 GPT-4.1 强大的视觉
OpenAI
RAG
架构
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
它取得了优于 GPT-4o mini、Gemini 1.5 Pro 和 Claude 3.5 Sonnet等商用闭源模型的表现,并进一步优化了 MiniCPM-Llama3-V 2.5 的
OCR
minicpm
面壁
Flowith:革新你的工作方式,体验节点式 AI 的超流畅生产力
文件上传与分析:支持 PDF、DOC、EXCEL 等多种文件格式的上传和分析,内置
OCR
Flowith
GPT
生产力工具
大模型
对于大模型RAG技术的一些思考
能够对Text、Title、Figure、Figure caption、Table、Table caption、Header、Footer、Reference、Equation10类区域进行检测,统一了
OCR
RAG
大模型
RAG
Rerank——RAG中百尺竿头更进一步的神器,从原理到解决方案
· 优化内容提取的方法:从源头解决内容提取的有效性,包括文本内容、表格内容(保留制表符)和图片内容(
OCR
RAG
检索增强
开源
星标破万!小钢炮2.6登顶GitHub,Hugging Face TOP3, 燃爆开源社区!
💪 强大的
OCR
能力及其他功能。
MiniCPM-V
2.6
大模型
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
文本增强提示方法通过从原始网页中提取所有文本元素并附加到指令提示之后,减轻了模型进行
OCR
的难度。
设计转代码
大模型
开源
5个最佳开源RPA框架!
它还提供了数十个命令,如自定义代码执行,图像识别和
OCR
等。
智能自动化
大模型
RPA框架
开源
5个最佳开源RPA框架
它还提供了数十个命令,如自定义代码执行,图像识别和
OCR
等。
开源模型
智能自动化
<
1
2
3
>
1
2
4
5
6
7
8
9
100