相关文章
腾讯云OCR(印刷体识别) API使用
腾讯云OCR(印刷体识别) API使用
使用背景: 业务部门下载了许多PDF的快递单 上面有联系方式 需要识别手机号码后保存下来 解决思路: 1、 如果是可编辑的pdf文档 可使用pdf 读取jar包来处理 2、 本需求的pdf是图片类型,…
建站知识
2025/3/2 20:52:26
OCR表格识别——(二)
前言:
先使用预训练模型体验一下结果: 这里主要使用paddleOC来实现,代码下载链接: https://github.com/PaddlePaddle/PaddleOCR
预训练模型下载:
# 下载模型
mkdir inference && cd inference
# 下载超轻量…
建站知识
2024/10/27 10:11:12
OCR表格识别—(一)
表格识别主要分为三个大的部分:文本检测 文本识别 表格结构识别。将表格识别过程进行细分,见下图所示。 在整个表格识别过程中,主要包括三种模型: 文本检测模型:识别出文本的坐标值和文本框。 文本识别模型:…
建站知识
2025/2/26 19:50:56
信息内容安全-图像文字识别OCR
OCR(Optical Character Recognition,光学字符识别),指识别图像中亮暗差别或其他特征,构建文字形状并翻译为计算机文字。有文章说这是人工智能的一个应用,也算吧,得益于近些年人工智能的火热,文字识别目前现成的工具和A…
建站知识
2025/3/8 22:24:15
OCR-文本检测和文本识别的数据
文章目录 1.文本识别数据集1.1.Synthetic Chinese String Dataset2.文本检测数据ICPR MWI 2018 挑战赛2.1.Pascal VOC20072.2.MSRA Text Detection 500 Database (MSRA-TD500)2.3.COCO-TEXT2.4.Google FSNS(谷歌街景文本数据集)2.5.Reading Chinese Text in the Wild(RCTW-17)2…
建站知识
2025/1/20 22:46:55