【Python】【OpenCV】OCR识别（一）

2024-01-02 20:41 由 VanGoghpeng 发表于 #后端开发

接着练手图像处理例子

　　抛开网上截图进行OCR识别，更多的图源来自于我们的手机，相机等等设备，而得到的图片都并非是板正的，大多随手一拍的图源都是带有角度的，所以我们需要先将图像进行摆正。

首先先对图像进行预处理，上代码：

 1 def edge_detect(image):
 2     gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
 3     edges = cv2.Canny(gray, 100, 200)
 4     contours, hierarchy = cv2.findContours(edges.copy(), cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
 5     conts = sorted(contours, key=cv2.contourArea, reverse=True)[:5]
 6     for c in conts:
 7         peri = cv2.arcLength(c, True)
 8         approx = cv2.approxPolyDP(c, 0.02*peri, True)
 9         if len(approx) == 4:
10             ss = approx
11             cv2.drawContours(image, [ss], -1, (0, 255, 0), 2)
12     cv2.imshow('', image)

1、使用Canny来进行边缘提取。

2、使用cv2.approxPolyDP来进行轮廓逼近。

3、将我们想要的轮廓绘制出来。

上述代码中，cv2.approxPolyDP方法的epsilon参数很有讲究，先贴上parameter和reval。

参数说明：

curve：输入的轮廓数据。
epsilon：指定逼近精度，即源轮廓到逼近结果的最大距离。较小的值会得到更精确的逼近，但轮廓的点数也会更多。
closed：一个布尔值，指示轮廓是否闭合。
approxCurve：可选参数，表示输出的逼近多边形曲线。

该函数返回逼近多边形的结果：

　　使用cv2.approxPolyDP函数可以将复杂的轮廓近似为简单的多边形，从而方便后续的形状分析和处理操作。

　　关于epsilon参数，这是一个和周长相关的参数，使用在进行轮廓逼近时的误差：

　　　　1、当epsilon（ε）越大时，也就是说，我们给定的误差范围越大，这就代表着我们得到的逼近轮廓的形状越是粗糙或者说敷衍（顶点较少），但是过大时会导致得到的逼近形状并不能很好的表达原始轮廓的形状。

　　　　2、当epsilon（ε）越小时，那么得到的逼近形状就越精确或者说细致（顶点较多），但是过小时会导致得到的逼近形状过于接近原始轮廓，出现过拟合的现状。

不理解的可以动手调整传入epsilon（ε）的值看看效果。

运行结果：

延展问题：如果我们得到的图源并不是完整的一页，或者说没有完整的最外层轮廓（如上述绘制出的边缘缺失了一部分），那么如何将得到的有角度图进行旋转矫正。

参考博文：OpenCV实战（4）——文档扫描OCR识别&答题卡识别判卷（文档扫描，图像矫正，透视变换，OCR识别） - 战争热诚 - 博客园 (cnblogs.com)

热门相关：现代隐士高手孽徒快坑师圣人门徒宝贝轻轻：总裁，用力爱！山神

Python性能测试框架Locust实战教程

01、认识Locust Locust是一个比较容易上手的分布式用户负载测试工具。它旨在对网站（或其他系统）进行负载测试，并确定系统可以处理多少个并发用户，Locust 在英文中是蝗虫的意思：作者的想法是在测试期间，放一大群蝗虫攻击您的网站。当然事先是可以用 Locust 定义每个蝗虫（或测试 ...阅读全文

python在容器内克隆拉取git私有仓库

前言目前有个python应用需要在容器镜像内拉取git私有仓库的代码，一开始的想法是用GitPython，折腾一番ssh私钥和known_hosts问题后，发现还是在镜像中封装个git最省事，然后用subprocess调用系统命令，镜像体积也没有想象中增加特别多。准备ssh私钥和known_ho ...阅读全文

Python 实现 PDF 到 Word 文档的高效转换（DOC、DOCX）

PDF（Portable Document Format）已成为一种广泛使用的电子文档格式。PDF的主要优势是跨平台，可以在不同设备上呈现一致的外观。然而，当我们需要对文件内容进行编辑或修改，直接编辑PDF文件会非常困难，而且效果也不理想。将PDF文件转换为Word文档（doc、docx）再进行编辑 ...阅读全文

python3发送Gratuitous ARP更新vip绑定关系

操作系统：CentOS 7.6_x64 Python版本：3.9.12 FreeSWITCH版本：1.10.9 高可用场景下，vip切换完成后需要发送arp广播更新ip和mac地址的绑定关系，如果不及时发广播，会导致tcp重连等问题。今天记录下python3如何使用arp广播更新ip和mac地 ...阅读全文

全面对比 Python、Go、VB、PHP、C/C++、C#、.Net、Java、… 等多种编程语言的区别

1. 语言类型：首先，C/C++、Java 、Python都是强类型的语言。强类型语言的定义如下：强类型语言是一种强制类型定义的语言，即一旦某一个变量被定义类型，如果不经强制转换，那么它永远就是该数据类型。而弱类型语言是一种弱类型定义的语言，某一个变量被定义类型，该变量可以根据环境变化自动进行转换 ...阅读全文

Python趣味入门14:类的继承

继承最好的示例竟然是病毒复制。类似于COVID-19病毒全球肆虐，病毒复制变异的过程就是下一代继承上一代部分特性，并发展出新特性的过程（如下图）。 ...阅读全文

Python教程(19)——python异常处理

什么是异常在计算机编程中，异常（Exception）是指在程序执行过程中发生的错误或异常情况。当出现异常时，程序无法正常继续执行，因此需要采取一些特殊的措施来处理异常，以防止程序崩溃或产生意外结果。异常可以在程序中的任何地方发生，可能是由错误的输入、无效的操作、资源不足、硬件问题或其他未预料的情 ...阅读全文

Python趣味入门13:类中的各种变量

类中不同的变量，其中我们已知道定义变量在类中就表示为属性。但是在不同的位置定义变量会有不同的作用，并且采用不同的命名方式，也会让变量具有不同的作用。本文假设有一个类指南针（compass），可想象成某个地图游戏中帮助主角寻找方向，也是本节主要的示例。 ...阅读全文

一键打包,随时运行,Python3项目虚拟环境一键整合包的制作(Venv)

之前我们介绍了如何使用嵌入式 Python3 环境给项目制作一键整合包，在使用嵌入式 Python 环境时，通常是作为另一个应用程序的一部分，而Python3虚拟环境是为了在开发过程中隔离项目所需的 Python 环境。虚拟环境允许我们在同一台计算机上的不同项目中使用不同的 Python 版本和软件 ...阅读全文

Python趣味入门12:初遇类与实例

小牛叔用轻松有趣的故事，带你进入Python的编程世界。一提到类大神们就经常说封装。说白了，封装即把围绕同一个对象相同的代码、数据整合在一起。比如在某段游戏代码中（比如熊猫厨房），有一个“面包”： 1、游戏提供“烘烤”的操作。 -> 很明显这是动作 -> 类的方法。2、面包有硬度指数 -> 很明显这... ...阅读全文