python识别图片文字

懒人在思考

2018-04-21

因为学校要求要刷一门叫《包装世界》的网课，而课程里有200多道选择题，而且只能在手机完成，网页版无法做题，而看视频是不可能看视频的，这辈子都不可能看...所以写了几行代码来进行百度搜答案。

思路如下：

手机屏幕投影到电脑上；
截图并识别图片文字；
调用百度来进行搜索；
提取html关键字。

环境配置：python3.6、第三方库：pyautogui、PIL、pytesseract、识别引擎tesseract-ocr

要识别中文，ocr引擎要下载一个中文包chi_sim放进Tesseract-OCR\tessdata里面。安装完ocr后还要配置一下调用路径，在Python36\Lib\site-packages\pytesseract找到pytesseract.py（这是我的windows路径），打开在里面添加一下路径：

1 # CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
2 tesseract_cmd = 'tesseract'
3 tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
4 img_mode = 'RGB'

然后用AirDroid或者Vysor、360手机助手之类的将手机的屏幕投影到电脑上，用鼠标确定截图坐标，代码如下：

1 import<span> pyautogui as pag
2 x,y =<span> pag.position()
3 posStr = "position:"+str(x).rjust(4)+','+str(y).rjust(4<span>)
4 print(posStr)

要获取两个坐标（截图开始坐标和结束坐标），然后利用获取的坐标运用如下代码截图并调用ocr引擎识别（识别出来的字是每个用空格分开的，所以要去除字符串中的空格），代码如下：

from PIL import Image
 from PIL import ImageGrab
 import pytesseract
 import webbrowser
 
 pos = (0,245,425, 327)
 cut_img = ImageGrab.grab(pos)
 cut_img.save('C:/imgSave/1.jpg') #保存截图到文件夹中
 print("screenshots sucess")
 
 text=pytesseract.image_to_string(Image.open('C:/imgSave/1.jpg'),lang='chi_sim') #调用识别引擎识别
 text=text.replace(" ","") #去空格
 print(text)
 url = 'http://www.baidu.com/s?wd=%s' % text #调用百度搜索
 webbrowser.open(url)

最终因为搜出来的全是题库，所以就没有提取html关键字了，其实是懒。

文字识别文字图片

懒人在思考

0 关注 1 粉丝 0 动态

相关推荐

Android 图片文字识别DEMO（基于百度OCR）

OCR 是 Optical Character Recognition 的缩写，翻译为光学字符识别，指的是针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技

alanlonglong 2020-06-14

机器学习基础---应用实例（图片文字识别）和总结

首先，展示一个复杂的机器学习系统是如何被组合起来的；最后，介绍一下照片OCR问题，展现机器学习中有用的想法和概念，其中之一就是应用在计算机视觉问题中，另一个是人工数据合成的概念。讨论一种滑动窗口分类器的方法。标准的做法是绘制一个学习曲线来确保有一个低偏差、

PeterHuang0 2020-05-26

利用百度AI OCR图片识别，Java实现PDF中的图片转换成文字

我们搞技术的，当然得自己学着解决现在的痛点。首先，说说一些在线版的PDF图片转文字，对文件大小有限制为2M，超过了便要收费了。

chenzhx 2019-09-06

如何使用Python进行OCR识别图片中的文字

OCR1，全称Optical character recognition，或者optical character reader，中文译名叫做光学文字识别。它是把图像文件中的手写文本，打印文本转换为机器编码文本的一种方法。OCR技术广泛用于识别打印纸张中的文

我心飞翔之家 2019-04-01

Python3一行代码实现图片文字识别的示例

自学Python3第5天，今天突发奇想，想用Python识别图片里的文字。没想到Python实现图片文字识别这么简单，只需要一行代码就能搞定。我们运行代码后识别的结果,有几个字没有正确识别，但是大多数字都能识别出来。这里我们需要用到两个库：pytesser

LHpython 2018-01-15

C# 调用百度AI接口实现文字识别

今天心血来潮做了个识别图片文字的demo，现在文字识别技术已经比较成熟了，而且还有可以调用的公共接口。今天做的demo主要简单对比了Tesseract-OCR和BAIDU.AI 这两种方法，感觉百度的中文识别准确率更高，Tesseract-OCR中文别准确

人工智能快报 2020-06-09

Python怎么识别文字？正确的方法详解

从Google的无人驾驶汽车到可以识别假钞的自动售卖机，机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域。将图像翻译成文字一般被称为光学文字识别。可以实现OCR的底层库并不多，目前很多库都是使用共同的几个底层OCR库，或者是在上面进行定制。在

alanlonglong 2020-06-02

OCR文字识别技术为人工智能添彩

当代可为是一个科学技术的社会，日新月异的科学技术正在飞速发展，生活中处处都能感受到科学技术就在身边以强有力的步伐在发展。科技的魅力就在于它正在改变着我们的生活，同时改变着世界。经过多年的创新与发展，文通科技现已成长为国内知名的高新技术企业，在全国十余个城市

luoyouren 2019-10-29

Readiris Corporate 17 for Mac(专业光学识别OCR软件)

Readiris Corporate 17 Mac是一款功能强大的专业光学识别OCR软件，可识别128种文字语言！Readiris Corporate Mac能够帮助你将纸张、PDF文件、图片文字的文字元素扫描成文字，具有自动识别和自动分析的功能，识别效率

Charliewolf 2019-10-22

SaaS平台开启文字识别新渠道

OCR技术作为其中最实用的分支之一，早几年便在应用市场中占有一席之地。基于OCR技术开发的产品种类繁多，包括文档识别、名片识别、证件识别、票据识别等等，几乎每一项应用都能在工作生活中发挥重要的作用。不过，对于一些刚起步的中小型企业来说，要将所需OCR产品统

IT互联网技术学习 2019-02-12

SaaS平台开启文字识别新渠道

OCR技术作为其中最实用的分支之一，早几年便在应用市场中占有一席之地。基于OCR技术开发的产品种类繁多，包括文档识别、名片识别、证件识别、票据识别等等，几乎每一项应用都能在工作生活中发挥重要的作用。不过，对于一些刚起步的中小型企业来说，要将所需OCR产品统

visionarywind 2019-02-12

[译]OpenCV OCR and text recognition with Tesseract

几周前,我向您展示了如何执行文本检测使用OpenCV的EAST深度学习模型。下一步是把这些区域包含文本和实际识别和OCR文字使用OpenCV和Tesseract。为了执行 OpenCV OCR 和文本识别任务，我们首先需要安装 Tesseract v4，包

Jasterwisdom 2019-07-01

OCR：精准、稳定、易用的文字识别

大家好，今天给大家介绍精准、稳定、易用的文字识别应用服务OCR。由此可见OCR实际上是让计算机认字，实现文字的自动输入，它是一种快捷、省力、高效的文本输入方法。需要注意的是OCR是指文字识别，但是OCR所采用的技术不仅仅是适用于文字识别。华为云学院现已发布

LinBSoft 2019-07-01

如何精准实现OCR文字识别？

欢迎大家前往腾讯云+社区，获取更多腾讯海量技术实践干货哦~前言2018年3月27日腾讯云云+社区联合腾讯云智能图像团队共同在客户群举办了腾讯云OCR文字识别——智能图像分享活动，活动举办期间用户耐心听分享嘉宾的介绍，并提出了相关的问题，智能图像团队的科学家

nanqi 2019-06-28

百度是如何做OCR结构化处理的？|技术头条

OCR技术是目前常用的一种AI能力。但一般OCR的识别结果是一种按行输出的半结构化输出。本次公开课我们邀请到了百度高级研发工程师向宇波老师，他将在12月20日（周四）带来一场主题为《基于模板的文字识别结果结构化处理技术》的分享。

我心飞翔之家 2019-05-04

python做文字识别一行代码都不用！（内附python教程分享）

今天，我们用Python实现对图像文字的识别，很简单！利用的库是pillow和pytesseract。pytesseract需要从网上下载，也很方便。基本上所有的文字都能识别，当然不可避免也会有一些乱字出现，这个库对于识别文字的能力还需提高，但简单的识别验

AndroidAmelia 2019-03-11

扣丁学堂Python培训之Python基于百度AI的文字识别的示例

对Python感兴趣的小伙伴现在就随扣丁学堂的小编一起来了解一下吧。使用百度AI的文字识别库，做出的调用示例，其中filePath是图片的路径，可以自行传入一张带有文字的图片，进行识别。下载baidu-aip这个库，可以直接使用pip下载：pip inst

一叶不知秋 2018-12-10

谷歌开源深度学习街景文字识别模型：让地图随世界实时更新

谷歌地图的街景功能拥有 800 亿张高分辨率图片，而且这个数字还在以每天百万的速度不断增加。街景图片是获取准确地理信息的绝佳渠道，而利用深度学习从图片中获取信息，并实时更新地图地址内容正是谷歌研究团队努力的目标。每一天，谷歌地图都会为数百万人指路，并提供相

timcompp 2017-05-04

python编程实现《吃鸡》文字识别自动搜索功能

《吃鸡》游戏最近很火。笔者也不息在玩，不外高中的知识都还给教员了。10秒的答题时辰让人根柢来不及去百度搜索。于是我建造了这个剧本，对问题问题停止文字识别，主动翻开网页停止搜索。首先来看一下测试成效：。安卓手机毗连电脑，经由过程adb调试实现敌手机答题页面的

heshenhan 2018-04-07

python实现《吃鸡大法》加文字识别玩转百万英雄！

《百万英雄》比较火。最近我也在玩，把高中的知识都还给教员了。10秒的答题时辰让人根柢来不及去百度搜索。于是我建造了这个剧本，对问题问题停止文字识别，主动翻开网页停止搜索。首先来看一下测试成效：。安卓手机毗连电脑，经由过程adb调试实现敌手机答题页面的截屏，

sulindong0 2018-03-28

懒人在思考

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号