Python图片识别——人工智能篇

sunskyday

2020-05-28

关注关注

二、安装识别引擎tesseract-ocr

一、安装pytesseract和PIL

　PIL全称：Python Imaging Library，python图像处理库，这个库支持多种文件格式，并提供了强大的图像处理和图形处理能力。

　由于PIL仅支持到Python 2.7，所以在PIL的基础上创建了Pillow库，支持最新Python 3.x。

1、pip命令安装

　　pip install pytesseract

　　pip install Pillow

2、使用pycharm编辑器安装，如下操作步骤。

Python图片识别——人工智能篇

安装成功：

安装pytesseract时，同时安装pillow，所以我们只需安装pytesseract即可。

Python图片识别——人工智能篇

　　3.尝试运行，

源码如下：

from PIL import Image
import pytesseract

Image = Image.open(‘1.png‘)   # 打开图片
text = pytesseract.image_to_string(Image,lang=‘chi_sim‘)  #使用简体中文解析图片
print(text)

　出现报错，如下图，

　原因：没有安装识别引擎tesseract-ocr

Python图片识别——人工智能篇

点击返回目录

二、安装识别引擎tesseract-ocr

1.Tesseract是开源的OCR引擎。Tesseract最初设计用于英文识别，经过改进引擎和训练系统，它能够处理其它语言和UTF-8字符。Tesseract 3.0能够处理任何Unicode字符，但并非在所有语言上都工作得很好。Tesseract在庞大字符集语言（比如中文）上较慢，但是工作良好。

下载链接: https://pan.baidu.com/s/1J0HNoVhX8WexS_5r0k2jDw 密码: ywc3

Python图片识别——人工智能篇

　　因为tesseract-ocr默认不支持中文识别。

将下载到的文件：chi_sim.traineddata 放到Tesseract-OCR安装目录 D:\Program Files (x86)\Tesseract-OCR\tessdata 下，如图：

Python图片识别——人工智能篇

　　2，安装完成tesseract-ocr后，需要做一下配置。

　　在Python安装目录（如：D:\Python35\Lib\site-packages\pytesseract）中修改 pytesseract.py文件。

Python图片识别——人工智能篇

　　也可以通过pycharm，Ctrl+B 快速打开pytesseract源码文件：

Python图片识别——人工智能篇

　　3.尝试运行，出现如下报错：

pytesseract.pytesseract.TesseractError: (1, ‘Error opening data file \\Program Files (x86)\\Tesseract-OCR\\chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your 　　"tessdata" directory. Failed loading language \‘chi_sim\‘ Tesseract couldn\‘t load any languages! Could not initialize tesseract.‘)

Python图片识别——人工智能篇

　　4.解决方法：将tessdata目录的上级目录所在路径：(默认为tesseract-ocr安装目录)添加至TESSDATA_PREFIX环境变量中，如下图：

　　注意：配置完环境变量需要重新打开pycharm编辑器（IDE）。

Python图片识别——人工智能篇

5.再次运行结果：图片识别成功！

但识别率不是很高，后期优化，持续更新。

Python图片识别——人工智能篇

人工智能机器学习 python https

安科网

Python图片识别——人工智能篇

sunskyday

二、安装识别引擎tesseract-ocr

sunskyday

相关推荐

如何通过7个步骤构建机器学习模型

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

理解AI：为什么要在人工智能系统中寻求可解释性呢？

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

IT自动化和人工智能将在2021年走向何方?

强化学习到底是什么，它如何运作？

数字营销：AI如何“看透”人类行为模式？

程序员用AI算法生成了3000个新的宝可梦

当教练、做监工…… 人机协同下的AI更懂你

Facebook借助人工智能对内容审核排序

人脸识别技术发展现状及未来发展趋势

零基础也能看懂的人工智能教程

关于人工智能的解读，看这一篇就够了

sunskyday