tesseract-OCR 图像识别插件 node-tesr 了解一下？

我心飞翔之家

2019-07-01

tesseract-OCR 图像识别插件 node-tesr 了解一下？

前言

该项目诞生于一次爬虫事件，当时一时兴起想把某租房网信息爬下来，前面进行的还是挺顺畅的，但是在租房价格信息上被摆了一道，房屋的价格信息为一个数字图片为底加上偏移量来显示的，和雪碧图一样的实现方式，当然，其中加上了一点小算法，具体如下。

获取数字图片信息和 offset 信息
- { "offset": [ [1, 4, 2, 8], [5, 1, 7, 8], [5, 1, 3, 8], ... ] }
由 offset 信息加上一点算法得出 position 信息
- （background-position: xxx px）
以数字图片为背景，加上偏移，append 到价格信息他应该在地方

略一思索，倒也不是什么大事儿，只要加个识别的过程再辅以算法即可。

在实行图像识别的过程中借助到了 google 的开源软件 tesseract-OCR，因为爬虫环境是 node，遂写了一个适用于 tesseract-OCR 最新版本的 node 插件，后续还添加了命令行使用的功能。

演示

命令行使用 --- 1

tesseract-OCR 图像识别插件 node-tesr 了解一下？

命令行使用 --- 2

tesseract-OCR 图像识别插件 node-tesr 了解一下？

模块使用 --- 1

tesseract-OCR 图像识别插件 node-tesr 了解一下？

项目在这里

如果觉得我对你有帮助，不妨给我个 star 吧，蟹蟹~

github node-tesr

正文

命令行使用

想要使用图像识别首先要确保电脑中已经安装了 tesseract-OCR 点击下载。

想要使用命令行建议全局安装

npm install node-tesr -g

tesr --from=./test/output.jpg --to=./output.txt

参数说明

--from 需要识别的图片路径（必须）
--to 若传入此参数会将识别的文字输出到该文件下（非必须，默认会将识别内容输出到命令行）
--l 识别语言，对中文稍微做了点处理，识别简体 --l=chs，识别繁体 --l=cht（非必须，默认为 eng）
--p 见 lib/config.js 里的说明（非必须，默认为 3 自动模式）
--o 见 lib/config.js 里的说明（非必须，默认为 3 自动模式）

模块引入使用

npm install node-tesr

const tesseract = require('node-tesr')

tesseract('./output.jpg', { l: 'eng', oem: 3, psm: 3 }, function(err, data) {
  // 此处获得识别内容
  console.log(data)
})

// 或者如下也可
tesseract('./output.jpg', function(err, data) {
  // 此处获得识别内容
  console.log(data)
})

后语

效果

经测试效果还是不错的，但是有一点需要注意一下，上面提到该网站的数字图片是透明底的，测试发现 tesseract-OCR 对透明底的似乎无解，这个时候就需要结合一下 images 这个 node 插件

let images = require('images')
images(500, 100)
  .fill(0xff, 0xff, 0xff, 1)
  .draw(images('demo.png'), 10, 10)
  .save('output.jpg', {
    quality: 100
  })

将透明底填充为白底即可正常识别

如何提高我的图像识别准确率

老板！我的图像识别率很低怎么破！

来，看这里，这个可以提高图像识别率。

识别算法学习

待办

增加网络地址图片也可识别的功能
使用 then 来处理回调

页脚

代码即人生，我甘之如饴。

我在这里 gayhub@jsjzh 欢迎大家来找我玩儿。

欢迎小伙伴们直接加我，拉你进群一起学习前端呀，记得备注一下你来自哪里哦。

tesseract-OCR 图像识别插件 node-tesr 了解一下？

tesseract-OCR 图像识别插件 node-tesr 了解一下？

我心飞翔之家

0 关注 0 粉丝 0 动态

相关推荐

人脸识别技术发展现状及未来发展趋势

人脸识别，通常也称人像识别、面部识别，是基于人的脸部特征信息进行身份识别的一种生物识别技术，主要用摄像机或摄像头采集含有人脸的图像或视频流，并自动在图像中检测和跟踪人脸，进而对检测到的人脸进行脸部的一系列相关技术。近年来，随着人工智能的发展以及国家经济发展

MachineIntellect 5评论 2020-11-18

指纹和脸，真的能代表生物识别吗？

从今年年初到现在，ToF传感器一直以来都是苹果、三星、GD、AMS等传感器企业和智能硬件企业所关注的技术，而ToF传感器目前应用最为广泛的领域就是人脸识别。但是人脸识别安全性频繁暴雷，导致生物识别的安全性备受关注，那么生物识别到底是什么样的一门生意?

alanlonglong 2020-11-05

人脸识别门禁系统启用后，轻松过闸之时也要留意潜在风险

通常来看，以往传统方式都有遗失卡、漏带卡、忘记密码、被复制卡等通病，一不小心就难以通过道闸，安全性也遭到多方质疑。与钥匙、门禁卡不同的是，人脸识别门禁系统是通过人的脸部特征来解锁的。人脸识别门禁系统的优点十分明显。学区的人脸识别门禁系统，能够将人脸识别技术

数智集 2评论 2020-10-26

人脸识别，要方便更要安全

西北工业大学学生“刷脸”进出图书馆。工作人员在郑州地铁紫荆山站刷脸过闸。但与此同时，人脸数据等个人隐私数据信息也存在被过度分析和滥用的风险，数据安全不容忽视。11月1日，国家标准《信息安全技术远程人脸识别系统技术要求》将正式实施。近日，北京市民杨女士

TifaBest 2评论 2020-10-25

人工智能如何应用于数据中心的物理安全

图像识别是人工智能的一大成功案例，而这项技术正迅速被广泛应用于各个领域。它的近亲，声音识别也是如此。显然，在物理安全中，图像识别最常用于面部认证。说到与健康相关的问题，一旦数据中心访客被诊断出患有COVID-19，图像识别就可以用来识别感染者访问过的所有位

古驿道 2020-10-21

NLP/CV模型跨界，视觉Transformer赶超CNN?

在计算机视觉领域中，卷积神经网络一直占据主流地位。不过，不断有研究者尝试将 NLP 领域的 Transformer 进行跨界研究，有的还实现了相当不错的结果。近日，一篇匿名的 ICLR 2021 投稿论文将标准 Transformer 直接应用于图像，提出

cswingman 2020-10-05

这款人像生成AI，可以让简笔草图“一秒”生成真实人脸

随着人工智能技术的发展，其用途也变得丰富多样，而在与图像结合方面，AI 面部识别技术和创建逼真图像的算法一直备受关注。近日，这一领域似乎又取得了新的突破：一种名为DeepFaceDrawing的 AI 图像转换器能够根据简单的素描草图，创建出足以以假乱真的

风和日丽 2020-09-22

可以提高你的图像识别模型准确率的7个技巧

假定，你已经收集了一个数据集，建立了一个神经网络，并训练了您的模型。但是，尽管你投入了数小时的工作来创建这个模型，它还是能得到50-70%的准确率。这肯定不是你所期望的。下面是一些提高模型性能指标的策略或技巧，可以大大提升你的准确率。epoch基本上就是你

数智集 2020-09-14

人脸值多少钱？人脸识别灰色产业链

如今，数十家初创企业和科技巨头正在向酒店、零售店、甚至学校和夏令营销售人脸识别服务。这一业务的兴盛归功于新算法，现在的算法在辨认人脸方面比五年前的更精确。目前，面部识别软件的使用几乎不受法律限制，这就意味着人们可能无法阻止公司以这种方式使用他们的面部信息。

LinBSoft 2020-07-30

PC人脸识别登录，出乎意料的简单

本文收录在个人博客：www.chengxy-nds.top，技术资源共享。之前不是做了个开源项目嘛，在做完GitHub登录后，想着再显得有逼格一点，说要再加个人脸识别登录，就我这佛系的开发进度，过了一周总算是抽时间安排上了。其实最近对写文章有点小抵触，写的

LetItBe 2020-07-29

PC人脸识别登录，出乎意料的简单

之前不是做了个开源项目嘛，在做完GitHub登录后，想着再显得有逼格一点，说要再加个人脸识别登录，就我这佛系的开发进度，过了一周总算是抽时间安排上了。其实最近对写文章有点小抵触，写的东西没人看，总有点小失落，好在有同行大佬们的开导让我重拾了信心。废话不多说

汤姆猴 2020-07-29

从“人脸”到“狗脸”，AI也要去宠物经济分杯羹？

拿人脸识别技术来说，从最开始的嗤之以鼻，到如今用人脸识别技术去登录账号、办理业务、付款、安检等等，确实便利了许多。而近日，“南商汤北旷视”的 AI 双雄之一北京旷视科技发布了一条有关“狗脸识别”的专利信息，引起不小的讨论——“这人工智能都智能到狗身上去了”

wjschaoren 2020-07-24

微软旷视人脸识别100%失灵!照片「隐身衣」,帮你保护照片隐私数据

左图，右图，你能看出区别吗？其实，算法已经悄悄给右边的照片加上了微小的修改。但就是这样肉眼根本看不出来的扰动，就能100%骗过来自微软、亚马逊、旷视——全球最先进的人脸识别模型！这代表着你再也不用担心po在网上的照片被某些软件扒得干干净净，打包、分类，几毛

luoyouren 2020-07-23

超强干货！一文看懂人脸识别在 App 应用中的隐私安全问题

本文转自雷锋网，如需转载请至雷锋网官网申请授权。“刷脸解锁手机”“刷脸购物”“刷脸验证身份办理银行卡”……但当人脸识别遇上现实，隐私问题依旧是不可跨越的现实问题。今天，我们从人脸识别在 App 应用中的隐私安全说起。近日，中国信息通信研究院安全研究所与北京

LinBSoft 2020-07-07

证件阅读器API接口SDK二次开发APP应用

总体来说当今的ocr识别技术主要细分为以下功能：ocr综合文字识别、ocr视频文字识别、人脸识别、证件识别、票据识别、车牌Vin码识别、银行卡识别、云识别。为了提高在移动终端上输入身份证信息的速度和准确性，可以嵌入证件图像识别软件SDK，以满足各行业应用需

xjp 2020-06-28

证件阅读器API接口SDK二次开发APP应用

总体来说当今的ocr识别技术主要细分为以下功能：ocr综合文字识别、ocr视频文字识别、人脸识别、证件识别、票据识别、车牌Vin码识别、银行卡识别、云识别。为了提高在移动终端上输入身份证信息的速度和准确性，可以嵌入证件图像识别软件SDK，以满足各行业应用需

BigCowPeking 2020-06-28

基于opencv的人脸采集、训练及识别应用

　　本文主要基于Python展现人脸识别的应用过程和方法，从人脸采集，人脸模型训练以及人脸识别应用讨论这三个过程简单是如何共同构成我们日常中人脸识别技术应用的，提高我们队人脸识别技术及应用的认识。通过采集到的人脸进行预处理后训练人脸的特征并输出模型结果，最

csdmeb 2020-06-25

Android 图片文字识别DEMO（基于百度OCR）

OCR 是 Optical Character Recognition 的缩写，翻译为光学字符识别，指的是针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技

alanlonglong 2020-06-14

IBM 全面停止 AI 人脸识别相关技术业务

近日，IBM 公司宣布停止提供人脸识别技术的相关服务，因为担心这项技术可能被用来促进种族和性别歧视。显然，IBM 此举旨在响应在美国愈演愈烈的反种族歧视运动“Black Lives Matter”。目前，美国少数城市已经禁止使用面部识别技术。自那以来，Cl

luoyouren 2020-06-10

Python怎么识别文字？正确的方法详解

从Google的无人驾驶汽车到可以识别假钞的自动售卖机，机器视觉一直都是一个应用广泛且具有深远的影响和雄伟的愿景的领域。将图像翻译成文字一般被称为光学文字识别。可以实现OCR的底层库并不多，目前很多库都是使用共同的几个底层OCR库，或者是在上面进行定制。在

alanlonglong 2020-06-02

我心飞翔之家

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号