">
可以看到,OCR对于字母数量较多的单词识别效果较好,但是对于一些小品词,准确率非常低。
reCAPTCHA是怎样工作的?原理其实也非常简单,对于每次提供给用户的验证码,有一个词是纯粹的验证码部分,用以校验对方是否是人类;还有另一个词正是来自古老文献中的词语,对于通过验证码校验的用户,可以简单地认为他们对这部分古老文献词语的识别也是正确的(事实上这部分的识别率非常高,官方提供的数据是99.5%)。
大约每天都会有两亿个验证码被人类识别,粗略地说,大概每人次需要花费十秒钟的识别时间,单独看这确实很少,但是累计起来,相当于每天有十五万小时以上的工时,这也是reCAPTCHA得以利用它的重要原因。
如果你也想加入reCAPTCHA项目,比如为自己的网站增加reCAPTCHA的验证码,你可以阅读这部分文字。其实它的原始想法很简单,但是却是一个很有价值的项目,我的博客在评论部分已经使用了reCAPTCHA验证码,你现在就可以体验到;如果你要获取它的wordpress插件,你可以到这里找到。
文章系本人原创,转载请保持完整性并注明出自《四火的唠叨》