小验证码藏大智慧,同时它还在悄悄获取你的免费劳动力!

在网上冲过浪的大家,对验证码一点也不陌生。据网友统计,全世界网民一天共要输入近2亿次验证码,按照每次输入花费十秒来计算,人类每天花在验证码上的时间已经超过了 50 万小时。

输入验证码既然是如此浪费时间的事情,为什么还一直存在呢?

01初代验证码解决垃圾邮件问题

2000年,雅虎的首席研究员来到卡内基梅隆大学,进行了一场名为“我们不知道如何解决的10个问题”的演讲。

其中,他提到,深深困扰着当时的互联网公司和用户的一个问题是:有一伙人开发了一种程序,可以全天无休止地批量注册新账号,并使用这些账号进行违规操作。

比如在公开版面上,刷评机器人用大量垃圾评论和广告淹没真人用户留下的有价值的信息;在金融交易平台,脚本程序可以靠不停试验来暴力破解密码;在票务网站,就算你有三头六臂也抢不过自动刷票软件;网站被人一次性注册几百万个垃圾帐号,然后产生垃圾信息,或者操纵投票,使网站失去了公正性。

小验证码藏大智慧,同时它还在悄悄获取你的免费劳动力!休闲区蓝鸢梦想 - Www.slyday.coM来源 | 百度

其实,解决这一问题的关键在于,网络请求是真人操作还是机器人行为。

当时,聆听演讲的大学生路易斯·冯·安在听到这个问题之后,陷入沉思,并在不久之后想到了,人可以用肉眼轻易识别出图片里的东西和手写的文本,而计算机却很难辨认。

正是基于这种思想,路易斯和他的同事合作开发了CAPTCHA (Completely Automated Public Turing Test To Tell Computers and Humans Apart)区分人机的全自动图灵测试系统,俗称验证码。

小验证码藏大智慧,同时它还在悄悄获取你的免费劳动力!休闲区蓝鸢梦想 - Www.slyday.coM来源 | pixabay

那么,验证码是怎么杜绝机器人对网站进行的非法操作呢?

当机器人像人一样模拟登录网页时,会碰到验证码,初代的验证码仅仅是一些扭曲的字母和数字,但即便是这样,也能难住机器人,使它们根本识别不出验证码里面的东西,这成为区分真人和机器人的重要方法。

当对真人和机器人做出了区分,网站就可以对机器人做出严厉的打击与限制。

小验证码藏大智慧,同时它还在悄悄获取你的免费劳动力!休闲区蓝鸢梦想 - Www.slyday.coM验证码(来源 | 百度)

02升级版验证码帮助纸质典籍电子化

近年来,电子书逐渐进入大众视野,如何把浩如烟海的纸质典籍电子化成为一大难题。

一种方式是依靠人类手工录入,不光费时费力,还容易出现错误;还有一种方法是扫描文本,再结合光学文字识别技术录入文字。这种方法听起来很美妙,但年代久远的书籍扫描出来后十分模糊,光学文字识别技术也无法录入正确字符。

为了将含有模糊文字的图片电子化,路易斯于2007年推出了新的验证码系统 reCAPTCHA(re即新的意思)。

小验证码藏大智慧,同时它还在悄悄获取你的免费劳动力!休闲区蓝鸢梦想 - Www.slyday.coM来源 | pixabay

在 reCAPTCHA 验证码系统里,一个验证码由两部分构成。

第一部分和初代验证码相似,是自动生成并且经过变形处理的文字或数字,用来检验你是真人还是机器人。第二部分会提供一个机器无法识别的单词给用户,这些单词来自书籍模糊扫描版的一部分,用户需要录入自己认为的结果。

小验证码藏大智慧,同时它还在悄悄获取你的免费劳动力!休闲区蓝鸢梦想 - Www.slyday.coMreCAPTCHA 验证码内容(来源 | 百度)

当用户可以正确输入第一部分验证码后,reCAPTCHA 会假设用户输入的第二部分也是正确的,然后把录入的结果返回至 reCAPTCHA 的项目主机,主机再把这个结果派发给多个用户进行多次交叉验证,以确保没有不小心或故意输错单词的情况。

也就是说,真正有效的人机测试在验证码的第一部分就已经完成了,而第二部分,则是用户在义务为人类文明做贡献了。

粗略统计,现今全世界每天都有 2 亿个字符通过 reCAPTCHA 录入,相当于人类 15万小时的工作量。也就是说,一个人要不吃不喝不睡连轴转两年半,才能完成 reCAPTCHA 一天的工作量。这样看来,验证码的功劳真的很大了!

03你输的验证码变成了人工智能训练的养料

在谷歌浏览器上,大家肯定都遇到过街景验证码,这是一类需要我们选中所给图片上的房屋、小轿车或路牌等的验证码。当你费眼费脑地选中它们的时候,其实是在为谷歌的人工智能免费打工。

这些图片大多来自于谷歌街景,其中的一部分图片人工智能已经识别出来,用来辨别你是否是真人。

和上文所说的识别模糊文字是一样的套路,其中还夹杂了几张人工智能难以识别的街景,用来获得你的免费劳动力。从用户这里搜集到的街景数据,帮助训练人工智能,使得人工智能可以像人眼一样准确地识别路况信息。

谷歌无人驾驶汽车正是依靠这些接受过训练的人工智能,才得以实现准确识别路灯、其他车辆和行人等,从而保证自动驾驶的顺利与安全。

在大家的“辛勤喂养”之下,谷歌旗下的无人驾驶汽车公司运用谷歌人工智能技术研发的无人驾驶汽车,已经在自动驾驶领域处于遥遥领先的地位,被称作是世界上最可能最先达到 L5 级别(完全自动驾驶)的汽车。

小验证码藏大智慧,同时它还在悄悄获取你的免费劳动力!休闲区蓝鸢梦想 - Www.slyday.coM来源 | 百度

如今,收购了reCAPCHA 的谷歌已经把大部分验证码都升级成了 reCAPCHA v3。用户只要点击一下“我不是机器人”的按钮,就能轻松通过验证。

即使是你的鼠标这么轻轻一点,验证码还是能从你身上得到些油水的。

因为,在你点击按钮的同时,谷歌会持续监控你的用户行为,鼠标的运动轨迹甚至是你打开的网页都可能被收集,这些数据会被用来判断你是否是真人,并且帮助验证码系统进一步升级打怪。

目前,国外有超过 65 万个网站使用 reCAPCHA v3,每点击一次验证按钮,就等于网络打卡,告诉谷歌你来过这儿,谷歌则根据你去过的网站来给你推送定制的广告。

小验证码藏大智慧,同时它还在悄悄获取你的免费劳动力!休闲区蓝鸢梦想 - Www.slyday.coM来源 | pixabay

怎么样,开篇的问题解决了吧!实际上,人类输入验证码的大笔时间并没有全部被浪费,反而每次输入验证码,你都是在为人类文明添砖加瓦,或者是为人工智能贡献养料。这么一想,是不是感觉自己的电脑都在散发着无私的荣光呢?

相关推荐

  • 友情链接:
  • PHPCMSX
  • 智慧景区
  • 微信扫一扫

    微信扫一扫
    返回顶部

    显示

    忘记密码?

    显示

    显示

    获取验证码

    Close