导航菜单

手把手使用Python教你破解谷歌(Google)人机验证码—上篇

/1前言/

今天,让我们来谈谈谷歌。我们都知道谷歌是目前表面上最强大的搜索引擎。我们可以通过谷歌巨大的搜索资源找到一些我们想要的资源。可能是一些付费电影,一些奇怪的小说,或者是某个角落里的种子。无论如何,谷歌搜索仍然非常强大。然而,我们可能遇到过许多梯子。我们已经搜索了很多,将会出现下图所示的情况。

这种验证码称为ReCaptcha验证码,是相对比较复杂的验证码之一。

当然,ReCaptcha不仅仅是由谷歌使用的。许多外国网站使用这种验证码,但在中国并不多,因为在中国很容易被屏蔽,所以很少使用。然而,我们是高端玩家。在一个自由的互联网中,我们怎么能局限于中国呢?下面,我们将破解ReCaptcha验证码。

/2测试网站预览/

:

谷歌提供的样本与实际的网站验证码完全相同。

ReCaptcha验证码样式,如下图所示。

/3?为什么使用第三方平台/

今天,让我们来谈谈谷歌。我们都知道谷歌是目前表面上最强大的搜索引擎。老读者可能知道,几年前我用第三方服务破解了B站的登录,没有时间上车的小伙伴可以在这两篇文章上盖章:干货|巨蟒大亨带你破解比里里网络的滑动验证(第一篇文章),干货|巨蟒大亨带你破解比里网络的滑动验证(第二篇文章)。然而,经常访问b站的小朋友们一定都知道b站目前已经改变了登录方式。如果他们想知道以前在b站自动登录的小朋友可以在这里盖章:Python在beery mile自动登录的奇怪把戏,所以我的文章真的赶上了最后一班车,但是现在他们不能登录。在后期,我有时间整理一篇关于如何破解b站的新文章。“嗯,有些人看到这个可能会鄙视我,说辣子鸡只会使用第三方平台。如果按照技术来划分,我真的是麻辣鸡,哈哈~ ~

但是在这里我们必须争论,不是说使用第三方平台就是麻辣鸡。我们可以想象,如果它是一个滑动验证码,我们当然有能力尝试它。python可以调用OpenCV,查看文档,当然这是可以实现的。然而,有一个问?馐悄憧赡苷攵缘耐镜幕橹け皇侗稹5牵绻扛鐾镜幕橹ぢ氩煌褂肙penCV时识别率可能会很低。如果你在一家公司,你不可能一直完成任务,嗯,等着被解雇吧,此外,像谷歌这样的人也不能解决这个问题,机器学习没有NB是不可能的,所以你只能使用第三方平台,毕竟,完成任务是第一个任务。

不用说,是这里选择的第三方平台=。

/4?为什么使用第三方平台/

让我们先了解一下现有的编码平台机制,这些机制不是很全面,但是可以参考。

第一个是编码平台训练各种数据,例如,哪些是花,哪些是车。然后我们把图片发送到编码平台,他给我们结果。然而,有一个问题。如果训练不好,我们这边的结果也很糟糕。各种各样的不准确都会影响结果。

第二个是平台雇佣人员,我们将整个验证码交给编码平台,平台会找人帮助我们点击。那就给我们结果。我们可以看到,当我们登录或做其他事情时,这绝对是第二种更灵活的方式。在这个阶段,机器的准确率没有我们人类聪明。

2captcha平台目前正在使用第二种方法,获得中等价位的差价,但识别率是我使用过的最高的。我没有成功,因为我选择了错误的平台,加班加点,打碎了鼠标。唉,选择一个合适的平台仍然很重要?所需的工具/

chromedriver:浏览器驱动程序,可以理解为没有界面的Chrome浏览器。

Selenium:用于模拟人们在浏览器上点击、输出、拖动等操作,相当于一个人在使用浏览器,通常用于处理反爬虫措施。

/6?摘要/

此时,文章中的字数接近2000字。由于篇幅原因,本文主要介绍第三方编码平台(点击阅读原文)和解码的理论部分。下一篇文章将详细介绍谷歌人机解码的具体过程,下一篇文章将伴随更多的图片和代码。请期待它,我的朋友们!