Go 2 Think

Just Think

Python爬虫:使用PyQuery爬取SS代理账号密码

前言

每次使用 shadow#socks 时都要更改密码(用的免费s#s账号,每6小时换次密码),打开网站再复制粘贴也挺费劲的,正好今天没事,就想写个爬虫自动把密码抓下来复制到剪贴板,我直接粘贴就好。

想着 jQuery 对 HTML 的 DOM 树操作挺方便的,就搜了下 python  相关的库,看有没关于 DOM 的,没想到还真有——PyQuery,而且语法与jQuery几乎相同。cool~~

那么,目标就很明确了:

  • 工具:python  &  PyQuery;
  • 功能:抓取 ss 密码,并把目标密码自动复制进剪贴板;
  • 附加:选择 ss 地址,1 – 美国,2 – 日本,3 – 新加坡;

关于 PyQuery 的安装与使用方法,在另一篇文章中介绍,本篇只说这个小爬虫。

过程

这个爬虫很简单,思路很清晰,就是获取网页,使用 pyquery 在 HTML 中把 3 个密码抓出来,并把选择的目标密码复制进剪贴板中。

首先查看目标网站的网页源码,锁定我们所需要的目标信息—— s#s 密码的位置,可以发现账号信息都在 id 为 #free 的<section> 中:

那么,接下来就是获取这段代码,并把所需要的 3 个密码取出来。

获取 id 为 #free 的代码段:

取出密码,因为密码在 <h4> 标签中,又没有 id 或者 class 等特殊标识,可以使用正则取出它们,既然用了pyquery,就干脆直接使用其 .eq(index) 好了,通过给定的索引号得到指定元素,3 个密码的索引也很好看出来:2,8,14:

有 3 个地址的 ss,我们只要选一个使用就够了,再增加一个选择功能,python 中没有 switch ,这里可以用字典替代实现:

到这里就可以把所需密码抓下来了,还要把所选密码自动复制到剪贴板:

完整代码:

 

点赞

发表评论

电子邮件地址不会被公开。 必填项已用*标注

*

code