在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称:domain-crawling开源软件地址:https://gitee.com/ainilili/domain-crawling开源软件介绍:作用闲来无事,写个脚本,用来爬取 语言作为一名javaer,这个脚本使用py开发。 使用先将domain-crawling拉到本地 git clone https://gitee.com/ainilili/domain-crawling.git 进入目录中执行py脚本 cd domain-crawling 通过 shell>> py domain-crawling.py -husage: domain-crawling.py [-h] [-p PATH] [-l LENGTH] [-o {y,n}] [-d DELAYED]Nico domain name crawler scriptoptional arguments: -h, --help show this help message and exit -p PATH, --path PATH The available domain name storage path after detection. -l LENGTH, --length LENGTH The length of the domain you want to detect is all combinations of a-z0-9. -o {y,n}, --openproxy {y,n} Open the IP proxy mode. -d DELAYED, --delayed DELAYED The interval between each climb, Unit s -s SUFFIX, --suffix SUFFIX Domain suffix 直接启动脚本: shell>> py domain-crawling.py 指定域名长度启动脚本: shell>> py domain-crawling.py --length 4 这时爬取的域名长度是4(默认也是4),例如: aaaa.combbbb.comcccc.com 指定爬取的域名(例如cn)后缀: shell>> py domain-crawling.py --suffix cn 如果要开启代理(默认关闭): shell>> py domain-crawling.py--openproxy y 如果更改数据保存文件(默认是时间戳.txt): shell>> py domain-crawling.py --path data1 设置爬取间隔时间(默认是0.1s)为0.5s: shell>> py domain-crawling.py --delayed 0.5 注意笔者使用的是data5u的爬虫代理,如果您哟啊开启代理模式,脚本中自带的orderId很可能早已失效,请自行注册然后使用,如果您有更好的代理,可以更改源码替换之。 |
请发表评论