OStack程序员社区-中国程序员成长平台 › 门户 › 开源› WEB应用开发›Web爬虫

17KSpider: 17K小说网定向爬虫

原作者: [db:作者] 来自: 网络收藏邀请

开源软件名称：

17KSpider

开源软件地址：

https://gitee.com/gainorloss_259/17KSpider

开源软件介绍：

17K小说网定向爬虫

免责声明：

本项目旨在学习Scrapy爬虫框架和使用Mssqlserver数据库，不可使用于商业和个人其他意图。若使用不当，均由个人承担。

项目简介：

借助目前超火的爬虫框架scrapy,使用mssqlserver做持久化从分类（三级分类）到书目到章节内容的全解析，完全可以依照抓取的数据来做一个自己的小说网

环境、架构

爬取对象

采用技术

采用技术：mssql,scrapy

使用步骤

1.根据项目文件下/src/db.sql sql脚本，建立相关数据库表,2.进入主项目目录，开启命令行键入

scrapy crawl category(一级和二级分类)
scrapy crawl category_third（三级分类）
scrapy crawl book（书目）
scrapy crawl chapter（章节内容）

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

phpDhtSpider: php实现的dht爬虫（分布式）发布时间：2022-02-14

StockCrawler: 股票数据采集器发布时间：2022-02-14

139-2527-9053

在线客服（服务时间 9:00～18:00）

在线QQ客服

地址：深圳市南山区西丽大学城创智工业园

电邮：jeky_zhao#qq.com

移动电话：139-2527-9053

客服电话

电子邮件