在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称:小说爬虫开源软件地址:https://gitee.com/yoqu/story-magic开源软件介绍:分布式小说爬虫说明
爬虫简介本项目主要用于学习爬虫知识搭建的项目,目标是做一个分布式多网站小说智能爬虫,动态提交爬取任务,单线管理,多ip终端防反扒(使用Eureka server 管理自服务的心跳连接) 目前正在初始开发中。完成后的功能主要有:
开发进度
启动项目启动步骤
{ "code": 200, "data": { "stories": [ { "newChapter": "第七百一十八章、风再起时!【卓雅居全文字秒更】", "resourceSite": null, "chapters": null, "author": null, "lastUpdateDate": null, "name": "逆鳞", "id": null, "bookUrl": "http://www.sodu.cc/mulu_26997.html", "resourceSiteUrl": null }, { "newChapter": "第163章 化敌为友", "resourceSite": null, "chapters": null, "author": null, "lastUpdateDate": null, "name": "逆鳞苍穹传", "id": null, "bookUrl": "http://www.sodu.cc/mulu_458710.html", "resourceSiteUrl": null } ] }, "message": null, "success": true } 更多API文档本地能成功跑起项目后,输入localhost:3333/swagger-ui.html查看API文档,文档使用swagger-ui截图展示: 项目结构目录结构├── common-utils 公共工具类├── eureka-server 服务注册发现中心,用于做多个worker集线管理├── story-admin 后台管理界面,管理抓取规则等功能├── story-api 公共api├── story-dao 数据访问层└── story-frontend 前端访问层,主要用于小说内容访问层└── story-worker 小说抓取器,有关爬虫相关的操作均由worker去操作 系统架构业务逻辑图程序交流交流QQ群:536747201 使用技术项目所选用的技术框架以及工具(包括但不限于):
|
请发表评论