开源软件名称:FilmSpider
开源软件地址:https://gitee.com/nbstart/FilmSpider
开源软件介绍:
FilmSpider介绍基于java的爬虫系统,可爬取国内主流视频网站的视频数据,目前支持爬取豆瓣、猫眼、IMDB、百度百科、优酷、电视猫数据。
软件架构软件架构说明 安装教程- git clone https://gitee.com/nbstart/FilmSpider/new/master.git
- xxxx
- xxxx
使用说明1、在spider类下面新建一个类,继承BaseSpider注意 新增的spider需要在构造函数中设置spider名称2、实现getContentId 和getFilmInfo 两个接口,getContentId返回地址转换结果,比如输入电影名称返回电影的详情页,getFilmInfo 返回爬取到的详情信息
1、在excel包下面新建excel解析类.分别创建excelReader 和excelWriter 2、实现reader和writer要求的接口,reader.readRowFromExcel 接口主要用于解析需要读取那些行,并解析成RawFromExcel 返回; writer的initExcelHeader 用于初始化需要保存的excel文件头,writeRow 将某一行写入excel,trans2Excel 用户类型转换
参与贡献- Fork 本仓库
- 新建 Feat_xxx 分支
- 提交代码
- 新建 Pull Request
码云特技- 使用 Readme_XXX.md 来支持不同的语言,例如 Readme_en.md, Readme_zh.md
- 码云官方博客 blog.gitee.com
- 你可以 https://gitee.com/explore 这个地址来了解码云上的优秀开源项目
- GVP 全称是码云最有价值开源项目,是码云综合评定出的优秀开源项目
- 码云官方提供的使用手册 https://gitee.com/help
- 码云封面人物是一档用来展示码云会员风采的栏目 https://gitee.com/gitee-stars/
|
请发表评论