在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
开源软件名称:cockroach开源软件地址:https://gitee.com/zhangyingwei/cockroach开源软件介绍:cockroach 爬虫:又一个 java 爬虫实现重构了cockroach2 简介cockroach[小强] 当时不知道为啥选了这么个名字,又长又难记,导致编码的过程中因为单词的拼写问题耽误了好长时间。 这个项目算是我的又一个坑吧,算起来挖的坑多了去了,多一个不多少一个不少。 一个小巧、灵活、健壮的爬虫框架,暂且叫做框架吧。 简单到什么程度呢,几句话就可以创建一个爬虫。 依赖部分<dependency> <groupId>com.github.zhangyingwei</groupId> <artifactId>cockroach-core</artifactId> <version>1.0.6-Beta</version></dependency><!-- https://mvnrepository.com/artifact/com.github.zhangyingwei/cockroach-annotation --><dependency> <groupId>com.github.zhangyingwei</groupId> <artifactId>cockroach-annotation</artifactId> <version>1.0.6-Beta</version></dependency> 代码部分:@EnableAutoConfigurationpublic class CockroachApplicationTest { public static void main(String[] args) throws Exception { TaskQueue queue = TaskQueue.of(); queue.push(new Task("http://blog.zhangyingwei.com")); CockroachApplication.run(CockroachApplicationTest.class,queue); }} 没错,就是这么简单。这个爬虫就是爬取 scala & kotlin作为目前使用的 jvm 系语言几大巨头,scala 与 kotlin 这里基本上对跟 java 的互调做的很好,但是这里还是给几个 demo。 scala/** * Created by zhangyw on 2017/12/25. */class TTTStore extends IStore{ override def store(taskResponse: TaskResponse): Unit = { println("ttt store") }}object TTTStore{} /** * Created by zhangyw on 2017/12/25. */@EnableAutoConfiguration@ThreadConfig(num = 1)@Store(classOf[TTTStore])object MainApplication { def main(args: Array[String]): Unit = { println("hello scala spider") val queue = TaskQueue.of() queue.push(new Task("http://blog.zhangyingwei.com")) CockroachApplication.run(MainApplication.getClass(),queue) }} kotlinclass TTTStore :IStore{ override fun store(response: TaskResponse) { print("ttt store") }} /** * Created by zhangyw on 2017/12/25. */@EnableAutoConfiguration@ThreadConfig(num = 1)@Store(TTTStore::class)object MainApplication { @JvmStatic fun main(args: Array<String>) { print("hello kotlin spider") val queue = TaskQueue.of() queue.push(Task("http://blog.zhangyingwei.com")) CockroachApplication.run(MainApplication::class.java, queue) }} 联系方式
LisenceLisenced under Apache 2.0 lisence |
请发表评论