• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

sogou: 最新代码链接:码云上不在更新

原作者: [db:作者] 来自: 网络 收藏 邀请

开源软件名称:

sogou

开源软件地址:

https://gitee.com/jtyoui/sogou

开源软件介绍:

sogou tyoui

这个一个搜狗词库爬虫,只需要一步就能爬完搜狗上的所有词库

使用maven下载

<!-- https://mvnrepository.com/artifact/cn.tyoui/sogou --><dependency>    <groupId>cn.tyoui</groupId>    <artifactId>sogou</artifactId>    <version>1.8.3</version></dependency>

执行程序

    public static void main(String[] args) throws Exception {          SoGou soGou = new SoGou();          //下载搜狗词库所有url地址。并保存在本项目下的sogou.txt文件中          //soGou.download_sogou();          //讲文本下的url地址下载到D盘下的cell文件夹中          //soGou.download_url("D://cell");          //将搜狗文件转化成txt文本          soGou.toTxt("D:\\cell\\89个节日.scel", "D:\\cell\\89个节日.txt", false);    }

下载如图

soGou.download_sogou();

地址和名字也\t分割

下载在本机如图

下载在D盘下cell目录

soGou.download_url("D://cell");

#################################################################################

转换文本有两种方式,选其中一种即可

第一种:(软件转换)在本项目下有一个搜狗文件转换器。可以将scel文件装换成純文本文件

搜狗文件是二进制,必须要转成txt才能看见

第二种:(代码转换)在D盘下的scel文件转化成txt

soGou.toTxt("D:\\cell\\89个节日.scel", "D:\\cell\\89个节日.txt", false);第一个参数是scel文件的地址第二参数是保存txt位置第三参数是是否追加 true是追加 false是不追加

鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap