• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

Java Selectable类代码示例

原作者: [db:作者] 来自: [db:来源] 收藏 邀请

本文整理汇总了Java中us.codecraft.webmagic.selector.Selectable的典型用法代码示例。如果您正苦于以下问题:Java Selectable类的具体用法?Java Selectable怎么用?Java Selectable使用的例子?那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。



Selectable类属于us.codecraft.webmagic.selector包,在下文中一共展示了Selectable类的12个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于我们的系统推荐出更棒的Java代码示例。

示例1: process

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Override
public void process(Page page) {
    List<Selectable> nodes = page.getHtml().xpath("//ul[@id=ma-thumb-list]/li").nodes();
    StringBuilder accum = new StringBuilder();
    for (Selectable node : nodes) {
        accum.append("img:").append(node.xpath("//a/@href").get()).append("\n");
        accum.append("title:").append(node.xpath("//img/@alt").get()).append("\n");
    }
    page.putField("",accum.toString());
    if (accum.length() == 0) {
        page.setSkip(true);
    }
    page.addTargetRequests(page.getHtml().links().regex("http://www\\.mama\\.cn/photo/.*\\.html").all());
}
 
开发者ID:mikeqian,项目名称:house,代码行数:15,代码来源:MamacnPageProcessor.java


示例2: process

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Override
public void process(Page page) {
    Html html = page.getHtml();
    count++;
    Selectable sel = html.links().regex("("+URLREG+"[a-zA-Z0-9\\d]+.shtml)");
    page.addTargetRequests(sel.all());
    if(count!=1) {
        for(String f:fields){
            String key = config.getProperty(f);
            if(!"".equals(key)) {
                String pro = config.getProperty(f+"_deleteTag");
                if(pro!=null) {
                    String[] tags = pro.split(",");
                    String value = html.xpath(key).toString();
                    if("content".equals(f))
                        page.putField(f,value);
                    else
                        page.putField(f, deleteTag(value, tags).replaceAll(config.getProperty(f + "_replaceStr"), ""));
                }
            }
        }
        try {
            page.putField("area", new String(Area.getBytes("ISO-8859-1"),"utf-8"));
        } catch (UnsupportedEncodingException e) {
            e.printStackTrace();
        }
    }
    System.out.println("############=====> "+count);
}
 
开发者ID:blogshun,项目名称:ants-project,代码行数:30,代码来源:MySpider.java


示例3: testNthNodesGet

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Test
public void testNthNodesGet(){
	Html html = new Html("<a data-tip=\"p$t$xxx\" href=\"/xx/xx\">xx</a>");
	assertThat(html.xpath("//a[1]/@href").get()).isEqualTo("/xx/xx");
	Selectable selectable = html.xpath("//a[1]").nodes().get(0);
	assertThat(selectable.xpath("/a/@href").get()).isEqualTo("/xx/xx");
}
 
开发者ID:code4craft,项目名称:webmagic,代码行数:8,代码来源:HtmlTest.java


示例4: getUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Override
public Selectable getUrl() {
    return page.getUrl();
}
 
开发者ID:laidu,项目名称:java-learn,代码行数:5,代码来源:PageProxy.java


示例5: parseAllTopics

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
public void parseAllTopics(Page page) {
	Selectable selectable = page.getHtml().xpath("//div[@id='group-topics']//a");
	List<Selectable> selectables = selectable.nodes();
	selectables.stream().filter((s) -> s.match()).forEach(System.out::print);
	page.putField("allTopics", selectables);
}
 
开发者ID:xyalan,项目名称:findhouse,代码行数:7,代码来源:DoubanHouseProcessor.java


示例6: setHtml

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
public void setHtml(Selectable html) {
    this.html = html;
}
 
开发者ID:yuany,项目名称:en-webmagic,代码行数:4,代码来源:Page.java


示例7: setUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
public void setUrl(Selectable url) {
    this.url = url;
}
 
开发者ID:code4craft,项目名称:webmagic,代码行数:4,代码来源:Page.java


示例8: getHtml

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
 * 获取页面的html内容
 *
 * @return html 页面的html内容
 */
public Selectable getHtml() {
    return html;
}
 
开发者ID:yuany,项目名称:en-webmagic,代码行数:9,代码来源:Page.java


示例9: getUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
 * 获取页面的Url
 *
 * @return url 当前页面的url,可用于抽取
 */
public Selectable getUrl() {
    return url;
}
 
开发者ID:yuany,项目名称:en-webmagic,代码行数:9,代码来源:Page.java


示例10: setUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
 * 设置url
 *
 * @param url
 */
public void setUrl(Selectable url) {
    this.url = url;
}
 
开发者ID:yuany,项目名称:en-webmagic,代码行数:9,代码来源:Page.java


示例11: getUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
 * get url of current page
 *
 * @return url of current page
 */
public Selectable getUrl() {
    return url;
}
 
开发者ID:code4craft,项目名称:webmagic,代码行数:9,代码来源:Page.java


示例12: getUrl

import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
Selectable getUrl(); 
开发者ID:laidu,项目名称:java-learn,代码行数:2,代码来源:Page.java



注:本文中的us.codecraft.webmagic.selector.Selectable类示例整理自Github/MSDocs等源码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
Java OutOfCharactersException类代码示例发布时间:2022-05-23
下一篇:
Java HTTPSampleResult类代码示例发布时间:2022-05-23
热门推荐
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap