本文整理汇总了Java中us.codecraft.webmagic.selector.Selectable类的典型用法代码示例。如果您正苦于以下问题:Java Selectable类的具体用法?Java Selectable怎么用?Java Selectable使用的例子?那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。
Selectable类属于us.codecraft.webmagic.selector包,在下文中一共展示了Selectable类的12个代码示例,这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞,您的评价将有助于我们的系统推荐出更棒的Java代码示例。
示例1: process
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Override
public void process(Page page) {
List<Selectable> nodes = page.getHtml().xpath("//ul[@id=ma-thumb-list]/li").nodes();
StringBuilder accum = new StringBuilder();
for (Selectable node : nodes) {
accum.append("img:").append(node.xpath("//a/@href").get()).append("\n");
accum.append("title:").append(node.xpath("//img/@alt").get()).append("\n");
}
page.putField("",accum.toString());
if (accum.length() == 0) {
page.setSkip(true);
}
page.addTargetRequests(page.getHtml().links().regex("http://www\\.mama\\.cn/photo/.*\\.html").all());
}
开发者ID:mikeqian,项目名称:house,代码行数:15,代码来源:MamacnPageProcessor.java
示例2: process
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Override
public void process(Page page) {
Html html = page.getHtml();
count++;
Selectable sel = html.links().regex("("+URLREG+"[a-zA-Z0-9\\d]+.shtml)");
page.addTargetRequests(sel.all());
if(count!=1) {
for(String f:fields){
String key = config.getProperty(f);
if(!"".equals(key)) {
String pro = config.getProperty(f+"_deleteTag");
if(pro!=null) {
String[] tags = pro.split(",");
String value = html.xpath(key).toString();
if("content".equals(f))
page.putField(f,value);
else
page.putField(f, deleteTag(value, tags).replaceAll(config.getProperty(f + "_replaceStr"), ""));
}
}
}
try {
page.putField("area", new String(Area.getBytes("ISO-8859-1"),"utf-8"));
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}
}
System.out.println("############=====> "+count);
}
开发者ID:blogshun,项目名称:ants-project,代码行数:30,代码来源:MySpider.java
示例3: testNthNodesGet
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Test
public void testNthNodesGet(){
Html html = new Html("<a data-tip=\"p$t$xxx\" href=\"/xx/xx\">xx</a>");
assertThat(html.xpath("//a[1]/@href").get()).isEqualTo("/xx/xx");
Selectable selectable = html.xpath("//a[1]").nodes().get(0);
assertThat(selectable.xpath("/a/@href").get()).isEqualTo("/xx/xx");
}
开发者ID:code4craft,项目名称:webmagic,代码行数:8,代码来源:HtmlTest.java
示例4: getUrl
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
@Override
public Selectable getUrl() {
return page.getUrl();
}
开发者ID:laidu,项目名称:java-learn,代码行数:5,代码来源:PageProxy.java
示例5: parseAllTopics
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
public void parseAllTopics(Page page) {
Selectable selectable = page.getHtml().xpath("//div[@id='group-topics']//a");
List<Selectable> selectables = selectable.nodes();
selectables.stream().filter((s) -> s.match()).forEach(System.out::print);
page.putField("allTopics", selectables);
}
开发者ID:xyalan,项目名称:findhouse,代码行数:7,代码来源:DoubanHouseProcessor.java
示例6: setHtml
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
public void setHtml(Selectable html) {
this.html = html;
}
开发者ID:yuany,项目名称:en-webmagic,代码行数:4,代码来源:Page.java
示例7: setUrl
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
public void setUrl(Selectable url) {
this.url = url;
}
开发者ID:code4craft,项目名称:webmagic,代码行数:4,代码来源:Page.java
示例8: getHtml
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
* 获取页面的html内容
*
* @return html 页面的html内容
*/
public Selectable getHtml() {
return html;
}
开发者ID:yuany,项目名称:en-webmagic,代码行数:9,代码来源:Page.java
示例9: getUrl
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
* 获取页面的Url
*
* @return url 当前页面的url,可用于抽取
*/
public Selectable getUrl() {
return url;
}
开发者ID:yuany,项目名称:en-webmagic,代码行数:9,代码来源:Page.java
示例10: setUrl
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
* 设置url
*
* @param url
*/
public void setUrl(Selectable url) {
this.url = url;
}
开发者ID:yuany,项目名称:en-webmagic,代码行数:9,代码来源:Page.java
示例11: getUrl
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
/**
* get url of current page
*
* @return url of current page
*/
public Selectable getUrl() {
return url;
}
开发者ID:code4craft,项目名称:webmagic,代码行数:9,代码来源:Page.java
示例12: getUrl
import us.codecraft.webmagic.selector.Selectable; //导入依赖的package包/类
Selectable getUrl();
开发者ID:laidu,项目名称:java-learn,代码行数:2,代码来源:Page.java
注:本文中的us.codecraft.webmagic.selector.Selectable类示例整理自Github/MSDocs等源码及文档管理平台,相关代码片段筛选自各路编程大神贡献的开源项目,源码版权归原作者所有,传播和使用请参考对应项目的License;未经允许,请勿转载。 |
请发表评论