• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

通过w3c方式读取xml内容

原作者: [db:作者] 来自: [db:来源] 收藏 邀请
/**
     * 通过w3c方式 读取xml内容
     * @param lablenames    要读取的节点名称
     * @param file_path_name 文件绝对路径
     * @return
     */
    public static WebMagic readXML(List<String> lablenames, String file_path_name) {

        
        WebMagic webMagic = new WebMagic();

        try {
            DocumentBuilderFactory factory = DocumentBuilderFactory .newInstance();

            DocumentBuilder builder = factory.newDocumentBuilder();

            org.w3c.dom.Document document = builder.parse(new File(file_path_name));

            org.w3c.dom.Element rootElement = document.getDocumentElement();

            for (int i = 0; i < lablenames.size(); i++) {
                NodeList list = rootElement.getElementsByTagName(lablenames.get(i));
                
                org.w3c.dom.Element element = (org.w3c.dom.Element) list .item(0);

                System.out.println(element.getChildNodes().item(0).getNodeValue());

                if ("starturl".equals(element.getNodeName())) {
                    webMagic.setStarturl(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("regexstarturl".equals(element.getNodeName())) {
                    webMagic.setRegexstarturl(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("labelName".equals(element.getNodeName())) {
                    webMagic.setLabelName(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("labeltype".equals(element.getNodeName())) {
                    webMagic.setLabeltype(element.getChildNodes().item(0)
                            .getNodeValue());
                }
                if ("regexdescendants".equals(element.getNodeName())) {
                    webMagic.setRegexdescendants(element.getChildNodes()
                            .item(0).getNodeValue());
                }

            }

        } catch (Exception e) {

            System.out.println("exception:" + e.getMessage());

        }
        return webMagic;

    }

 


鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
C语言第二次博客作业---分支结构发布时间:2022-07-13
下一篇:
c#平均分配问题发布时间:2022-07-13
热门推荐
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap