Java Treebank类代码示例

OStack程序员社区-中国程序员成长平台 › 门户 › 编程› Java›Java编程经验

原作者: [db:作者] 来自: [db:来源] 收藏邀请

本文整理汇总了Java中edu.stanford.nlp.trees.Treebank类的典型用法代码示例。如果您正苦于以下问题：Java Treebank类的具体用法？Java Treebank怎么用？Java Treebank使用的例子？那么恭喜您, 这里精选的类代码示例或许可以为您提供帮助。

Treebank类属于edu.stanford.nlp.trees包，在下文中一共展示了Treebank类的11个代码示例，这些例子默认根据受欢迎程度排序。您可以为喜欢或者感觉有用的代码点赞，您的评价将有助于我们的系统推荐出更棒的Java代码示例。

示例1: getSegmentedWordLengthDistribution

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
private Distribution<Integer> getSegmentedWordLengthDistribution(Treebank tb) {
  // CharacterLevelTagExtender ext = new CharacterLevelTagExtender();
  ClassicCounter<Integer> c = new ClassicCounter<Integer>();
  for (Iterator iterator = tb.iterator(); iterator.hasNext();) {
    Tree gold = (Tree) iterator.next();
    StringBuilder goldChars = new StringBuilder();
    Sentence goldYield = gold.yield();
    for (Iterator wordIter = goldYield.iterator(); wordIter.hasNext();) {
      Word word = (Word) wordIter.next();
      goldChars.append(word);
    }
    Sentence ourWords = segmentWords(goldChars.toString());
    for (int i = 0; i < ourWords.size(); i++) {
      c.incrementCount(Integer.valueOf(ourWords.get(i).toString().length()));
    }
  }
  return Distribution.getDistribution(c);
}

开发者ID:FabianFriedrich，项目名称:Text2Process，代码行数:19，代码来源:ChineseMarkovWordSegmenter.java

示例2: getSegmentedWordLengthDistribution

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
private Distribution<Integer> getSegmentedWordLengthDistribution(Treebank tb) {
  // CharacterLevelTagExtender ext = new CharacterLevelTagExtender();
  ClassicCounter<Integer> c = new ClassicCounter<Integer>();
  for (Iterator iterator = tb.iterator(); iterator.hasNext();) {
    Tree gold = (Tree) iterator.next();
    StringBuilder goldChars = new StringBuilder();
    ArrayList goldYield = gold.yield();
    for (Iterator wordIter = goldYield.iterator(); wordIter.hasNext();) {
      Word word = (Word) wordIter.next();
      goldChars.append(word);
    }
    List<HasWord> ourWords = segment(goldChars.toString());
    for (int i = 0; i < ourWords.size(); i++) {
      c.incrementCount(Integer.valueOf(ourWords.get(i).word().length()));
    }
  }
  return Distribution.getDistribution(c);
}

开发者ID:amark-india，项目名称:eventspotter，代码行数:19，代码来源:ChineseMarkovWordSegmenter.java

示例3: simplify

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
public Treebank simplify(Tree tree) {

    Treebank totalSimplified = new MemoryTreebank();

    Queue<Tree> queue = new LinkedList<Tree>();
    queue.offer(tree);
    while (!queue.isEmpty()) {
      Tree t = queue.poll();

      boolean hasSimplification = false;

      int types[] = new int[] { //
      Simplifier.Parenthesis, //
          Simplifier.Coordination };

      for (int type : types) {
        hasSimplification = simplify(t, queue, totalSimplified, type);
        if (hasSimplification) {
          break;
        }
      }

      if (!hasSimplification) {
        if (t != tree) {
          totalSimplified.add(t);
        }
      }
    }
    return totalSimplified;
  }

开发者ID:leebird，项目名称:legonlp，代码行数:31，代码来源:GenerateParCooSimplification.java

示例4: simplify

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
public Treebank simplify(Tree tree) {

    Treebank totalSimplified = new MemoryTreebank();

    Queue<Tree> queue = new LinkedList<Tree>();
    queue.offer(tree);
    while (!queue.isEmpty()) {
      Tree t = queue.poll();

      boolean hasSimplification = false;

      int types[] = new int[] { //
      Simplifier.Parenthesis, //
          Simplifier.Coordination, //
          Simplifier.Relative, //
          Simplifier.Apposition,//
          Simplifier.Others //
      };

      for (int type : types) {
        hasSimplification = simplify(t, queue, totalSimplified, type);
        if (hasSimplification) {
          break;
        }
      }

      if (!hasSimplification && t != tree) {
        totalSimplified.add(t);
      }
    }
    return totalSimplified;
  }

开发者ID:leebird，项目名称:legonlp，代码行数:33，代码来源:GenerateSimplification.java

示例5: getCandidates

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
protected List<Entity> getCandidates(Entity entity, Treebank treebank, boolean intraSentence)
{
 List<Entity> entityList = new ArrayList<Entity>();
 
 for(Tree tree : treebank)
 {
  List<Tree> leaves = tree.getLeaves();
  OffsetLabel first = (OffsetLabel) leaves.get(0).label();
  OffsetLabel last = (OffsetLabel) leaves.get(leaves.size() - 1).label();
  int start = first.beginPosition();
  int end = last.endPosition();
  
  TregexPattern np = TregexPattern.compile("NP|NNP|NNPS|NN|NNS");
  TregexMatcher m = np.matcher(tree);
  while(m.find())
  {
	  Tree npTree = m.getMatch();
	  List<Token> tokens = Utils.getTokens(tree, npTree);

	  if(!npTree.isLeaf())
	  {
		  Entity candidate = new Entity("",npTree.nodeString(),tokens);
  
			if (entity.from() > candidate.to()) {
				if (intraSentence) {
					if ((entity.from() > start) && (entity.to() < end))
						entityList.add(candidate);
				} else
					entityList.add(candidate);
			}
	  }
  } 
 }
 return entityList;
}

开发者ID:leebird，项目名称:legonlp，代码行数:36，代码来源:ResoluteAnaphora.java

示例6: main

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
public static void main(String[] args) {
  TreebankLangParserParams tlpp = new NegraPennTreebankParserParams();
  Treebank tb = tlpp.memoryTreebank();
  tb.loadPath(args[0]);
  for (Tree aTb : tb) {
    aTb.pennPrint();
  }
}

开发者ID:FabianFriedrich，项目名称:Text2Process，代码行数:9，代码来源:NegraPennTreebankParserParams.java

示例7: getTuningSet

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
private static List<FactoredLexiconEvent> getTuningSet(Treebank devTreebank,
    FactoredLexicon lexicon, TreebankLangParserParams tlpp) {
  List<Tree> devTrees = new ArrayList<Tree>(3000);
  for (Tree tree : devTreebank) {
    for (Tree subTree : tree) {
      if (!subTree.isLeaf()) {
        tlpp.transformTree(subTree, tree);
      }
    }
    devTrees.add(tree);
  }
  List<FactoredLexiconEvent> tuningSet = treebankToLexiconEvents(devTrees, lexicon);
  return tuningSet;
}

开发者ID:benblamey，项目名称:stanford-nlp，代码行数:15，代码来源:FactoredLexicon.java

示例8: main

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
public static void main(String[] args) {
  // simple testing code
  Treebank treebank = new DiskTreebank();
  CategoryWordTag.suppressTerminalDetails = true;
  treebank.loadPath(args[0]);
  final HeadFinder chf = new NoPunctuationHeadFinder();
  treebank.apply(new TreeVisitor() {
    public void visitTree(Tree pt) {
      pt.percolateHeads(chf);
      pt.pennPrint();
      System.out.println();
    }
  });
}

开发者ID:benblamey，项目名称:stanford-nlp，代码行数:15，代码来源:NoPunctuationHeadFinder.java

示例9: processFile

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
@Override
public final void processFile(String dir, String filename) {
  super.processFile(dir, filename);

  if (filename.equals("PMC-3062687-12-Methods")) {
    return;
  }

  readResource(dir, filename);

  if (index != -1) {
    MemoryTreebank newTreebank = new MemoryTreebank();
    newTreebank.add(treebank.get(index));
    treebank = newTreebank;
  }

  // general
  Treebank simpTreebank = new MemoryTreebank();
  for (Tree t : treebank) {
    simpTreebank.addAll(simplify(t));
  }

  // output
  try 
       {
    PrintStream out = new PrintStream(new FileOutputStream(Env.DIR_SIMP
        + filename
        + ".ptb.simp"));
    Set<String> noDuplicates = new HashSet<String>();
    for (Tree tree : simpTreebank) {
      String line = tree.toString();
      if (!noDuplicates.contains(line)) {
        out.println(line);
        noDuplicates.add(line);
      }
    }
    out.close();
  } catch (FileNotFoundException e) {
    e.printStackTrace();
    System.exit(1);
  }
}

开发者ID:leebird，项目名称:legonlp，代码行数:43，代码来源:GenerateSimplification.java

示例10: recover

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
public String recover(String text, List<Entity> entityList, HashMap<String,HashMap<String,Integer>> map)
{
       PtbReader ptbReader = new PtbReader(Env.DIR_PARSE + filename + ".ptb");
       Treebank treebank = ptbReader.readTreebank();
       String res = "";
       String pattern = Env.ENTITY_REPLACE;

       for(Tree t : treebank)
       {      
       	List<Tree> leaves = t.getLeaves();
       	
   		for(Tree l : leaves)
   		{        	 
   			String word = Utils.adaptValue(l.label().toString());
   	    	Pattern r = Pattern.compile(pattern);
   	    	Matcher m = r.matcher(word);
   	    	
   	    	while(m.find())
   	    	{
   	    		String needle = m.group();
   	    		try {
   	    			int entStart = map.get(needle).get("start");
   	    			int entend = map.get(needle).get("end");

    			for(Entity entity : entityList)
    			{	        
    				
        			int start = entity.from();
        			int end = entity.to();
       				String entityText = entity.getText();

       				if(start == entStart && entend == end)
        			{
       					word = word.replace(needle, entityText);
       					m = r.matcher(word);
       					break;
        			}
        		}
   	    		} catch (Exception e){
   	    			System.out.println(needle);
   	    			System.exit(1);
   	    		}
   	    	}
   	    	l.setValue(word);
   		}
       	res += t.toString()+"\n";
       }
       return res;
}

开发者ID:leebird，项目名称:legonlp，代码行数:50，代码来源:RecoverEntity.java

示例11: main

import edu.stanford.nlp.trees.Treebank; //导入依赖的package包/类
/**
 * Execute with no arguments for usage.
 */
public static void main(String[] args) {

  if(!validateCommandLine(args)) {
    System.err.println(usage);
    System.exit(-1);
  }

  final TreebankLangParserParams tlpp = Languages.getLanguageParams(LANGUAGE);
  final PrintWriter pwOut = tlpp.pw();

  final Treebank guessTreebank = tlpp.diskTreebank();
  guessTreebank.loadPath(guessFile);
  pwOut.println("GUESS TREEBANK:");
  pwOut.println(guessTreebank.textualSummary());

  final Treebank goldTreebank = tlpp.diskTreebank();
  goldTreebank.loadPath(goldFile);
  pwOut.println("GOLD TREEBANK:");
  pwOut.println(goldTreebank.textualSummary());

  final LeafAncestorEval metric = new LeafAncestorEval("LeafAncestor");

  final TreeTransformer tc = tlpp.collinizer();

  //The evalb ref implementation assigns status for each tree pair as follows:
  //
  //   0 - Ok (yields match)
  //   1 - length mismatch
  //   2 - null parse e.g. (()).
  //
  //In the cases of 1,2, evalb does not include the tree pair in the LP/LR computation.
  final Iterator<Tree> goldItr = goldTreebank.iterator();
  final Iterator<Tree> guessItr = guessTreebank.iterator();
  int goldLineId = 0;
  int guessLineId = 0;
  int skippedGuessTrees = 0;
  while( guessItr.hasNext() && goldItr.hasNext() ) {
    Tree guessTree = guessItr.next();
    List<Label> guessYield = guessTree.yield();
    guessLineId++;

    Tree goldTree = goldItr.next();
    List<Label> goldYield = goldTree.yield();
    goldLineId++;

    // Check that we should evaluate this tree
    if(goldYield.size() > MAX_GOLD_YIELD) {
      skippedGuessTrees++;
      continue;
    }

    // Only trees with equal yields can be evaluated
    if(goldYield.size() != guessYield.size()) {
      pwOut.printf("Yield mismatch gold: %d tokens vs. guess: %d tokens (lines: gold %d guess %d)%n", goldYield.size(), guessYield.size(), goldLineId, guessLineId);
      skippedGuessTrees++;
      continue;
    }
    
    final Tree evalGuess = tc.transformTree(guessTree);
    final Tree evalGold = tc.transformTree(goldTree);

    metric.evaluate(evalGuess, evalGold, ((VERBOSE) ? pwOut : null));
  }
  
  if(guessItr.hasNext() || goldItr.hasNext()) {
    System.err.printf("Guess/gold files do not have equal lengths (guess: %d gold: %d)%n.", guessLineId, goldLineId);
  }
  
  pwOut.println("================================================================================");
  if(skippedGuessTrees != 0) pwOut.printf("%s %d guess trees\n", "Unable to evaluate", skippedGuessTrees);
  metric.display(true, pwOut);
  pwOut.close();
}

开发者ID:benblamey，项目名称:stanford-nlp，代码行数:77，代码来源:LeafAncestorEval.java

注：本文中的edu.stanford.nlp.trees.Treebank类示例整理自Github/MSDocs等源码及文档管理平台，相关代码片段筛选自各路编程大神贡献的开源项目，源码版权归原作者所有，传播和使用请参考对应项目的License；未经允许，请勿转载。

鲜花

握手

雷人

路过

鸡蛋

该文章已有0人参与评论

请发表评论

全部评论

专题导读

More+

10-27 六六分期app的软件客服如何联系？(六六分期

11-06 可心卡盟:win10系统火狐flash插件崩溃怎么

11-06 亲亲特价:怎么删除回收站图标

11-06 济南大学虚拟社区:鲁大师节能降温的具体办

11-06 xlueops.exe:无线网络安装向导

11-06 女斗合众国:win7系统cf与主机连接不稳定怎

11-06 0xc000022-[cf烟雾头]cf怎么调烟雾头

11-06 qizideyouhuo:应用程序无法正常启动0xc0000

11-06 ipz-185:win7系统vcf文件怎么打开

11-06 傻哥蹦迪:win10系统s4怎么打开usb调试

11-06 八神浩树gtaste:回收站清空了怎么恢复

11-06 妖尾之黑色守护:win10系统电脑没有1440x900

11-06 校园至尊魔王小说:win7系统浏览网页时字体

11-06 女斗合众国:win10系统访问共享文件夹提示请

11-06 tokyo hot n0654:恢复win7系统默认字体一招

11-06 雨酷仙境:设置win7系统转移临时文件夹腾出

11-06 阿穆纳伊之杖:win7系统开始菜单在右边还原

11-06 tunespotting:win10系统火狐flash插件总是

11-06 甘尔葛分析师：计谋网站seo关键词暴涨有什

11-06 蔡贵霖: 计谋网站seo关键词暴涨有什么秘密

11-06 博益网首页:ao3网页版进入不了解决方法

11-06 漏斗子专栏: 网站数据分析小白易懂精华篇

11-06 见证双虹怎么做:win7系统开启telnet命令的

11-06 颾狐蝶蜋:系统资源不足无法完成请求的服务

11-06 国光中学校歌:提交网站到alexa查询详细步骤

11-06 西安有情天:静态网页和动态网页的区别

11-06 红木雅尚斋:外部链接构造对网站的好处

11-06 前官礼遇：防止域名劫持–增强域安全性的10

11-06 密传二转答案: 中文分词算法有哪些

11-06 金泉家园邮编:百度快照劫持的表现及应对方

Java ServiceRegistryDao类代码示例发布时间：2022-05-23

Java ZipExporterImpl类代码示例发布时间：2022-05-23

剪的笔顺,诠释剪的笔画,认识剪的部首

1 六六分期app的软件客服如何联系？(六六分期

六六分期app的软件客服如何联系？不知道吗？加qq群【895510560】即可！标题：六六分期

阅读：18819|2023-10-27

2 可心卡盟:win10系统火狐flash插件崩溃怎么

今天小编告诉大家如何处理win10系统火狐flash插件总是崩溃的问题，可能很多用户都不知

阅读：9873|2022-11-06

3 亲亲特价:怎么删除回收站图标

今天小编告诉大家如何对win10系统删除桌面回收站图标进行设置，可能很多用户都不知道

阅读：8283|2022-11-06

4 济南大学虚拟社区:鲁大师节能降温的具体办

今天小编告诉大家如何对win10系统电脑设置节能降温的设置方法，想必大家都遇到过需要

阅读：8640|2022-11-06

5 xlueops.exe:无线网络安装向导

我们在使用xp系统的过程中,经常需要对xp系统无线网络安装向导设置进行设置，可能很多

阅读：8570|2022-11-06

6 女斗合众国:win7系统cf与主机连接不稳定怎

今天小编告诉大家如何处理win7系统玩cf老是与主机连接不稳定的问题，可能很多用户都不

阅读：9573|2022-11-06

7 0xc000022-[cf烟雾头]cf怎么调烟雾头

电脑对日常生活的重要性小编就不多说了，可是一旦碰到win7系统设置cf烟雾头的问题，很

阅读：8565|2022-11-06

8 qizideyouhuo:应用程序无法正常启动0xc0000

我们在日常使用电脑的时候，有的小伙伴们可能在打开应用的时候会遇见提示应用程序无法

阅读：7959|2022-11-06

9 ipz-185:win7系统vcf文件怎么打开

今天小编告诉大家如何对win7系统打开vcf文件进行设置，可能很多用户都不知道怎么对win

阅读：8567|2022-11-06

10 傻哥蹦迪:win10系统s4怎么打开usb调试

今天小编告诉大家如何对win10系统s4开启USB调试模式进行设置，可能很多用户都不知道怎

阅读：7497|2022-11-06

客服电话

电子邮件

Java Treebank类代码示例

示例1: getSegmentedWordLengthDistribution

示例2: getSegmentedWordLengthDistribution

示例3: simplify

示例4: simplify

示例5: getCandidates

示例6: main

示例7: getTuningSet

示例8: main

示例9: processFile

示例10: recover

示例11: main

请发表评论

全部评论

上一篇：

下一篇：

微信小程序校历组件

librespeed/speedtest: Self-hosted Speedt

【2020最新简单赚钱套路】遛狗赚钱是真的吗

avehtari/BDA_m_demos: Bayesian Data Anal

四维彩超怎么看性别？四维看男孩女孩诀窍

剪的笔顺,诠释剪的笔画,认识剪的部首

六六分期app的软件客服如何联系？(六六分期

florent37/ViewAnimator: A fluent Android

florent37/Shrine-MaterialDesign2: implem

CVE-2020-36276

SimpleSoftwareIO/simple-sms: Send and re

关于我们

产品与服务

解决方案

139-2527-9053