在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
昨天有幸拜读了洞庭散人的<基于朴素贝叶斯分类器的文本分类算法>,我正在学习这个,我从内心感谢洞庭散人的分享!随即我把它移植到了c#平台上。 该程序用到了Lucene.Net,用到了基于词典的ICTCLAS中文分词1.0. ICTCLAS中文分词for Lucene.Net接口代码(实现Analyzer):
}
ICTCLAS中文分词for Lucene.Net接口代码(实现Tokenizer):
}
中文分词器代码:
}
训练管理器代码:
先验概率计算代码:
}
条件概率计算代码:
}
用于保存分类结果的类:
}
贝叶斯分类器代码:
}
代码太多,编辑的时候卡的很,于是再整个(二) |
请发表评论