需求是:在文章中,匹配到繁体字并将其去掉。最初想使用匹配unicode的方法,后发现无效,没了思路。请问如何解决?
没啥好的方案。。因为 Unicode 的排序是根据笔画来的,而正则匹配 Unicode 也是,解决方案就是创建字典,然后字典检查,比如下面在 github 上的两个开源项目,都是这种采用字典的方式。
2.1m questions
2.1m answers
60 comments
57.0k users