java基于dfa实现敏感词过滤
在实现文字过滤的算法中,DFA是比较好的实现算法。DFA 即 Deterministic Finite Automaton,也就是确定有穷自动机,它是是通过event和当前的state得到下一个state,即event+state=nextstate。
- 准备词库
1 | 台独 |
略。。。。。
可下载开源的词库 词库
- 初始化敏感词库
1 | package cn.pconline.pcloud.admin.dfa; |
- 敏感词过滤
1 | package cn.pconline.pcloud.admin.dfa; |
- 运行结果
1 | 敏感词的数量:1894 |