分词器

内部操作步骤

Standard-Analyzer

基于复杂的语法实现词汇单元化, 这种语法规则可以识别Email地址、首字母缩写、字母数字等

Simple-Analyzer

在分字母字符切分文本,并将其转成为小写形式

IK-Analyzer

实现了以词典作为基础信息的正方向切分, 以及正反双向最大匹配切分,是第三方实现的分词器

ICTCLAS4J

中科院的分词器,是基于语义分词的,简化了传统分词程度的复杂度