Solr 字段分析(Field Analysis)

字段分析(Field analysis) 用来告诉 Solr 在处理添加索引或者更新索引的时候对于近来的数据进行何种操作。

有关这个过程更精确的名字可以使用 处理(processing)或者甚至可以使用消化 (digestion),但是官方的名字还是使用 分析(analysis)。

考虑下面的使用实例,在背景资料中,每一个单词都应该被索引,这样能够让你在对人员信息进行查找的时候能够快速找到你所需要的信息,当你输入需要查询的内容的时候,例如番茄酱,或者其他信息,你希望能够快速的找到。

但是,在背景资料中,可能包含有大量的单词是你不需要关心的,例如英文单词 “the”, “a”, “to”,此外,番茄酱(Ketchup)是大写的 K 在每个句子的前面,当用户查询 “Ketchup”这个词的时候,你希望 Solr 能够返回有关的这个人。

有关这些问题的解决方案就是字段分析。针对背景资料字段,你可以告诉 Solr 如何对输入背景资料字段的内容进行单词拆分。专业术语在这里称为分词。你可以告诉 Solr 你是希望所有的单词为小写,同时告诉 Solr 删除所有音标字符。

字段分析针对每一种字段类型都有不同的分析方法而且也非常重要,请参考本 Wiki 的后续内容有关字段分析的描述。