18
Lucene varsayılan bir stop filtresine sahiptir (http://lucene.apache.org/core/4_0_0/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html), listedeki kelimelerin hangileri olduğunu bilen var mı?Lucene'nin StopFilter'ında kullanılan varsayılan stopwords listesi nedir?
Kullanarak bir anahtar kelime için 'Lucene' 5.5.0 kullanıyorum. Stop word filtresini 'tokenStream = new StopFilter (yeni ClassicFilter (yeni LowerCaseFilter (stdToken)), StopAnalyzer.ENGLISH_STOP_WORDS_SET) ile belirtiyorum; ancak' Lucene', durdurma sözcüklerini filtrelememektedir. Özlediğim bir şey var mı? –
Gerçek kaynak bağlantısı: http://alvinalexander.com/java/jwarehouse/lucene/src/java/org/apache/lucene/analysis/StopAnalyzer.java.shtml –
Liste mevcut Elasticsearch'te bulunabilir: The Definitive Guide , [Şifreler: Performans Versus Precision] (https://www.elastic.co/guide/en/elasticsearch/guide/current/stopwords.html) – Paul