iPhone için Elasticsearch içinde arama yaparken iPhone maçı yapmak için mücadele.Elasticsearch'te CamelCase tokenizer ürününü hariç bırak
Bazı kaynak kodları söz konusu olduğundan, kesinlikle CamelCase tokenizer'a ihtiyacım var, ancak iPhone'u iki açıdan kırıyor gibi görünüyor, bu yüzden iphone bulunamıyor.
Herkes, camelCase kelimelerini jetonlara (deve + case) bölmek için istisnalar eklemenin bir yolunu biliyor mu?
GÜNCELLEME: netleştirmek için, NullPointerException öğesinin [null, pointer, exception] olarak belirtilmesini istiyorum, ancak iPhone'un [i, telefon] olmasını istemiyorum.
Başka herhangi bir çözüm?
UPDATE 2: @ ChintanShah'ın yanıtı bize daha da fazlasını veren farklı bir yaklaşım önermektedir - NullPointerException, [null, pointer, exception, nullpointer, pointerexception, nullpointerexception] olarak belirlenir ve bu, kesinlikle bakış açısından çok daha yararlıdır. arama yapandan. Ve endeksleme de daha hızlı! Fiyatın ödenmesi endeks büyüklüğündedir, ancak bu üstün bir çözümdür.
Küçük harfli filtreyi niye kullanmıyorsunuz? Tüm sözcükleri küçültecek – ChintanShah25
@ ChintanShah25 Bu, tokenizer'ı nasıl onarmaya yardımcı olur? (ve btw - küçük harfli filtre kullanıyorum) – tishma
tokenizatörleri filtrelerden farklıdır. iPhone, küçük boyutlu filtreli iphone olarak dizine eklenecektir. Eğer tüm yanlış almazsa, belirteci göndermeden ve – ChintanShah25