NLP'ye yeni yaşıyorum ve NLP sınıfım için bir alıştırmayı çözmem gerekiyor. Temel olarak, (CRF, ABC, vb.) Ve diğer büyük harfli sözcükler (GIDA, EV) gibi kısaltmalar içeren bir ham metin alıyorum ve bunları sınıflandırmam gerekiyor.Kısaltma ve sadece büyük harfle yazılmış kelimeler arasında ayrım yapın.
Nerden başlayacağımı bilmiyorum, bazı algoritmalara işaret edebilir misiniz? Sorunu çözmeme yardımcı olabilecek stokastik yaklaşımlar?
Sadece bir kısaltma ve isminiz olması durumunda bir pos teli kullanma fikrinin size yardımcı olacağını kabul ediyorum, fakat eğer roma harfleri (I, V, VI) gibi diğer yanlış kısaltmalardan veya alfabe (hepatit A, B veya C). Pos tack de bu davaları birbirinden ayırmak için yeterli olur mu? –