2016-03-21 11 views
1

Watson/Alchemy Sentiment Analysis API'sini kullanıyorum ve makaleler tartışılır şekilde olumlu olduğunda, negatif etiketli bazı makaleler buldum. Bu, makalelerin iyi ya da yararlı azalmaları tartıştığı zaman olur.Bazı durumlarda negatif olarak yanlış bildirilen Watson/Alchemy duyarlılık analizi

Örneğin, this Washington Post article, "Amerika Birleşik Devletleri'nde silah şiddetinde büyük bir düşüş yaşadık. İşte nedeni." API'ye gönderildiğinde, makale oldukça iyimser olsa bile, -0.4 bir puan verir! (Makale, silah şiddetinin önemli ölçüde düştüğünü savunuyor.)

Başka bir örnek ise "Ocak 2016'da CoreLogic Raporları 38.000 Tamamlanan Haciz." API, metin olumlu olsa da, -0.27'lik bir belge duyarlılık puanı döndürür: "... haciz envanteri yüzde 21.7 oranında azaldı ve tamamlanan hacizler Ocak 2015'e kıyasla yüzde 16.2 azaldı. Tamamlanan hacizlerin sayısı ülke çapında azaldı Ocak 2015'te 46.000 iken, Ocak 2016'da 38.000'e yükseldi. "

Bu sorunu çözmek için bilinen bir çözüm var mı? Spesifik olarak, dikkatli bir okuyucunun, API'nin önerdiğinden oldukça farklı olan makalelerin duygularını değerlendirdiği durumlarda hizmetin güvenilirliğine ve sonuçlarımıza zarar vermek istemeyiz. Belirli vakalar için duygu sonuçlarını değiştirmeme izin verecek bir şey arıyorum (ör. "Hacizlerde azalma", "cinayetlerde azalma" gibi).

cevap

1

Bunun oldukça normal olduğuna inanıyorum :-) bu, sonuçların% 100'ünde size doğru cevabı verebilen bir duyarlılık analizi algoritmasıdır :-) Algoritmanın uygulanmasından haberdar değilim, ama bahse girerim Duygu, ifadelerin ve kelimelerin "duyarlılığı" ndan hesaplanır. Örneğin, muhtemelen "silah", "şiddet" muhtemelen olumsuz duygularla ilişkilidir, ancak Watson "büyük düşüş" ile ilişkili olduğunu anlamada başarısız olmuş olabilir (hatta "düşüş" olumsuz bir duyguya sahip olabilir).

Son teknoloji duyarlılık analiz algoritmaları bile, çok özel alanlar için yaklaşık% 85 ~ 90 doğruluk oranına ulaşabilir. Dolayısıyla beklentilerinizi buna göre ayarlamak her zaman önemlidir.

+0

Leo doğrudur. Verilerden alıntılar çıkarmayı ve [doğal dil sınıflandırıcısı] (http://www.ibm.com/smarterplanet/us/en/ibmwatson/developercloud/nl-classifier.html) üzerinde Alchemy'nin başarısız olduğu örnekleri sınıflandırmak için eğitim yapmayı öneririm. doğru sınıflarına (pozitif veya negatif). Bu modeli simya çıktınızda ikinci bir geçiş olarak kullanabilirsiniz. –

+0

Giriş adamlarınız için teşekkürler. Yaklaşımınızı kullanmayı planlayacağım James, duyguları uygunsuz şekilde puanlayabilecek metin türünü işaretlemek için bir NLC'yi eğitin ve daha sonra el ile olan puanları tersine çevirin. – jdscott

İlgili konular