2016-04-08 30 views
-1

EM kümeleyicisini kullanarak 43574 zaman serisini kümelendim. Çıktı 24 kümedir. Burada bazı sorularım var. İlk olarak, 24 kümeyle başa çıkmak pratik olarak yararlı mıdır? Çok mu fazla değil? Eğer sonuçları nöroşirrahiye iletirseniz, bu kümeleri etiketlemek amacıyla bu kümelenmeler hasta için işe yarayacak mı? En önemli sorum şu ki, aşağıda görüldüğü gibi, birkaç kümede% 0 olasılık var mı ?! Bu ne anlama geliyor? Öyleyse neden farklı kümelenmelerde varlar? Herhangi bir yardım büyük takdir, Ve bu bende ne olduğunu:EM Bazı kümeler için log olasılığı ile weka ile kümeleme 0? Kafa karıştırıcı çıkış

0 1892 (4%) 1 5153 (% 12) 2 1594 (% 4) 3 1221 (% 3) 4 122 (0 %) 5 2714 (% 6) 6 7092 (% 16) 7 141 (% 0) 8 166 (% 0) 9 464 (% 1) 10 3331 (% 8) 11 4316 (% 10) 14 2411 (% 6) 15 2573 (% 6) 17 3063 (% 7) 18 142 (% 0) 19 4211 (% 10) 20 925 (% 2) 21 2038 (% 5) 22 5 (% 0)

cevap

0

Bu değerler olasılıklarının değildir, ancak boyutu.

data=array([1892, 5153, 1594, 1221, 122, 2714, 7092, 141, 166, 
    464, 3331, 4316, 2411, 2573, 3063, 142, 4211, 925, 2038, 5]) 

for f in data * 100./sum(data): print "%.1f%%" % f, 

hassas ek rakam ile, aşağıdaki görece küme boyutu elde edilir:

4.3% 11.8% 3.7% 2.8% 0.3% 6.2% 16.3% 0.3% 0.4% 1.1% 7.6% 9.9% 
5.5% 5.9% 7.0% 0.3% 9.7% 2.1% 4.7% 0.0% 

Bu olasılıklarının değildir. küme boyutu/veri kümesi boyutu.

+0

Anony, Bu bana% 0 olan 5 kümeyi tanımlamak ne anlama geliyor? Dediğin gibi, küme büyüklüğü. Bu kümede hiçbir veri kategorize edilemezse, neden bu kümeyi elde ederiz ?! Ayrıca neden 1 yerine birkaç% 0 aldım? – Parisan

+0

Mutlak 0.0000000 değil, 5/43574. Bu da bir olasılık değil. sadece 5 objeyle ** çok küçük bir küme **. Muhtemelen aykırı veya kötü ön işlem. –

+0

Teşekkürler Anony. Mantıklı. – Parisan

İlgili konular