2009-10-01 15 views
6

1D dizisi değerleri verildiğinde, her bir 'mod' normal bir dağılım olduğu yerde en iyi ikili mod dağılımının ne olduğunu anlamanın en basit yolu nedir? Diğer bir deyişle, 1D dizisi değerlerini yeniden üreten iki normal dağılımın kombinasyonunu nasıl bulabilirsiniz?Bir değerler kümesine iki modlu bir dağılımın yerleştirilmesi

Özellikle, bunu python'da uygulamakla ilgileniyorum, ancak cevaplar dile özgü olmak zorunda değil.

Teşekkürler!

cevap

4

Yapmaya çalıştığınız şey bir Gaussian Karışımı modeli olarak adlandırılır. Bunu çözmenin standart yaklaşımı Beklenti Maksimizasyonu kullanmaktır, scipy svn, makine öğrenimi ve scikits olarak adlandırılan bir bölüm içerir. Onu biraz kullanıyorum.

0

Müthiş scipy paketini kullanmanızı öneririm. Optimizasyon için birkaç yöntem sunar.

Önceden tanımlanmış en küçük kareye uygun bir şekilde veya bu çizgiler boyunca bir şey uygulayarak büyük bir yağ uyarısı var. İkinci/her iki zirveleri daha büyük

  1. Gürültü: Burada

    içine çalışacak birkaç sorunlardır. Kısmi tepe - verileriniz kenarlardan birinde kesilmiştir.
  2. Örnekleme - zirvelerin genişliği, örneklenen verilerinizden daha küçüktür.
  3. Bu normal değil - Eğer ...
  4. Bindirme bazı sonuç alırsınız - zirveleri çakışırsa bulacaksınız sık sık bir tepe doğru takılmıştır ama ikinci ... sıfır apporach olacak
0

1D dizisi için neden bimodal dağıtıma uymanın nedenini anlamaya çalışıyorum? Bunu yapmanın avantajları nelerdir?

+1

Örnek: Değerlerin 500 kadın ve 500 erkeğin ölçülen göğüs çevresi olduğunu varsayalım. –

İlgili konular