2010-09-13 27 views
24

k-Means clustering algoritmasının bir çevrimiçi sürümü var mı?Çevrimiçi k-ortalamalar kümeleme

çevrimiçi derken onlar sisteme girerken her veri noktası gerçek zamanlı olarak kullanıldığında dolayısıyla hesaplama zaman tasarrufu, her seferinde, seri bir tane işlenir anlamına gelir.

iyi sonuçları ile bir kendime yazdım, ama bu benim ana tezi kullanılmak üzere olduğundan Gerçekten başvurmak için "standart" bir şey olmasını tercih ederim.

Ayrıca, herkes diğer online kümeleme algoritmaları için tavsiyeler var mı? (lmgtfy başarısız;))

cevap

34

Evet var. Google bunu daha önce "ardışık k-araçları" olarak bildiği için bulamadı.

this section of some Princeton CS class notes numaralı sırada, birbirini izleyen K-araçlarının iki sözde kod uygulaması Richard Duda tarafından bulunabilir. Aşağıda, iki uygulamalarından biri çoğaltılamaz ettik:

Make initial guesses for the means m1, m2, ..., mk 
Set the counts n1, n2, ..., nk to zero 
Until interrupted 
    Acquire the next example, x 
    If mi is closest to x 
     Increment ni 
     Replace mi by mi + (1/ni)*(x - mi) 
    end_if 
end_until 

bu konuda güzel şey bu sadece her kümenin ortalama ve küme atanan veri noktalarının sayısı sayısı hatırlamak gerektiğidir. Bu iki değişkeni güncelledikten sonra, veri noktasını atabilirsiniz.

Ben bunun için bir alıntıyı bulmak mümkün nerede olacağını emin değilim. Duda'nın klasik metni Pattern Classification and Scene Analysis veya daha yeni basım Pattern Classification'a bakmaya başlarım. Eğer orada değilse, Chris Bishop'un en yeni kitabı ya da Daphne Koller ve Nir Friedman'ın son metnini deneyebilirsiniz.

+0

teşekkür ederiz Bölüm 12. Yerel Modellerde Ethem Alpaydın tarafından "Makine Öğrenmesi Giriş" bölümünde çevrimiçi k-ortalama hakkında daha fazla bulabilirsiniz. Bu tüm farkı yarattı. – Theodor

+2

Uygun alıntı aslında MacQueen yayını olabilir. Kesinlikle bu ortalama güncelleme kuralını içerir ve anlayabildiğim kadarıyla tek bir geçiş yapar. O zaman tam olarak bu algoritmaya sahipsiniz. –

2

Sen

+0

özellikle neler var? – dove

+0

lütfen bu bölümün nasıl yararlı olduğunu açıklayın ve kullanıcıların sorusunu ele alın. – WebChemist