Bir çevrimiçi topluluk veri kümesini R ile analiz ediyorum. Tek sorunla uğraştığım için yardımın için gerçekten minnettarım. İşte bir özet:Yalnızca R’deki tüm katılımcıları, yalnızca tek bir değişken seviyesinde ve ikincisinde hiç olmadığı zaman nasıl kaldırabilirim?
Veri seti: Her kullanıcının kullanıcı adı kullanılabilir. Her satır, tek bir çevrimiçi toplulukta bir kullanıcının aktivitesini temsil eder. Örnek a: 1. satır, 'mavi' kullanıcısının, o ana kadar bir gönderiye katkıda bulunduğu çevrimiçi topluluk x'in bir üyesi olduğunu gösterir. Örnek b: 5. satırda, 'mavi' kullanıcısının, şu ana kadar 2 gönderiye katkıda bulunduğu çevrimiçi toplulukların y sahibi olduğu gösterilir. Aşağıya bakınız!
Soru: Herhangi bir çevrimiçi toplulukta yalnızca kullanıcı veya kullanıcı olarak etkin olan veri kümesindeki tüm kullanıcıları kaldırmak istiyorum. Ayrıca, birkaç çevrimiçi toplulukta üye olarak aktif olmaları durumunda bunları kaldırmak istiyorum. Diğer bir deyişle, kullanıcıların 'turuncu', 'mor', 'siyah' ve 'beyaz' kaldırmak istiyorum. Önemli: Veri kümesi> 1Mio içerir. satırlar. Bunu dikkate alan bir yaklaşım arıyorum :) Teşekkür ederim.
username role # of posts
blue member 1
blue member 0
red owner 6
red owner 1
blue owner 2
red member 1
blue owner 3
blue member 2
blue owner 1
blue owner 0
red member 8
green owner 1
red owner 2
red member 3
green member 4
yellow owner 5
green member 3
green owner 4
yellow owner 5
yellow member 6
yellow owner 8
*orange owner 1
orange owner 2
purple member 3
purple member 4
black owner 4
white member 4*
adlarının bir vektör dönmek black'and 'white'', sorununuzun diğer açıklamasına ilişkindir. Ayrıca, çevrimiçi topluluk için ek bir sütun olması gerektiği anlaşılıyor, çünkü bu örnekte açık değil. –
Açıklığa kavuşturmak için, kullanıcı adı '* sahibi' ve 'üye' olarak gösterilmiyorsa kullanıcı adlarını kaldırmak istiyorsunuz? – Adam
@Adam, bu durumda, örneğin neden "kırmızı" kaldırılmaz? –