2010-12-04 16 views
7

Veri çerçevem, .csv dosyasından aldığım anket verileridir. Sütunlardan biri yaş ve 18 yaşın altındaki tüm yanıtlayıcıları kaldırmak istiyorum. O zaman, frekans dağılımları yapabileceğim kendi veri şemalarına (18-24, 25-35, vb.) Yaş gruplarını ayırmam gerekecek. Bir rpy2 DataFrame'den belirli bir satırın seçilmesi

The R code is simple enough

:

x.sub <- subset(x.df, y > 2) 

Ama bir R deyimi içine piton benim dataframe değişkeni almak için r() fonksiyonunu nasıl kullanılacağını anlamaya olamaz. Rpy2 DataFrame sınıfında bir .subset() işlevi olması gerektiği düşünülür. Ama eğer varsa, onu bulamıyorum.

cevap

10

bir tam örnek belgelerinde değildir (ve orada olmalıdır olabilir) o

from rpy2.robjects.vectors import DataFrame 
dataf = DataFrame.from_csvfile("my/file.csv") 

dataf_subset = dataf.rx(dataf.rx2("age").ro >= 18, True) 

(2.1.x ile aynı olmalıdır) rpy2 2.2.0-dev kullanılarak, fakat bu elemanları oluşturan var extracting elements ve R operators on vectors

+0

Görüyorum. Bunu açıkladığın için teşekkürler. Takdir. – forestfanjoe

İlgili konular