R ile çok yeni yaşıyorum, bu yüzden verilerimin istenen manipülasyonunu nasıl gerçekleştireceğimize dair bazı işaretler alabileceğimi ümit ediyorum.R: veri kümelerini çeyrek/deciles'e bölme. Doğru yöntem nedir?
Üç değişkenli bir veri dizim var.
gene_id fpkm meth_val
1 100629094 0.000 0.0063
2 100628995 0.000 0.0000
3 102655614 111.406 0.0021
Ben çeyreklere veya Deciles içine fpkm dayalı benim gene_ids stratifying sonra ortalama meth_val çizmek istiyorum.
Bir dataframe içine benim veri yüklemek kez ...
data <- read.delim("myfile.tsv", sep='\t')
Ben fpkm belirleyebilir kullanarak Deciles:
Oradan 0% 10% 20% 30% 40% 50%
0.000000e+00 9.783032e-01 7.566164e+00 3.667630e+01 1.379986e+02 3.076280e+02
60% 70% 80% 90% 100%
5.470552e+02 8.875592e+02 1.486200e+03 2.974264e+03 1.958740e+05
verir
quantile(data$fpkm, prob = seq(0, 1, length = 11), type = 5
ki ben 'fpkm_val'in bu devrelerden birine uyup uymadığına bağlı olarak, veri çerçevesini esas olarak 10 gruba ayırmak isterim. Sonra ggplot'ta her decile meth_valini bir kutu çizimi olarak çizmek ve deciles boyunca bir istatistiksel test yapmak istiyorum.
Gerçekten sıkıştığım ana şey veri kümemi uygun şekilde nasıl bölebildiğim. Herhangi bir yardım büyük ölçüde takdir edilecektir!
Teşekkürler bir demet!
R'deki kesme işlevini, küme değerlerine ayarlanan sonlar argümanı ile kullanın. İşte benzer bir Q & A http://stackoverflow.com/questions/11728419/using-cut-and-quartile-to-generate-breaks-in-r-function – technOslerphile