Bazı analizleri R veya python kullanarak yapmak için kullanmam gereken 1,3 GB tsv veri dosyasına sahibim. Makinemde 8 GB RAM var ve Windows 8 çalışıyor. Dosyayı RStudio veya herhangi bir dosya okuma uygulaması ile yükleyemiyorum. Dosyayı okuyabildiğim ve üzerinde çalışabileceğim bir şey var mı? Amazon'a hadoop ile taşınmalı mıyım? Bu bana göründüğü kadar büyük bir veri sorunudur.Büyük dosyalarda çalışma mümkün değil RStudio
cevap
R.'de yükleme yaparken sorunlarla karşılaşıyordum, python pandalarını kullanarak yükleyebiliyorum ve 8 GB RAM bilgisayarla çalışıyor gibi görünüyor. Tüm dosyayı belleğe okumazsanız, örneğin, satırı satır satır okumazsanız ve biraz iş yaparsanız, o zaman iyi olmalısınız.
Bunu bir çözüm olduğunu belirten bir şekilde yazdınız, ancak sorunuz 8 GB'lık bir süre olduğunu söyledi. Bu sorunuzun bir eki ise, lütfen bu cevabı silin ve sorunuzu – Rob
olarak düzenleyin. Bunu "R ile çalışmaya başlayamadım, ama 8gb makinemde bile Python Pandalarla çalışmasını sağladım." ". – Gimby
@Gimby Fair yeterince – Rob
- 1. Java: büyük dosyalarda regex değişimi
- 2. Eclipse'deki uzak dosyalarda çalışmak mümkün mü?
- 3. RStudio projeleri için yetenekler
- 4. mümkün değil
- 5. Angular js içinde farklı dosyalarda birden çok modülle çalışma
- 6. Geri Dönük Dosya bir çalışma alanında değil çalışma alanında değil
- 7. less.css dosyalarda değişkenleri paylaşıyor
- 8. RStudio Sunucu başlatılıyor
- 9. Büyük bellek yığını değil çöp toplanan değil
- 10. IIS7, bazı statik dosyalarda 404 döndürür, diğerleri değil
- 11. Rstudio sunumunda şeklin kontrol boyutu
- 12. Rstudio oluşturulamıyor .Rd dosyaları
- 13. mümkün değil - Django
- 14. mümkün değil setUpClass
- 15. Dizinleri kaldırmak mümkün değil.
- 16. En büyük değil null sütun
- 17. Özelleştirilmiş UITableViewCell initWithCoder: çalışma değil
- 18. Quartz.NET beklendiği gibi çalışma değil
- 19. svn: uyarı: '.' çalışma kopyası değil
- 20. Mümkün dll mümkün değil (pdb kullanılabilir)
- 21. Sürüm Kontrollü Dosyalarda Görselleştirmeyi Değiştirme
- 22. Özel özelliklerle dosyalarda arama yapma
- 23. Rstudio komut geçmişi
- 24. Ubuntu için Rstudio kurulumu
- 25. Rstudio, knitr, Rmarkdown
- 26. RStudio Parlak Koşullu Çizim
- 27. RStudio konsolunda kiril gösteriliyor
- 28. RStudio knitr temaları
- 29. Çalışma zamanında neden bir pencere daha büyük?
- 30. RStudio web tarayıcısında dokümanları açar
Yerel olarak mapreduce yapmanın yolları da vardır, bu nedenle bir Hadoop kümesine ihtiyaç duyduğunuzda, –
cevabınız var. Fakat R programını yazdığımda, tüm dosya üzerinde çalışacak. Bu yüzden sadece üst k kayıtlarını gözetlesem bile yardım etmeyecek. Mapreduce işini yerel olarak çalıştırmak hakkında biraz daha bilgi verebilir misiniz? – Zack
Ayrıca, R veya python ile çalışmam gerek. – Zack