2016-04-08 22 views
0

Büyük bir veri dosyası (7GB) öğrenmek istiyorum: 800 satır, 5 milyon sütun. Bu yüzden bu verileri yüklemek ve kullanabileceğim bir forma koymak istiyorum (2D liste veya dizi).Yinelenen verileri iteratörler veya yığınlar olmadan yükleyin

sorun burada ben veri yüklemek ve bunları saklamak çalıştığınızda, onlar sadece ben bu tür nasıl kullanılacağı hakkında çok şey duydum 500.

satırda durdurmak tüm hafızamı (12GB) ve kullanımı veri, chunks ve yineleyicileri kullanmak gibi, ancak bunları tamamen bellekte yüklemek istiyorum, böylece çapraz doğrulama yapabilirim. Yardım için pandaları kullanmaya çalıştım ama sorun aynı.

7 GB'lık verilerin tamamını yüklemek ve yüklemek istediğim bazı sorunlar var mı? Ya da bana yardımcı olabilecek başka bir fikrin var mı?

+0

Başka hangi kaynaklar kullanılıyorsa çıkardıktan sonra 12 GB RAM'iniz var mı? – timgeb

+6

Neyse, gerçekten her şeyi belleğe yüklemek istiyorsanız, ancak yeterli belleğe sahip değilseniz, yanıt daha fazla bellek almaktır. Ya da verileri bir şekilde sıkıştırın. – timgeb

+0

ne yapmak istediğinize bağlıdır. Yolda parçalara ayrılır ve her seferinde bir parça yükler. – galaxyan

cevap

0

Takas veya sayfa dosyası almayı deneyebilirsiniz. İşletim sisteminize bağlı olarak, sisteminizin tek bir işlemde daha fazla nesneyi fiziksel belleğe sığacak şekilde ele almasını sağlamak için sanal belleği kullanabilirsiniz. working set'un ne kadar büyük olduğuna bağlı olarak, performans o kadar fazla acı çekmeyebilir veya tamamen korkunç olabilir. Yani, daha fazla bellek almanın ya da bazı bölümleme stratejisi kullanmanın (yığınlama dediğinize benzer) probleminiz için daha iyi bir çözüm olduğu kesindir.

Pencerelerde, sayfa dosya boyutunun nasıl ayarlanacağı hakkında bilgi için here'a bakın. Redhat Linux için takas ekleme hakkında bilgi için this link'u deneyin.

İlgili konular