Ben here ve here özetlenen CSV kullanarak adımlara ihracat birkaç farklı yaklaşımlar çalıştı. Ama ben işe yaramadı. Yani, yaptığım şey buydu (en büyük masam yaklaşık 2GB idi). o ... çok sayıda adımdan gibi Google saatlerce değişmiş olabilir rastgele kod mücadele daha iyi görünüyor olsa Bu da hatta nispeten hızlı bir şekilde çalışır:
- Bulut Depolama içine gidin ve 2 yeni grup oluştururuz "data_backup "ve" data_export ". Öğeleri depolamak için zaten bir kovanız varsa bunu atlayabilirsiniz.
- Dönüştürmeye çalıştığınız veri deposu için "Konsolum"> Google Datastore> Yönetici> Datastore Yöneticisi'ni açın.
- Yedeklemek istediğiniz varlık veya varlıklara bakın ve "Yedekleme Varlıkları" na tıklayın. Ben sadece bir defada 5 hepsini kontrol etmek yerine ihracat 5 tablo gibi vardı beri bir anda yaptım.
- Google Depolama (gs) Asistan Google Big Query gidin
- bunları saklamak istiyor kepçe belirtin (Bunu daha önce hiçbir yerde kullanmadığı ama gitmem kek oldu)
- aşağı küçük oka tıklayın ve "Yeni Veri Kümesi Oluştur" u seçin ve ona bir isim verin.
- Yeni oluşturduğunuz yeni veri kümesinin yanındaki aşağı oku ve ardından "Yeni Tablo Oluştur" u seçin. Veri Seç adımının altındaki "Bulut Datastore Yedekleme" yi seçerek içe aktarma adımlarını izleyin. Ardından, Büyük Sorgu'ya almak istediğiniz yedeklemeyi seçin, böylece bir sonraki adımda csv'ye dışa aktarabilirsiniz.
- Tablo içe aktarıldığında (ki benimki için oldukça hızlıydı), tablo adının yanındaki aşağı oku tıklayın ve "Dışa Aktar" ı seçin. Doğrudan csv'ye dışa aktarabilir ve dışa aktarma için oluşturduğunuz google saklama kutusuna kaydedebilir ve oradan indirebilirsiniz.
İşte birkaç ipucu:
- veri ilişkileri iç içe verdiyse, (onlar da bu her ne avro biçimde sunduğumuz)
- ben json2csv kullanılan ziyade CSV daha JSON ihracat zorunda kalacak csv olarak kaydedilemeyen dışa aktarılmış JSON dosyalarınımı dönüştürmek için. Büyük masalarda biraz yavaş çalışır, ancak bitirir.
- Json2csv'deki bir python bellek hatası nedeniyle 2 GB dosyasını 2 dosyaya bölmem gerekiyordu. Ben dosyaları bölmek için GSplit kullanılan ve Diğer Özellikleri altında seçeneğe onay işareti> Başlıkları> ... GSplit etiketleri eklemeyin Etiketler & (bu yapılan GSplit bölünmüş dosyaları herhangi bir veri eklemek vermedi emin)
gibi Dedim ki, bu birkaç adım olsa da aslında oldukça hızlıydı. Umarım birileri, tuhaf yedekleme dosyası formatlarını dönüştürmeye veya artık çalışmayabilecek kodları çalıştırmaya harcanan zamandan kaçınmaya yardımcı olur.
Bu yedekleri indirebilirsiniz. Yine de, csv formatında değil, ama muhtemelen bunu –
dönüştürebilirsiniz. Ayrıca, bunu gsutil ile geri yükleyebilirim, değil mi? Her şeyi indirmiyor gibi görünüyor. – Heisenberg
evet, "muhtemelen dönüştürün" :) bu leveldb dökümüdür, bu yüzden biraz karmaşıktır. Gsutil yüklemelerini hiç denemedim, nasıl çalıştığından emin değilim. –