Verileri bir cassandra kümesinden başka bir halka boyutuna sahip başka bir cassandra kümesine nasıl geçireceğinizi bulmaya çalışıyorum .. .de, 5 düğüm kümesinden 7 düğüm kümesine .sayfa.N boyutunda Cassandra kümesinden veri N boyutunda farklı bir kümeye geçirme N +/- M
Ssable2json'a bakmaya başladım, çünkü bu belirli cassandra düğümünde SSTable için bir json dosyası oluşturuyor. Benim düşüncem, halkadaki her düğümde bir sütun ailesi için bunu yapmaktı. Yani, bir 5 düğüm halkasında, bu bana 5 json dosyası verecek, her düğümde bulunan sütun ailesinde saklanan veriler için bir dosya.
Sonra json dosyalarını bir dosyaya birleştiririm ve json2sstable'ı kullanarak yeni bir kümeye, büyüklüğüne, yani 7'ye izin veririm. Cassandra'nın daha sonra verileri düğümler boyunca eşit olarak çoğaltacağını/dengeleyeceğini umuyordum halkada, ama ben sadece SSTables yazılı olduklarında değişmez olduğunu okudum. Öyleyse, daha önce bahsettiğim şeyi yapsaydım, bir düğümde sütun ailemdeki tüm verilerle bir zil sesiyle sonuçlanırdım.
Herhangi biri, bir kümeden veriyi farklı bir halka boyutuna sahip farklı bir kümeye geçirme işlemine karar vermeme yardımcı olabilir mi?
Düzgün sstable'a yazarsam, cassandra verileri diğer düğümlere çoğaltır mı? Ayrıca, tüm veri dosyalarını halkadaki tüm düğümlerden tek bir klasöre koyar ve üzerinde sstableloader çalıştırırsam, veriler orijinal kümedeki 3 düğümde çoğaltılacağı için yinelenen verilerle sonuçlanmayacak mıyım? – Turbo
Evet, yinelenen verilerle sonuçlanacaksınız. Sıkıştırma bununla ilgilenecek, bu yüzden sorun değil. Ayrıca: "tüm veri dosyalarını tek bir klasöre koymaya" gerek yok, sadece bunu yerinde yapın. (Netleştirmek için düzenlenmiştir.) – jbellis
Hey jbellis, bilgi için teşekkürler. Bence burası bir rota. Benim senaryo hakkında daha fazla bilgi eklemek için, bir veri modeli oluşturmak için ec2 üzerinde hadoop kullanıyorum ve cassandra üzerinde, ayrıca ec2 üzerinde devam ediyorum. Daha sonra model inşa edildiğinde, cassandra verilerini ağıma indireceğim. Model oluştururken bazı ölçeklenebilirlik faydaları elde etmek için ec2 üzerinde oldukça büyük bir cassandra halkası oluşturacağım. Ancak ağımdaki hedef yüzük, muhtemelen yarı yarıya daha küçük olacaktır. Bu yüzden planım, veri dosyalarını ec2'den ağıma çekmek ve daha sonra verileri içe aktarmak. daha fazla sonraki yorum ... – Turbo