2009-12-04 16 views
10

Yaklaşan bir proje için bir depolama platformunu değerlendiriyorum ve Cassandra'ya geri dönmeye devam ediyorum. 'u kaybeden bu proje için herhangi bir veri miktarı kabul edilemez. Şimdiye kadar bir ilişkisel veritabanı (Microsoft SQL Server) kullandık, ancak veriler çok çeşitli ve büyüktür ki, depolanması ve sorgulanması sorunu haline gelmiştir.Cassandra birincil veri deposu olarak kullanılmaya uygun mu?

Cassandra, birincil veri deposu olarak kullanmak için yeterince sağlam mıdır? Yoksa sadece erişimi hızlandırmak için mevcut verileri yansıtmak için mi kullanılmalı?

cevap

9

Anecdotally: Evet, Twitter, Digg, Ooyala, SimpleGeo, Mahalo ve diğerleri birincil veri deposu için Cassandra'yı kullanıyor veya hareket ediyor (http://n2.nabble.com/Cassandra-users-survey-td4040068.html).

Teknik olarak: evet; çoğaltmayı desteklemenin yanı sıra (çoklu veri merkezlerine de dahil olmak üzere), her Cassandra düğümünün yazımların dayanıklı olmasını sağlamak için bir fsync'd taahhüt kütüğü vardır; oradan yazılanlar, sıkıştırılıncaya kadar (birden fazla SSTable'ı GC eski versiyonlara birleştiren) değişmeyen SSTables'e dönüştürülür. Snapshotting, herhangi bir zamanda otomatik sıkıştırma öncesi-sıkıştırma dahil olmak üzere desteklenir.

+0

Digg ve Facebook'u biliyordum, ancak ne kadar olgun olduğunun farkında değildim. Teşekkürler! –

3

Uygulamanız için Cassandra'yı kullanmanız veya kullanmanız, yalnızca veri iş yükünüze bağlıdır. Cassandra yoğun yazma gerektiren iş yükleri için optimize edilmiştir, bu nedenle, büyük miktarda verinin eklenmesi gereken uygulamalar (Facebook'ta altyapı günlüğü bilgileri gibi) için uygundur.

Ancak, hızlı geri alma ve ekleme hızına ihtiyacınız varsa, bir sorun değil, o zaman belki de (okuma yoğun iş yükleri optimize edilmiş) HBase bir göz atmalısınız.

İlgili konular