2013-08-05 22 views

cevap

5

Sadece depolama amacıyla, HDFS'de her şeyi saklayabilirsiniz. Ama bu hiçbir anlam ifade etmeyecek. Her şeyden önce, Hadoop'u RDBMS'inizin (burada yapmaya çalıştığınız) yerini alması gerektiğini düşünmemelisiniz. Her ikisi de tamamen farklı amaçlar içindir. Hadoop, işlemsel, ilişkisel veya gerçek zamanlı ihtiyaçlarınız için uygun değildir. Çevrimdışı toplu işleme gereksinimlerinize hizmet etmek üzere tasarlandı. Dolayısıyla, kullanım durumunuzu doğru bir şekilde analiz etmek ve kararınızı dondurmak daha iyidir.

Bir öneri olarak size Hive numaralı telefonu işaret etmek istiyorum. Mevcut Hadoop kümenizin üstünde size depolama olanakları sağlar. Ayrıca, SQL arkaplanından geliyorsanız, hayatınızı daha kolaylaştıracak deponuza bir SQL benzeri arayüz sağlar. Yine de, Hive aynı zamanda bir parti işleme sistemidir ve gerçek bir zamana ihtiyacınız varsa iyi bir uyum değildir.

Abhinav tarafından önerildiği gibi HBase bir göz atabilirsiniz. Hadoop kümenizin üzerinde çalışabilen ve verilerinize rastgele, gerçek zamanlı okuma/yazma erişimi sağlayan bir DB'dir. Ama unutmamak gerekir ki bir şey bir NoSQL db. SQL terminolojileri ve sözleşmeleri takip etmez. Yani, başlangıçta biraz uzaylı bulabilirsin. RDBMS'nizin satır stili depolamasından farklı olarak verilerinizi yeni bir depolama stilinde (sütun) nasıl saklayacağınız gibi konuları düşünmeniz gerekebilir. Aksi halde, kurulumu ve kullanımı bir sorun değildir.

HTH

0

Herhangi bir dosya HDFS'de saklanabilir. Ama bir SQL tip DB istiyorsanız, HBASE için gitmelisiniz. Verilerinizi doğrudan HDFS'ye kaydederseniz, rasyonaliteyi saklayamazsınız.

+1

İlişkisel verileri HBase gibi bir sütunlu depoya nasıl depolayabileceğini eklemelisiniz. –