hadoop, SequenceFile
anahtar-değer çifti (kayıt) biçiminde yazar. Büyük bir sınırsız günlük dosyasına sahip olduğumuzu düşünün. Hadoop dosyayı blok büyüklüğüne göre böler ve çoklu veri düğümlerine kaydeder. Her bir anahtar/değer çiftinin tek bir blokta yer alması garanti edilir mi? ya da anahtarın, düğüm 1'de bir blokta ve düğüm 2'de ikinci blokta değer (veya bunun parçaları) olacak şekilde bir durumumuz olabilir. Eğer baştan çıkarıcı-tam bölünmeler olabilirse, o zaman çözüm nedir? senkronizasyon işaretçileriBölme Sırası Denetimli bir şekilde - Hadoop
Başka bir soru şudur: hadoop otomatik olarak senkronizasyon işaretleri yazıyor mu yoksa el ile mi yazmalıyız?