2010-05-01 22 views
5

Bir üretim ortamında bir ton küçük/basit REST web sorguları çalıştırmak için dağıtılmış bir kurulum oluşturmak istiyorum. Bir düğümden yürütülen her 5-10 ilgili sorgu için, standart bir ilişkisel veritabanında (PostgreSQL gibi) depolanması gereken çok az miktarda türetilmiş veri üreteceğim.MANY basit ağ görevlerini dağıtmak için çözüm?

Bu tür bir sorun kümesi için hangi platformlar oluşturulur? Doğa, veri boyutları ve miktarları Hadoop'un zihniyetiyle çelişiyor gibi görünüyor. Daha önce bahsettiğim Condor ve Sun Grid Engine gibi daha grid tabanlı mimariler de var. Bu platformların hatalardan herhangi bir kurtarma işlemi yapıp yapmadıklarından emin değilim (bir işin başarılı olup olmadığını kontrol etmek).

Gerçekten sevdiğim şey, veritabanımın güncelleşmesiyle birlikte iş ekleyebileceğim bir FIFO türü kuyruğudur.

İş için en iyi araçla ilgili öneriniz var mı?

+0

Sonlandırdığım (özel) bir izleme programına oldukça benziyor. Yapılandırılabilir aralıklarla belirli aralıklarla birden fazla URL'den indirir, sonuçları bir PostgreSQL veritabanına ayrıştırır ve kaydeder. Bunu, indirme işlerinin öncelik sırasını koruyan tek bir C++ programı olarak uyguladım (aslında bir std :: haritası, izleme devre dışı bırakıldığında işlerin çekilmesi gerekir) ve indirme işlemini gerçekleştirmek için libcurl kullanır. Sonuçları izlemeyi ele almamıştım çünkü izleme programı ve veritabanı aynı sunucuda yaşıyor. Gerçekten bir platform kullanmadım, bu yüzden +1 :-) –

cevap

1

Celery'a baktınız mı?

+0

Projeler oldukça genç olmasına rağmen ilginç görünüyor. Ayrıca SSS'ye dayanarak sağlamlığından da emin değilim: “Sıranın hiçbir zaman boşaltılamamasının bir nedeni, mesajların rehin alındığı eski bir kereviz sürecine sahip olmanız olabilir. Celeryd düzgün bir şekilde kapatılmamışsa bu gerçekleşebilir.” Ayrıca, django bağımlılığı can sıkıcıdır: "Kerevizi Django'nun dışından kullanmak mümkün olsa da, hala Django'ya koşmak zorundayız, bu ORM ve önbellek çerçevesini kullanmaktır." – EmpireJones

+0

@empirejones Aslında SSS girişi artık alakalı değil. Bu sırada bekleyen bekleyen işleri silmeyle ilgili. Bir işçinin önceden bazı işlerini rezerve edebilir (ön alım sayısından dolayı), eğer işçinin aracı bağlantısı kesilirse, işler başka bir yere gönderilir (ya da yeniden bağlanırsa aynı çalışan). İlgili hatalar düzeltildi, bu çok işlem ve forking ile ilgili bir sorun oldu. – asksol

İlgili konular