2011-06-03 13 views
6

Sitem giderek büyüyor ve çeşitli kanallardan çok fazla spam çekmeye başlıyor. Sitede çok sayıda farklı UGC (profiller, forumlar, blog yorumları, durum güncellemeleri, özel mesajlar, vb.) Bulunmaktadır. Devam etmekte olduğum çeşitli etki azaltma çabalarım var ki, spam'cıları değerli bir hedef olmadığına ikna etmek için bir blitzkrieg olarak devreye sokmayı umuyorum. İşlevsel olarak ne yaptığım konusunda çok güveniyorum, ancak bir eksik parça tüm eski spam'leri bir kerede öldürüyor.Büyük bir Rails sitesinde esnek spam algılama oluşturmak için iyi bir açık kaynak paketi nedir?

İşte ne var:

  • Büyük iyi/kötü korpus (5 rakamlı kötü, 6 veya 7 rakamlı iyi). Bir çok spam'in çok güvenilir parmak izleri vardır ve bunu 6 ay boyunca görmezden geldiğim gerçeği, yardımcı olur :)
  • AWS'a dağıtılan büyük, modüler Rails sitesi. Büyük bir trafik alanı değil, bir SOA'nın başlangıcıyla 8 örnek çalışıyoruz.
  • Yakut, Redis, Resque, MySQL, Vernik, Nginx, Unicorn, şef, Gentoo tüm

Benim gereksinimleri: Ben hacmi verili oldukça iyi gerçekleştirmek istediğiniz

  1. veri (bu yüzden ben saf bir yakut çözümüne karşı ihtiyatlıyım).
  2. Farklı türde içeriklere birden fazla sınıflandırma yapabiliyor olmalıyım (419-scam vs botnet link spam)
  3. Kendi dedektif çalışmalarımıza dayanan manüel faktörleri eklemek istiyorum (şablon eşleştirme, IP yeniden kullanımı vb)
  4. Nihayetinde Ruby ile kullanılmak üzere güzel bir arayüz oluşturmak istiyorum. Eğer bu benim ellerimi C'ye ya da herhangi bir şeye kirletmemi gerektiriyorsa, halledebilirim ama yapabilirsem kaçıracağım.

Bu uzun ve belirsiz bir soru olduğunun farkındayım ama ne öncelikle arıyorum sadece iyi paketlerin bir listesi ve yaklaşım yolları konusunda benzer küçük sistemler inşa etti birinden ikincil herhangi rasgele düşünceler .

cevap

5

Kabul edilebilir bir açık kaynak çözüm aradık ve bulamadık.

Aynı sonuca varırsanız ve özel spam karşılığını dikkate almaya karar verirseniz, ödenen Akismet işbirlikçi spam filtreleme hizmetine bakın. Bir düzine orta ölçekli sitede, ondan iyi bir performans gösterdik. Raf ve rackismet aracılığıyla raylarla entegre olur.

+0

Kesinlikle düşündüğüm bir şey. Performansı ve görece maliyetini, özellikle farklı amaçlar için eğitmek istediğim farklı kurumları göz önünde bulundurarak sorgularım. Belki de yanlış yönlendirilirim, ama şu an kendi başıma dönmeye devam edeceğim ... – gtd

İlgili konular