2009-07-26 26 views
5

Wordpress, herhangi bir metin bloğunu spam olarak sınıflandıramayacak gibi görünen, Akismet adlı bir spam filtreleme eklentisine sahiptir. Arayüzlerinden ve veritabanlarından/algoritmalarından geçmeniz gereken tek uyarı, açık kaynaklı ya da halihazırda mevcut olan başka mecralar değildir.Ücretsiz bir anti spam veritabanı var mı?

Ayrıca, web uygulamanızdaki kullanıcılar tarafından gönderilen e-postaları, yorumları veya diğer tüm metinleri sınıflandırmanız için web tarafından erişilebilir bir API sağlayan ticari sağlayıcılar da vardır.

Bir metin bloğunu spam/spam olmayan olarak sınıflandırabilen herhangi bir açık kaynak veya serbestçe erişilebilir veritabanı var mı?

Düzenleme: İşte Temelde ben belirli ifadeler spam olma olasılıkları ile orada geniş bir veritabanı olduğunu umuyordum

istediğini daha net bir açıklama yer almaktadır. Spamser'lerin tüm e-posta adreslerini e-posta adreslerine eşit olarak gönderdiğinden beri, Bayesian spam filtresini bu veritabanına önceden yerleştirerek, herhangi bir kullanıcı eğitimi olmaksızın çoğu spam'i ele geçirerek başlayan bir uygulama yaratabilirim. Yorum dayalı

cevap

1

Güncelleme:

ben basit bir veritabanı hile yapacağını sanmıyorum. Çoğu spam algoritmik olarak oluşturulur (ör. Yorum spam genellikle içerikten içerik içerir). Akismet, muhtemelen bağlantı analizi ve bilinen istenmeyen e-posta imzalarının kullanımı gibi şeylerin bir kombinasyonunu yapar, ancak yayınlamaz.

Bazı ilginç AI projelerini classify good rather than bad content'a okudum. Ayrıca, blog yorumlarını çeşitli spam tetikleyicilere (yükleme sayfası hemen sonra yanıt gönderimi vb.) Göre analiz eden Spam Karma adresine bakabilirsiniz.


Orijinal cevap (DNS listelerinin):

+0

Artık bir metin bloğunu spam olarak veya şimdi sınıflandırıp sınıflandırabilen bir veritabanına bakıyorum. Akismet (bir wordpress eklentisi), örneğin, herhangi bir yorumu spam olarak ya da değil şeklinde sınıflandırabilir. –

+0

Jon'un belirttiği gibi, bir veri tabanı sınıflandırma için çok kullanışlı değil. Akismet, bir veritabanına karşı kontrol etmek yerine spam oluşturmak için kullanılan prosedür üretimini taklit eder. – JoshJordan

+0

Bu linkler için teşekkürler. İstenmeyen postaları sınıflandırmak için birçok algoritma varken, iyi bir spam imza veritabanı çok değerlidir. Wordpress veya Google gibi birinin spam imzalarını ücretsiz bir veritabanı olarak yayınladığını umuyordum. Muhtemelen, biliyorum. Ama bir erkek hayal edebilir mi? –

1

Belki bu tamamen ölü bir soru - ancak şunu bir kontrol edin: http://www.stopforumspam.com IP'lerini kontrol etmek veya kendi DB'lerine karşı kullanıcı adlarını veya e-postalarını girmek için kendi API'larını kullanın. Ama size zaman aşımı parametresi ile cURL kullanmanızı öneririm - hizmet bazen size zaman zaman olmayabilir veya olmayabilir.

İlgili konular