Wordpress, herhangi bir metin bloğunu spam olarak sınıflandıramayacak gibi görünen, Akismet adlı bir spam filtreleme eklentisine sahiptir. Arayüzlerinden ve veritabanlarından/algoritmalarından geçmeniz gereken tek uyarı, açık kaynaklı ya da halihazırda mevcut olan başka mecralar değildir.Ücretsiz bir anti spam veritabanı var mı?
Ayrıca, web uygulamanızdaki kullanıcılar tarafından gönderilen e-postaları, yorumları veya diğer tüm metinleri sınıflandırmanız için web tarafından erişilebilir bir API sağlayan ticari sağlayıcılar da vardır.
Bir metin bloğunu spam/spam olmayan olarak sınıflandırabilen herhangi bir açık kaynak veya serbestçe erişilebilir veritabanı var mı?
Düzenleme: İşte Temelde ben belirli ifadeler spam olma olasılıkları ile orada geniş bir veritabanı olduğunu umuyordum
istediğini daha net bir açıklama yer almaktadır. Spamser'lerin tüm e-posta adreslerini e-posta adreslerine eşit olarak gönderdiğinden beri, Bayesian spam filtresini bu veritabanına önceden yerleştirerek, herhangi bir kullanıcı eğitimi olmaksızın çoğu spam'i ele geçirerek başlayan bir uygulama yaratabilirim. Yorum dayalı
Artık bir metin bloğunu spam olarak veya şimdi sınıflandırıp sınıflandırabilen bir veritabanına bakıyorum. Akismet (bir wordpress eklentisi), örneğin, herhangi bir yorumu spam olarak ya da değil şeklinde sınıflandırabilir. –
Jon'un belirttiği gibi, bir veri tabanı sınıflandırma için çok kullanışlı değil. Akismet, bir veritabanına karşı kontrol etmek yerine spam oluşturmak için kullanılan prosedür üretimini taklit eder. – JoshJordan
Bu linkler için teşekkürler. İstenmeyen postaları sınıflandırmak için birçok algoritma varken, iyi bir spam imza veritabanı çok değerlidir. Wordpress veya Google gibi birinin spam imzalarını ücretsiz bir veritabanı olarak yayınladığını umuyordum. Muhtemelen, biliyorum. Ama bir erkek hayal edebilir mi? –