nasauber.de

Blog

bayes-php

Gesagt, getan: nachdem ich meinen Bayes-Filter in php geschrieben und einige Zeit getestet habe, stelle ich ihn jetzt der Allgemeinheit zur Verfügung. Dem ganzen habe ich den höchst kreativen Namen „bayes-php“ gegeben, das Programm steht ab jetzt zum Download bereit.

Standardmäßig benutzt bayes-php eine BerkeleyDB, um die statistischen Daten der gelernten Texte zu speichern. Falls diese nicht verfügbar sein sollte, kann alternativ auch eine MySQL-Tabelle benutzt werden.

Nach ca. 100 gelernten Spam-Einträgen schätzt der Filter so gut wie alle Spam-Texte, die ich ihm anbiete, mit 90 % Wahrscheinlichkeit oder mehr als Spam ein. Den Rest meist mit zumindest mehr als 70–80 %. Wo man die Grenze setzt, ab wann ein Eintrag als Spam gehandhabt wird, bleibt jedem selbst überlassen.

Also auf jeden Fall viel Spaß damit! Ich würde mich freuen, wenn jemand den Filter benutzen und mir evtl. auch Feedback bezüglich der Leistungsfähigkeit zukommen lassen würde :-)