본문 바로가기

Linux

스팸어쎄신과 보고필터의 개인적인 속도 비교(?)

스팸어쎄신을 쓸지 보고 필터를 쓸지 생각하다가 2가지 모두 테스트 해보기로 했다.

테스트 환경은 P4 1.8, 512M Centos 4.4(Final) 이었으며, Bogofilter와 Spamassassin의 DB구성은 가지고 있던 스팸메일 8GB가량을 이용하여 학습시켰다.

<사용된 프로그램>
bogofilter-1.1.5
Spamassassin-3.1.8
Sendmail -8.13.1

테스트는 내가 받은 메일중 랜덤하게 스팸메일과 햄메일로 구분하여 테스트 하였으며, 그에 따른 갯수와 시간차이는 아래와 같다.

---------------------------------------------------------------------------
bogofilter 테스트 결과
1차 : 246개 / 5.71088504791 Sec [Spam Mail - total 2.8Mb]
2차 : 50개 / 1.11812186241 Sec [Spam Mail - total 572kb]
3차 : 50개 / 1.02395009995 Sec [Ham Mail - total 552kb]
4차 : 948개 / 233.392926931 Sec [Spam Mail - total 49Mb]
---------------------------------------------------------------------------

---------------------------------------------------------------------------
SpamAssassin 테스트 결과
1차 : 246개 / 747.7881019617 Sec [Spam Mail - total 2.8Mb]
2차 : 50개 / 150.555448055 Sec [Spam Mail - total 572kb]
3차 : 50개 / 150.555171013 Sec [Ham Mail - total 552kb]
4차 : 948개 / 2840.07560301 Sec [Spam Mail - total 49Mb]
---------------------------------------------------------------------------


우선 처리 결과에서는 Bogofilter가 압승이다. -_-;;

시간뿐만 아니라 필터링 된 메일 목록들을 확인해 보아도, 스팸메일과 햄메일을 분명하게 구분한건 보고필터였다.

50개씩 테스트 한 것이 그에 대한 부분이며, Spamassassin은 햄메일을 스팸으로 인식하거나, 스팸을 햄으로 인식해버리는 경우가 스팸,햄 모두 합하여 100건중 14건이 발생하였고, 보고필터는 스팸은 모두 스팸으로 인식하고, 햄은 50개중 2개만 스팸으로 잘못 인식했다.

물론, 같은 메일을 가지고 테스트 한 것이며, 속도 차이 뿐만 아니라 필터링 결과에서도 Bogofilter가 Spamassassin보다 앞선것이다.

내가 셋팅을 잘 못해서 그런건지는 모르겠지만, 스팸어세신의 속도.. 상당히 치명적인다.

약 1000개 메일을 처리하는데 50분 가량걸린다니.. ㅜ_ㅜ


우선은 Bogofilter를 셋팅하는것으로 확정이닷!! ㅋㅋ