作者 主題: 關於 spamassassin 不能自動學習問題(郵件表頭訊息)?  (閱讀 4202 次)

0 會員 與 1 訪客 正在閱讀本文。

joe0120

  • 活潑的大學生
  • ***
  • 文章數: 241
    • 檢視個人資料
郵件表頭內容:
Return-Path: <patria_daisyzq@jhancock.com>
X-Original-To: mis@abc.test.com.tw
Delivered-To: mis@abc.test.com.tw
Received: from localhost (localhost [127.0.0.1])
   by abc.test.com.tw (Postfix) with ESMTP id 19B115C082;
   Mon,  1 Jun 2009 07:02:55 +0800 (CST)
Received: from abc.test.com.tw ([127.0.0.1])
   by localhost (abc.test.com.tw [127.0.0.1]) (amavisd-new, port 10024)
   with ESMTP id gEBQwKSOAmsH; Mon,  1 Jun 2009 07:02:54 +0800 (CST)
Received: by abc.test.com.tw (Postfix, from userid 5001)
   id DE8AC5C081; Mon,  1 Jun 2009 07:02:54 +0800 (CST)
X-Spam-Checker-Version: SpamAssassin 3.2.4 (2008-01-01) on abc.test.com.tw
X-Spam-Level:
X-Spam-Status: No, score=-0.6 required=2.0 tests=BAYES_00,
   RCVD_IN_BL_SPAMCOP_NET autolearn=no version=3.2.4

Received: from wbizlnuw (auh-as30184.alshamil.net.ae [217.164.69.212])
   by abc.test.com.tw (Postfix) with ESMTP id 351A15C082;
   Mon,  1 Jun 2009 07:02:27 +0800 (CST)
Subject: BIG SAVING -> $1.87 forCializ, $1.20 forViagra, Cheap & Big Discount CanadaDrugsPharmacy which serves over 150,000 customers whad 912
Date: Sun, 31 May 2009 15:04:40 -0700
To: <mis@twowin.com.tw>
X-Sender: <patria_daisyzq@jhancock.com>
Sender: <patria_daisyzq@jhancock.com>
From: "Patria Daisy" <patria_daisyzq@jhancock.com>
Message-ID: <1243807480.8621@jhancock.com>
Reply-To: "Patria Daisy" <patria_daisyzq@jhancock.com>
In-Reply-To: <15c901c9e1cc$bfb3efa5$b73adacd@t0d3bp2>
Content-Type: text/plain;
   charset="iso-8859-2"
Content-Transfer-Encoding: 8bit

請教關於 spamassassin 自動學習問題
1、這是一封郵件郵件,被 Microsoft outlook 2003 過濾為垃圾郵件,在郵件主機上有設定每30分鐘執行如下指令
/usr/bin/sa-learn --showdots --spam --mbox /var/spool/mail/spam
/usr/bin/sa-learn --showdots --ham  --mbox /var/spool/mail/nospam
當我收下該郵件時,我也手動寄給 spam 該帳號,但還是每次都收到相同垃圾郵件

2、如郵件表頭裡的autolearn=no (紅色字),是不是表示 spamassassin 的自動學習機制沒有啟動呢,其設定檔內容如下:

rewrite_header Subject *****SPAM*****
report_safe 0
required_score 2.0
use_bayes_rules 1
bayes_auto_learn 1 ←這行有設自動學習
skip_rbl_checks         0
use_razor2              0
use_dcc                 0
use_pyzor               0
sa_mail_body_size_limit = 153600
score HEADER_8BITS 0
score HTML_COMMENT_8BITS 0
score SUBJ_FULL_OF_8BITS 0
score UPPERCASE_25_50 0
score UPPERCASE_50_75 0
score UPPERCASE_75_100 0
header __FROM_TEATIME Received =~ /from twowin.com.tw/i
header __FROM_TEATIME_IP Received =~ /\[88\.88\.88\.20\]/
meta FROM_TEATIME_BUT_IP_ERROR (__FROM_TEATIME)
describe FROM_TEATIME_BUT_IP_ERROR From 4wei.us but ip not match
score FROM_TEATIME_BUT_IP_ERROR 8


謝"

joe0120

  • 活潑的大學生
  • ***
  • 文章數: 241
    • 檢視個人資料
補充說明
我試著把
 42 #   Bayesian classifier auto-learning (default: 1)
 43 #
 44 bayes_auto_learn 0  //改成 0

再測試,表頭內容變成如下
X-Spam-Checker-Version: SpamAssassin 3.2.4 (2008-01-01) on smtp.twowin.com.tw
X-Spam-Level:
X-Spam-Status: No, score=-100.7 required=2.0 tests=ALL_TRUSTED,AWL,BAYES_00,
   HTML_FONT_FACE_BAD,HTML_MESSAGE,HTML_OBFUSCATE_10_20,TVD_SPACE_RATIO,
   USER_IN_WHITELIST autolearn=disabled version=3.2.4

到底 spamassassin 的自動學習機制是否有起動 ? 實在很納悶.......

pippeng

  • 活潑的大學生
  • ***
  • 文章數: 329
  • 性別: 男
    • 檢視個人資料
    • IT Ranger
1.SpamAssassin 是使用貝氏演算的學習方式,他必須靠學習來成長,不是你餵他什麼他馬上就變成有為的青年給你看.
2.他很聰明同樣的事不做第2次,所以你餵一堆相同的信給他,他當然不會再去學一次.
3.我個人認為除非你專職是抓spam,不然就想開一點,或是找商業軟體或設備來抓那些殘餘的spam.
用心用心再用心

joe0120

  • 活潑的大學生
  • ***
  • 文章數: 241
    • 檢視個人資料
1.SpamAssassin 是使用貝氏演算的學習方式,他必須靠學習來成長,不是你餵他什麼他馬上就變成有為的青年給你看.
2.他很聰明同樣的事不做第2次,所以你餵一堆相同的信給他,他當然不會再去學一次.
3.我個人認為除非你專職是抓spam,不然就想開一點,或是找商業軟體或設備來抓那些殘餘的spam.

感謝指導
原因問題就是出在一直餵一推相同是沒有作用的
也知道要想開點,只是上面釘下來時,就很不是知味,所以才想有什麼方式可以處理更好的,自己也可以輕鬆點......哈~

yufeng

  • 懷疑的國中生
  • **
  • 文章數: 86
    • 檢視個人資料
感謝指導
原因問題就是出在一直餵一推相同是沒有作用的
也知道要想開點,只是上面釘下來時,就很不是知味,所以才想有什麼方式可以處理更好的,自己也可以輕鬆點......哈~

上面釘下來, 就拿報表給他看, 看看濾掉了多少垃圾!!
要不狠一點, 把它關個兩天, 那感覺就出來了.

pippeng

  • 活潑的大學生
  • ***
  • 文章數: 329
  • 性別: 男
    • 檢視個人資料
    • IT Ranger
不知道你有沒有設定RBL
設這個很有用喔
用心用心再用心

abelyang

  • 酷!學園 學長們
  • 俺是博士!
  • *****
  • 文章數: 1097
    • 檢視個人資料
bayes_auto_learn 1
bayes_auto_learn_threshold_nonspam 0
bayes_auto_learn_threshold_spam 15.0

sa 的 auto learn 並不是達到 require_hit 就 learn spam
也不是低於 require_hit 就 learn nospam