垃圾郵件帶來的威脅日趨嚴重,顯示出垃圾郵件過濾技術的價值所在。現今的過濾技術多為機器學習與資料探勘的結合,這些技術強調能達到極高的準確度,但其誤判率卻不一定很低;在實際狀況中,誤判率造成的損失通常都是難以彌補的。許多垃圾郵件防治方案只是針對某些現行的技術提出改善,而混用多種演算法的研究又相當少見,於是本研究提出了區域聯防的架構,結合約略集合理論、基因演算法與XCS分類元系統,期望能廣為散播關於垃圾郵件的即時資訊,使郵件伺服器得以聯手防堵氾濫成災的垃圾郵件。
約略集合理論在處理不精確也不完整的資料方面有卓越的能耐,並且是有助於交換分享的規則導向演算法;又因約略集合理論計算最佳reduct組合屬於NP-hard的問題,所以需藉助基因演算法可在大量資料中快速搜尋、比對、演化出最佳解的特性,產生垃圾郵件的過濾規則。XCS中的強化學習能幫助各個郵件伺服器了解最適合自身的郵件分類準則。以區域聯防為基礎的垃圾郵件過濾成果,經過一些統計方法評估後證實有不錯的表現,並有以下兩個結論:
(1)從別台郵件伺服器交換來的過濾規則,確實對阻擋掉更多的垃圾郵件有貢獻。
(2)混用多種演算法的垃圾郵件防治方案能同時改善準確度與誤判率。
|