系 所新聞 研 究成果 學 術活動

研究成果

研 究計畫 海 外研習 校 友園地 讀 書會 新 知分享 生 活雜感 生 活花絮 人 才交流

以正範例與未分類範例為學習資料之混合式文件分類技術

 碩士班93級校友陳雪菁

題目(中) 以正範例與未分類範例為學習資料之混合式文件分類技術
題目(英) An Ensemble Approach for Text Categorization with Positive and Unlabeled Examples
研究生 陳雪菁(碩士學位)
指導教授 魏志平
摘 要(中)

         

        文件分類技術可以自動化的從已經分類好的訓練範例中學習出分類模式,並藉由此模式,將未分類的文件歸類到正確的類別之中。傳統二分類情況下的文件分類技術, 所需要的訓練範例必須包含正範例與負範例,然而,在很多現實情況下,取得負範例需要很昂貴的成本,相較之下,正範例與未分類範例的取得就容易許多。因此, 本研究針對現有只以正範例與未分類範例作為學習範例的演算法的限制,利用Ensemble的概念提出了一個混合式的研究架構,並以垃圾郵件過濾器作為我們 評估的例子,實證評估結果顯示,本研究確實比PNB與PEBL此兩種演算法能達到更穩定且可靠的分類結果。

 

摘 要(英)

想 對此論文更加了解者可連至此網址: http://etd.lib.nsysu.edu.tw/ETD-db/ETD-search-c/view_etd?URN=etd-0729105-110206

論 文下載 本篇論文開放權限為 校內外都一年後公開
 
 

 

 

 

 

 

 

 

 

 

本期電子報

資 管系首頁

Copyright 2006 Department of Information Management, NSYSU.  
國立中山大學資管系•版權所有•歡迎轉載•但請尊重智慧財產權•註明出處