近年來國內各政府機關皆採用電子信箱,或民意信箱類似的服務,以供民眾利用網路來傳達對政府機關的意見或詢問,而當民眾透過電子信箱送入陳情案件時,需經過人工分類方可將民眾的意見送至業務所屬的承辦機關辦理,在案件日益增加的情形下,完全仰賴人工分案的處理,將顯得非常沒有效率,所以我們希望可以利用機器自動分類的方式,輔助人工作業,以提高案件處理效率。為了建立一個適合本研究的分類機制,我們利用各種不同方法的組合,希望歸納出一個最佳的分類模型以用於未來對未分類案件的分類處理。
本研究利用文件分類學習程序來建立一個案件分類學習模型,利用民眾送入的中文己知分類的案件來做為訓練案件資料。在文件分類學習的三個主要階段中的每個階段,本研究皆採用兩種方法來進行效能的評估,在特徵值萃取及挑選階段中,將案件經中研院中文斷詞系統斷詞後,利用x2取最大值法及加權平均法來挑選特徵值集合,在案件表示階段分別以TFxIDF及Binary來表示,而在歸納處理階段則採用決策樹及SVM歸納法來分別進行分類分析並產出分類模型。實證結果顯示特徵值挑選階段使用x2取最大值、案件表示階段以Binary為表示法,歸納處理階段採用SVM為一最佳的分類預測模型,可獲得77.28%的辨識正確率,而召回率及精確率也同樣有大於77%的成效,顯示此案件分類模型能有效的預測案件所屬類別,具有實務應用價值。
|