系 所新聞 研 究成果 學 術活動

研究成果

研 究計畫 海 外研習 校 友園地 讀 書會 新 知分享 生 活雜感 生 活花絮 人 才交流

跨語言文件自動分類之研究:以翻譯訓練文集建立跨語言分類之方 法

 碩士班93 級校友許凱翔

題 目(中) 跨 語言文件自動分類之研究:以翻譯訓練文集建立跨語言分類之方法
題 目(英) Cross-Lingual Text Categorization: A Training-corpus Translation-based Approach
研 究生 許 凱翔(碩士學位)
指導 教授 魏 志平
摘 要(中)

         

        文件分類技術可以自動化的從已經分類好的訓練文件中學習出分類模式,藉由所學出的分類基準,將未分類的文件歸類到正確的類別之中。現存的文件分類技術只能 處理單語言的文件,也就是不論是訓練文件以及測試文件中的所有文件必須是以同一種語言撰寫而成。然而因為網際網路的發達,以及受到全球企業環境的影響,不 論是個人與組織都會使用不同語言的文件,進而需要對其建檔與歸類,因此跨語言文件分類就有其需求存在。在現存跨語文件分類的研究中,都是採用翻譯預測端文 件之策略,因此無法系統化的降低翻譯帶來的雜訊,也局限了跨語分類之效能。為了解決翻譯預測端文件之策略的侷限性,本研究提出翻譯訓練端文件的跨語言文件 分類之方法,透過分類器具有的一般化能力以降低翻譯雜訊。實證結果顯示,本研究所提出的跨語文件分類技術有效的降低翻譯雜訊帶來的影響,也較現有的技術達 到更高的分類準確度。

 

摘 要(英)

想 對此論文更加了解者可連至此網址: http://etd.lib.nsysu.edu.tw/ETD-db/ETD-search-c/view_etd?URN=etd-0721105-122705

論 文下載 本篇論文開放權限為 校內一年後公開,校外永不公開
 
 

 

 

 

 

 

 

 

 

 

本期電子報

資 管系首頁 

Copyright 2006 Department of Information Management, NSYSU.  
國立中山大學資管系•版權所有•歡迎轉載•但請尊重智慧財產權•註明出處