跨語言文件自動分類之研究:以翻譯訓練文集建立跨語言分類之方法

系所新聞

研究成果

學術活動

研究成果

研究計畫

海外研習

校友園地

讀書會

新知分享

生活雜感

生活花絮

人才交流

跨語言文件自動分類之研究:以翻譯訓練文集建立跨語言分類之方法

碩士班93 級校友許凱翔

題目(中)	跨語言文件自動分類之研究:以翻譯訓練文集建立跨語言分類之方法
題目(英)	Cross-Lingual Text Categorization: A Training-corpus Translation-based Approach
研究生	許凱翔（碩士學位）
指導教授	魏志平
摘要(中)	文件分類技術可以自動化的從已經分類好的訓練文件中學習出分類模式，藉由所學出的分類基準，將未分類的文件歸類到正確的類別之中。現存的文件分類技術只能處理單語言的文件，也就是不論是訓練文件以及測試文件中的所有文件必須是以同一種語言撰寫而成。然而因為網際網路的發達，以及受到全球企業環境的影響，不論是個人與組織都會使用不同語言的文件，進而需要對其建檔與歸類，因此跨語言文件分類就有其需求存在。在現存跨語文件分類的研究中，都是採用翻譯預測端文件之策略，因此無法系統化的降低翻譯帶來的雜訊，也局限了跨語分類之效能。為了解決翻譯預測端文件之策略的侷限性，本研究提出翻譯訓練端文件的跨語言文件分類之方法，透過分類器具有的一般化能力以降低翻譯雜訊。實證結果顯示，本研究所提出的跨語文件分類技術有效的降低翻譯雜訊帶來的影響，也較現有的技術達到更高的分類準確度。
摘要(英)	想對此論文更加了解者可連至此網址： http://etd.lib.nsysu.edu.tw/ETD-db/ETD-search-c/view_etd?URN=etd-0721105-122705
論文下載	本篇論文開放權限為校內一年後公開，校外永不公開

　

　

　

　

　

　

　

　

　

　

本期電子報

資管系首頁　

Copyright 2006 Department of Information Management, NSYSU.
國立中山大學資管系‧版權所有‧歡迎轉載‧但請尊重智慧財產權‧註明出處