系所新聞 行政公告 校友專區 學術活動 研究成果 研究計畫 海外研習 系學會 新知分享 生活雜感 生活花絮 人才交流
混合式自動文件摘要方法 98級校友
袁立安
題目(中) 混合式自動文件摘要方法
題目(英) A hybrid approach to automatic text summarization
研究生 袁立安(碩士)
指導教授 張德民
摘要(中)

 

文件自動摘要可以有效節省使用者在閱讀大量文件時所耗費的時間,亦即摘要的目的在於從文件中萃取出原文必要、重要的文句,而不失其原意涵,以期從摘要中使用者即可瞭解文件所涵蓋的概念,幫助使用者更快速瞭解文件內容。

 

本研究提出一個文件自動摘要的方法,KCS,透過文件關鍵字詞權重的計算與字詞間關係的分析,藉以幫助挑選文件中具有涵蓋較多資訊的句子,來提升摘要的品 質。所提方法的過程可分成兩大步驟:1) 找出在文件中的重要關鍵字,使用統計方法之機率模式(K-mixture) 計算字詞權重。2)接著找出名詞與名詞、名詞與動詞之字詞關係,再藉由這些關係以距離調節找出名詞的連結強度,並據以篩選文句,來增加摘要結果的代表性。

 

本研究進行三個實驗以驗證本研究所提之方法。摘要結果利用其於文件分類上的準確度加以判斷,文件分類法則固定為天真貝氏法。實驗結果顯示K- mixture 之機率模式比一般常用統計法之TFIDF 較佳,但仍不比所選取之語言學方法(CS)為佳;但是結合K-mixture 與CS 之KCS 法,可以大幅提昇文件分類的準確度,亦即KCS 可以擷取較有代表性之文句,而其之適用性與可行性得以
驗證。

 

摘要(英)
論文下載 本篇論文開放權限為校內校外完全公開
研究成果
本期電子報
資管系首頁

Copyright 2009 Department of Information Management, NSYSU.
國立中山大學資管系‧版權所有‧歡迎轉載‧但請尊重智慧財產權‧註明出處

CSS design by gundamew@gmail.com
2009