題目(中) |
文件探勘技術中字詞擴展之研究 |
題目(英) |
Investigations of Term Expansion on Text
Mining Techniques |
研究生 |
楊錦生(碩士學位) |
指導教授 |
魏志平 |
摘要(中) |
近來電腦及網路科技的快速發展促成了全球網路的連結,也使得線上文件快速地成長及累積。這些在網路上或組織內所累積下來的文件可能含有許多組織競爭所需的知識,有效的文件管理(Document
Management)技術(包括資訊檢索(Information Retrieval)、資訊過濾(Information Filtering)、文字探勘(Text
Mining)等)可協助組織有效的運用這些文件。然而,文件管理研究面臨一項挑戰性的議題,即所謂的字詞使用差異(Word Mismatch)。目前字詞使用差異的研究主要是在資訊檢索的研究領域,並以字詞擴展(Term
Expansion)的技術來解決這個問題,然而,在文件探勘的文獻中,這個問題卻極少被處理與解決。因此,本論文旨在對文件探勘技術中字詞擴展之使用進行研究,並特別以文件分類(Text
Categorization)、文件分群(Document Clustering)以及事件偵測(Event Detection)這三類文件探勘技術為研究對象,發展這三類技術所需之字詞擴展技術。根據實證評估的結果,當使用相關係數(Correlation
Coefficient)作為特徵選擇(Feature Selection)方式時,字詞擴展技術增加了的文件分類之效能。在文件分群方面,使用字詞擴展之文件分群技術並未改善分群之效能,但在Specificity的衡量上,使用字詞擴展技術的結果普遍明顯地優於傳統文件分群技術。最後,使用字詞擴展來協助事件偵測則導致了偵測效果的降低。 |
摘要(英) |
想對此論文更加了解者可連至此網址:http://etd.lib.nsysu.edu.tw/ETD-db/ETD-search-c/view_etd?URN=etd-0802102-142205 |
論文下載 |
本篇論文開放權限為校內公開 校外一年後公開
為顧及論文版權 故不提供下載連結 |