研究成果--92級資管所碩士班論文簡介
個人化文件分群:技術發展與實證評估
題目(中)

個人化文件分群:技術發展與實證評估

題目(英) Personalized Document Clustering: Technique Development and Empirical Evaluation
研究生 吳佳真(碩士學位)
指導教授 魏志平
摘要(中)

  

        隨著資訊科技與網際網路的發展,使得人們可以容易地從網路上獲取大量所需資訊(通常為文字格式的文件),因此,需要管理的電子化文件也與日遽增。在文件管理方面,傳統上人們習慣用類別的概念來整理其檔案或文件。然而,面對越來越多的電子化文件,以手動方式來管理文件類別,將耗費使用者相當多的時間、精神與體力。因此,一個能夠自動化地進行文件分群管理的工具對許多使用者來說是相當需要的。此外,每個人的分類標準與偏好往往是不盡相同的,基於自動化文件分群的需求以及個人化概念的重要性,我們提出「個人化文件分群」的技術來滿足個人在自動化文件管理上需求。

 

        為達成個人化文件分群的目的,本論文提出採用個人的部份分群(partial clustering)資訊當成擷取使用者分類偏好的來源,其中,個人的部份分群指的是由使用者提供對部分文件所作的分群結果。本研究針對文件表達方式(document representation)提出feature refinement與feature weighting二種方法,同時對分群過程提出pre-cluster-based HAC與atomic-based HAC二種方法。在以傳統的文件分群技術當作是比較的基準中,實證結果顯示本論文所提出的四種個人化文件分群技術比傳統的文件分群技術更能夠接近個人分群的結果。此外,在提出的四種個人化文件分群技術中,pre-cluster-based HAC比atomic-based HAC有較優異的分群表現;另一方面,以feature weighting方法進行的文件分群結果優於feature refinement的文件分群結果。

 

摘要(英)

想對此論文更加了解者可連至此網址:http://etd.lib.nsysu.edu.tw/ETD-db/ETD-search-c/view_etd?URN=etd-0814103-140550

論文下載 本篇論文開放權限為校內立即公開,校外一年後公開
回電子報首頁

國立中山大學資管系 版權所有
Copyright 2003 Department of Information Management, NSYSU.

歡迎轉載 但請尊重智慧財產權 註明出處