根據情境式文件分群理論,個人的文件分群行為不單純只是考量文件的屬性(包含內容),也取決於個人在什麼樣任務和情境之下進行分群。因此,有效的文件分群技術必須能夠考量使用者不同的偏好觀點,進而產生特定偏好的分群結果。偏好引導的情境式文件分群技術(PAC)支援以偏好為基礎的文件分群,並且考量使用者的分群偏好產生特定偏好的分群結果。而本文主要針對PAC探討兩個研究議題:(1)不同的字詞關係是否可以增進PAC的效能以及(2)不同的語料庫所建構出來的統計式字典是否可以增進PAC的效能。實證的結果顯示,在完整的群集標註詞(Anchoring
terms)前提下,本文所提出來的方法和PAC具有相同的分群效能,然而隨著群集標註詞(Anchoring
terms)的減少,並沒有辦法到達和PAC相同的分群效能,甚至產生較差的分群效能。實證的結果也顯示使用較大的語料庫所建構出來的統計式字典沒有辦法增進PAC的分群效能。
|