文件分群係根據一群文件的內容自動將其組織成有意義的類別。現有的文件分群技術大多只處理單語文件,也就是所有文件只以單一種語言所寫成。然而隨著國際化的趨勢以及網際網路科技的發展,組織或個人常常會產生獲取進而儲存不同語言之文件,也因此產生了對多語文件自動分群技術的需要。此技術的重要性及需要性激發了本研究的動機,於是我們設計了一個以字詞翻譯為基礎之多語文件自動分群技術。我們的實證評估以
cluster recall 與cluster precision 來衡量分群效果,結果顯示所提出之多語文件分群技術達到令人滿意的效果。 |