摘要(中) |
綜合法則歸納系統之延伸研究
知識淬取一直都是專家系統 (Expert System, ES)
設計的瓶頸,而專家系統中的知識單元更是由這些被淬取的知識所組成,因此知識模型的良寙直接影響專家系統表現的優劣。克服該瓶頸的方法之一,便是自資料樣本中推論出專家法則,也因此有眾多學者專家建議使用有效的分析技術,淬取出專家知識法則
(D. Michie, 1983)。在許多的知識模型 (Pattern) 淬取技術中,較常被使用的分類與預測
(Classification and Prediction) 淬取技術包含ID3、C4.5、類神經網路
(Artificial Neural Network, ANN)…等技術;但這些技術通常利用相同的標準處理類別與非類別
(例:數值資料) 特徵值 (Attribute),因此可能因為資料轉換的偏誤導致分類知識模型產生誤差。
為使資料探勘技術能同時以不同之方式,處理類別與非類別特徵值 (Attribute),Liang於1992年提出『綜合法則歸納系統』
(Composite Rule Induction System, CRIS),利用Tabular
Approach與Statistical
Elaboration的方式,分別分析Qualitative與Quantitative之特徵值以產生較精確之分類法則,同時利用機率運算
(Bayesian Theorem)
將分類法則與事件機率間之關聯被清楚地呈現。但該方法僅能處理二元類別之分析,且建立之歸納法則亦無法明確呈現自變項特徵值
(Independent Attribute) 分類鑑別效力。
故本研究提出『複類別特徵值判定』、『特徵值效力檢定』及『假說法則產生限制』等三個方法,改善CRIS技術僅能處理二元類別分析的限制,並呈現出分類法則的鑑別效力。且為了驗證改良CRIS方法之可行性,本研究建立一套簡單的CRIS系統,並使用Cytel
Software Corporation開發的XLMiner3做為標竿測試 (Benchmark Testing)
對照組,進行各分類技術之『執行效率』、『分類模型錯誤率』及『分類模型預測準確力』等績效之測試比較。
|