在中文語言學的範疇內,中文詞彙字可分類成實詞與虛詞兩類。虛詞不能獨立構成句子,只能配合實詞以完成語法結構。因此虛詞的用法常成為語言學家的研究對象以及判斷語句結構的重要依據之一。發展自動判斷虛詞的工具,是中文自然語言處理一項重要的議題。在本論文中所談之中文停用字的判斷,目的即為中文單字虛字的判斷。 本論文提出一個自動判斷虛詞的方法,結合單類支持向量機與二元分類支持向量機,運用人工判斷的資料來訓練機器學習核心,建立自動判斷中文虛字的工具。針對每個中文字建立四十五個特徵參數。不論單類支持向量機與二元分類支持向量機,以及特徵選取的工具的實作上皆應用LIBSVM工具。 實驗語料庫為CBETA佛典語料庫中法華部類中的十六部經,取其中的《薩曇分陀利經》與《佛說法華三昧經》兩部經文中取得訓練樣本及測試樣本來進行實驗。訓練樣本共3660個字,其中正例資料為289字,另外測試樣本共3228個字,其中正例資料為223個字。實驗結果顯示,本論文所提出的方法,在參數最佳化之後,可達到精確率0.947且召回率0.920,然而在獨立測試實驗的精確率為0.311且召回率為0.318。 由於獨立測試的結果其正確率較差,本論文亦探討造成此結果的因素。分析其可能因素有二: 一為訓練資料與測試資料間朝代不同以致用字遣詞與文體差異,二為訓練資料數量不足。In Chinese linguistics studies, the Chinese vocabulary can be classified as content words and function words. The role of function words is attached or connected. Function words can no...