本論文研究多語問答,擬將單語問答系統擴展到處理更多語言,也就是某一種語言的問題,不再限於根據同一語言的文件,去找出問題的答案,而是可以跨語言問答。舉例來說,給定中文問句,以及英文文件,希望找出英文文件中此問題的答案,回傳給使用者。這樣一來,可以利用到的資源較多,也能讓使用者獲得更多相關的答案。 本文將翻譯的問題,放在問句的部分,也就是去作「問句翻譯」,除了基本的查字典翻譯,我們還利用網路資源來擷取未知詞的翻譯,並從答對數、答對平均排名和查詢時間,三個方面來作效能評估。而「答案整合」的部分,則是要將多語問答系統在不同語言的文件中,找到的相同答案合併,並且重新排序輸出。 最後,我們使用NTCIR-5的CLQA task的CE -Subtasks的問題集和文件集,來作中英問答實驗,測試多語問答系統的效能。實驗結果正確率為15.33%,MRR為0.06236,相對於英文單語問答,效能減低大約三分之一。摘要 i 索引 ii 附圖目錄 iv 附表目錄 v 第1章 導論 1 1.1 研究動機 1 1.2 相關研究 1 1.2.1 問答系統 1 1.2.2 跨語言資訊檢索 2 1.3 研究目標 3 1.4 論文編排 4 第2章 多語問答系統架構 5 2.1 中文斷詞及詞性標記系統 5 2.2 資訊檢索系統 6 2.3 具名實體辨識系統 7 2.4 問答系統核心 7 第3章 問句翻譯與答案整合 9 3.1 問句翻譯 9 3.1.1 查字典 9 3.1.2 利用網路資源翻譯 10 3.2 答案整合 19 第4章 多語問答系統實驗 22 4.1 實驗資料 22 4.2 評估方式 23 4.3 多語與單語問答系統之效能 23 4.4 效能比較 25 4.5 錯誤分析 27 4.5.1 斷詞錯誤 27...