本論文主要在探討如何建立一個有效率的相連音國語詞彙辨識系統之參考 樣本空間,我們利用中文語音的特性,採單音節的辨識方式來做詞彙的辨 識,同時我們也利用欲辨識詞彙集合中,每一單音節間相似程度不同的差 異,發展出音節測距函數,根據此函數的測距我們將參考樣本空間做適當 的分類,並將決策樹的樹狀結構運用在分類上,因此我們也設計出可以依 據欲辨識詞彙集合組成的不同而能自動產生一棵有效率的辨識決策樹的方 法。實驗分成語者獨立和語者相關兩部份,辨識詞彙集合則以台灣區26個 縣市地名及常用的30個中文名詞為測試語料,在語者獨立實驗上我們達 到90﹪的辨識率,在語者相關實驗上我們則達到95﹪的辨識率。The major goal of this thesis is to discuss how to build an efficient recognition reference space for the small Chinese vocabulary set. On the basis of similarity of Chinese isolated syllable, we develop a "distance function" by which we can properly classify the r...
词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用.该文研究了基于大规模语料库的汉语词义相似度计算方法,...
漢字をその部品と位置関係で表現する「構成読み」を,JIS第1・第2水準の漢字を対象に開発した.この構成読みで漢字の形を正確に想起できることを検証するため,晴眼者と視覚障害者を対象に実験を行った.その結...
本文针对“把”字句在机器翻译中的困难,探索一种规则和统计相结合的“把”字句的自动释义和句式变换的方法。具体的计算步骤为:(1)根据“把”字句与其他句式的变换关系,我们将“把”字句分为不同的小类,并总结...
[[abstract]]學習華語文需具備斷詞的能力,由於華語句子的書寫形式不像拼音文字的書寫形式會使用空格,因此,華語句子中的詞彙並不具凸顯性,而造成華語學習者理解詞彙的困難。 本研究旨在建置一華語常...
漢語分類詞數量之歧異現象起因於未有一套共同界定分類詞之準則。因此,本篇論文採用四個以語言學為基礎之準則重新檢視漢語分類詞,並在眾多漢語分類詞分類中,採用五個語言學代表性研究提出之漢語分類詞分類為本篇語...
本文提出了"主观词"的概念,并探讨主观词存在的心理现实性以及主观词的加工特征。包括3项研究:研究1考察了普通大学生对双字结构的词汇辨别情况,发现他们倾向于将短语和词主观判断为词,即...
文本分类作为一项重要的数据挖掘技术,在国内广泛地应用于词义辨析、文本组织与管理、信息过滤、Web网页文档分类、数字图书馆、信息检索等众多领域,因此提高文本分类的精确度和效率有重要的研究意义。文本分类主...
本文提出以規則法與相似法將未知動詞自動分類至中研院詞庫小組(1993)的動詞分類標記上。規則法中的規則從訓練語料中訓練出,並加上未知動詞重疊的規律,包含率約二成五,正確率約86.86%∼91.32%。...
该文对比了句本位语法图解树库与中文信息处理现行词法规范在分词单位和词类标注两方面的差异,指出目前自动词法分析与句法分析的若干脱节之处,梳理了图解树库中关于临时造词、惯用语等特殊结构的标注策略和语言学理...
本文探讨了一个词汇学习任务——识别任务在对外汉语中对于情境专用语(situation-bound utterances,简称SBU)记忆的有效性。参加实验的为本科二至三年级的意大利汉语学习者,分为实验...
本篇論文主要在探討如何利用近期發展之深度學習技術在於中文句子分散式表示法學習。近期深度學習受到極大的注目,相關技術也隨之蓬勃發展。然而相關的分散式表示方式,大多以英文為主的其他印歐語系作為主要的衡量對...
大量的认知科学研究表明,词在阅读认知加工过程中起着非常重要的作用。因此在阅读中一个重要的过程就是把词从文本中切分出来。有别于英文等拼音文字,中文文本的词之间没有空格分隔。在没有空格辅助的条件下,中文阅...
语汇、语义系统的核心是字义关系的研究,本文结合上下位概念的关系讨论义场、义素的 结构及其在汉语语汇系统中的反映。根据形声字提供的线索,汉语早期对现实的编码以‘声” 义为核心,组成字族;“声”体现上位概...
本論文遵循通用的智慧教學系統架構建立一個系統平台以研究自然語言對話為基礎的電腦輔助教學。潛在語意分析(LSA)技術是一種用概念比對方式來模擬人類在高等認知的知識表現統計模型。此技術雖在許多領域有顯著的...
汉语隐喻计算是中文信息处理中的棘手难题之一.已有的隐喻识别研究多以人工方式分析和抽取隐喻特征,存在着主观性强、难以扩充的缺点,并且对于专业背景知识要求比较严格.本文基于大规模语料库的机器学习,利用最大...
词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用.该文研究了基于大规模语料库的汉语词义相似度计算方法,...
漢字をその部品と位置関係で表現する「構成読み」を,JIS第1・第2水準の漢字を対象に開発した.この構成読みで漢字の形を正確に想起できることを検証するため,晴眼者と視覚障害者を対象に実験を行った.その結...
本文针对“把”字句在机器翻译中的困难,探索一种规则和统计相结合的“把”字句的自动释义和句式变换的方法。具体的计算步骤为:(1)根据“把”字句与其他句式的变换关系,我们将“把”字句分为不同的小类,并总结...
[[abstract]]學習華語文需具備斷詞的能力,由於華語句子的書寫形式不像拼音文字的書寫形式會使用空格,因此,華語句子中的詞彙並不具凸顯性,而造成華語學習者理解詞彙的困難。 本研究旨在建置一華語常...
漢語分類詞數量之歧異現象起因於未有一套共同界定分類詞之準則。因此,本篇論文採用四個以語言學為基礎之準則重新檢視漢語分類詞,並在眾多漢語分類詞分類中,採用五個語言學代表性研究提出之漢語分類詞分類為本篇語...
本文提出了"主观词"的概念,并探讨主观词存在的心理现实性以及主观词的加工特征。包括3项研究:研究1考察了普通大学生对双字结构的词汇辨别情况,发现他们倾向于将短语和词主观判断为词,即...
文本分类作为一项重要的数据挖掘技术,在国内广泛地应用于词义辨析、文本组织与管理、信息过滤、Web网页文档分类、数字图书馆、信息检索等众多领域,因此提高文本分类的精确度和效率有重要的研究意义。文本分类主...
本文提出以規則法與相似法將未知動詞自動分類至中研院詞庫小組(1993)的動詞分類標記上。規則法中的規則從訓練語料中訓練出,並加上未知動詞重疊的規律,包含率約二成五,正確率約86.86%∼91.32%。...
该文对比了句本位语法图解树库与中文信息处理现行词法规范在分词单位和词类标注两方面的差异,指出目前自动词法分析与句法分析的若干脱节之处,梳理了图解树库中关于临时造词、惯用语等特殊结构的标注策略和语言学理...
本文探讨了一个词汇学习任务——识别任务在对外汉语中对于情境专用语(situation-bound utterances,简称SBU)记忆的有效性。参加实验的为本科二至三年级的意大利汉语学习者,分为实验...
本篇論文主要在探討如何利用近期發展之深度學習技術在於中文句子分散式表示法學習。近期深度學習受到極大的注目,相關技術也隨之蓬勃發展。然而相關的分散式表示方式,大多以英文為主的其他印歐語系作為主要的衡量對...
大量的认知科学研究表明,词在阅读认知加工过程中起着非常重要的作用。因此在阅读中一个重要的过程就是把词从文本中切分出来。有别于英文等拼音文字,中文文本的词之间没有空格分隔。在没有空格辅助的条件下,中文阅...
语汇、语义系统的核心是字义关系的研究,本文结合上下位概念的关系讨论义场、义素的 结构及其在汉语语汇系统中的反映。根据形声字提供的线索,汉语早期对现实的编码以‘声” 义为核心,组成字族;“声”体现上位概...
本論文遵循通用的智慧教學系統架構建立一個系統平台以研究自然語言對話為基礎的電腦輔助教學。潛在語意分析(LSA)技術是一種用概念比對方式來模擬人類在高等認知的知識表現統計模型。此技術雖在許多領域有顯著的...
汉语隐喻计算是中文信息处理中的棘手难题之一.已有的隐喻识别研究多以人工方式分析和抽取隐喻特征,存在着主观性强、难以扩充的缺点,并且对于专业背景知识要求比较严格.本文基于大规模语料库的机器学习,利用最大...
词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用.该文研究了基于大规模语料库的汉语词义相似度计算方法,...
漢字をその部品と位置関係で表現する「構成読み」を,JIS第1・第2水準の漢字を対象に開発した.この構成読みで漢字の形を正確に想起できることを検証するため,晴眼者と視覚障害者を対象に実験を行った.その結...
本文针对“把”字句在机器翻译中的困难,探索一种规则和统计相结合的“把”字句的自动释义和句式变换的方法。具体的计算步骤为:(1)根据“把”字句与其他句式的变换关系,我们将“把”字句分为不同的小类,并总结...