本文讨论怎样借助计算机及相关的测试程序,来为汉语词类的划分提供一种方便和快速的途径.着重展示一种新的用计算机辅助发现词类知识的方法:把划分词类的语法功能标准组织成一套量表,再编制为软件程序,最终形成网络版词类测试平台.详细介绍了我们怎样基于<汉语词类划分手册>,设计并编程实现了网络版汉语词类测试平台.最后,分析了目前测试平台仍需改进的地方,并提出了初步的解决方案.教育部人文社会科学重点研究基地重大研究项目的资助中文核心期刊要目总览(PKU)中国社会科学引文索引(CSSCI)0283-9
采用两个测试 ,多媒语言理解测试和文章的阅读理解测试 ,分别测量了大学生的汉语综合理解能力和阅读理解能力。多媒语言理解测试根据Gernsbacher的多媒理解量表编制而成。文章的阅读理解测试是莫雷编制...
中文文本正则化是把非汉字字符串转化为汉字串以确定其读音的过程.该工作的难点:一是正则化对象--非汉字串形式复杂多样,难于归纳;二是非汉字串有歧义,需要消歧处理.文章引入非标准词的概念对非汉字串进行有效...
本文考察了语篇修辞层级结构边界的韵律表现。对由20个语篇构成的语料库进行了修辞结构的层级标注和声学分析。声学参数主要采用小句边界处无声段,音高重置和边界前音节延长。研究得到以下主要结论:(1)小句边界...
词类的内在依据从本质上说不是词的分布,而是词的语法意义。因此不可能简单地根据分布上的相似性划分词类。分布是语法意义的外在表现,可以通过分布同语法意义的对应关系来推断词性,而分布同词性的对应关系可以根据...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
论述了采用统计模型进行汉语韵律层次结构分析和韵律建模的思路,将韵律结构划分为3个基本层级:韵律词,韵律短语和韵律短语群,提出了一种新的基于统计的韵律结构模型.实验表明该模型对韵律词边界的预测准确率和召...
本文旨在从句法音系接面的角度、根据大规模语料库的统计材料论证类词缀是现代汉语的一个独立的、重要的单位类别.作者发现,与词根相比,类词缀与词缀、助字一样具有单向高搭配性、结构类型个别化和类化作用的特点,...
[目的]对&quot;中文早期语言与沟通发展量表”(CCDI)进行标准化,同时了解中国婴幼儿语言发展规律.[方法]使用CCDI量表,采用父母报告形式,对1 600多例8~30月小儿的语言发展情...
在作者歸屬的研究中,語言特徵的選擇一直是很重要的一環,因為會反映到整個預測結果表現。大多數常用的語言特徵雖然在分類上表現優異,像是高頻詞彙、n-grams、及標點符號等,但這些語言特徵內的詞組卻無法解...
漢語分類詞數量之歧異現象起因於未有一套共同界定分類詞之準則。因此,本篇論文採用四個以語言學為基礎之準則重新檢視漢語分類詞,並在眾多漢語分類詞分類中,採用五個語言學代表性研究提出之漢語分類詞分類為本篇語...
本文根据现代汉语各种虚词的典型成员的语法表现来选定一组分布特征,按照它们对于相关词类的重要性、根据经验给其中的每个特征设定权值;再用每类词的非典型成员的语法表现作校验,做成一套可用以对有关的虚词进行词...
[[abstract]]世上任何語言皆非自然產物,皆需歷經社會團體制約,並於歷史長河承先啟後,且有先賢著書立論載於史冊,深邃人文化成。儘管吾國古今閣樓藏書汗牛充棟,為何卻不見與「讀話」相關經籍? ...
本論文は、The Mandarin Interlanguage Corpus (MIC) という、様々な母語話者から構成される初中級から中級までの中国語学習者の書きことばと話しことばの小規模学習コーパ...
采用两个测试 ,多媒语言理解测试和文章的阅读理解测试 ,分别测量了大学生的汉语综合理解能力和阅读理解能力。多媒语言理解测试根据Gernsbacher的多媒理解量表编制而成。文章的阅读理解测试是莫雷编制...
采用两个测试 ,多媒语言理解测试和文章的阅读理解测试 ,分别测量了大学生的汉语综合理解能力和阅读理解能力。多媒语言理解测试根据Gernsbacher的多媒理解量表编制而成。文章的阅读理解测试是莫雷编制...
中文文本正则化是把非汉字字符串转化为汉字串以确定其读音的过程.该工作的难点:一是正则化对象--非汉字串形式复杂多样,难于归纳;二是非汉字串有歧义,需要消歧处理.文章引入非标准词的概念对非汉字串进行有效...
本文考察了语篇修辞层级结构边界的韵律表现。对由20个语篇构成的语料库进行了修辞结构的层级标注和声学分析。声学参数主要采用小句边界处无声段,音高重置和边界前音节延长。研究得到以下主要结论:(1)小句边界...
词类的内在依据从本质上说不是词的分布,而是词的语法意义。因此不可能简单地根据分布上的相似性划分词类。分布是语法意义的外在表现,可以通过分布同语法意义的对应关系来推断词性,而分布同词性的对应关系可以根据...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
论述了采用统计模型进行汉语韵律层次结构分析和韵律建模的思路,将韵律结构划分为3个基本层级:韵律词,韵律短语和韵律短语群,提出了一种新的基于统计的韵律结构模型.实验表明该模型对韵律词边界的预测准确率和召...
本文旨在从句法音系接面的角度、根据大规模语料库的统计材料论证类词缀是现代汉语的一个独立的、重要的单位类别.作者发现,与词根相比,类词缀与词缀、助字一样具有单向高搭配性、结构类型个别化和类化作用的特点,...
[目的]对&quot;中文早期语言与沟通发展量表”(CCDI)进行标准化,同时了解中国婴幼儿语言发展规律.[方法]使用CCDI量表,采用父母报告形式,对1 600多例8~30月小儿的语言发展情...
在作者歸屬的研究中,語言特徵的選擇一直是很重要的一環,因為會反映到整個預測結果表現。大多數常用的語言特徵雖然在分類上表現優異,像是高頻詞彙、n-grams、及標點符號等,但這些語言特徵內的詞組卻無法解...
漢語分類詞數量之歧異現象起因於未有一套共同界定分類詞之準則。因此,本篇論文採用四個以語言學為基礎之準則重新檢視漢語分類詞,並在眾多漢語分類詞分類中,採用五個語言學代表性研究提出之漢語分類詞分類為本篇語...
本文根据现代汉语各种虚词的典型成员的语法表现来选定一组分布特征,按照它们对于相关词类的重要性、根据经验给其中的每个特征设定权值;再用每类词的非典型成员的语法表现作校验,做成一套可用以对有关的虚词进行词...
[[abstract]]世上任何語言皆非自然產物,皆需歷經社會團體制約,並於歷史長河承先啟後,且有先賢著書立論載於史冊,深邃人文化成。儘管吾國古今閣樓藏書汗牛充棟,為何卻不見與「讀話」相關經籍? ...
本論文は、The Mandarin Interlanguage Corpus (MIC) という、様々な母語話者から構成される初中級から中級までの中国語学習者の書きことばと話しことばの小規模学習コーパ...
采用两个测试 ,多媒语言理解测试和文章的阅读理解测试 ,分别测量了大学生的汉语综合理解能力和阅读理解能力。多媒语言理解测试根据Gernsbacher的多媒理解量表编制而成。文章的阅读理解测试是莫雷编制...
采用两个测试 ,多媒语言理解测试和文章的阅读理解测试 ,分别测量了大学生的汉语综合理解能力和阅读理解能力。多媒语言理解测试根据Gernsbacher的多媒理解量表编制而成。文章的阅读理解测试是莫雷编制...
中文文本正则化是把非汉字字符串转化为汉字串以确定其读音的过程.该工作的难点:一是正则化对象--非汉字串形式复杂多样,难于归纳;二是非汉字串有歧义,需要消歧处理.文章引入非标准词的概念对非汉字串进行有效...
本文考察了语篇修辞层级结构边界的韵律表现。对由20个语篇构成的语料库进行了修辞结构的层级标注和声学分析。声学参数主要采用小句边界处无声段,音高重置和边界前音节延长。研究得到以下主要结论:(1)小句边界...