在作者歸屬的研究中,語言特徵的選擇一直是很重要的一環,因為會反映到整個預測結果表現。大多數常用的語言特徵雖然在分類上表現優異,像是高頻詞彙、n-grams、及標點符號等,但這些語言特徵內的詞組卻無法解釋分類間的因果關係及相互差異。為了解決這問題,本論文提出詞性組合、否定程度組合及情態詞組合共3種具有語言學意義的語言特徵作為輔助驗證,並以雷震這位作者的文本為基準,探討在「同主題不同作者」及「同作者不同主題」兩個研究方向上是否適用。本論文將會使用隨機森林演算法建立分類模型,使用OOB錯誤率評估分類模型分類表現,並透過重要特徵數值找出各詞組作為決策點的權重。最後希望能從分類規則中,找出不同作者以及不同類型間語言特徵的獨特性詞組並做解釋。In the study of authorship attribution, the choice of language features have always been a very important part because it reflects the performance of the whole prediction. Most of the commonly used language features are excellent in classification, such as word frequencies, n-grams, and punctuation, but the phrases within these language features can not explain the causal relationship between categories and the differences betw...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
两个实验探讨句法和语义在汉语简单句加工中的作用及其相互关系。实验一采用施事判断任务,发现句法作用与语义可逆性的作用都很显著;实验二采用快速句子判断任务,发现句法作用是主要的,语义可逆性无显著作用;两个...
神奈川県茅ヶ崎市 中国大陸から漢字・漢文が日本に渡来してきたことは、わが言語・文学・思想などにはかりしれないほどの影響を与えた。西欧文化の洗礼を受ける以前のわが国の精神生活・社会生活を考えるうえに漢籍...
基于自建的香港当代社会生活口译语料库,本文考察Laviosa(1998)提出的译文词汇特征是否在口译语料库中有所体现并解释其原因。研究发现,口译译文中高频词出现的比例高于低频词,且词汇密度要比原生英语...
本稿は、異なる言語の間に見られる〈相対性〉(relativity) を問題にしており、即ち、同じ事態であってもそれを言語化する際、言語によって差があり得るという認識に立って、異言語間の表現構造を比較し...
本稿では「日中対照コーパス」の原文が中国語である文学作品から仮定条件を表す代表的な“如果”構文をピックアップし,日本語との構文形式の比較を行うことによって,両言語の共通点と相違点を見極めた。本稿ではデ...
汉学是一门历史悠久的学科,长久以来以稳步的速度发展着,但直到近些年才得到中国学者的特别重视。在这种背景下,过去一些不为人知或是不够重视的文献才得以重新现世。其中,西方汉学特别是欧洲汉学,其研究兼具广度...
采用两个测试 ,多媒语言理解测试和文章的阅读理解测试 ,分别测量了大学生的汉语综合理解能力和阅读理解能力。多媒语言理解测试根据Gernsbacher的多媒理解量表编制而成。文章的阅读理解测试是莫雷编制...
語音合成系統近年發展主要可分為兩大類,第一為串接式的語音合成,從錄製好的語音資料庫中挑選所需音訊片段,串接而成所需之語音。第二則是統計模型式的語音合成,不同於前者,此方式會以語音資料庫訓練聲學模型,並...
[[abstract]]世上任何語言皆非自然產物,皆需歷經社會團體制約,並於歷史長河承先啟後,且有先賢著書立論載於史冊,深邃人文化成。儘管吾國古今閣樓藏書汗牛充棟,為何卻不見與「讀話」相關經籍? ...
采用两个测试 ,多媒语言理解测试和文章的阅读理解测试 ,分别测量了大学生的汉语综合理解能力和阅读理解能力。多媒语言理解测试根据Gernsbacher的多媒理解量表编制而成。文章的阅读理解测试是莫雷编制...
[[abstract]]本研究目的在探討以中文為母語之英語學習者其英語增強搭配詞使用及母語影響。在第一部分的分析中,研究者使用英國國家語料庫(BNC)及中國學習者英語語料庫(CLEC)比較英語母語者與...
语义问题一直是自然语言处理领域的一个难点。近年来,随着深度学习技术的逐渐兴起,越来越多的研究采用深度神经网络对语义相关的问题进行建模。在语义层面上开展研究,能更为有效地解决一些传统统计方法所难以解决的...
通过大型语料库对<汉语水平词汇与汉字等级大纲>中的离合词逐个进行考察,得到大量有效数据,发现了离合词家族的一些词汇语义规律.离合词中,大部分是表示人的普通的日常生活行为的词.统计发现,离合...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
两个实验探讨句法和语义在汉语简单句加工中的作用及其相互关系。实验一采用施事判断任务,发现句法作用与语义可逆性的作用都很显著;实验二采用快速句子判断任务,发现句法作用是主要的,语义可逆性无显著作用;两个...
神奈川県茅ヶ崎市 中国大陸から漢字・漢文が日本に渡来してきたことは、わが言語・文学・思想などにはかりしれないほどの影響を与えた。西欧文化の洗礼を受ける以前のわが国の精神生活・社会生活を考えるうえに漢籍...
基于自建的香港当代社会生活口译语料库,本文考察Laviosa(1998)提出的译文词汇特征是否在口译语料库中有所体现并解释其原因。研究发现,口译译文中高频词出现的比例高于低频词,且词汇密度要比原生英语...
本稿は、異なる言語の間に見られる〈相対性〉(relativity) を問題にしており、即ち、同じ事態であってもそれを言語化する際、言語によって差があり得るという認識に立って、異言語間の表現構造を比較し...
本稿では「日中対照コーパス」の原文が中国語である文学作品から仮定条件を表す代表的な“如果”構文をピックアップし,日本語との構文形式の比較を行うことによって,両言語の共通点と相違点を見極めた。本稿ではデ...
汉学是一门历史悠久的学科,长久以来以稳步的速度发展着,但直到近些年才得到中国学者的特别重视。在这种背景下,过去一些不为人知或是不够重视的文献才得以重新现世。其中,西方汉学特别是欧洲汉学,其研究兼具广度...
采用两个测试 ,多媒语言理解测试和文章的阅读理解测试 ,分别测量了大学生的汉语综合理解能力和阅读理解能力。多媒语言理解测试根据Gernsbacher的多媒理解量表编制而成。文章的阅读理解测试是莫雷编制...
語音合成系統近年發展主要可分為兩大類,第一為串接式的語音合成,從錄製好的語音資料庫中挑選所需音訊片段,串接而成所需之語音。第二則是統計模型式的語音合成,不同於前者,此方式會以語音資料庫訓練聲學模型,並...
[[abstract]]世上任何語言皆非自然產物,皆需歷經社會團體制約,並於歷史長河承先啟後,且有先賢著書立論載於史冊,深邃人文化成。儘管吾國古今閣樓藏書汗牛充棟,為何卻不見與「讀話」相關經籍? ...
采用两个测试 ,多媒语言理解测试和文章的阅读理解测试 ,分别测量了大学生的汉语综合理解能力和阅读理解能力。多媒语言理解测试根据Gernsbacher的多媒理解量表编制而成。文章的阅读理解测试是莫雷编制...
[[abstract]]本研究目的在探討以中文為母語之英語學習者其英語增強搭配詞使用及母語影響。在第一部分的分析中,研究者使用英國國家語料庫(BNC)及中國學習者英語語料庫(CLEC)比較英語母語者與...
语义问题一直是自然语言处理领域的一个难点。近年来,随着深度学习技术的逐渐兴起,越来越多的研究采用深度神经网络对语义相关的问题进行建模。在语义层面上开展研究,能更为有效地解决一些传统统计方法所难以解决的...
通过大型语料库对<汉语水平词汇与汉字等级大纲>中的离合词逐个进行考察,得到大量有效数据,发现了离合词家族的一些词汇语义规律.离合词中,大部分是表示人的普通的日常生活行为的词.统计发现,离合...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
[[abstract]]本論文旨在探討台灣一般成人的國語語音變體出現率,並研究不同人口學變項對國語語音變體出現率的影響。本研究自台灣華語言語資料集(宋淨純,2014;張雅萍,2014;Chen, Ch...
两个实验探讨句法和语义在汉语简单句加工中的作用及其相互关系。实验一采用施事判断任务,发现句法作用与语义可逆性的作用都很显著;实验二采用快速句子判断任务,发现句法作用是主要的,语义可逆性无显著作用;两个...