用例ベース翻訳は,これまで,経験則にもとづく指標/基準により用例を選択してきた.しかし,経験則に頼った場合,その修正を行うのが困難であり,また,アルゴリズムが不透明になる恐れがある.そこで,本研究では用例ベース翻訳を定式化するための確率モデルを提案する.提案するモデルは,翻訳確率の最も高い用例の組み合わせを探索することで,翻訳文を生成する.さらに,本モデルは用例と入力文のコンテキストの類似度を自然に翻訳確率に取り込む拡張も可能である.実験の結果,本モデルを用いたシステムは,従来の経験則によるシステムの精度を僅かに上回り,用例ベース翻訳の透明性の高いモデル化を実現することに成功した.Example-based machine translation (EBMT) systems, so far, rely on heuristic measures in retrieving translation examples, Such a heuristic measure costs time to adjust, and might make its algorithm unclear. This paper presents a probabilistic model for EBMT. Under the proposed model, the system searches the translation example combination which has the highest probability. The proposed model clearly formalizes EBMT process. In addition, the model can na...
We present a new phrase-based con-ditional exponential family translation model for statistical mach...
Statistical machine translation is based on the idea to extract information from bilingual corpora, ...
"现代汉语词的语法属性研究"是中国国家哲学社会科学基金在"九五"期间支持的语言学科重大课题"信息处理用现代汉语...
机器翻译是自然语言处理的一个重要分支,旨在自动将源语言文本翻译为目标语言文本,并同时保留源语言文本包含的语义信息。统计机器翻译(StatisticalMachineTranslation,SMT)是当...
神奈川県茅ヶ崎市 パターン認識過程は、入力パターンの帰属するであろう候補カテゴリ候補を単一の元から成る候補カテゴリに絞っていくものである[3],[4]。 本論文では、1つのパターンφについての認識の...
Example-based machine translation (EBMT) systems, so far, rely on heuristic measures in re-trieving ...
Рассмотрены подходы вероятностного декодирования кодов с высокой плотностью контроля четности на осн...
Рассматриваются вопросы применения компьютерных технологий для исследования вероятностных и статисти...
本文综述了基于信源信道思想和基于最大熵思想的统计机器翻译方法并介绍了统计机器翻译的评测方法.基于信源信道的方法将翻译概率表示为一个语言模型和一个翻译模型.而基于最大熵的方法则是利用一系列实数值特征函数...
Показана возможность использования математической модели программно-управляемого вероятностно...
Рассмотрены функциональная схема и математическая модель программно-управляемого вероятностн...
在统计机器翻译中,基于句法的方法、基于短语的方法比基于词的方法更有效。这些方法都需要大规模的双语平行语料,然而,对于一些语言来说,仅有部分小规模的双语平行语料是可以利用的,这种数据稀疏的情况会降低统计...
48名大学生被试对20个汉语文字概率表达所代表的数值概率进行了值评定和区间评定。结果发现:(1)对同一文字概率词,汉语的数字转化值和英语的数字转化值不匹配; (2)汉语文字概率词的被试内变异比较低,大...
Рассматриваются основные положения системно-информационного похода к моделированию процесса механооб...
视觉词语的产生是基于字袋模型的图像检索中的重要一环:根据已知的视觉词典,查询图像特征被映射到词典中相应的视觉词语.提出一种新的基于空间相关性的快速视觉词语产生算法.统计视觉词典中任意两个词语在数据库中...
We present a new phrase-based con-ditional exponential family translation model for statistical mach...
Statistical machine translation is based on the idea to extract information from bilingual corpora, ...
"现代汉语词的语法属性研究"是中国国家哲学社会科学基金在"九五"期间支持的语言学科重大课题"信息处理用现代汉语...
机器翻译是自然语言处理的一个重要分支,旨在自动将源语言文本翻译为目标语言文本,并同时保留源语言文本包含的语义信息。统计机器翻译(StatisticalMachineTranslation,SMT)是当...
神奈川県茅ヶ崎市 パターン認識過程は、入力パターンの帰属するであろう候補カテゴリ候補を単一の元から成る候補カテゴリに絞っていくものである[3],[4]。 本論文では、1つのパターンφについての認識の...
Example-based machine translation (EBMT) systems, so far, rely on heuristic measures in re-trieving ...
Рассмотрены подходы вероятностного декодирования кодов с высокой плотностью контроля четности на осн...
Рассматриваются вопросы применения компьютерных технологий для исследования вероятностных и статисти...
本文综述了基于信源信道思想和基于最大熵思想的统计机器翻译方法并介绍了统计机器翻译的评测方法.基于信源信道的方法将翻译概率表示为一个语言模型和一个翻译模型.而基于最大熵的方法则是利用一系列实数值特征函数...
Показана возможность использования математической модели программно-управляемого вероятностно...
Рассмотрены функциональная схема и математическая модель программно-управляемого вероятностн...
在统计机器翻译中,基于句法的方法、基于短语的方法比基于词的方法更有效。这些方法都需要大规模的双语平行语料,然而,对于一些语言来说,仅有部分小规模的双语平行语料是可以利用的,这种数据稀疏的情况会降低统计...
48名大学生被试对20个汉语文字概率表达所代表的数值概率进行了值评定和区间评定。结果发现:(1)对同一文字概率词,汉语的数字转化值和英语的数字转化值不匹配; (2)汉语文字概率词的被试内变异比较低,大...
Рассматриваются основные положения системно-информационного похода к моделированию процесса механооб...
视觉词语的产生是基于字袋模型的图像检索中的重要一环:根据已知的视觉词典,查询图像特征被映射到词典中相应的视觉词语.提出一种新的基于空间相关性的快速视觉词语产生算法.统计视觉词典中任意两个词语在数据库中...
We present a new phrase-based con-ditional exponential family translation model for statistical mach...
Statistical machine translation is based on the idea to extract information from bilingual corpora, ...
"现代汉语词的语法属性研究"是中国国家哲学社会科学基金在"九五"期间支持的语言学科重大课题"信息处理用现代汉语...