自动生成图像描述连接了计算机视觉和自然语言处理两个领域,一直以来,都是图像理解、人工智能的长远目标。它不仅需要更深层的理解图像语义,还需要合理的生成自然语言来表达。近些年来,随着计算能力的提升、数据资源的丰富、深度学习的发展,该任务已经取得了巨大的进步,但仍然面临着许多未解决的问题和挑战。 本文全面研究了自动生成图像描述的相关问题,首先,说明了视觉和语言两个领域的相关技术,如深度学习、语言理解、多模态学习等。其次,详细的介绍了解决该任务的极具代表性的方法。再者,在基线模型的基础上,我们从两个不同的角度,对模型做了改进:第一,开发了一个深度双向门限循环单元图像描述模型,试图在解码阶段,全面挖掘文本描述更深层次的语义;第二,我们提出了双向引导图像描述生成模型,在图像编码阶段,加入文本信息引导图像过滤。在文本解码阶段,加入图像属性信息引导语言生成,使得模型能够更全面挖掘图像和文本的关键信息,削弱信息转换的不平衡影响。 最后,在公共评测集MSCOCO上,评估了改进的模型的性能,本文提出的方法无论使用通用的评价指标BLEU、METEOR等,还是使用其他人工评价指标,都比目前已有的相关工作有着较为显著的提高,有力验证了模型的有效性
電気回路などの対象の理解に対する教育的支援では,対象に関する説明が有力な支援手段として用いられている.説明による教育的支援では,一つの対象に関して一般にさまざまに存在する説明を,対象に関する何を理解さ...
[[abstract]]本研究旨在探討軍訓教官對本身的工作特性、組織承諾及組織公民行為之知覺,並探討三者之間的關係。期透過本研究瞭解何種工作特性最能激起工作者的工作動機,以提供管理者在工作設計時找出應...
北宋期に新法を擁して政治経済の改革を推進した政治家として著名な王安石は、当時を代表する詩人の一人と目された人物でもあった。ここではその詩中に繰り返し登場する「鍾山」という題材を取り出し、その描かれかた...
自动生成图像描述连接了计算机视觉和自然语言处理两个领域,一直以来,都是图像理解、人工智能的长远目标。它不仅需要更深层的理解图像语义,还需要合理的生成自然语言来表达。近些年来,随着计算能力的提升、数据资...
埼玉県越谷市基礎造形教育法は教員の質や学生の資質による教育効果のムラを低減する教育法であるが、課題によっては学生の表現志向の影響で教育効果に差が発生する場合がある。学生の表現志向は「具象的表現」と「抽...
本文主要研究基于点特征的图像匹配算法。点特征是图像上具有明显特性并能够把目标标识出来的点,它可以较好的描述目标的特征。点特征检测和图像匹配技术在计算机视觉和图像理解等领域应用很广,例如运动跟踪、目标识...
電気回路などの対象の理解に対する教育的支援では,対象に関する説明が有力な支援手段として用いられている.説明による教育的支援では,一つの対象に関して一般にさまざまに存在する説明を,対象に関する何を理解さ...
图像质量评价旨在模仿人类视觉系统来衡量图像质量,是计算机视觉和图像处理的基本任务之一,主要用于评价和指导图像压缩算法及相关图像处理算法。全参考图像质量评价是指在有参考图像和失真图像的情况下,准确度量图...
知識型商品的價值來自於其內蘊的知識,而其價值決定於顧客的認知與使用能力,同時,許多知識型商品因重製成本很低,有利於廣泛擴散流通,但也容易誘使使用者出現無償使用的投機行為,面臨創新利益無法實質回收的困境...
随着中国经济的快速发展,员工心理的日益被重视,员工的工作情感和工作行为也得到了一定程度的关注。众多研究表明工作情感与工作行为有显著相关,但在中国背景下情况如何却鲜有实证研究。本文旨在研究中国文化背景下...
本稿は,台湾閩南語の句首助詞「啊」が台湾華語に転移する事象を主な研究対象として,約500分の台湾の政治番組から得た会話データを用いてこの「啊」を検討し,華語の視点から論じようと試みたものである。句首助...
応用視覚藝術調査法は、藝術を基礎とする方法論ないし方法論的枠組みであり、以下のような仮説の上に成り立っている: 「視覚藝術」は、標識(マーク)、コラージュから模型、絵画、そしてレアリア(実在物)とかア...
近年、文学系の学会において国語教育の危機が論議される中、中古文学会では研究を教育に生かすための授業方法の試みが提案されている。本稿は2015年度に設置された本学文芸文化学科の専門科目の中で、研究成果を...
近年、文学系の学会において国語教育の危機が論議される中、中古文学会では研究を教育に生かすための授業方法の試みが提案されている。本稿は2015年度に設置された本学文芸文化学科の専門科目の中で、研究成果を...
埼玉県越谷市文末文体有敬体和简体之分,根据谈话对方及场面的不同,使用或者转挽相对应的文末文体。这一直是日语习得的难点之一。本稿作为阐明日语学习者的有关文末文体转换基准的基础研究,调查了中国学习者的文末...
電気回路などの対象の理解に対する教育的支援では,対象に関する説明が有力な支援手段として用いられている.説明による教育的支援では,一つの対象に関して一般にさまざまに存在する説明を,対象に関する何を理解さ...
[[abstract]]本研究旨在探討軍訓教官對本身的工作特性、組織承諾及組織公民行為之知覺,並探討三者之間的關係。期透過本研究瞭解何種工作特性最能激起工作者的工作動機,以提供管理者在工作設計時找出應...
北宋期に新法を擁して政治経済の改革を推進した政治家として著名な王安石は、当時を代表する詩人の一人と目された人物でもあった。ここではその詩中に繰り返し登場する「鍾山」という題材を取り出し、その描かれかた...
自动生成图像描述连接了计算机视觉和自然语言处理两个领域,一直以来,都是图像理解、人工智能的长远目标。它不仅需要更深层的理解图像语义,还需要合理的生成自然语言来表达。近些年来,随着计算能力的提升、数据资...
埼玉県越谷市基礎造形教育法は教員の質や学生の資質による教育効果のムラを低減する教育法であるが、課題によっては学生の表現志向の影響で教育効果に差が発生する場合がある。学生の表現志向は「具象的表現」と「抽...
本文主要研究基于点特征的图像匹配算法。点特征是图像上具有明显特性并能够把目标标识出来的点,它可以较好的描述目标的特征。点特征检测和图像匹配技术在计算机视觉和图像理解等领域应用很广,例如运动跟踪、目标识...
電気回路などの対象の理解に対する教育的支援では,対象に関する説明が有力な支援手段として用いられている.説明による教育的支援では,一つの対象に関して一般にさまざまに存在する説明を,対象に関する何を理解さ...
图像质量评价旨在模仿人类视觉系统来衡量图像质量,是计算机视觉和图像处理的基本任务之一,主要用于评价和指导图像压缩算法及相关图像处理算法。全参考图像质量评价是指在有参考图像和失真图像的情况下,准确度量图...
知識型商品的價值來自於其內蘊的知識,而其價值決定於顧客的認知與使用能力,同時,許多知識型商品因重製成本很低,有利於廣泛擴散流通,但也容易誘使使用者出現無償使用的投機行為,面臨創新利益無法實質回收的困境...
随着中国经济的快速发展,员工心理的日益被重视,员工的工作情感和工作行为也得到了一定程度的关注。众多研究表明工作情感与工作行为有显著相关,但在中国背景下情况如何却鲜有实证研究。本文旨在研究中国文化背景下...
本稿は,台湾閩南語の句首助詞「啊」が台湾華語に転移する事象を主な研究対象として,約500分の台湾の政治番組から得た会話データを用いてこの「啊」を検討し,華語の視点から論じようと試みたものである。句首助...
応用視覚藝術調査法は、藝術を基礎とする方法論ないし方法論的枠組みであり、以下のような仮説の上に成り立っている: 「視覚藝術」は、標識(マーク)、コラージュから模型、絵画、そしてレアリア(実在物)とかア...
近年、文学系の学会において国語教育の危機が論議される中、中古文学会では研究を教育に生かすための授業方法の試みが提案されている。本稿は2015年度に設置された本学文芸文化学科の専門科目の中で、研究成果を...
近年、文学系の学会において国語教育の危機が論議される中、中古文学会では研究を教育に生かすための授業方法の試みが提案されている。本稿は2015年度に設置された本学文芸文化学科の専門科目の中で、研究成果を...
埼玉県越谷市文末文体有敬体和简体之分,根据谈话对方及场面的不同,使用或者转挽相对应的文末文体。这一直是日语习得的难点之一。本稿作为阐明日语学习者的有关文末文体转换基准的基础研究,调查了中国学习者的文末...
電気回路などの対象の理解に対する教育的支援では,対象に関する説明が有力な支援手段として用いられている.説明による教育的支援では,一つの対象に関して一般にさまざまに存在する説明を,対象に関する何を理解さ...
[[abstract]]本研究旨在探討軍訓教官對本身的工作特性、組織承諾及組織公民行為之知覺,並探討三者之間的關係。期透過本研究瞭解何種工作特性最能激起工作者的工作動機,以提供管理者在工作設計時找出應...
北宋期に新法を擁して政治経済の改革を推進した政治家として著名な王安石は、当時を代表する詩人の一人と目された人物でもあった。ここではその詩中に繰り返し登場する「鍾山」という題材を取り出し、その描かれかた...