本論文關注的是電腦視覺中一個已充分研究過的議題,即光學文字識別。然而,我 們主要著重在一種非常特別的圖片類型:解析度非常低並且有大量失真與干擾的印刷中 文字。雖然使用卷積神經網路已能成功穩定識別高解析度印刷文字或手寫文字,然而, 對於品質非常低的印刷中文字仍有幾個挑戰,需要進一步分析研究。具體來說,我們的 資料集是點陣印刷機產生的 31,570 張文字圖片,包含模糊文字、缺少筆劃的文字以及 文字與其他文字或圖形重疊的文字圖片。為了有效地解決這些困難,我們實驗不同的深 層神經網路架構以及超參數,最後獲得辨識成果最佳的設置。在 1,530 類,平均解析度 為 16x18 像素的圖片中,top-1 和 top-5 的準確率分別為 71% 和 87%。Recent advances in deep neural networks have changed the landscape of computer vision and pattern recognition research significantly. Convolutional neural networks (CNN), for example, have demonstrated outstanding capabilities in image classification, in many cases exceeding human performance. Many tasks that did not get satisfactory results using conventional machine learning approaches are now being actively re-examine...
针对现有的图像质量评价方法普遍为人工设计特征,难以自动且有效提取到符合人类视觉系统的图像特征,受人眼视觉特性的启发,提出一种新的基于卷积神经网络的全参考图像质量评价方法(DeepFR)。该方法基于对数...
针对现有的图像质量评价方法普遍为人工设计特征,难以自动且有效提取到符合人类视觉系统的图像特征,受人眼视觉特性的启发,提出一种新的基于卷积神经网络的全参考图像质量评价方法(DeepFR)。该方法基于对数...
文字是表达人类思想和情感的重要载体,获取自然场景图像中的文字信息从而实现图像内容的理解,将为人们的生活提供极大的便利,因此场景图像中的文字定位和识别也一直受到学界业界的关注。铭牌图像是场景图像中的一个...
图像分类能够有效地管理和组织图像,为图像处理的多个领域的工作奠定良好的基础。伴随互联网技术和社交网络的兴起,数字图像数量上急剧增加应用也越来越多,人们在情感和信息表达的时候也更多采用直观的图片来代替文...
本文主要研究超分辨率图像重建以及图像去噪技术。基于学习的单帧超分辨率重建问题通过机器学习方法从训练样本集中提取所需的高频信息,从而对低分辨率测试样本缺少的信息进行预测,达到提高图像分辨率的目的。受深度...
在如今智能多屏时代,人们对图像的要求越来越高,高清、高质是现代视觉信息所追求的基本目标。同时,图像作为当下传播和分享信息最为便捷的载体,已经成为了人们沟通和交流不可或缺的一种表现形式。但是,成像过程等...
卷积神经网络(Convolution Neural Networks,CNN)和循环神经网络(Recurrent Neural Networks,RNN)在图像分类、计算机视觉、自然语言处理、语音识别...
[[abstract]]「文字」是人類歷經好幾個世紀逐漸演化出來,是人與人之間溝通的符號,隨著影像辨識技術逐漸成熟,在自然場景的影像中偵測、辨識文字的辨識率已相當高,其中又以深度學習最為卓越,在深度學...
Cieľom tejto práce je vytvoriť hlbokú neurónovú sieť schopnú zvýšiť rozlíšenie obrazov získaných ele...
场景文本识别主要研究的内容是识别出自然场景环境下拍摄的图像中所包含的 文本。自然场景文本包括路牌、商业广告、杂货店店面和车牌号码等。随着计算机 技术的发展,尤其是智能手机和数码相机的发展,先进的数码设...
本文针对传统的基于稀疏表示的人脸识别方法在小样本情况下对类内变化鲁棒性不强的问题,从特征的层面入手,提出了基于深度学习特征的稀疏表示的人脸识别方法。本方法首先利用深度卷积神经网络提取对类内变化不敏感的...
本篇論文主要在探討如何利用近期發展之深度學習技術在於中文句子分散式表示法學習。近期深度學習受到極大的注目,相關技術也隨之蓬勃發展。然而相關的分散式表示方式,大多以英文為主的其他印歐語系作為主要的衡量對...
图像超分辨率重建是计算机视觉领域中一个研究热点,有广阔的应用前景和实际应用价值。它主要关注在硬件设备性能受限的情况下,从所获取的单幅或者多幅图像中,设计算法尽可能提高图像的分辨率,尽量保持图像中丰富的...
본 논문은 딥 러닝 (deep learning)을 이용하여 입력 영상의 기울어진 정도를 측정하고 수평에 맞게 바로 세우는 세우는 방법을 제시 한다 . 기존 방법들은 일반적으로 영상...
[[abstract]]摘要 機器學習理論在發展出深度學習的演算法後開始大量普及,進入產業與生活中,加上資料取得的質與量大幅提升、電腦運算速度也快速倍增,讓機器學習得以進行大量實務應用,逐漸為人類生活...
针对现有的图像质量评价方法普遍为人工设计特征,难以自动且有效提取到符合人类视觉系统的图像特征,受人眼视觉特性的启发,提出一种新的基于卷积神经网络的全参考图像质量评价方法(DeepFR)。该方法基于对数...
针对现有的图像质量评价方法普遍为人工设计特征,难以自动且有效提取到符合人类视觉系统的图像特征,受人眼视觉特性的启发,提出一种新的基于卷积神经网络的全参考图像质量评价方法(DeepFR)。该方法基于对数...
文字是表达人类思想和情感的重要载体,获取自然场景图像中的文字信息从而实现图像内容的理解,将为人们的生活提供极大的便利,因此场景图像中的文字定位和识别也一直受到学界业界的关注。铭牌图像是场景图像中的一个...
图像分类能够有效地管理和组织图像,为图像处理的多个领域的工作奠定良好的基础。伴随互联网技术和社交网络的兴起,数字图像数量上急剧增加应用也越来越多,人们在情感和信息表达的时候也更多采用直观的图片来代替文...
本文主要研究超分辨率图像重建以及图像去噪技术。基于学习的单帧超分辨率重建问题通过机器学习方法从训练样本集中提取所需的高频信息,从而对低分辨率测试样本缺少的信息进行预测,达到提高图像分辨率的目的。受深度...
在如今智能多屏时代,人们对图像的要求越来越高,高清、高质是现代视觉信息所追求的基本目标。同时,图像作为当下传播和分享信息最为便捷的载体,已经成为了人们沟通和交流不可或缺的一种表现形式。但是,成像过程等...
卷积神经网络(Convolution Neural Networks,CNN)和循环神经网络(Recurrent Neural Networks,RNN)在图像分类、计算机视觉、自然语言处理、语音识别...
[[abstract]]「文字」是人類歷經好幾個世紀逐漸演化出來,是人與人之間溝通的符號,隨著影像辨識技術逐漸成熟,在自然場景的影像中偵測、辨識文字的辨識率已相當高,其中又以深度學習最為卓越,在深度學...
Cieľom tejto práce je vytvoriť hlbokú neurónovú sieť schopnú zvýšiť rozlíšenie obrazov získaných ele...
场景文本识别主要研究的内容是识别出自然场景环境下拍摄的图像中所包含的 文本。自然场景文本包括路牌、商业广告、杂货店店面和车牌号码等。随着计算机 技术的发展,尤其是智能手机和数码相机的发展,先进的数码设...
本文针对传统的基于稀疏表示的人脸识别方法在小样本情况下对类内变化鲁棒性不强的问题,从特征的层面入手,提出了基于深度学习特征的稀疏表示的人脸识别方法。本方法首先利用深度卷积神经网络提取对类内变化不敏感的...
本篇論文主要在探討如何利用近期發展之深度學習技術在於中文句子分散式表示法學習。近期深度學習受到極大的注目,相關技術也隨之蓬勃發展。然而相關的分散式表示方式,大多以英文為主的其他印歐語系作為主要的衡量對...
图像超分辨率重建是计算机视觉领域中一个研究热点,有广阔的应用前景和实际应用价值。它主要关注在硬件设备性能受限的情况下,从所获取的单幅或者多幅图像中,设计算法尽可能提高图像的分辨率,尽量保持图像中丰富的...
본 논문은 딥 러닝 (deep learning)을 이용하여 입력 영상의 기울어진 정도를 측정하고 수평에 맞게 바로 세우는 세우는 방법을 제시 한다 . 기존 방법들은 일반적으로 영상...
[[abstract]]摘要 機器學習理論在發展出深度學習的演算法後開始大量普及,進入產業與生活中,加上資料取得的質與量大幅提升、電腦運算速度也快速倍增,讓機器學習得以進行大量實務應用,逐漸為人類生活...
针对现有的图像质量评价方法普遍为人工设计特征,难以自动且有效提取到符合人类视觉系统的图像特征,受人眼视觉特性的启发,提出一种新的基于卷积神经网络的全参考图像质量评价方法(DeepFR)。该方法基于对数...
针对现有的图像质量评价方法普遍为人工设计特征,难以自动且有效提取到符合人类视觉系统的图像特征,受人眼视觉特性的启发,提出一种新的基于卷积神经网络的全参考图像质量评价方法(DeepFR)。该方法基于对数...
文字是表达人类思想和情感的重要载体,获取自然场景图像中的文字信息从而实现图像内容的理解,将为人们的生活提供极大的便利,因此场景图像中的文字定位和识别也一直受到学界业界的关注。铭牌图像是场景图像中的一个...