为充分提取视频序列中人体行为的静态特征与时域特征,提高人体行为识别算法的准确率,结合深度卷积神经网络与递归神经网络,提出一种端到端的网络模型,分别使用多帧叠加的RGB图像与光流图像作为网络输入,将基于RGB图像的人体行为特征与基于光流图像的人体行为特征进行加权融合,作为最终的人体行为特征。实验结果表明,该算法可以有效提高行为识别准确率,在公开数据集UCF101上取得了84.68%的平均准确率,高于改进前长效递归卷积神经网络(82.34%)
개체명 인식 문제에서 한국어는 언어 특성상 개체명에 대한 두드러진 특징이 없기 때문에 일반적인 기계학습을 하기 위해 다양한 자질 정보들을 추출해서 사용했다. 하지만 여러 자질 정...
1. Object recognition 2. Deep learning CNN 3. Image/Video manual annotation yolo framewor
Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακ...
为充分提取视频序列中人体行为的静态特征与时域特征,提高人体行为识别算法的准确率,结合深度卷积神经网络与递归神经网络,提出一种端到端的网络模型,分别使用多帧叠加的RGB图像与光流图像作为网络输入,将基于...
多媒體在人類的生活中扮演重要的角色。有數以萬計的影片被上傳至網路。一些熱門的主題,像是籃球和棒球運動都有著極高的點閱率。因此資料擷取的技術逐漸變得重要。 人類的動作辨識可以被近一步應用於異常事件偵測以...
基于自然场景图像的人体行为识别方法中遮挡、背景干扰、光照不均匀等因素影响识别结果,利用人体三维骨架序列的行为识别方法可以克服上述缺点。首先,考虑人体行为的时空特性,提出一种时空特征融合深度学习网络人体...
学位の種別: 課程博士審査委員会委員 : (主査)東京大学教授 古関 隆章, 東京大学教授 池内 克史, 東京大学教授 大崎 博之, 東京大学教授 伊庭 斉志, 東京大学教授 瀬崎 薫, 東京大学教授...
视觉是人类感知外部世界、获取环境信息的重要途径,相对于听觉、触觉和嗅觉等其他感觉器官,它具有独特的时空特性。计算机视觉是用传感器和计算机代替人眼对目标进行识别、跟踪和测量,研究如何使机器会“看”的科学...
人体行为识别是计算机视觉领域中的一个重要研究热点,广泛应用于智能视频监控、运动行为分析、人机交互、虚拟现实等方面。近年来,随着Kinect等体感摄像机的推出,行为识别的重心逐渐转移到RGBD视频中。R...
人体行为识别是计算机领域的一项重要的研究课题,在众多领域都有着广泛的应用前景。基于姿态信息的行为识别是行为识别方法中一个重要的分支。通常可以将基于姿态表示的行为识别过程分为姿态估计和行为识别两个步骤。...
针对在复杂环境中目标尺度变化、形状变化以及场景光照变化、背景干扰等因素导致的目标跟踪稳定性下降问题,提出一种基于自适应多层卷积特征决策融合的目标跟踪算法。首先,通过卷积神经网络VGG-Net-19提取...
對於辨識長時間的動作,時間之間的高階依賴關係非常有用,但是利用高階依賴關係,將造成常用的圖形時間模型像是HMM或者是CRF的模型計算複雜度很大程度的提升。本論文提出使用多變數線性預測,來利用時間上高階...
近年來,卷積神經網路在人臉表示法的學習中有非常傑出的表現與成果,但大部分的研究專注於利用大量的資料學習人臉表示法而非同時利用人臉最具有語意的特徵如性別、年齡與膚色等來更佳化人臉表示法。在這篇論文中,我...
随着计算机计算技术和存储技术的快速发展,视频信息占人们接受信息的比重越来越大,对视频的智能分析也越来越重要。其中视频多目标跟踪是对视频分析的重要切入点,因此不管是在学术界还是在商业界,多目标跟踪都是研...
本論文提出在智慧環境中學習及便是人類日常生活的問題,先前大部分的方法先收集人類行為的資料並學出其模型,然後再使用學得的模型來辨識人的行為,然而,人的行為習慣及環境的佈置可能會隨著時間而發生改變,造成行...
개체명 인식 문제에서 한국어는 언어 특성상 개체명에 대한 두드러진 특징이 없기 때문에 일반적인 기계학습을 하기 위해 다양한 자질 정보들을 추출해서 사용했다. 하지만 여러 자질 정...
1. Object recognition 2. Deep learning CNN 3. Image/Video manual annotation yolo framewor
Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακ...
为充分提取视频序列中人体行为的静态特征与时域特征,提高人体行为识别算法的准确率,结合深度卷积神经网络与递归神经网络,提出一种端到端的网络模型,分别使用多帧叠加的RGB图像与光流图像作为网络输入,将基于...
多媒體在人類的生活中扮演重要的角色。有數以萬計的影片被上傳至網路。一些熱門的主題,像是籃球和棒球運動都有著極高的點閱率。因此資料擷取的技術逐漸變得重要。 人類的動作辨識可以被近一步應用於異常事件偵測以...
基于自然场景图像的人体行为识别方法中遮挡、背景干扰、光照不均匀等因素影响识别结果,利用人体三维骨架序列的行为识别方法可以克服上述缺点。首先,考虑人体行为的时空特性,提出一种时空特征融合深度学习网络人体...
学位の種別: 課程博士審査委員会委員 : (主査)東京大学教授 古関 隆章, 東京大学教授 池内 克史, 東京大学教授 大崎 博之, 東京大学教授 伊庭 斉志, 東京大学教授 瀬崎 薫, 東京大学教授...
视觉是人类感知外部世界、获取环境信息的重要途径,相对于听觉、触觉和嗅觉等其他感觉器官,它具有独特的时空特性。计算机视觉是用传感器和计算机代替人眼对目标进行识别、跟踪和测量,研究如何使机器会“看”的科学...
人体行为识别是计算机视觉领域中的一个重要研究热点,广泛应用于智能视频监控、运动行为分析、人机交互、虚拟现实等方面。近年来,随着Kinect等体感摄像机的推出,行为识别的重心逐渐转移到RGBD视频中。R...
人体行为识别是计算机领域的一项重要的研究课题,在众多领域都有着广泛的应用前景。基于姿态信息的行为识别是行为识别方法中一个重要的分支。通常可以将基于姿态表示的行为识别过程分为姿态估计和行为识别两个步骤。...
针对在复杂环境中目标尺度变化、形状变化以及场景光照变化、背景干扰等因素导致的目标跟踪稳定性下降问题,提出一种基于自适应多层卷积特征决策融合的目标跟踪算法。首先,通过卷积神经网络VGG-Net-19提取...
對於辨識長時間的動作,時間之間的高階依賴關係非常有用,但是利用高階依賴關係,將造成常用的圖形時間模型像是HMM或者是CRF的模型計算複雜度很大程度的提升。本論文提出使用多變數線性預測,來利用時間上高階...
近年來,卷積神經網路在人臉表示法的學習中有非常傑出的表現與成果,但大部分的研究專注於利用大量的資料學習人臉表示法而非同時利用人臉最具有語意的特徵如性別、年齡與膚色等來更佳化人臉表示法。在這篇論文中,我...
随着计算机计算技术和存储技术的快速发展,视频信息占人们接受信息的比重越来越大,对视频的智能分析也越来越重要。其中视频多目标跟踪是对视频分析的重要切入点,因此不管是在学术界还是在商业界,多目标跟踪都是研...
本論文提出在智慧環境中學習及便是人類日常生活的問題,先前大部分的方法先收集人類行為的資料並學出其模型,然後再使用學得的模型來辨識人的行為,然而,人的行為習慣及環境的佈置可能會隨著時間而發生改變,造成行...
개체명 인식 문제에서 한국어는 언어 특성상 개체명에 대한 두드러진 특징이 없기 때문에 일반적인 기계학습을 하기 위해 다양한 자질 정보들을 추출해서 사용했다. 하지만 여러 자질 정...
1. Object recognition 2. Deep learning CNN 3. Image/Video manual annotation yolo framewor
Εθνικό Μετσόβιο Πολυτεχνείο--Μεταπτυχιακή Εργασία. Διεπιστημονικό-Διατμηματικό Πρόγραμμα Μεταπτυχιακ...