图像理解是计算机视觉领域的研究热点之一,通常情况下,它要求将图像中所有点标注为它所对应的景物类别。这一过程也可以看作是对图像中的所有类别景物目标的识别。当景物比较复杂且类别数目比较多时,一般采用基于机器学习的方法实现多类目标识别任务。其基本思路为将一定量的已经完成理解标注的图像作为训练集,用机器学习的方法建立图像特征与标注之间的内在模型(参数),利用这种模型实现对新图像的标注即目标识别。这类方法具有很好的通用性,它也是目前机器学习领域的重要研究方向之一。主要研究内容集中在学习算法的设计、目标特征的选取以及各目标模式以及关系的建立等等。 本文以自然场景的图像理解为背景,对学习模型的建立,特征的选取和融合,目标间关系的表达等方面开展了研究。主要研究内容与成果如下: 1)纹理是图像中区分不同景物的重要特征之一,利用纹理对目标模式进行建模一直是本方向的研究热点。本文首先对图像中的纹理进行编码,然后利用Joint-boost学习方法对不同景物的纹理依存关系进行建模,并在此基础上设计了多种景物特征项,提出了一种条件随机场模型(Conditional Random Field)对这些景物特征项进行融合。实现结果表明:Joint-boost学习方法可以很好地建立目标的纹理模式,条件随机场模型在对多种特征项的融合方面起到了重要作用。 2)图像中不同景物之间在是否同时出现方面具有一定的关联关系,有效利用这种关联关系可以提高识别性能。本文建立了景物目标间的关联关系模型,为使关联发挥更大的作用,本文给定图像主题的前提条件下,建立了主题与关联关系的模型,通过机器学习的方法确定了模型中的参数。实验结果表明,这种方法可以显著提高系统性能,证明了本文方法的正确有效。 3)轮廓等结构信息是景物的另一类重要特征...