构建一个提供评测工具的笔画基准测试库,其中包含一个人工搭建的笔画数据库,该数据库拥有4种字体的汉字图像以及对应的人工提取的笔画信息.通过比较算法自动提取的笔画结果和数据库中的标准笔画之间的差异,测试库可以评测笔画自动提取算法的性能.还提出一种新的基于Delaunay三角剖分的方法,可以有效地从汉字图像中提取出笔画信息.在测试库中对现有的3种笔画提取方法进行比较,实验数据表明,所提出的笔画基准测试库能够对笔画提取算法给出有效的评测,并且新的算法在汉字笔画提取的性能中效率较高.This paper presents a benchmark, which includes a manually-constructed database and evaluation tools. Specifically, the database contains a number of images of Chinese characters represented in four commonly-used font styles and corresponding stroke images manually segmented from character images. Performance of a given stroke extraction method can be evaluated by calculating dissimilarities of the automatic segmentation results and the ground truth using two specially-designed metrics. Moreover, the autho...
Stroke extraction of Chinese characters plays an important role in the field of character recognitio...
本文提出关于两级汉字识别问题的一种方法。第一级分类采用四种办法:文字边缘长度,四边编码,交叉线(对角线)编码及文字两侧负象的重心。用这四种办法每类可产生平均16个字的候选类。第一级分类大大改进了识别效...
本文提出关于两级汉字识别问题的一种方法。第一级分类采用四种办法:文字边缘长度,四边编码,交叉线(对角线)编码及文字两侧负象的重心。用这四种办法每类可产生平均16个字的候选类。第一级分类大大改进了识别效...
一般來說,OCR系統抽取文字筆劃的方式,傳統上是將所要辨識的原 始文字字形先作細線化(thinning),接下來才開始進行文字筆劃抽取( s...
提出一种基于笔端相似性的方法,来解决在较大规模字体集上的单字符字体识别问题.该方法首先提取汉字笔画上的特定部位——笔端,然后利用笔端形状作为汉字的字体特征,对其进行识别.实验证明,该方法不但在常用字体...
by Yeung Chuen-sang.Thesis (M.Ph.)--Chinese University of Hong Kong, 1987.Bibliography: leaves 190-1...
本論文では, 統計的文字認識の前処理における非線形正規化, 原特徴量の高次元化, および特徴選択によって手書き漢字認識の認識精度を向上させることを検討する. また, 処理の高速化のために, 線形識別関...
在先前提出的汉字通透性算法中 ,包括了水平通透性和垂直通透性 ,而汉字作为整体 ,其通透性也应该是一个整体 ,所以 ,当前研究对这一算法进行了更正 ,然后运用新的算法对先前实验材料和基本汉字集 (6 ...
在先前提出的汉字通透性算法中 ,包括了水平通透性和垂直通透性 ,而汉字作为整体 ,其通透性也应该是一个整体 ,所以 ,当前研究对这一算法进行了更正 ,然后运用新的算法对先前实验材料和基本汉字集 (6 ...
Stroke extraction and matching are critical for structural interpretation based applications of hand...
提出了一种获得汉字笔画种类及其拓扑结构的新方法.通过分析TrueType字库存储的汉字字形信息,构造笔画图形并提取出笔画特征,采用统计分类和边界关键点定位相结合的方法,利用综合分类法实现了对二级676...
[[sponsorship]]資訊科學研究所,資訊科技創新研究中心[[note]]已出版;[SCI];有審查制度;具代表性[[note]]http://gateway.isiknowledge.com...
为使汉字草体计算机输入识别精简化,对汉字草书手写体,实施分类与亚分类等类似处理.参照人的汉字草书书写习惯,提出模糊识别汉字草体手写输入算法.结合各种具体编码约定,可使软件编写思路清晰、减少编程工作量、...
Stroke extraction of Chinese characters plays an important role in the field of character recognitio...
Stroke extraction of Chinese characters plays an important role in the field of character recognitio...
Stroke extraction of Chinese characters plays an important role in the field of character recognitio...
本文提出关于两级汉字识别问题的一种方法。第一级分类采用四种办法:文字边缘长度,四边编码,交叉线(对角线)编码及文字两侧负象的重心。用这四种办法每类可产生平均16个字的候选类。第一级分类大大改进了识别效...
本文提出关于两级汉字识别问题的一种方法。第一级分类采用四种办法:文字边缘长度,四边编码,交叉线(对角线)编码及文字两侧负象的重心。用这四种办法每类可产生平均16个字的候选类。第一级分类大大改进了识别效...
一般來說,OCR系統抽取文字筆劃的方式,傳統上是將所要辨識的原 始文字字形先作細線化(thinning),接下來才開始進行文字筆劃抽取( s...
提出一种基于笔端相似性的方法,来解决在较大规模字体集上的单字符字体识别问题.该方法首先提取汉字笔画上的特定部位——笔端,然后利用笔端形状作为汉字的字体特征,对其进行识别.实验证明,该方法不但在常用字体...
by Yeung Chuen-sang.Thesis (M.Ph.)--Chinese University of Hong Kong, 1987.Bibliography: leaves 190-1...
本論文では, 統計的文字認識の前処理における非線形正規化, 原特徴量の高次元化, および特徴選択によって手書き漢字認識の認識精度を向上させることを検討する. また, 処理の高速化のために, 線形識別関...
在先前提出的汉字通透性算法中 ,包括了水平通透性和垂直通透性 ,而汉字作为整体 ,其通透性也应该是一个整体 ,所以 ,当前研究对这一算法进行了更正 ,然后运用新的算法对先前实验材料和基本汉字集 (6 ...
在先前提出的汉字通透性算法中 ,包括了水平通透性和垂直通透性 ,而汉字作为整体 ,其通透性也应该是一个整体 ,所以 ,当前研究对这一算法进行了更正 ,然后运用新的算法对先前实验材料和基本汉字集 (6 ...
Stroke extraction and matching are critical for structural interpretation based applications of hand...
提出了一种获得汉字笔画种类及其拓扑结构的新方法.通过分析TrueType字库存储的汉字字形信息,构造笔画图形并提取出笔画特征,采用统计分类和边界关键点定位相结合的方法,利用综合分类法实现了对二级676...
[[sponsorship]]資訊科學研究所,資訊科技創新研究中心[[note]]已出版;[SCI];有審查制度;具代表性[[note]]http://gateway.isiknowledge.com...
为使汉字草体计算机输入识别精简化,对汉字草书手写体,实施分类与亚分类等类似处理.参照人的汉字草书书写习惯,提出模糊识别汉字草体手写输入算法.结合各种具体编码约定,可使软件编写思路清晰、减少编程工作量、...
Stroke extraction of Chinese characters plays an important role in the field of character recognitio...
Stroke extraction of Chinese characters plays an important role in the field of character recognitio...
Stroke extraction of Chinese characters plays an important role in the field of character recognitio...
本文提出关于两级汉字识别问题的一种方法。第一级分类采用四种办法:文字边缘长度,四边编码,交叉线(对角线)编码及文字两侧负象的重心。用这四种办法每类可产生平均16个字的候选类。第一级分类大大改进了识别效...
本文提出关于两级汉字识别问题的一种方法。第一级分类采用四种办法:文字边缘长度,四边编码,交叉线(对角线)编码及文字两侧负象的重心。用这四种办法每类可产生平均16个字的候选类。第一级分类大大改进了识别效...