隨著時代演進,人們對於電子產品的使用已逐漸普及。傳達文字訊息的方式,由過去的書寫文字,進而進展成現在的數位文字。促使文本數位化的需求提升。為了使影像轉換為數位文字,市面上已有開發光學文字辨識系統,能將影像做自動轉換數位文字,但是這些系統主要是針對現代印刷字體。至於非印刷體文字,如手寫字、雕版印刷等,其辨識率並不佳。因此,本研究,為了改善現有光學文字辨識軟體正確率,增加使用者數位化文本的便利性以減少使用之人力成本。 本研究流程主要分為二步驟,第一步驟:將文本作結構的分析,切割出字符影像,避免切割不完全使得辨識時造成辨識錯誤。第二步驟分為兩個部分,第一部分是將切割出的字符,以方向梯度直方圖(HOG)來表示字符特徵。將字符依特徵向量作粗略分群,再以文本之語言模型,觀察其分群情況,增加其分群效果。最後根據分群的結果,作錯誤辨識的偵測,以及改正其錯誤文字;第二部分是將文本利用現有之文字辨識軟體,將影像轉為數位文字,透過外部文本的語言模型來偵測與改正錯誤文字。最後比較這兩部分之錯誤字偵測及修正情形。本研究方法與使用Plustek DI express 6.0辨識的結果作比較,在使用內部文本的部分,增加5%的辨識正確率,從65%增加至70%。而使用外部文本的部分,則是增加了9.8%的辨識正確率
本論文從華語學習者以正確句子不適切語境之學習偏誤現象瞭解華語教學中應建立語體概念的假設,進而探討現代漢語口語及書面語兩大語體之差異為何,對語體的探究不僅僅從語用層面著手,應從語言本體加以深究之。以政治...
近年來電子商務蓬勃發展,嚴重侵蝕實體通路業績,因此線下服務提供者更應善用資料科學技術,找出顧客未被滿足之需求,進而提供優質服務,其中脫穎而出的關鍵非推薦系統莫屬。 本研究以運用計算產品相似程度的「項目...
application/pdfイギリス経済史の山本浩司氏は,最近の2 冊の著書Taming Capitalism before its Triumph: Public Service, Distrus...
新学習指導要領「国語科」に於いて,今回新たに「伝え合う力」の育成という双方向的なコミュニケーション能力の重要性が提示された。これは21世紀の言語教育における基礎基本の一つとして,単に国語科のみの学習内...
摘要:研究将儿童头脑中实际掌握的声旁家族称为主观家族,主观家族的大小和分布不同于客观家族,以往研究发现儿童命名会受客观家族影响,但客观家族也许不能反映儿童实际水平的家族,所以研究将考察主观家族对儿童命...
摘要:文字方向认知是儿童早期阅读发展的基础,通常包括对倒置方向和和镜像方向文字加工两个方面。以往研究发现,视知觉能力在汉语儿童汉字学习中起着重要作用。本研究旨在考察儿童对倒置和镜像汉字的认知发展的基础...
テキストマイニングは、テキストデータをコンピュータで形態素解析したものを計量的に分析し、テキストの書き手の特徴情報の抽出を可能にし、書き手によって異なる特徴を客観的に可視化する手法である。筆者は、原田...
[[abstract]]近年來,由於網際網路的發達以及資訊傳播的迅速,使得資訊科技廣泛被運用於學習領域上,不管對於企業、學校甚至個人,亦產生重要之影響。 本研究設計一套「成語及相似字教學系統」,進行...
成像制导技术是当代精确制导技术发展的主流和方向,日趋复杂的战场环境使得目标的识别与跟踪的难度加大,因此必须对传统的日标识别与跟踪技术进行改进和完善,以适应新型制导武器系统发展的需要。本文主要介绍了两种...
台灣是一個多個族群融合的社會,同時也匯集多種語言,除了被稱為國語的北京話之外,還有台語、客語、原住民語等,這些語言相互影響之下,必定對語言本身產生了變化。 本論文主要針對台灣華語中的「有字句」句法結構...
本研究采取问卷调查的方法探讨了我国购彩人群的特征、购彩成瘾人群的特征以及影响购彩成瘾的因素。研究分三部分进行:研究一,我国彩票购买人群的心理行为特征。研究二,我国购彩成瘾者的群体特征。从总体中筛选出成...
華語教師不僅作為語言的教導者,其身上更大的使命應為中華文化的傳播者,筆者認為華語教學中的婚俗文化教學為文化教學中相當重要的主題,不過現行教材少見針對此主題之著墨,學習者與教學者不得其門而入,因此嘗試將...
汉语深层失读是目前阅读障碍中的一项重要研究课题。本研究围绕汉语深层失读进行了三方面的研究:第一,探查汉语深层失读的临床主要症状、伴随症状以及相互之间的关系,不同类型单字和词的阅读成绩;通过详细的实验,...
現行の学習指導要領では,文字を書くことに関する学習は,小・中学校では国語科書写として位置付けられ,その内容は実用性に限定されている。高等学校では芸術科書道として位置付けられ,実用性を高めながら芸術性...
人文科学系の研究.教育は、現在進んでいるビッグデータの量的特徵抽出による現象の一般化とは方向性が正反対で、現在の流行手法をそのまま取り入れても有效性は低い。むしろ質的分析による読解を補完するために小規...
本論文從華語學習者以正確句子不適切語境之學習偏誤現象瞭解華語教學中應建立語體概念的假設,進而探討現代漢語口語及書面語兩大語體之差異為何,對語體的探究不僅僅從語用層面著手,應從語言本體加以深究之。以政治...
近年來電子商務蓬勃發展,嚴重侵蝕實體通路業績,因此線下服務提供者更應善用資料科學技術,找出顧客未被滿足之需求,進而提供優質服務,其中脫穎而出的關鍵非推薦系統莫屬。 本研究以運用計算產品相似程度的「項目...
application/pdfイギリス経済史の山本浩司氏は,最近の2 冊の著書Taming Capitalism before its Triumph: Public Service, Distrus...
新学習指導要領「国語科」に於いて,今回新たに「伝え合う力」の育成という双方向的なコミュニケーション能力の重要性が提示された。これは21世紀の言語教育における基礎基本の一つとして,単に国語科のみの学習内...
摘要:研究将儿童头脑中实际掌握的声旁家族称为主观家族,主观家族的大小和分布不同于客观家族,以往研究发现儿童命名会受客观家族影响,但客观家族也许不能反映儿童实际水平的家族,所以研究将考察主观家族对儿童命...
摘要:文字方向认知是儿童早期阅读发展的基础,通常包括对倒置方向和和镜像方向文字加工两个方面。以往研究发现,视知觉能力在汉语儿童汉字学习中起着重要作用。本研究旨在考察儿童对倒置和镜像汉字的认知发展的基础...
テキストマイニングは、テキストデータをコンピュータで形態素解析したものを計量的に分析し、テキストの書き手の特徴情報の抽出を可能にし、書き手によって異なる特徴を客観的に可視化する手法である。筆者は、原田...
[[abstract]]近年來,由於網際網路的發達以及資訊傳播的迅速,使得資訊科技廣泛被運用於學習領域上,不管對於企業、學校甚至個人,亦產生重要之影響。 本研究設計一套「成語及相似字教學系統」,進行...
成像制导技术是当代精确制导技术发展的主流和方向,日趋复杂的战场环境使得目标的识别与跟踪的难度加大,因此必须对传统的日标识别与跟踪技术进行改进和完善,以适应新型制导武器系统发展的需要。本文主要介绍了两种...
台灣是一個多個族群融合的社會,同時也匯集多種語言,除了被稱為國語的北京話之外,還有台語、客語、原住民語等,這些語言相互影響之下,必定對語言本身產生了變化。 本論文主要針對台灣華語中的「有字句」句法結構...
本研究采取问卷调查的方法探讨了我国购彩人群的特征、购彩成瘾人群的特征以及影响购彩成瘾的因素。研究分三部分进行:研究一,我国彩票购买人群的心理行为特征。研究二,我国购彩成瘾者的群体特征。从总体中筛选出成...
華語教師不僅作為語言的教導者,其身上更大的使命應為中華文化的傳播者,筆者認為華語教學中的婚俗文化教學為文化教學中相當重要的主題,不過現行教材少見針對此主題之著墨,學習者與教學者不得其門而入,因此嘗試將...
汉语深层失读是目前阅读障碍中的一项重要研究课题。本研究围绕汉语深层失读进行了三方面的研究:第一,探查汉语深层失读的临床主要症状、伴随症状以及相互之间的关系,不同类型单字和词的阅读成绩;通过详细的实验,...
現行の学習指導要領では,文字を書くことに関する学習は,小・中学校では国語科書写として位置付けられ,その内容は実用性に限定されている。高等学校では芸術科書道として位置付けられ,実用性を高めながら芸術性...
人文科学系の研究.教育は、現在進んでいるビッグデータの量的特徵抽出による現象の一般化とは方向性が正反対で、現在の流行手法をそのまま取り入れても有效性は低い。むしろ質的分析による読解を補完するために小規...
本論文從華語學習者以正確句子不適切語境之學習偏誤現象瞭解華語教學中應建立語體概念的假設,進而探討現代漢語口語及書面語兩大語體之差異為何,對語體的探究不僅僅從語用層面著手,應從語言本體加以深究之。以政治...
近年來電子商務蓬勃發展,嚴重侵蝕實體通路業績,因此線下服務提供者更應善用資料科學技術,找出顧客未被滿足之需求,進而提供優質服務,其中脫穎而出的關鍵非推薦系統莫屬。 本研究以運用計算產品相似程度的「項目...
application/pdfイギリス経済史の山本浩司氏は,最近の2 冊の著書Taming Capitalism before its Triumph: Public Service, Distrus...