米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 松下電器産業株式会社

発明の名称 文字認識装置
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開平7−37038
公開日 平成7年(1995)2月7日
出願番号 特願平5−183718
出願日 平成5年(1993)7月26日
代理人 【弁理士】
【氏名又は名称】小鍜治 明 (外2名)
発明者 湯下 良一
要約 目的
文字の線の太さが異なる場合であっても文字認識を行うことができる汎用性、信頼性に優れた文字認識装置の提供。

構成
2値画像データを記憶する画像記憶部2と、2値画像データ中の文字に外接する文字矩形を検出する文字矩形検出部3と、文字矩形の位置座標を記憶する文字矩形記憶部4と、2値画像データから1文字毎の文字画像を抽出してこの文字画像をマス目状にしこの文字画像の各マス目内の黒画素数を計数して図形特徴を抽出する図形特徴抽出部5と、図形特徴に対して黒画素数の最大値と最小値に基づいて補正を行う図形特徴補正部10と、全ての文字の図形特徴を記憶している認識辞書6と、図形特徴補正部10で補正された図形特徴と認識辞書6とを比較して類似度の最も高い文字に対応する文字コードを出力する文字認識部11と、を備えた構成からなる。
特許請求の範囲
【請求項1】認識文書から得られる2値画像データを記憶する画像記憶部と、前記画像記憶部に記憶されている2値画像データ中の黒画素の連なりを基にして各々の文字に外接する文字矩形を検出する文字矩形検出部と、前記文字矩形検出部で検出された個々の文字矩形の2値画像データ上における位置座標を記憶する文字矩形記憶部と、前記文字矩形記憶部中の文字矩形の位置座標を基にして2値画像データから1文字毎の文字画像を抽出してこの文字画像を縦・横方向に所定数分割してマス目状にしこの文字画像の各々のマス目内の黒画素数を計数して図形特徴を抽出する図形特徴抽出部と、前記図形特徴抽出部で抽出された図形特徴の各々のマス目内の黒画素数に対して各マス目の黒画素数の最大値と最小値に基づいて補正を行う図形特徴補正部と、全ての文字の図形特徴を記憶している認識辞書と、前記図形特徴補正部で補正された図形特徴と前記認識辞書とを比較して類似度の最も高い文字に対応する文字コードを出力する文字認識部と、前記文字認識部から出力される文字コードを認識結果として記憶する認識結果記憶部と、を備えたことを特徴とする文字認識装置。
発明の詳細な説明
【0001】
【産業上の利用分野】本発明は新聞,雑誌等の活字,ドット文字,手書き文字等を認識し、asciiコード等のコード情報に変換する文字認識装置に関するものである。
【0002】
【従来の技術】近年、文書等の検索等の作業性の向上,保存スペースの節約等のために、文書の電子化が行われるようになった。この際の入力装置として、キーボードに代わって文字認識装置が用いられるようになっている。
【0003】以下に従来の文字認識装置について説明する。図4は従来の文字認識装置の機能ブロック図である。1は認識対象文書を走査して2値画像データを出力する画像入力部、2は画像入力部1より出力される2値画像データを記憶する画像記憶部、3は画像記憶部2に記憶されている2値画像データから黒画素の連なりを基にして各々の文字に外接する文字矩形を検出する文字矩形検出部、4は文字矩形検出部3で検出された個々の文字矩形の2値画像データ上での位置座標を記憶する文字矩形記憶部、5は文字矩形記憶部4中に記憶されている文字矩形の位置座標を基にして2値画像データから1文字毎の文字画像を抽出しこの文字画像を縦・横方向に所定数分割してマス目状にしこの文字画像の各マス目内の黒画素数を計数して図形特徴を抽出する図形特徴抽出部、6は全ての認識対象文字を同様にマス目状に分割し各マス目内の黒画素数を記憶することによって全ての認識対象文字の図形特徴を記憶している認識辞書、7は図形特徴抽出部5で抽出された文字画像の図形特徴と認識辞書6に記憶されている認識対象文字の図形特徴とを対応するマス目内の黒画素数の差をとることで比較していきこの黒画素数の差の絶対値が最も小さい図形特徴を有する認識辞書6中の認識対象文字に対応する文字コードを出力する文字認識部、8は文字認識部7から出力される文字コードを認識結果として記憶する認識結果記憶部、9は認識結果記憶部8に記憶された認識結果等を表示するための表示部である。
【0004】以上のように構成された従来の文字認識装置について、以下その動作を説明する。図5は2値画像データの一例を示す図であり、図6は文字画像の一例を示す図である。a,b,cは2値画像データ中の1文字に外接する文字矩形、Xは文字矩形aの2値画像データ上でのx座標、Yは同様に文字外接矩形aのy座標である。
【0005】ここで、図6に示すように、1つの文字画像は、図形特徴抽出部5によって、f00乃至f33の16個のマス目に分割されるものとする。
【0006】初めに、画像入力部1によって、認識対象文書は2値画像データに変換され、画像記憶部2へ記憶される。ここで、例として、図5に示すような2値画像データが得られたものとする。次に、文字矩形検出部3によって、画像記憶部2に記憶されている2値画像中の黒画素の連なりを基にして、2値画像中の各々の文字に外接する文字矩形を検出し、その位置座標を文字矩形記憶部4に記憶する。ここで、図5に示すように、文字外接矩形a,b,cが検出されたものとする。次に、図形特徴抽出部5によって、文字矩形記憶部4中の文字矩形の位置座標に基づいて、画像記憶部2中の2値画像データから一文字分の文字画像を抽出する。ここで、図5に示すように、文字矩形記憶部4中に文字矩形aの座位座標X,Yが記憶されており、図6に示すように文字矩形aの内部が文字画像として抽出されたものとする。次に、図形特徴抽出部5は、抽出された文字画像を縦・横4つずつに分割し、f00乃至f33の16個のマス目に分け、それぞれのマス目毎の黒画素数を計数して、文字画像の図形特徴を抽出する。次に、文字認識部7は、図形特徴抽出部5で抽出された文字画像の図形特徴と、認識辞書6中に記憶されている認識対象文字の図形特徴とを比較し、図形特徴が最も類似している認識対象文字に対応した文字コードを認識結果記憶部8へ記憶する。次に、表示部9によって、認識結果記憶部8に記憶されている文字コードに対応する文字を認識結果として表示する。
【0007】
【発明が解決しようとする課題】しかしながら上記従来の構成では、図形特徴抽出部が文字画像を所定数のマス目に分割し、各々のマス目内の黒画素数を直接図形特徴として抽出しているため、文字画像中の文字の形が同じ場合であっても、文字の線が太い時は各々のマス目内の黒画素数が大きくなり、文字の線が細い時はこの黒画素数が小さくなり、それに応じて文字画像の図形特徴も変動してしまうために、線の太さが異なる文字を認識することができず汎用性に欠けるとともに、誤認識をすることがあり信頼性に欠けるという問題点を有していた。
【0008】本発明は上記従来の問題点を解決するもので、文字の線の太さが異なる場合であっても、文字認識を行うことができ汎用性に優れるとともに、認識精度を向上させることができる信頼性に優れた文字認識装置を提供することを目的とする。
【0009】
【課題を解決するための手段】この目的を達成するために本発明の文字認識装置は、認識文書から得られる2値画像データを記憶する画像記憶部と、前記画像記憶部に記憶されている2値画像データ中の黒画素の連なりを基にして各々の文字に外接する文字矩形を検出する文字矩形検出部と、前記文字矩形検出部で検出された個々の文字矩形の2値画像データ上における位置座標を記憶する文字矩形記憶部と、前記文字矩形記憶部中の文字矩形の位置座標を基にして2値画像データから1文字毎の文字画像を抽出してこの文字画像を縦・横方向に所定数分割してマス目状にしこの文字画像の各々のマス目内の黒画素数を計数して図形特徴を抽出する図形特徴抽出部と、前記図形特徴抽出部で抽出された図形特徴の各々のマス目内の黒画素数に対して各マス目の黒画素数の最大値と最小値に基づいて補正を行う図形特徴補正部と、全ての文字の図形特徴を記憶している認識辞書と、前記図形特徴補正部で補正された図形特徴と前記認識辞書とを比較して類似度の最も高い文字に対応する文字コードを出力する文字認識部と、前記文字認識部から出力される文字コードを認識結果として記憶する認識結果記憶部と、を備えた構成を有している。
【0010】
【作用】この構成によって、図形特徴補正部が、図形特徴抽出部で抽出された文字画像を分割した各々のマス目毎の黒画素数の最大値及び最小値に応じて図形特徴を補正し、文字認識部がこの補正された図形特徴を用いて文字認識を行うために、文字画像中の文字の形が同じであれば、この補正された図形特徴が文字の線の太さによらず略一定となり、文字の太さにかかわらず文字認識を行うことができるとともに、認識精度を向上させることができる。
【0011】
【実施例】以下本発明の一実施例における文字認識装置について、図面を参照しながら説明する。図1は本発明の一実施例における文字認識装置の機能ブロック図であり、図2は本発明の一実施例における文字認識装置の装置ブロック図である。1は画像入力部、2は画像記憶部、3は文字矩形検出部、4は文字矩形記憶部、5は図形特徴抽出部、6は認識辞書、8は認識結果記憶部、9は表示部であり、これらは従来例と同様なものなので同一の符号を付し説明を省略する。10は図形特徴抽出部5から出力される図形特徴の内分割された各々のマス目毎の黒画素数の最大値と最小値に基づいて図形特徴の文字画像の線の太さに対する補正を行う図形特徴補正部、11は図形特徴補正部10で補正された図形特徴と認識辞書6中の認識対象文字とを比較して文字認識を行う文字認識部である。図2において、12は文字認識装置全体を制御する中央演算処理装置(以下CPUと略す)、13はCPU12への指示が記載されたプログラムが記憶された制御プログラム領域14と認識辞書6が記憶される認識辞書領域15とを有するリードオンリメモリ(以下ROMと略す)、16は画像記憶部2を構成する2値画像データ領域17と文字矩形記憶部4を構成する文字矩形データ領域18と認識結果記憶部8を構成する認識結果データ領域19とを有するランダムアクセスメモリ(以下RAMと略す)、20は画像入力部1を構成し認識対象文書を走査して2値画像データを得るスキャナ、21は文字認識装置に文字認識開始の指示等を与えるためのキーボード、22はCRT等からなり表示部9を構成し認識結果等を表示するための表示装置、23は上記のデバイスを接続するバスである。
【0012】以上のように構成された本発明の一実施例における文字認識装置について、以下その動作を説明する。図3は本発明の一実施例における文字認識装置のフローチャートである。
【0013】初めに、認識対象文書を画像入力部1によって2値画像に変換して入力し、これを画像記憶部2に記憶する(S1)。次に、文字矩形検出部3によって、画像記憶部2に記憶されている2値画像データ中の黒画素の連なりに外接する矩形を求め、これに“i”等の分離している文字に対する補正を行って、2値画像データ中の1文字に外接する文字矩形を検出し、各文字矩形の2値画像データ上での位置座標を文字矩形記憶部4に記憶する(S2)。次に、図形特徴抽出部5によって、文字矩形記憶部4中に記憶されている文字矩形の位置座標を基にして、画像記憶部2中の2値画像データから1文字分の文字画像を抽出し、この文字画像を縦・横方向に所定数分割し、各マス目毎の黒画素数を計数して図形特徴を抽出する(S3)。次に、図形特徴補正部10によって、S3で抽出された図形特徴に、各マス目毎の黒画素数の最小値と最大値に基づいて、文字画像中の文字の線の太さに対する補正を行う(S4)。このstepの詳細は後述する。次に、文字認識部11によって、S4で補正された文字画像の図形特徴と、認識辞書6中の認識対象文字の図形特徴とを従来例と同様にして比較し、類似度の最も高い認識対象文字に対応するasciiコード等の文字コードを認識結果として出力し、これを認識結果記憶部8に記憶する(S5)。次に、画像記憶部2に記憶されている2値画像中の全ての文字を認識したか調べる(S6)。Noである場合は、次の文字を認識するためにS3へjumpし、Yesである場合は、表示部9によって、認識結果記憶部8に記憶されている全ての文字コードに対応する文字を認識結果として表示し、全ての処理を終了する(S7)。
【0014】次に、S4における図形特徴補正処理について、図6に示す具体例を用いて詳細に説明する。ここで、S3における図形特徴抽出処理によって、図6に示すような文字画像が抽出され、これがf00乃至f33の16個のマス目に分割され、各々のマス目毎の黒画素数が計数されて、文字画像の図形特徴が抽出されているものとする。この抽出された図形特徴を(表1)に示す。
【0015】
【表1】

【0016】まず、文字画像の各マス目毎の黒画素数の最小値,最大値を求める。ここで、(表1)より明らかなように、この最小値は0、最大値は26である。これに対して、認識文字の図形特徴を表す認識辞書6中の認識対象文字をマス目状に分割した各々のマス目内の黒画素数が1バイトで表されており、この値の範囲が0から255までであるものとする。次に、文字画像の各マス目毎の黒画素数の範囲を、認識対象文字の各々のマス目内の黒画素数の範囲に合うように補正する。ここで、認識対象文字の各々のマス目内の黒画素数の範囲が0から255までであり、文字画像の各マス目毎の黒画素数の最小値と最大値が異なっているために、補正後の図形特徴は(数1)で算出される。
【0017】
【数1】

【0018】この図形特徴補正部10による補正結果を(表2)に示す。
【0019】
【表2】

【0020】ここで、文字画像の各マス目毎の黒画素数の最小値と最大値とが等しい、即ち、全てのマス目の黒画素数が等しい場合は、1マス目あたりの総画素数を用い、補正後の図形特徴は(数2)で算出される。
【0021】
【数2】

【0022】以上のように本発明によれば、文字画像中の文字の線の太さに対する図形特徴の補正を行うことができ、文字の各所における濃淡の比を補正された図形特徴として抽出することができるために、認識対象文書中の文字の太さにかかわりなく、文字認識を高精度で行うことができる。
【0023】
【発明の効果】以上のように本発明は、図形特徴補正部が、図形特徴抽出部で抽出された文字画像を分割した各々のマス目毎の黒画素数の最大値及び最小値に応じて図形特徴を補正し、文字認識部がこの補正された図形特徴を用いて文字認識を行うために、文字画像中の文字の形が同じであれば、この補正された図形特徴が文字の線の太さによらず略一定となり、文字の太さにかかわらず文字認識を行うことができ汎用性に優れるとともに、認識精度を向上させることができる信頼性に優れた文字認識装置を実現できるものである。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013