米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 日本電気株式会社

発明の名称 文字認識装置および方法
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開平9−16715
公開日 平成9年(1997)1月17日
出願番号 特願平7−165125
出願日 平成7年(1995)6月30日
代理人 【弁理士】
【氏名又は名称】京本 直樹 (外2名)
発明者 佐瀬 慎治
要約 目的
印字濃度の異なる多様な字形の文字を高精度に読み取る。

構成
入力された多値画像を予め設定された閾値で2値化処理部20により2値化し、その2値化画像を文字切出し部30で1文字ごとに切出す。1文字分の文字画像に対して、文字認識部40で文字認識が行こなわれる。一方、1文字ごとに切り出された2値化文字画像における黒点数を黒点数計数部60で計数する。そして、文字認識の結果と黒点数の計数結果により、多値画像を2値化しなおす必要があるかどうかを再2値化判定部70で判定し、必要がある場合には、前述の閾値とは異なる閾値を閾値変更部80で設定し、その新たな閾値を用いて再2値化処理部90により再度多値画像を2値化する。
特許請求の範囲
【請求項1】 読取対象の多値画像を入力する画像入力手段と、前記多値画像を予め定められた第1の閾値で2値化して2値画像を得る2値化手段と、前記2値画像を、1文字ずつ切り出して文字画像を得る文字切出し手段と、前記文字画像の2値化の際の閾値に依存する特徴を示す値を特徴量として検出する特徴量検出手段と、前記文字画像を格納手段に予め登録された参照パターンと照合することにより文字認識を行う文字認識手段と、前記特徴量と前記文字認識で判定結果を与えた前記参照パターンに付加された前記特徴量の許容範囲とに基づいて、前記文字画像に対し、前記第1の閾値と異なる閾値で再度2値化すべきか否かを判定する判定手段と、前記判定手段の判定に応じて、前記多値画像のうち少なくとも前記文字画像を含む領域を、前記第1の閾値と異なる第2の閾値を用いて再度2値化して2値画像を得る再2値化手段とを備えることを特徴とする文字認識装置。
【請求項2】 前記特徴量検出手段は、前記文字画像における黒点数を計数する手段であることを特徴とする前記請求項1に記載の文字認識装置。
【請求項3】 前記特徴量検出手段は、前記文字画像における輪郭長を計測する手段であることを特徴とする前記請求項1に記載の文字認識装置。
【請求項4】 前記再2値化手段は、前記特徴量と前記許容範囲との比較結果に基づいて、前記第2の閾値を設定する閾値設定手段を含むことを特徴とする前記請求項1に記載の文字認識装置。
【請求項5】 前記閾値設定手段は、前記特徴量と前記許容範囲の上限値または下限値との差に応じて、前記第1の閾値と前記第2の閾値との変更幅を設定する手段を備えることを特徴とする前記請求項4に記載の文字認識装置。
【請求項6】 前記文字画像の大きさを正規化する手段を備え、前記文字認識手段は、正規化された前記文字画像を認識するものであり、前記特徴量検出手段は、正規化された前記文字画像の特徴量を検出するものであることを特徴とする前記請求項5に記載の文字認識装置。
【請求項7】 読取対象の多値画像を入力する画像入力手段と、前記多値画像を予め定められた第1の閾値で2値化して2値画像を得る2値化手段と、前記2値画像を、1文字ずつ切り出して文字画像を得る文字切出し手段と、予め参照パターンが登録されるとともに、各参照パターンごとに濃度情報が登録される格納手段と、前記文字画像を前記格納手段に予め登録された参照パターンと照合することにより文字認識を行うとともに、その文字認識の判定結果を与えた前記参照パターンに付加された前記濃度情報を得る文字認識手段と、前記濃度情報に基づいて、前記文字画像に対し、前記第1の閾値と異なる閾値で再度2値化すべきか否かを判定する判定手段と、前記判定手段の判定に応じて、前記多値画像のうち前記文字画像を含む領域を、前記第1の閾値と異なる第2の閾値を用いて再度2値化して2値画像を得る再2値化手段とを備えることを特徴とする文字認識装置。
【請求項8】 前記格納手段は、読取対象の多値文字画像を最適な第3の閾値で2値化して得られたパターンが参照パターンとして登録される標準パターン用辞書と、前記多値文字画像を前記第3の閾値よりも大きな閾値で2値化して得られたパターンが参照パターンとして登録される薄パターン用辞書と、前記多値文字画像を前記第3の閾値よりも小さな閾値で2値化して得られたパターンが参照パターンとして登録される濃パターン用辞書とを含む少なくとも3種の辞書を備え、前記文字認識手段は、文字認識の判定結果を与えた参照パターンが前記いずれの辞書に登録されたものかを検出し、その検出結果を濃度情報として出力することを特徴とする前記請求項7に記載の文字認識装置。
【請求項9】 前記再2値化手段は、前記濃度情報に基づいて、前記第2の閾値を設定する閾値設定手段を備えることを特徴とする前記請求項8に記載の文字認識装置。
【請求項10】 読取対象の多値画像を入力するステップと、前記多値画像を予め定められた第1の閾値で2値化して2値画像を得るステップと、前記2値画像を、1文字ずつ切り出して文字画像を得るステップと、前記文字画像の2値化の際の閾値に依存する特徴を示す値を特徴量として検出するステップと、前記文字画像を格納手段に予め登録された参照パターンと照合することにより文字認識を行うステップと、前記特徴量と前記文字認識で判定結果を与えた前記参照パターンに付加された前記特徴量の許容範囲とに基づいて、前記文字画像に対し、前記第1の閾値と異なる閾値で再度2値化すべきか否かを判定するステップと、前記判定手段の判定に応じて、前記多値画像のうち少なくとも前記文字画像を含む領域を、前記第1の閾値と異なる第2の閾値を用いて再度2値化して2値画像を得るステップとを含むことを特徴とする文字認識方法。
発明の詳細な説明
【0001】
【産業上の利用分野】本発明は、文字認識装置および方法に関し、特に、多様な濃度で記入または印刷された多様な形状の文字を読み取ることを可能とする文字認識装置および方法に関する。
【0002】
【従来の技術】文字認識装置において、スキャナからの多値濃度の画像(以下、多値画像とする)を適正な閾値(濃度)で2値化することによって得られる文字画像を読み取る技術は非常に重要なものである。例えば、様々な場所で印字された伝票を回収して読み取る場合、伝票には、新品のインクリボンを用いて印字されたような濃い印字や、また、かろうじて人間が識別できる程度の薄い印字等、様々な濃度の印字がなされる。そして、この印字文字の濃度差は、文字の形状の多様さとともに、文字認識の性能を劣化させる主要な原因となっていた。固定した閾値により2値画像を得る場合、実際には、同形状の文字であっても、普通の濃度で印字されている場合と、非常に濃く印字されている場合とでは、図8(a)および図8(b)や、図9(a)および図9(b)に示すように全く異なる文字画像が得られることになる。したがって、印字濃度の相違が原因で、認識結果は全く異なるものとなってしまい、誤認識を引き起こしていた。
【0003】このような文字画像の濃度の変化に対応するために用いられる技術が、例えば、特開平4−148293号公報や特開平4−309194号公報に開示されている。
【0004】特開平4−148293号公報に開示された従来の技術は、紙面全体の濃度分布に基づいて、文字部分の濃度とその他の濃度の境界を検出し、その境界濃度を最適閾値として設定するというものであった。
【0005】また、特開平4−309194号公報に開示された従来の技術は、印字濃度の異なる文字パターンを予め複数の辞書に登録しておき、認識時に印字濃度を検出し、検出された印字濃度に応じて最適な辞書を選択することにより、様々な印字濃度の文字を認識するというものであった。
【0006】
【発明が解決しようとする課題】しかしながら、従来の技術のうち、特開平4−148293号公報に記載の方法では、濃度分布を利用しているために、処理時間が非常にかかるという問題点があった。さらに、紙面全体の濃度分布を利用しているために、例えば、非ドロップアウトカラーで印字された記入枠を有する帳票を読取対象とした場合には、適当な2値化閾値が得られないという問題点があった。
【0007】また、特開平4−309194号公報に記載の方法では、例えば、図8(b)に示すような文字画像「6」を認識する場合には、印字濃度が濃い場合の辞書が選択されることになるが、その文字画像に対して「6」と「8」とを十分に区別することが非常に困難であった。同様に、図9(b)に示す文字画像は、文字「4」がつぶれたものであるが、単に、印字濃度ごとに最適な辞書を用いるだけでは、この文字画像に対して「4」と「6」とを十分に区別することができなかった。
【0008】以上のように、従来の技術では、処理効率および認識精度の点で多くの問題点を残していた。
【0009】
【課題を解決するための手段】上記問題点を解決するために、本発明の文字認識装置は、読取対象の多値画像を入力する画像入力手段と、得られた多値画像を予め定められた第1の閾値で2値化して2値画像を得る2値化手段と、その2値画像を、1文字ずつ切り出して文字画像を得る文字切出し手段と、文字画像の特徴を示す値を特徴量として検出する特徴量検出手段と、予め参照パターンが登録されるとともに、各参照パターンごとに前記特徴量の許容範囲が登録される格納手段と、文字画像を前述の格納手段に予め登録された参照パターンと照合することにより文字認識を行うとともに、その文字認識の判定結果を与えた参照パターンに付加された許容範囲を得る文字認識手段と、特徴量と許容範囲とを比較することによって、文字画像に対し、第1の閾値と異なる閾値で再度2値化すべきか否かを判定する判定手段と、多値画像のうち文字画像を含む領域を、第1の閾値と異なる第2の閾値を用いて再度2値化して2値画像を得る再2値化手段とを備えるものである。特徴量としては、文字画像の黒点数や、輪郭長を適用する。本発明は、このように構成することにより、文字の潰れやかすれの具合を文字認識の結果および文字の黒点数や輪郭長等の特徴量に基づいて計測し、その計測結果にしたがって、容易にかつ高精度に最適な再2値化のための閾値を設定することができる。
【0010】さらに、特徴量と許容範囲との比較結果に応じて、新たに設定される第2の閾値を所望の値に設定することにより、最適な2値化閾値をより早く設定することができる。
【0011】さらに、本発明は、読取対象の多値文字画像を最適な第3の閾値で2値化して得られたパターンが参照パターンとして登録される標準パターン用辞書と、その多値文字画像を第3の閾値よりも大きな閾値で2値化して得られたパターンが参照パターンとして登録される薄パターン用辞書と、その多値文字画像を第3の閾値よりも小さな閾値で2値化して得られたパターンが参照パターンとして登録される濃パターン用辞書とを含む少なくとも3種の辞書を備えた文字辞書を用い、1文字ごとに切り出された文字画像を格納手段に予め登録された参照パターンと照合することにより文字認識を行うとともに、その文字認識の判定結果を与えた参照パターンが前述のいずれの辞書に登録されたものなのかを検出し、その検出結果を濃度情報(標準情報、濃情報および薄情報)として得る文字認識手段と、その濃度情報に基づいて、文字画像に対し、第1の閾値と異なる閾値で再度2値化すべきか否かを判定する判定手段と、多値画像のうち文字画像を含む領域を、第1の閾値と異なる第2の閾値を用いて再度2値化して2値画像を得る再2値化手段とを備えるものである。
【0012】
【実施例】次に、本発明の文字認識装置の実施例について図面を参照して詳細に説明する。
【0013】本発明の第1の実施例は、入力された多値画像を予め設定された閾値で2値化し、その2値化画像を1文字ごとに切出した後、その1文字分の文字画像に対して、文字認識を行う。一方、1文字ごとに切り出された2値化画像は、2次元メッシュ構造を有しており、文字部分が黒点、背景が白点として構成されている。そして、その2値化画像を構成する黒点部分のメッシュ数を計数する。そして、文字認識の結果と黒点数の計数結果により、多値画像を2値化しなおす必要があるかどうかを判定し、必要がある場合には、前述の閾値とは異なる閾値で、再度多値画像を2値化する。2値化された文字画像を文字認識するとともに、前述と同様に文字画像の黒点数を計数し、文字認識結果と黒点数の計数結果に応じて、再度、2値化しなおす必要があるか否かを判定する。以上の処理を、2値化しなおす必要がないと判定されるまで繰り返し行い、最終的な文字認識結果を入力画像の読取結果として出力するというものである。このように、本実施例は、文字の潰れやかすれの具合を文字認識の結果および文字の黒点数等の特徴量に基づいて計測し、その計測結果にしたがって、容易にかつ高精度に最適な再2値化のための閾値を設定することができる。
【0014】図1は、本実施例の文字認識装置の構成を示すブロック図であり、画像入力部10は、多値画像を入力するものである。多値画像の形式は、各画素について濃度情報を有している画像であり、スキャナから光学的に入力された信号であっても、予めファイル装置等の記憶手段に記憶しておいた画像データを読み出したものであってもかまわない。ここで、前者の場合には、画像入力部10として、光学スキャナを、また、後者の場合には、ファイルデータ読出装置を適用することになる。
【0015】2値化処理部20は、画像入力部10で入力された多値画像を予め設定された閾値で2値化する。この閾値は、画像入力部や、濃度補正処理等に依存するものであり、実験的に設定されるものである。
【0016】文字切出し部30は、2値化処理部20により2値化された2値画像から、1文字ずつの文字画像を切り出すものである。帳票OCRのように予め読取位置が定まっている場合には、与えられた読取位置を示す座標から直接文字画像を切り出す。また、文書OCRにおけるページ画像やカメラ入力の画像などの場合には、読取対象部分を解析により自動的に抽出して、文字画像を切り出す。これらの文字切出し方法は、本発明の本質ではなく、既に、開示されている多くの従来技術から、入力画像の形成等により適宜適切な方法を選択して実行すればよいものである。なお、本実施例では、各読取対象の文字画像の2値画像の切出し位置を文字切出し部30内のメモリに格納しておく。この文字画像の切出し位置は、後述される再2値化処理部90における処理で使用される。
【0017】文字認識部40は、文字辞書50に格納されている参照パターンと、文字切出し部30により1文字ごとに切り出された文字画像とを照合するものである。本実施例では、文字画像が文字辞書50内のどの参照パターンを利用して認識されたかがわかればよいため、その具体的な手法は、多数提案されている従来の技術の文字認識方法のいずれでもかまわない。ただし、文字認識部40では、文字画像の変形を許容できる度合い、つまり、読み取ることが可能な文字画像の変形の度合い(以下、変形吸収能力)を高く設定しておく。こうすると、2値化処理部20で多値画像を2値化する際に使用された閾値が不適当な値であって、2値化して得られる文字画像が変形していたとしても、その文字画像を文字辞書50内のいずれかの参照パターンを利用して認識することが可能となる。つまり、図8(b)に示す文字画像が「6」の参照パターンにより判定されることもあれば、「8」の参照パターンにより判定されることもある。この際、文字認識における変形吸収能力を高く設定したことにより、誤認識の発生率が高くなるが、後述するように、本実施例では、閾値を変更して再2値化処理を行った後、再度、文字認識を行うように構成されているため、変形吸収能力を高く設定することによる認識率の低減は、最終的な文字画像の読取結果には反映されない。
【0018】黒点数計数部60は、文字切出し部30により1文字ごとに切り出された文字画像における黒点数を計数するものである。2値画像の黒点を1、白点を0とし、文字切出し部30から送出される文字画像中の1の数を計数する処理であり、周知技術であるため、詳細な説明は省略する。
【0019】再2値化判定部70は、文字認識部40から送られる情報と黒点数計数部60から送られる文字画像の黒点数とに基づいて、閾値を変えて、再度、2値化処理を行うか否かを判定する。
【0020】閾値変更部80は、再2値化判定部70で、再2値化を行う必要があると判定された場合に、再2値化判定部70から送られる情報に基づいて2値化処理部20で用いられた閾値とは異なる新たな閾値を設定し、その変更後の閾値を再2値化処理部90に送出する。
【0021】再2値化処理部90は、文字切出し部30で既に算出されている1文字ごとの切出し位置を参照して、多値画像のうち再2値化が必要である判定された文字画像を含む領域を閾値変更部80により変更された新たな閾値を用いて2値化する。
【0022】次に、本実施例の動作について図1、図2および図3を参照して説明する。図2は、本実施例で用いられる文字辞書の登録内容を示す図であり、図3は、図1における閾値変更部の構成を示すブロック図である。なお、画像入力部10で多値画像が入力されてから、文字切出し部30で文字切出し処理が行われるまでの処理は、周知慣用技術であるため、説明は省略する。
【0023】本実施例では、図2に示すような文字辞書50を用いる。この文字辞書50には、格納される各参照パターン51ごとに、その参照パターンを利用して認識される文字画像の黒点の計数値として許容される範囲52が予め登録されている。そして、文字認識部40から、文字画像の認識結果とともに、認識する際に用いられた参照パターンに応じた黒点計数値の許容範囲が再2値化判定部70に送出される。再2値化判定部70では、黒点数計数部60から送られる文字画像の黒点計数値と文字認識部40から送られる黒点計数値の許容範囲とが比較される。そして、黒点計数部60から送られる黒点計数値が黒点数の許容範囲内に入れば、文字認識部40から送られる認識結果が最終的な読取結果として出力される。また、黒点計数部60から送られる黒点計数値が前述の許容範囲内に入らなければ、再度、2値化が必要であると判定されるとともに、黒点計数値と許容範囲の大小関係が閾値変更部80に出力される。なお、文字認識部40において、文字画像をいずれの参照パターンを利用しても認識できなかった場合には、再2値化判定部70は、認識不能信号を閾値変更部80に出力する。
【0024】再2値化判定部70から黒点計数値と許容範囲の大小関係が出力されると、閾値変更部80における変更方向設定部81では、閾値の変更方向が設定される。つまり、黒点計数値が許容範囲よりも大きい場合には、閾値を大きくする(言い換えれば、2値化文字画像を薄くする)方向に閾値変更方向が設定される。逆に、黒点計数値が許容範囲よりも小さい場合には、閾値を小さくする(言い換えれば、2値化文字画像を濃くする)方向に閾値変更方向が設定される。
【0025】設定された閾値の変更方向は、比較部82により、前回の閾値の変更方向と比較される。前回の閾値の変更方向は、履歴記憶部84に記憶されている。比較部82により、閾値の変更方向が、前回のものと逆方向、例えば、前回、閾値を大きくする方向に変更したにもかかわらず、今回、閾値を小さくする方向に変更するように設定されている場合には、この文字画像は読取不能であると判定される。一方、閾値の変更方向が、前回のものと同一方向である場合には、そのまま、閾値の変更方向を閾値設定部83に送出する。また、はじめての閾値変更処理の場合にも、同様に、変更方向設定部81で設定された閾値の変更方向が閾値設定部83に送出される。この際、今回の閾値の変更方向は、履歴記憶部84に格納される。
【0026】閾値設定部83では、比較部82から送られる閾値の変更方向および履歴記憶部84から読み出される今回の閾値とに基づいて、新たな閾値が設定される。そして、新たに設定された閾値は、履歴記憶部84に格納される。こうして、設定された閾値が、再2値化処理部90に送出され、再2値化処理部90により、その新たな閾値を用いて、画像入力部10から送出される多値画像が2値化される。この際、既に説明したとおり、文字切出し部30からの文字切出し位置情報を参照することにより、多値画像のうち再2値化が必要であると判定された文字画像を含む領域だけが再2値化されることになる。なお、閾値設定部83による閾値の設定の際、最大濃度レベルと等しい閾値をさらに大きくするように変更する場合や、最小濃度レベルと等しい閾値をさらに小さくするように変更する場合には、その文字画像は、読取不能であると判定される。
【0027】再2値化判定部70から認識不能信号が送出されると、閾値変更部80における読出部85により、履歴記憶部84に格納されている今回の閾値およびその際の閾値の変更方向が読み出され、それらが閾値設定部83に送出される。閾値設定部83は、読み出された今回の閾値を、前回の変更方向と同一方向に修正して新たな閾値を設定する。ここで、読出部85に読み出された今回の閾値が、予め設定された初期値であり、閾値変更方向を示すデータが存在しない場合には、閾値設定部83により、最小の濃度レベルに近い値もしくは最大の濃度レベルに近い値が新たな閾値として設定される。そして、その新たな閾値とともに、閾値変更方向として、最小の濃度レベルに近い値が設定された場合には閾値を大きくする方向が、また、最大の濃度レベルに近い値が設定された場合には閾値を小さくする方向が履歴記憶部84に格納され、以降の閾値の変更設定処理の際に用いられる。そして、既に説明したとおり、閾値設定部83で設定された新たな閾値を用いて、再2値化処理部90により、多値画像が2値化される。なお、前述のとおり、閾値設定部83による閾値の設定の際、最大濃度レベルと等しい閾値をさらに大きくするように変更する場合や、最小濃度レベルと等しい閾値をさらに小さくするように変更する場合には、その文字画像は、読取不能と判定される。
【0028】再2値化処理部90で再度、2値化され得られた文字画像は、再び文字認識部40で文字認識される。以上の処理が、個々の文字画像ごとに、読取結果が出力されるか、または、読取不能と判定されるまで繰り返される。
【0029】前述の文字辞書50に登録される各参照パターンごとの黒点数の許容範囲は、予め実験により決定される最適な範囲が設定される。つまり、実際に文字の読み取りを行い、参照パターンごとに正読された場合の2値文字画像の黒点数の分布と、正読されなかった場合の黒点数の分布とを作成し、その黒点数の分布に基づいて、誤読や読取不能が極力発生しないような黒点数の範囲を設定する。
【0030】また、閾値を変更する際の変更幅は、濃度の階調の設定、入力機器や画像補正の性質等に応じて適宜設定すればよいが、例えば、黒点数計数部60から再2値化判定部70に送られる黒点数と黒点数の許容範囲との近さに応じて動的に変化させてもよい。つまり、黒点数計数部60から送られる黒点数が、許容範囲の上限の1〜1.5倍までであれば、変更幅を1階調の濃度レベルとし、黒点数が、許容範囲の上限の1.5倍〜2倍までであれば、変更幅を2階調の濃度レベルとする。また、黒点数が、許容範囲の下限の1倍〜1/2倍までであれば、変更幅を1階調の濃度レベルとし、許容範囲の下限の1/2〜1/3倍までであれば、変更幅を2階調の濃度レベルとする。
【0031】なお、再2値化処理部90において、前回の閾値よりも小さい、つまり、文字画像が濃くなる方向に再2値化処理が行われた場合、文字切出し枠よりも2値化された文字画像が大きくなってしまう場合がある。そこで、文字切出し部30で取得された文字切出し枠と中心が同じで面積を大きくした枠を設定し、その枠内で再2値化された文字画像の外接矩形を再度設定する等の処理を行う。
【0032】さらに、文字辞書50には、参照パターンのみを登録しておき、参照パターンに対応する黒点数の許容範囲は、再2値化判定部70内に設けるテーブルに格納しておいてもよい。つまり、文字認識部60は、文字認識処理で判定結果を与えた参照パターンを再2値化判定部70に送出し、再2値化判定部70は、前述のテーブルを参照して、得られた参照パターンに対応した黒点数の許容範囲を得るように構成してもよい。
【0033】次に、本発明の第2の実施例について図4を参照して説明する。
【0034】本実施例は、前述の第1の実施例における再2値化判定部における再2値化の判定基準として、2値化された文字画像における黒点数に変えて、文字画像の輪郭長を用いるものであり、全体の処理自体は、第1の実施例と同様であるため、重複部分の説明は省略する。
【0035】図4は、本実施例の構成を示すブロック図であり、図1に示す第1の実施例の構成における黒点数計数部60の変わりに、文字画像の輪郭長を計測する輪郭長計測部100が設けられ、さらに、各参照パターンごとに許容される輪郭長の範囲が登録された文字辞書53が設けられている。輪郭長計測部100では、輪郭追跡アルゴリズムを用いて正確に文字画像の輪郭長を計測することができる。輪郭追跡アルゴリズムは、ラン追跡や3×3のマスクによる追跡が広く知られており、周知慣用技術であるため説明は省略する。
【0036】文字認識部41では、文字切出し部30から送出される文字画像を文字辞書53内の参照パターンを用いて文字認識し、その認識結果とともに、用いた参照パターンに対応した輪郭長の許容範囲が再2値化判定部71に送出される。再2値化判定部71では、輪郭長計測部100から送られる文字画像の輪郭長と文字認識部41から送られる輪郭長の許容範囲とが比較され、その比較結果に基づいて、再2値化の必要性が判定される。その他の処理は、第1の実施例とほとんど同様であるため説明を省略する。
【0037】文字画像の輪郭長は、情報量が黒点数に比べて多いために、これを再2値化の判定基準として用いることにより、よりきめ細かな再2値化の判断および閾値の設定を行うことが可能となる。
【0038】なお、第1の実施例および第2の実施例では、再2値化の判定基準である文字画像の特徴量として黒点数または輪郭長を用いたが、同様の効果を発揮する他の文字画像の特徴量を適用してもよいことは言うまでもない。
【0039】次に、本発明の第3の実施例について図5を参照して説明する。
【0040】前述の第1および第2の実施例では、印字文字のように規格がはっきりしている場合の読取には有効であるが、読取対象が手書き文字や大きさが非常にばらついている印字文字である場合には、文字画像の大きさが大きく変化してしまうため、精度よく認識できないこともある。そこで、本実施例では、1文字ごとに切り出された文字画像を正規化する手段を設けることにより、文字画像の大きさのばらつきによる認識率の低下を防止するというものである。
【0041】図5は、本実施例の構成を示すブロック図であり、本実施例の構成の大部分が前述の第1の実施例の構成と同様であるため、重複部分の説明は省略する。正規化部120は、文字切出し部30により1文字ごとに切り出された各文字画像の特徴量(例えば、黒点数や輪郭長)を一定範囲内の値にするように、文字切出し部30から送られる文字画像の大きさ正規化する。正規化の方法は、文字画像の外接矩形の大きさを各文字画像ごとに一定にする方法、各文字画像ごとに外接矩形の縦横比を変化させずにその面積を一定にする方法および各文字画像ごとの1次モーメントや2次モーメントを一定にする方法等を使用することができる。文字認識部40は、正規化された文字画像を文字認識し、また、黒点数計数部60は、正規化された文字画像の黒点数を計数する。その他の処理は、前述の第1の実施例と同様である。なお、黒点数計数部60および文字辞書50の代わりに第2の実施例における輪郭長計測部100および文字辞書53を用いてもかまわないことは言うまでもない。
【0042】次に、本発明の第4の実施例について図6および図7を参照して説明する。
【0043】本実施例は、文字認識の際に用いられる参照パターンに付加された濃度情報(「濃」、「標準」および「薄」の3種類)に基づいて、再2値化の必要性を判定するというものである。
【0044】図6は、本実施例の構成を示すブロック図であり、文字辞書54は、図7に示すように、標準参照パターン用辞書541、濃参照パターン用辞書542および薄参照パターン用辞書543を備えている。この文字辞書54の作成方法について説明する。文字を入力して得られた多値画像から、その文字を読み取るのに最適な2値化閾値で2値化して得られるパターンを標準参照パターン用辞書541に登録する。また、その最適な2値化閾値よりも濃い閾値(濃度レベルとしては小さい閾値)でその多値画像を2値化して得られるパターンを濃参照パターン用辞書542に登録する。また、その最適な2値化閾値よりも薄い閾値(濃度レベルとしては大きい閾値)でその多値画像を2値化して得られるパターンを薄参照パターン用辞書543に登録する。このように、同一の文字を入力して得られた多値画像を3種類の閾値で2値化して得られる3つの参照パターンを閾値の濃度別にそれぞれ登録する。
【0045】文字認識部42は、文字切出し部30から送出される文字画像を文字辞書54の参照パターンを用いて認識するとともに、用いた参照パターンが標準参照パターン用辞書541、濃参照パターン用辞書542または薄参照パターン用辞書543のいずれの辞書に登録されているものなのかを検出する。この際、使用する辞書を限定するのではなく、3つの辞書に登録された全ての参照パターンと文字画像とが照合される。そして、文字の認識結果とともに、参照パターンが登録されていた辞書の濃度情報(「標準濃度」、「濃い濃度」または「薄い濃度」のいずれか)が再2値化判定部72に出力される。
【0046】再2値化判定部72では、文字認識部42から送られた濃度情報に基づいて、再2値化の必要性が判定される。文字認識部42から濃度情報として「標準濃度」が出力された場合に限り、再2値化の必要性がないと判定され、濃度情報と同時に文字認識部42から出力された認識結果が最終的な読取結果として出力される。これに対し、文字認識部42から送られた濃度情報が、「濃い濃度」または「薄い濃度」である場合には、再2値化が必要であると判定され、その濃度情報が閾値変更部86に出力される。
【0047】閾値変更部86では、基本的には、図1に示す第1の実施例における閾値変更部80と同様の処理が実行される。第1の実施例では、閾値変更部80は、再2値化判定部70から出力される黒点計数値とその許容範囲との大小関係に基づいて、新たな閾値が設定されるが、本実施例では、閾値変更部86は、再2値化判定部72から出力される「濃い濃度」または「薄い濃度」の濃度情報に基づいて、新たな閾値が設定される。ここで、閾値変更部86では、「濃い濃度」の濃度情報が供給された場合には、第1の実施例における黒点計数値が許容範囲よりも大きい場合と同様の処理が実行される。つまり、元の閾値を薄くする方向(閾値の濃度レベルを大きくする方向)に変更して得られる閾値が再2値化のための新たな閾値として設定される。一方、「薄い濃度」の濃度情報が供給された場合には、第1の実施例における黒点計数値が許容範囲よりも小さい場合と同様の処理が実行される。つまり、元の閾値を濃くする方向(閾値の濃度レベルを小さくする方向)に変更して得られる閾値が再2値化のための新たな閾値として設定される。そして、再2値化処理部90は、閾値変更部86で変更された新たな閾値を用いて画像入力部10から送出される多値画像を2値化し、2値化して得られる文字画像を文字認識部42に供給する。なお、本実施例において、特に説明していない部分の動作は、前述の第1の実施例の動作と同様である。
【0048】なお、濃度情報を、「極薄濃度」、「薄濃度」、「標準濃度」、「濃濃度」、「極濃濃度」のごとく、さらに細かく設定してもよく、この場合は、文字辞書54内に設けられる辞書の数も増えることになる。
【0049】
【発明の効果】以上説明したように、本発明によれば、文字認識の結果および2値化文字画像の黒点計数値または輪郭長に基づいて、閾値を変更しての再2値化を行うか否かを判定し、最終的に、最適な閾値を用いて、多値画像を2値化しているために、読取対象の濃度の変化が大きい場合でも、参照パターンのフォント数等を限定することなく、正確に読み取ることができる。特に、輪郭長を再2値化の判定基準として用いることにより、読取精度を向上させることができる。
【0050】さらに、第3の実施例では、文字画像を正規化した後、その文字画像の黒点計数値や輪郭長を計測するように構成しているために、手書き文字や大きさの一定しない印字文字も、高精度に読み取ることができる。
【0051】さらに、第4の実施例は、H/W等、繰り返し処理の方が有効な形態では、本発明を効率よく実現することができる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013