米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 松下電器産業株式会社

発明の名称 文字認識装置
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開平7−28930
公開日 平成7年(1995)1月31日
出願番号 特願平5−175239
出願日 平成5年(1993)7月15日
代理人 【弁理士】
【氏名又は名称】小鍜治 明 (外2名)
発明者 湯下 良一
要約 目的
認識対象文書の一部を認識する場合に、利用者が文字認識領域を行単位で容易に指定することを目的とする。

構成
2値画像データを記憶している画像記憶部2から各々の文字に外接する文字矩形を検出して文字矩形記憶部5に記憶する文字矩形検出部4と、文字矩形の位置座標から行矩形等を切り出し行矩形記憶部7に記憶する行切り出し部6と、文字認識を行う座標を指定するための座標入力部3と、行矩形記憶部7を参照して入力された座標を含む行を検出する認識領域検出部12と、検出された行に含まれる文字矩形を基にして2値画像データから文字画像を抽出しその図形特徴を抽出する図形特徴抽出部8と、全ての文字の図形特徴を記憶している認識辞書9と、図形特徴抽出部8で抽出された図形特徴と認識辞書9とを比較して文字認識を行う文字認識部13とを備えた構成からなる。
特許請求の範囲
【請求項1】認識対象文書を走査して得られる2値画像データを記憶する画像記憶部と、前記画像記憶部に記憶されている2値画像データ中の黒画素の連なりを基にして各々の文字に外接する文字矩形を検出する文字矩形検出部と、前記文字矩形検出部で検出された個々の文字矩形の2値画像データ上における位置座標を記憶する文字矩形記憶部と、前記文字矩形記憶部に記憶されている文字矩形の位置座標の水平方向の分布が高い部分を行として切り出し個々の行を構成する文字矩形及び行に外接する行矩形を検出する行切り出し部と、前記行切り出し部で検出された各々の行を構成する文字矩形及び行矩形の2値画像データ上における位置座標を記憶する行矩形記憶部と、文字認識を行う座標を指定するための座標入力部と、前記行矩形記憶部を参照して前記座標入力部で入力された座標を含む行を検出する認識領域検出部と、前記認識領域検出部で検出された行に含まれる文字矩形の前記文字矩形記憶部中の位置座標を基にして2値画像データから1文字毎の文字画像を抽出しその図形特徴を抽出する図形特徴抽出部と、全ての文字の図形特徴を記憶している認識辞書と、前記図形特徴抽出部で抽出された図形特徴と前記認識辞書とを比較して類似度の最も高い文字に対応する文字コードを出力する文字認識部と、前記文字認識部から出力される文字コードを認識結果として記憶する認識結果記憶部とを備えたことを特徴とする文字認識装置。
発明の詳細な説明
【0001】
【産業上の利用分野】本発明は新聞,雑誌等の活字,ドット文字,手書き文字等を認識し、asciiコード等のコード情報に変換する文字認識装置に関するものである。
【0002】
【従来の技術】近年、文書等の検索等の作業性の向上,保存スペースの節約等のために、文書の電子化が行われるようになった。この際の入力装置として、キーボードに代わり文字認識装置が用いられるようになっている。
【0003】以下に従来の文字認識装置について説明する。図5は従来の文字認識装置の機能ブロック図である。1は認識対象文書を走査して2値画像データを出力する画像入力部、2は画像入力部1より出力される2値画像データを記憶する画像記憶部、3は画像記憶部2に記憶されている2値画像データの内文字認識を行う領域を指定するための座標入力部、4は座標入力装置3で指定された領域内の画像記憶部2に記憶されている2値画像データから黒画素の連なりを基にして各々の文字に外接する文字矩形を検出する文字矩形検出部、5は文字矩形検出部4で検出された個々の文字矩形の2値画像データ上での位置座標を記憶する文字矩形記憶部、6は文字矩形記憶部5に記憶されている文字矩形の位置座標の水平方向の分布が高い部分を行として切り出し個々の行を構成する文字矩形及び行に外接する行矩形を検出する行切り出し部、7は行切り出し部6で検出された各々の行を構成する文字矩形及び行矩形の2値画像データ上における位置座標を記憶する行矩形記憶部、8は文字矩形記憶部5中に記憶されている文字矩形の位置座標を基にして2値画像データから1文字毎の文字画像を抽出しその図形特徴を抽出する図形特徴抽出部、9は全ての認識対象文字の図形特徴を記憶している認識辞書、10は図形特徴抽出部8で抽出された文字画像の図形特徴と認識辞書9に記憶されている認識対象文字の図形特徴とを比較して類似度が最も高い図形特徴を有する認識辞書9中の認識対象文字に対応する文字コードを出力する文字認識部、11は文字認識部10から出力される文字コードを認識結果として記憶する認識結果記憶部である。
【0004】以上のように構成された従来の文字認識装置について、以下その動作を説明する。図6(a)は従来の文字認識装置の文字認識領域指定方法を示す図であり、図6(b)は一般的な文字矩形及びその文字矩形情報を示す図であり、図6(c)は一般的な行矩形及びその行矩形情報を示す図であり、図6(d)は一般的な文字認識結果情報を示す図である。aは利用者が指定した文字認識を行う領域を示す文字認識領域、P1 は座標入力部3によって入力された文字認識領域aの左上の2値画像データ上の位置を示す左上入力座標、P2 は座標入力部3によって入力された文字認識領域aの右下の位置を示す右下入力座標、Xは文字認識領域aの左上のX座標を示す文字認識領域X座標、ΔYは同様な文字認識領域Y座標、ΔXは文字認識領域aの幅を示す文字認識領域幅、Yは同様な文字認識領域高さである。図6(b)において、bは2値画像データ内の1文字に外接する文字外接矩形、b′は文字外接矩形bに対する文字矩形情報、Xmは文字外接矩形bの位置のX座標を示す文字矩形X座標、Ymは同様な文字矩形Y座標、ΔXmは文字外接矩形bの幅を示す文字矩形幅、ΔYmは同様な文字矩形高さである。図6(c)において、cは2値画像データ内の1つの行に外接する行矩形、c′は行矩形cに対する行矩形情報、Xnは行矩形cの位置のX座標を示す行矩形X座標、Ynは同様な行矩形Y座標、ΔXnは行矩形cの幅を示す行矩形幅、ΔYnは同様な行矩形高さである。図6(d)において、dは1つの文字矩形に対して文字認識を行った結果を示す文字認識結果である。
【0005】初めに、画像入力部1によって、認識対象文書を2値画像データに変換して読み込み、画像記憶部2に記憶する。次に、座標入力部3によって、利用者が文字認識を行う領域を指定する。ここで、図6(a)に示すように、2値画像データ内の文字列“abc”,“def”の部分を認識するために、利用者が座標入力部3によってこの部分を、正確に囲むように、左上入力座標P1 ,右下入力座標P2 を入力し、文字認識領域aとして指定したものとする。次に、文字矩形検出部4によって、2値画像データ中の座標入力部3で指定された文字認識領域内の黒画素の連なりを基にして、2値画像データ中の1文字に外接する文字矩形を検出し、各文字矩形の2値画像データ上の位置座標,通し番号よりなる文字矩形番号とを文字矩形情報b′として文字矩形記憶部5に記憶する。ここで、例として、画像記憶部2内の2値画像データから図6(b)に示すような文字外接矩形bが検出され、文字矩形記憶部5に文字矩形情報b′が記憶されたものとする。次に、行切り出し部6によって、文字矩形記憶部5中の各文字矩形の水平方向の2値画像データ上の位置座標の分布から分布の高い部分を行、低い部分を行間として切り出し、各行を構成する文字矩形及び各行に外接する行矩形cを検出し、その行情報を行矩形記憶部7へ記憶する。次に、文字認識部10によって、行矩形記憶部7の行情報に基づいて各行を構成している文字矩形番号を図形特徴抽出部8へ出力する。次に、図形特徴抽出部8によって、入力された文字矩形番号と文字矩形記憶部5とに基づいて、画像記憶部2から1文字の文字画像を抽出し、その黒画素の分布から図形特徴を抽出する。次に、文字認識部10によって、文字画像の図形特徴と認識辞書9中の認識特徴対象文字の図形特徴とを比較し、類似度の最も高い認識対象文字に対するasciiコード等の文字コードを認識結果として認識結果記憶部11へ記憶する。ここで、図6(d)に示すように、文字認識結果dは文字矩形番号と文字コードとからなっている。従来の文字認識装置は、上記の処理によって、認識対象文書の内の利用者が指定した部分を認識している。
【0006】
【発明が解決しようとする課題】しかしながら上記従来の構成では、利用者が認識対象文書中の一部だけを認識するために文字認識領域を指定する際に、文字認識領域を正確に囲む座標を座標入力部より入力しなければならず、認識対象文書の文字が小さい場合や、行と行との間が狭い場合等に、文字認識領域の指定が難しく煩雑で手数が掛かり作業性に欠けるという問題点を有していた。
【0007】本発明は上記従来の問題点を解決するもので、認識対象文書の一部を認識する場合に、利用者が文字認識領域を行単位で容易に指定することができる作業性に優れた文字認識装置を提供することを目的とする。
【0008】
【課題を解決するための手段】この目的を達成するために本発明の文字認識装置は、認識対象文書を走査して得られる2値画像データを記憶する画像記憶部と、前記画像記憶部に記憶されている2値画像データ中の黒画素の連なりを基にして各々の文字に外接する文字矩形を検出する文字矩形検出部と、前記文字矩形検出部で検出された個々の文字矩形の2値画像データ上における位置座標を記憶する文字矩形記憶部と、前記文字矩形記憶部に記憶されている文字矩形の位置座標の水平方向の分布が高い部分を行として切り出し個々の行を構成する文字矩形及び行に外接する行矩形を検出する行切り出し部と、前記行切り出し部で検出された各々の行を構成する文字矩形及び行矩形の2値画像データ上における位置座標を記憶する行矩形記憶部と、文字認識を行う座標を指定するための座標入力部と、前記行矩形記憶部を参照して前記座標入力部で入力された座標を含む行を検出する認識領域検出部と、前記認識領域検出部で検出された行に含まれる文字矩形の前記文字矩形記憶部中の位置座標を基にして2値画像データから1文字毎の文字画像を抽出してその図形特徴を抽出する図形特徴抽出部と、全ての文字の図形特徴を記憶している認識辞書と、前記図形特徴抽出部で抽出された図形特徴と前記認識辞書とを比較して類似度の最も高い文字に対応する文字コードを出力する文字認識部と、前記文字認識部から出力される文字コードを認識結果として記憶する認識結果記憶部とを備えた構成を有している。
【0009】
【作用】この構成によって、行切り出し部が予め行情報を行矩形記憶部に記憶させ、認識領域検出部が座標入力部で利用者が入力した座標を含む行を行矩形記憶部を参照することで検出し、文字認識部でこの行内の文字を認識することで、利用者が認識しようとする行の行矩形の内部の任意の位置を座標入力部から入力することだけで、文字認識領域を行単位で極めて容易に指定することができる。
【0010】
【実施例】以下本発明の一実施例における文字認識装置について、図面を参照しながら説明する。図1は本発明の一実施例における文字認識装置の機能ブロック図であり、図2は本発明の一実施例における文字認識装置の装置ブロック図である。1は画像入力部、2は画像記憶部、3は座標入力部、4は文字矩形検出部、5は文字矩形記憶部、6は行切り出し部、7は行矩形記憶部、8は図形特徴抽出部、9は認識辞書、11は認識結果記憶部であり、これらは従来例と同様なものなので同一の符号を付し説明を省略する。12は利用者が座標入力部3から入力した位置座標を含む行を行矩形記憶部7を参照して検出する認識領域検出部、13は認識領域検出部12で検出された行内の文字を認識する文字認識部である。図2において、14は文字認識装置全体を制御する中央演算処理装置(以下CPUと略す)、15はCPU14への指示が記載されたプログラムが記憶された制御プログラム領域16と認識辞書9が記憶される認識辞書領域17とを有するリードオンリメモリ(以下ROMと略す)、18は画像記憶部2を構成する2値画像データ領域19と文字矩形記憶部5を構成する文字矩形データ領域20と行矩形記憶部7を構成する行矩形データ領域21と認識結果記憶部11を構成する認識結果データ領域22とを有するランダムアクセスメモリ(以下RAMと略す)、23は画像入力部1を構成し認識対象文書を走査して2値画像データ領域19を得るスキャナ、24は文字認識装置に文字認識開始の指示等を与えるためのキーボード、25はマウス等からなり座標入力部3を構成して利用者が文字認識領域等の所望の位置座標を入力するための座標入力装置、26は認識結果等を表示するための表示するための表示装置、27は上記のデバイスを接続するバスである。
【0011】以上のように構成された本発明の一実施例における文字認識装置について、以下その動作を説明する。図3は本発明の一実施例における文字認識装置のフローチャートであり、図4は本発明の一実施例における文字認識装置の文字認識領域指定方法を示す図である。図4において、e,fは行切り出し部6で切り出された行矩形、P3 ,P4 は利用者が座標入力部3から入力した文字認識を行う行を指定するための認識対象行指定位置である。
【0012】初めに、画像入力部1によって、認識対象文書を2値画像に変換して入力し、これを画像記憶部2に記憶する(S1)。次に、文字矩形検出部4によって、画像記憶部2に記憶されている2値画像データ中の黒画素の連なりに外接する矩形を求め、これに“i”等の分離している文字に対する補正を行って、2値画像データ中の1文字に外接する文字矩形を検出し、各文字矩形の2値画像データ上での位置座標を文字矩形記憶部5に記憶する(S2)。次に、行切り出し部6によって、S2で検出された文字矩形の水平方向の位置の分布を求め、分布が高い部分を行、低い部分を行間として行の切り出しを行い、各行を構成する文字矩形番号と行に外接する行矩形の2値画像データ上での位置座標を行矩形記憶部7へ記憶する(S3)。ここで、例として、図4に示すように、行矩形e,fが切り出されたものとする。次に、座標入力部3によって、利用者がS3で切り出された行の内、文字認識したい行を指定する(S4)。ここで、図4に示すように、行矩形e,fの内部を文字認識するために、利用者が認識対象行指定位置P3 ,P4 を指定したものとする。また、認識対象行指定位置P3 ,P4 の位置は、行矩形e,f内であれば、文字上,文字間のいずれであってもよい。次に、認識領域検出部12によって、S4で指定された位置座標を含む行矩形e,fを、行矩形記憶部7に記憶されている全ての行矩形の座標を参照して検出する(S5)。ここで、図4に示すように、この処理によって行矩形e,fが検出される。次に、文字認識部13によって、S5で検出された行矩形を構成している文字矩形を、従来例と同様にして認識し、その認識結果を認識結果記憶部11に記憶する(S6)。次に、表示装置26によって、S6で求められた認識結果を表示し、全ての処理を終了する(S7)。
【0013】尚、本実施例においては、認識対象行を指定する際に、座標入力部3によって個々の行を各々指定しているが、認識開始行と認識終了行だけを指定するようにすれば、連続した複数の行を指定する際の作業性を向上させることができ好ましい。
【0014】
【発明の効果】以上のように本発明は、行切り出し部によって予め行情報が行矩形記憶部に記憶され、認識領域検出部によって座標入力部で利用者が入力した座標を含む行を行矩形記憶部を参照することで検出し、文字認識部でこの行内の文字を認識することで、利用者が認識しようとする行の行矩形の内部の任意の位置を座標入力部から入力するだけで、文字認識領域を行単位で極めて容易に指定することができる作業性に優れた文字認識装置を実現できるものである。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013