米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 松下電器産業株式会社

発明の名称 文字認識装置
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開平7−160811
公開日 平成7年(1995)6月23日
出願番号 特願平5−304012
出願日 平成5年(1993)12月3日
代理人 【弁理士】
【氏名又は名称】小鍜治 明 (外2名)
発明者 池牟禮 由美子
要約 目的
領域のサイズ、属性を修正できることを目的とする。

構成
文字認識対象文書を二値化した二値画像データから文字,表,図形,画像,罫線の属性付きの領域を抽出する手段と、抽出された領域と二値画像データと重ねて表示する手段と、領域の枠と領域の属性を重ねて表示する手段と、領域のサイズを拡縮する手段と、領域の属性を変更する手段と、領域に対して領域属性に応じた認識処理を行う手段を備える。
特許請求の範囲
【請求項1】文字認識対象文書を二値化した二値画像データから文字,表,図形,画像,罫線の属性付きの領域を抽出する手段と、抽出された領域と二値画像データと重ねて表示する手段と、領域の枠と領域の属性を重ねて表示する手段と、領域のサイズを拡縮する手段と、領域の属性を変更する手段と、領域に対して領域属性に応じた認識処理を行う手段を備えたことを特徴とする文字認識装置。
発明の詳細な説明
【0001】
【産業上の利用分野】本発明は、印刷文書のデータベース化や文書の再利用のために、スキャナ等の光学的手段を用いて取り込んだ二値画像データから文字,図形,表,画像,罫線等の属性毎に領域を抽出し、各属性に応じた認識処理を行う文字認識装置に関するものである。
【0002】
【従来の技術】従来の文字認識装置における認識処理の流れについて、以下に説明する。
(1)スキャナにより認識対象となる文書の二値画像データを取り込む。
(2)取り込んだ二値画像データから、文字,図形,表,画像(写真),罫線の属性をもつ領域を抽出し、抽出された領域の範囲を示す枠と領域の属性を表示する。
(3)表示された領域結果をマウス等のポインティングデバイスによって認識する領域を選択する。
(4)選択された領域に対して、領域の属性に応じた認識処理を行う。
【0003】文字領域が選択された場合は文字認識を行い、図形領域が選択された場合は図形のベクトル化処理を行い、表領域が選択された場合は表構造の認識を行った後、セル内の文字認識を行う。また、画像領域については画像データの圧縮を行い、データ量の軽減を図る。
(5)文字認識された結果に対しては認識結果の表示を行い、認識確度の低い認識結果に対しては、複数候補文字選択、あるいは、文字の挿入削除等の文字編集を行い、希望するデータの取得を実現する。
【0004】
【発明が解決しようとする課題】しかしながら上記従来の文字認識装置では、実際には画像であるものを文字として認識してしまうことがあり、画像に文字認識をかけ、文字認識結果がデタラメなものとなることがあった。このような場合、オペレータはいちいちデタラメな認識結果を修正せねばならず、オペレータの負担が甚大となるという問題点を有していた。
【0005】そこで本発明は、オペレータの負担を軽減できる文字認識装置を提供することを目的とする。
【0006】
【課題を解決するための手段】本発明は、文字認識対象文書を二値化した二値画像データから文字,表,図形,画像,罫線の属性付きの領域を抽出する手段と、抽出された領域と二値画像データと重ねて表示する手段と、領域の枠と領域の属性を重ねて表示する手段と、領域のサイズを拡縮する手段と、領域の属性を変更する手段と、領域に対して領域属性に応じた認識処理を行う手段を備える。
【0007】
【作用】本発明は前記の構成により、領域修正手段によって領域の属性又はサイズの変更を行い、オペレータが認識処理に先立ち正しい属性サイズに変更することができ、爾後の認識の精度を向上することにより、オペレータの修正の手間を減ずることができる。
【0008】
【実施例】本発明の一実施例における文字認識装置について図面を参照して説明する。図1は本発明の一実施例における文字認識装置のブロック図である。1は、リードオンリーメモリ(以下、ROMと略す)2に格納されている文字認識プログラムを実行する中央処理装置(以下、CPUと略す)である。ランダムアクセスメモリ(以下、RAMと略す)3には、認識対象文書をスキャナ4より取り込んだ画像データ及び文字認識プログラムで使用するデータを格納する。キーボード5,マウス6は、認識結果に対して、オペレータが確認/修正の指令を外部より与える装置である。CRT7は、CPU1によって実行された認識結果を表示する表示装置である。
【0009】図2は、本発明の一実施例における文字認識装置のフローチャート、図3は本発明の一実施例における文字認識装置において領域を表わす枠と二値画像データを重ねて表示した表示例図、図4は本発明の一実施例における文字認識装置において領域と属性を重ねて表示した表示例図である。以下、図2〜図4を参照しながら本発明の一実施例における文字認識装置の文字認識処理について説明する。
【0010】スキャナ4により認識対象となる文書の二値画像データを取り込む(S1)。本実施例では領域抽出処理を高速に行うために取り込んだ二値画像データを解像度100DPI程度にOR縮小して、RAM3に格納する。
【0011】取り込んだ画像データに対して、認識処理を行うか否かの確認のために、取り込み画像データをCRT7に表示する(S2)。ここで表示する画像データは、画像データの全体が表示可能となるように縮小されたデータである。
【0012】次に、取り込んだ画像データに対して処理を続けるか否かをキーボード5、あるいは、マウス6による入力により決定する(S3)。処理終了が選択された場合は、endへジャンプする。
【0013】処理継続の場合は、領域抽出用の解像度100DPIの画像データを基に、文字,表,図形,画像(写真),罫線の属性付きの領域を抽出する(S4)。
【0014】図3に示すように、S4で抽出した領域に対し、各領域の範囲を表わす枠と画像データを重ねて、CRT7に表示して(S5)、キーボード5、あるいは、マウス6によるオペレータからの外部指令(入力)を待つ(S6)。
【0015】キーボード5、あるいは、マウス6より入力があった場合に、認識処理を行う領域が指定されたか否かの判定を行う(S7)。認識を行う領域が選択された場合はS16へジャンプする。領域選択でない場合はS8へ進む。
【0016】S8では、拡大表示が選択されたか否かを判定する。拡大表示が選択された場合は、S13の拡大表示処理へジャンプし、そうでない場合はS9へ進む。
【0017】S9では、縮小表示が選択されたか否かを判定する。縮小表示が選択された場合は、S14の縮小表示処理へジャンプし、そうでない場合はS10へ進む。
【0018】S10では、領域修正が選択されたか否かを判定する。領域修正が選択された場合はS15の領域修正処理へジャンプし、そうでない場合はS11へ進む。
【0019】S11では、領域抽出結果表示の画面切替えが選択されたか否かを判定する。画面切替えが選択された場合はS12へ進み、それ以外の入力の場合はS6の入力待ち状態に戻る。
【0020】S12は、キーボード5、あるいは、マウス6によって画面切替えが選択された場合の処理である。現在表示されている状態が図3に示すように画像データと領域枠の場合は、図4に示すような領域枠と領域の属性が表示される。また、現在表示されている状態が図4に示すように領域枠と領域の属性が表示されている場合は、図3に示すように画像データと領域枠の表示に切替えられる。即ち、画面切替えは図3と図4の状態がトグルとなる。図3の状態は画像データに対して、領域抽出範囲が正確に検出されているかの確認のため、図4の状態は領域の属性が正確に検出されているかの確認のために提供される。領域属性の区別に枠の線のパターンにより区別したり、色で区別したりしてもよいが、その場合白黒のCRT7では判定できないので、この表示切替え方式を実現した。領域表示切替え終了後、S6の入力待ち状態に戻る。
【0021】S13は、キーボード5、あるいは、マウス6によって拡大表示が選択された場合の処理である。ここでの処理は、現在表示している画像データの倍率を1段階上げて再表示する。この機能を設けることによって、検出した領域の修正が高精度で行える。拡大表示処理終了後、S6の入力待ち状態に戻る。
【0022】S14は、キーボード5、あるいは、マウス6によって縮小表示が選択された場合の処理である。ここでの処理は、現在表示している画像データの倍率を1段階下げて再表示する。拡大表示した画像データの文書全体のイメージを見たい場合にこの機能を選択する。縮小表示処理終了後、S6の入力待ち状態に戻る。
【0023】S15は、キーボード5、あるいは、マウス6によって領域修正が選択された場合の処理である。領域抽出された結果に誤りがあった場合等、検出した領域に対して修正を行う場合に、この機能が選択される。修正項目には、領域の座標値の変更,属性の変更,領域の削除,追加,分割,統合があり、希望の領域結果を得ることが可能である。領域修正処理終了後、S6の入力待ち状態に戻る。
【0024】S16では、キーボード5、あるいは、マウス6によって領域修正が選択された場合の処理である。選択された領域に対して、領域の属性に応じた認識処理を行う。文字領域が選択された場合は文字認識を行い、図形領域が選択された場合は図形のベクトル化処理を行い、表領域が選択された場合は表構造の認識を行った後、セル内の文字認識を行う。また、画像領域については画像データの圧縮を行い、データ量の軽減を図る。文字認識された結果に対しては認識結果の表示を行い、認識確度の低い認識結果に対しては、複数候補文字選択、あるいは、文字の挿入削除等の文字編集を行い、希望するデータの取得を実現する。
【0025】
【発明の効果】本発明は上述のように構成したので、認識処理に先立ち領域のサイズ、属性を修正でき、認識の精度を向上することにより、オペレータの負担を軽くすることができる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013