Warning: copy(.htaccess): failed to open stream: Permission denied in /home/jp321/public_html/header.php on line 8
文字認識装置及び文字処理方法 - 凸版印刷株式会社
米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 凸版印刷株式会社

発明の名称 文字認識装置及び文字処理方法
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2001−331765(P2001−331765A)
公開日 平成13年11月30日(2001.11.30)
出願番号 特願2000−147834(P2000−147834)
出願日 平成12年5月19日(2000.5.19)
代理人
発明者 松島 貴久 / 斎藤 貢市 / 原 香次郎
要約 目的


構成
特許請求の範囲
【請求項1】画像情報を表示する手段と、前記画像情報から文字パターンを認識する手段と、前記認識した文字パターンの書式を前記画像情報に合わせる手段と、前記認識した文字パターンの縦組/横組を画像情報に合わせる手段と、前記画像情報の表示色と前記書式と縦組/横組を合わせた文字パターンの表示色を変更する手段と、前記書式と縦組/横組を合わせた文字パターンを前記画像情報の表示と階層表示にして重ねて表示する手段と、前記文字パターンの階層表示の位置を移動可能とする手段と、前記文字パターンを修正可能とする手段とを有することを特徴とする文字認識装置。
【請求項2】前記文字パターンの階層表示の位置の移動がページ単位の移動であることを特徴とする請求項1記載の文字認識装置。
【請求項3】前記文字パターンの階層表示の位置の移動が行単位の移動であることを特徴とする請求項1記載の文字認識装置。
【請求項4】前記文字パターンの階層表示の位置の移動が文字単位の移動であることを特徴とする請求項1記載の文字認識装置。
【請求項5】画像情報を表示する工程と、前記画像情報から文字パターンを認識する工程と、前記認識した文字パターンの書式を前記画像情報に合わせる工程と、前記認識した文字パターンの縦組/横組を画像情報に合わせる工程と、前記画像情報の表示色と前記書式と縦組/横組を合わせた文字パターンの表示色を変更する工程と、前記書式と縦組/横組を合わせた文字パターンを前記画像情報の表示と階層表示にして重ねて表示する工程と、前記文字パターンの階層表示の位置を移動する工程と、前記文字パターンを修正する工程とを有することを特徴とする文字処理方法。
【請求項6】前記文字パターンの階層表示の位置の移動がページ単位の移動であることを特徴とする請求項5記載の文字処理方法。
【請求項7】前記文字パターンの階層表示の位置の移動が行単位の移動であることを特徴とする請求項5記載の文字処理方法。
【請求項8】前記文字パターンの階層表示の位置の移動が文字単位の移動であることを特徴とする請求項5記載の文字処理方法。
発明の詳細な説明
【0001】
【発明の属する技術分野】本発明は文字を含む画像情報から文字パターンのデータ(以下文字データとする。)を認識する文字認識装置及びこの文字認識のエラーの検出と文字データの修正を行う文字処理方法に関し、特に画像から光学的に画像情報を読み取り、文字データを認識する光学的文字認識装置(以下OCRとする)及びこの文字認識のエラーの検出と文字データの修正を行う文字処理方法に関する。
【0002】
【従来の技術】近年になり、急速に印刷におけるプリプレスのDTP化が進み、画像情報からの文字データの読み取りも大量に行われるようになってきた。それに伴い、OCRによる文字認識も精度を要求されるようになってきているが、読み取りエラーを完全になくす有効な手段は未だにない。このため、文字認識のエラーの検出と文字データの修正を人手により行う必要があり、時間や労力がかさむものとなっていた。
【0003】そこで、OCRによる文字認識のエラーの検出と修正を効率よく行うために、画像情報と認識した文字データを並列して表示したものがある。また、特許公報第2763042号にあるように、画像情報と認識した文字データを重ねて表示したものもある。
【0004】しかしながらこのような方法でも、文字フォントとその大きさ、行間隔、文字間隔等の書式設定を合わせても、欧文フォントの挿入などで組版時での文字位置の調整を行う場合があるため、文字の位置関係がズレてしまい、特に行単位で画像情報と文字データを並列表示しても、文字認識のエラーの検出と文字データの修正が困難になることがあった。
【0005】
【発明が解決しようとする課題】本発明はこのような問題点を解決するためになされたものであり、その課題とするところは、文字の位置関係がズレたものであっても、文字認識のエラーの検出と文字データの修正を効率よく行うことを可能とする文字認識装置及び文字処理方法を提供することにある。
【0006】
【課題を解決するための手段】本発明はこの課題を解決するため、すなわち請求項1記載の発明は、画像情報を表示する手段と、前記画像情報から文字パターンを認識する手段と、前記認識した文字パターンの書式を前記画像情報に合わせる手段と、前記認識した文字パターンの縦組/横組を画像情報に合わせる手段と、前記画像情報の表示色と前記書式と縦組/横組を合わせた文字パターンの表示色を変更する手段と、前記書式と縦組/横組を合わせた文字パターンを前記画像情報の表示と階層表示にして重ねて表示する手段と、前記文字パターンの階層表示の位置を移動可能とする手段と、前記文字パターンを修正可能とする手段とを有することを特徴とする文字認識装置である。
【0007】本発明はこの手段により、文字パターンの階層表示の位置を移動可能とすることにより、画像情報での文字の文中での位置関係がズレを起こしている場合であっても、適宜位置を合わせつつ文字を重ねて表示し、文字認識のエラーの検出と文字データの修正が容易に可能となる。
【0008】また請求項2記載の発明は、前記文字パターンの階層表示の位置の移動がページ単位の移動であることを特徴とする請求項1記載の文字認識装置である。
【0009】本発明はこの手段により、ページ単位での階層表示の移動を可能とし、これにより特に特定の1ページ内でのみ画像情報が縦組と横組の複合であったりする場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば文字部分が縦組みであっても、ある1ページのみに横組みの表があり、この表内に文字がある場合、表の中外でのページ単位の階層表示の移動方向を縦横を変えて文字を重ねることで、エラーの検出と文字データの修正が容易に可能となる。
【0010】また請求項3記載の発明は、前記文字パターンの階層表示の位置の移動が行単位の移動であることを特徴とする請求項1記載の文字認識装置である。
【0011】本発明はこの手段により、行単位での階層表示の移動を可能にし、これにより特に画像情報における文字の間隔が任意の行の文の一部分でのみ変化していたりする場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば和文中への欧文フォントの挿入により文字間隔が狭まる場合などに、欧文フォントのある行では文字データの階層表示を右左に移動して文字を重ねることで、エラーの検出と文字データの修正が容易に可能となる。
【0012】また請求項4記載の発明は、前記文字パターンの階層表示の位置の移動が文字単位の移動であることを特徴とする請求項1記載の文字認識装置である。
【0013】本発明はこの手段により、文字単位での階層表示の移動を可能にし、これにより特に画像情報における文字の並び位置がずれている場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば横組の和文中へ挿入された欧文フォントなどで組版時に文字の並び位置を上がっている場合などに、文字単位で文字データの階層表示を上下に移動して文字を重ねることで、エラーの検出と文字データの修正が容易に可能となる。
【0014】また請求項5記載の発明は、画像情報を表示する工程と、前記画像情報から文字パターンを認識する工程と、前記認識した文字パターンの書式を前記画像情報に合わせる工程と、前記認識した文字パターンの縦組/横組を画像情報に合わせる工程と、前記画像情報の表示色と前記書式と縦組/横組を合わせた文字パターンの表示色を変更する工程と、前記書式と縦組/横組を合わせた文字パターンを前記画像情報の表示と階層表示にして重ねて表示する工程と、前記文字パターンの階層表示の位置を移動する工程と、前記文字パターンを修正する工程とを有することを特徴とする文字処理方法である。
【0015】本発明はこの手段により、文字パターンの階層表示の位置を移動可能とすることにより、画像情報での文字の文中での位置関係がズレを起こしている場合であっても、適宜位置を合わせつつ文字を重ねて表示し、文字認識のエラーの検出と文字データの修正が容易に可能となる。
【0016】また請求項6記載の発明は、前記文字パターンの階層表示の位置の移動がページ単位の移動であることを特徴とする請求項5記載の文字処理方法である。
【0017】本発明はこの手段により、ページ単位での階層表示の移動を可能とし、これにより特に特定の1ページ内でのみ画像情報が縦組と横組の複合であったりする場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば文字部分が縦組みであっても、ある1ページのみに横組みの表があり、この表内に文字がある場合、表の中外でのページ単位の階層表示の移動方向を縦横を変えて文字を重ねることで、エラーの検出と文字データの修正が容易に可能となる。
【0018】また請求項7記載の発明は、前記文字パターンの階層表示の位置の移動が行単位の移動であることを特徴とする請求項5記載の文字処理方法である。
【0019】本発明はこの手段により、行単位での階層表示の移動を可能にし、これにより特に画像情報における文字の間隔が任意の行の文の一部分でのみ変化していたりする場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば和文中への欧文フォントの挿入により文字間隔が狭まる場合などに、欧文フォントのある行では文字データの階層表示を右左に移動して文字を重ねることで、エラーの検出と文字データの修正が容易に可能となる。
【0020】また請求項8記載の発明は、前記文字パターンの階層表示の位置の移動が文字単位の移動であることを特徴とする請求項5記載の文字処理方法である。
【0021】本発明はこの手段により、文字単位での階層表示の移動を可能にし、これにより特に画像情報における文字の並び位置がずれている場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば横組の和文中へ挿入された欧文フォントなどで組版時に文字の並び位置を上がっている場合などに、文字単位で文字データの階層表示を上下に移動して文字を重ねることで、エラーの検出と文字データの修正が容易に可能となる。
【0022】
【発明の実施の形態】以下、本発明を図面に基づき詳細に説明する。図1に本発明の一実施例における画像情報の表示とこれと書式と縦組/横組を合わせた文字パターンを階層表示にて重ねた表示と、この文字パターンを行単位で移動可能とした場合の階層表示の位置を移動した場合の表示を示す。1〜0の文字の並びからなる画像情報1はその中間(5〜8)で文字間隔が広がっている。そのためこれから認識した文字データ2を並列しても位置が合わないためエラーの検出が明確に行われない。また、図1では濃淡で示しているが、画像情報1と文字データ2は色を変えて表示しているものとする。
【0023】ここで、画像情報1に対して文字データ2を階層表示とすることにより、行の左に合わせて重ね合せた表示3により行の左側の部分は変換が正常に行われていることを示すように色が混合した表示(図1では黒色表示)となりエラーの検出を明確に行うことができる。しかし、行の右側では実際は誤変換していないにもかかわらず色が混合した表示とはならず、画像情報1の色と文字データ2の色がそれぞれ表示されてしまう。
【0024】そこで、画像情報1に対して階層表示となっている文字データ2の表示位置を右に移動して重ね合せた表示4により、行の右側の部分も変換が正常に行われていることを示すように色が混合した表示(図では黒色表示)となりエラーの検出を明確に行うことができる。
【0025】図2に本発明の一実施例における、文字パターンの階層表示を行単位で行う場合の文字処理方法の工程を示す。まず、画像情報をOCRにて読み取り、OCRにて認識した文字パターンのデータを画像情報に合わせて縦組/横組表示を設定する。また、文字パターンのデータの書式(文字のフォント、大きさ、文字間隔、行間隔等)を画像情報に合わせて設定する。ここで書式の設定、縦組/横組の設定の順番はどちらを先に行っても良く、特に限定しない。その後、画像情報と文字データの文字色を決定し、画像情報の表示と階層表示するように文字データの表示を行う。また、表示状態を見てから文字色を変更しても良い。ここで、文字データは各行ごとに表示位置を移動可能なものとし、行ごとに文字データの表示位置を移動しながら画像情報の文字と重ねて表示させ、エラーの検出を行い、エラーが検出された箇所の文字データの修正を行う。
【0026】図3に本発明の一実施例における文字認識装置の構造を示す。CPUは中央処理装置であって、内部にフォントデータや文字コードデータを有する読み出し専用メモリ(ROM)や、各種プログラムや入力部からのデータ、フォントデータ等を一次保存する書き込み可能メモリ(RAM)を有し、以下に示す各部とそれぞれはバスラインにて接続される。その他、バスラインは図示しない外部(LANCD−ROMドライブ、ネットワーク等)と接続することも可能である。表示部はカラーLCD等のディスプレイ、入力部はキーボード等を示す。VRAMは表示用書き込み専用メモリを示し、HDは外部記憶装置となるハードディスクを示し、各種フォントデータが記録保存されており、場合によっては新規のフォントデータも外部より入力登録、保存される。あるいは修正後の文字データなどを記録保存する。PRTはプリンターであり、修正後の文字データを出力するものであるが、特に必要というわけではなく、適宜設けるものであってよい。
【0027】画像情報読取部は画像のイメージデータをビットマップイメージで読み取るもので、このデータを画像情報メモリに格納する。本発明においては画像情報は画像をこの画像情報読取部で読み取っても良いし、元からビットマップイメージで得られた画像情報を画像情報メモリに直接格納しても良い。文字データ認識部は前記画像情報より文字を切り出し、文字データとして認識するもので、このデータを文字データメモリに格納する。
【0028】縦組/横組設定部は画像情報の縦組/横組を判別するプログラムと、文字データをこれに合わせて設定するプログラムが格納されている。書式設定部は画像情報より判別した文字データの書式を設定するものであり、ROM、RAMに格納された文字コードのデータより該当するフォントの種類及び大きさを設定し、文字間隔、行間隔等を設定する。文字色設定部は画像情報の表示色と文字データの文字表示色を異なるものに設定するもので、好ましくは青と赤、または緑と赤などのように明確に判別できるように色分けされる。
【0029】
【発明の効果】以上に示したように、本発明の請求項1記載の発明によれば、文字パターンの階層表示の位置を移動可能とすることにより、画像情報での文字の文中での位置関係がズレを起こしている場合であっても、適宜位置を合わせつつ文字を重ねて表示し、文字認識のエラーの検出と文字データの修正が容易に可能となるという作用効果を奏する。
【0030】また、請求項2記載の発明によれば、ページ単位での階層表示の移動を可能とし、これにより特に特定の1ページ内でのみ画像情報が縦組と横組の複合であったりする場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば文字部分が縦組みであっても、ある1ページのみに横組みの表があり、この表内に文字がある場合、表の中外でのページ単位の階層表示の移動方向を縦横を変えて文字を重ねることで、エラーの検出と文字データの修正が容易に可能となるという作用効果を奏する。
【0031】また、請求項3記載の発明によれば、行単位での階層表示の移動を可能にし、これにより特に画像情報における文字の間隔が任意の行の文の一部分でのみ変化していたりする場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば和文中への欧文フォントの挿入により文字間隔が狭まる場合などに、欧文フォントのある行では文字データの階層表示を右左に移動して文字を重ねることで、エラーの検出と文字データの修正が容易に可能となるという作用効果を奏する。
【0032】また、請求項4記載の発明によれば、文字単位での階層表示の移動を可能にし、これにより特に画像情報における文字の並び位置がずれている場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば横組の和文中へ挿入された欧文フォントなどで組版時に文字の並び位置を上がっている場合などに、文字単位で文字データの階層表示を上下に移動して文字を重ねることで、エラーの検出と文字データの修正が容易に可能となるという作用効果を奏する。
【0033】また、請求項5記載の発明によれば、文字パターンの階層表示の位置を移動可能とすることにより、画像情報での文字の文中での位置関係がズレを起こしている場合であっても、適宜位置を合わせつつ文字を重ねて表示し、文字認識のエラーの検出と文字データの修正が容易に可能となるという作用効果を奏する。
【0034】また、請求項6記載の発明によれば、ページ単位での階層表示の移動を可能とし、これにより特に特定の1ページ内でのみ画像情報が縦組と横組の複合であったりする場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば文字部分が縦組みであっても、ある1ページのみに横組みの表があり、この表内に文字がある場合、表の中外でのページ単位の階層表示の移動方向を縦横を変えて文字を重ねることで、エラーの検出と文字データの修正が容易に可能となるという作用効果を奏する。
【0035】また、請求項7記載の発明によれば、行単位での階層表示の移動を可能にし、これにより特に画像情報における文字の間隔が任意の行の文の一部分でのみ変化していたりする場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば和文中への欧文フォントの挿入により文字間隔が狭まる場合などに、欧文フォントのある行では文字データの階層表示を右左に移動して文字を重ねることで、エラーの検出と文字データの修正が容易に可能となるという作用効果を奏する。
【0036】また、請求項8記載の発明によれば、文字単位での階層表示の移動を可能にし、これにより特に画像情報における文字の並び位置がずれている場合に好適に文字認識のエラーの検出と文字データの修正が可能となる。例えば横組の和文中へ挿入された欧文フォントなどで組版時に文字の並び位置を上がっている場合などに、文字単位で文字データの階層表示を上下に移動して文字を重ねることで、エラーの検出と文字データの修正が容易に可能となるという作用効果を奏する。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013