米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 村田機械株式会社

発明の名称 構造化文書生成装置とそのプログラム
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2003−30220(P2003−30220A)
公開日 平成15年1月31日(2003.1.31)
出願番号 特願2001−213688(P2001−213688)
出願日 平成13年7月13日(2001.7.13)
代理人 【識別番号】100086830
【弁理士】
【氏名又は名称】塩入 明 (外1名)
【テーマコード(参考)】
5B075
【Fターム(参考)】
5B075 ND06 NK31 
発明者 谷本 好史
要約 課題
画像データとリンクなどにより関連付けた構造化文書の生成に際して、検索用のキーワードに適した文字情報を、構造化文書中に容易に埋め込む事ができるようにする。

解決手段
画像データをスキャナで読み取った際に、文字情報およびその位置情報を抽出するための手段と、抽出した文字情報をキーワードとして、その位置情報とともに属性として埋め込んだ構造化文書を生成するための手段とを設け、抽出した文字情報を属性情報として構造化文書中に埋め込んで、構造化する。
特許請求の範囲
【請求項1】 画像データから構造化文書を生成するための装置であって、画像データ中の文字情報を抽出するための手段と、抽出した文字情報を属性として埋め込んだ構造化文書を生成するための手段、とを設けたことを特徴とする、構造化文書生成装置。
【請求項2】 前記抽出手段を文字認識手段で構成したことを特徴とする、請求項1の構造化文書生成装置。
【請求項3】 前記文字認識手段はさらに抽出した文字情報の画像データ中での位置に関する情報を出力し、かつ前記文字情報と共に該位置情報を構造化文書に属性として埋め込むことを特徴とする、請求項2の構造化文書生成装置。
【請求項4】 画像データから構造化文書を生成する装置のためのプログラムであって、画像データ中から抽出した文字情報を属性として埋め込んだ構造化文書を生成するための命令を設けたことを特徴とする、構造化文書生成プログラム。
【請求項5】 さらに、抽出した文字情報の画像データ中での位置に関する情報を、構造化文書に属性として埋め込むための命令を設けたことを特徴とする、請求項4の構造化文書生成プログラム。
【請求項6】 さらに、画像データから文字情報を抽出する際のルールに従って、文字情報の候補を抽出するための命令とを設けたことを特徴とする、請求項4または5の構造化文書生成プログラム。
発明の詳細な説明
【0001】
【発明の利用分野】この発明は、構造化文書の生成装置とそのプログラムとに関する。
【0002】
【従来技術】XML(Extensible Markup Language)やSVG(Scalable Vector Graphics),XHTML(Extensible Hypertext Markup Language),VoiceXML(Voice Extensible Markup Language)などの構造化文書のための規格が提案されている。これらの規格では、データの意味内容を情報処理装置が理解して扱えるように、タグなどで構造化して用いる。XMLなどはマークアップ言語であるが、データの構造化を目的とする点で、データの表現(タブや改行、フォントなどの指定)を目的とするHTMLとは異なっている。XMLなどの特徴は、構造化されたデータに対して、属性の名前を新たに定義できる点にある。属性はデータの名前とデータ自体のセットであり、名前をデータの意味や内容と対応させれば、名前によってデータを解釈して、処理・加工できる。
【0003】ファクシミリで受信した文書やスキャナで読み取った文書を、構造化しあるいは構造化文書と結びつけて管理することが提案されている。このような場合、構造化文書の検索用などにキーワード等を埋め込むことができると便利であるが、元々のデータが画像データであるため、キーワードは一々人手で入力する必要がある。
【0004】
【発明の課題】この発明の基本的課題は、画像データを構造化した構造化文書、あるいは画像データとリンクなどにより関連付けた構造化文書の生成に際して、検索用のキーワードなどに適した文字情報を、構造化文書中に容易に埋め込むことができるようにすることにある(請求項1〜6)。請求項2の発明での追加の課題は、文字情報の抽出のための具体的構成を提供することにある。請求項3,5の発明での追加の課題は、画像データ中の文字情報やその周辺の画像を容易に確認できるようにすることにある。請求項6の発明での追加の課題は、キーワード等として埋め込むのに適した文字情報を的確に抽出できるようにすることにある。
【0005】
【発明の構成】この発明の構造化文書生成装置は、画像データから構造化文書を生成するための装置であって、画像データ中の文字情報を抽出するための手段と、抽出した文字情報を属性として埋め込んだ構造化文書を生成するための手段、とを設けたことを特徴とする(請求項1)。画像データは構造化文書中に埋め込んでも良いが、構造化文書とは別ファイルにして、リンクなどにより関連付けても良い。
【0006】好ましくは、前記抽出手段を文字認識手段で構成し、文字情報を自動的に抽出できるようにする(請求項2)。特に好ましくは、文字認識手段から抽出した文字情報の画像データ中での位置に関する情報を出力させて、文字情報と共に位置情報を構造化文書に属性として埋め込む(請求項3)。
【0007】この発明の構造化文書管理プログラムは、画像データから構造化文書を生成する装置のためのプログラムであって、画像データ中から抽出した文字情報を属性として埋め込んだ構造化文書を生成するための命令を設けたことを特徴とする(請求項4)。
【0008】好ましくは、抽出した文字情報の画像データ中での位置に関する情報を、構造化文書に属性として埋め込むための命令を設ける(請求項5)。また好ましくは、画像データから文字情報を抽出する際のルールに従って、文字情報の候補を抽出するための命令とを設ける(請求項6)。ルールは、固定のルールでも、ユーザが追加・変更・修正可能な可変のルールでも良い。
【0009】
【発明の作用と効果】この発明の構造化文書生成装置や構造化文書生成プログラムでは、画像データ中の文字情報を抽出して、構造化文書に属性として埋め込むので、文字情報をキーワード等として利用し、構造化文書の検索や管理、あるいは構造化文書とリンクした画像データの検索や管理が容易になる(請求項1,4)。
【0010】ここで文字情報の抽出は、光学的文字読取装置(OCR)等の文字認識手段を用いれば、容易に行うことができる(請求項2)。そして抽出した文字情報を構造化するのみでなく、文字情報の位置に関する情報を属性として構造化すると、画像データ中での文字情報自体を容易に確認でき、文字情報の確認や文字情報の周囲の画像の取り出し等が容易になる(請求項3,5)。
【0011】画像データ中に多数の文字情報が含まれている場合でも、キーワードとして相応しいものを適切に抽出できるようにするため、好ましくは文字情報を抽出するためのルールを設け、このルールに従って属性として埋め込む文字情報の候補を抽出する(請求項6)。
【0012】例えば納品書や請求書等の定型文書を構造化する場合、宛先や品番、納品書や請求書の発行日等が文字情報の候補として相応しく、これらの位置はほぼ決まっているので、所定の位置から文字情報を抽出することをルールとすればよい。また文字情報の候補の辞書を設け、辞書に含まれている文字列を候補として抽出しても良い。さらに図1,図2,表1,表2等の文字列とそれに続く文字列を文字情報の候補として抽出するルールを設けると、「図1 AとBとの関係」等の図表や写真の表題等を文字情報として抽出できる。このようにして、画像データの種類と目的とに応じた文字情報を抽出できる。
【0013】
【実施例】図1〜図3に、実施例の構造化文書生成装置とそのプログラムとを示す。なお構造化文書生成装置に関する記載は、原則として構造化文書の生成プログラムにも該当する。図1に示すように、構造化文書生成装置2はスキャナ4とキーワード付与部6とを備えている。キーワード付与部6は、スキャナ4で読み取った画像データ(イメージデータ)から文字情報とその位置に関する情報を抽出する。キーワード付与部6には、光学的文字読取装置(OCR)8と、ルール表適用部10並びにルール表記憶部12,ユーザインターフェース14とを設けてある。
【0014】ルール表は画像データから文字情報を抽出する際のルールを集めた表で、抽出すべき文字情報の存在位置に関するルールや、辞書に存在するかどうかから文字列の抽出を判別するための文字列を集めた辞書、表1,図1等の特定の文字列に応答してその周辺の文字列を探索するためのルール、等からなる。これらのルールでは、請求書や納品書等の定型文書か、一般的な文書か、あるいは実験結果のチャートや写真などかにより、適用すべきルールが異なる。そこでルール表を多数設け、ユーザインターフェース14からユーザがルール表を選択できるようにする。そしてルール表記憶部12には多数のルール表を記憶し、ユーザはこのうち1もしくは複数のルール表を選択して、ルール表適用部10により選択したルール表を適用する。またユーザは、ユーザインターフェース14を介して、ルール表でのルールの変更や追加,削除等ができ、修正されたルール表を更新してルール表記憶12に記憶できる。
【0015】20は操作パネルやディスプレイ等を備えた操作部で、22はSVG変換部で、スキャナ4で読み取った画像データをSVG文書に変換する。なお画像データ自体を構造化せずに、画像データから抽出した文字情報等をその他の管理情報と共に構造化してXML文書を作成し、画像データ自体はXML文書とリンク等により関連付けても良い。
【0016】24は構造化文書処理部で、SVG変換部22等で生成した構造化文書に対して、キーワード検索部26で文字情報をキーワードとして用いて検索し、抽出部28で構造化した画像データ中の文字情報とその周囲の部分を画像データに再変換して抽出する。これは例えば、画像データ中の文字情報自体を確認したい場合や、文字情報が図や写真などの表題である場合に、周囲の図や写真を文字情報と共に抽出するためのものである。また抽出部28では、倍率を指定することにより、抽出する範囲を変更できる。
【0017】30は通信インターフェースで、生成した構造化文書を送信し、あるいはファクシミリデータ等を受信し、キーワード付与部6でキーワードの文字情報を抽出して、SVG変換部22で構造化文書に変換する。32は記憶部で、SVG文書や画像データ、あるいはプログラム等を記憶する。34は補助記憶ドライブで、記憶媒体36から構造化文書の生成プログラムを読み取って記憶部32等に記憶させる、あるいは蓄積した構造化文書を記憶媒体36に書き込む等のためのものである。
【0018】構造化文書生成装置2は、既存のネットワークスキャナやファクシミリサーバ等に組み込んで用いると便利である。そしてこの場合、スキャナ4や操作部20,通信インターフェース30,記憶部32,補助記憶ドライブ34等は、ネットワークスキャナやファクシミリサーバ等に備え付けのものをそのまま利用できる。ネットワークスキャナやファクシミリサーバ等に、構造化文書生成装置2を組み込むためには、キーワード付与部6とSVG変換部22並びに構造化文書処理部24を追加し、記憶媒体36から構造化文書生成プログラムを供給すればよい。なお構造化文書処理部24は、生成済みの構造化文書の処理に関するもので、設けなくても良い。
【0019】図2に、構造化文書の生成プログラムを示す。スキャナで画像データを読み取ると、例えばプレビュー画像からOCRで文字情報を抽出し、ルール表に従ってキーワードの候補となる文字情報を選択して、表示する(s1)。例えば画像データの種類が納品書や請求書等の定型文書であれば、宛先,品番,発行日等の主な文字情報が存在する場所は決まっており、ルール表に画像データ中の抽出すべき文字情報の位置を定めておけば、容易に文字情報の候補を抽出できる。
【0020】また画像データが非定型の一般文書の場合、抽出すべき文字情報を記載した辞書をルール表として作成し、辞書に含まれる文字列を文字情報の候補として抽出する。個人名や項目名、タイトル、内容に関するキーワード等で、文字情報を抽出できる。さらに「表1」,「図1」等のキーワードとそれに続く文字列とを文字情報として抽出するようにルール表を定めると、図や表等の表題をキーワードとして抽出できる。
【0021】構造化文書生成装置により画像データを構造化するユーザは、操作部の画面等でキーワードを確認し、必要に応じてキーワードを追加あるいは修正する(s2)。またルール表のルールはユーザが追加,変更でき、ユーザがルール表を変更した場合、必要に応じてルール表を更新して記憶する(s3,s4)。キーワードの候補が確定すると、例えばスキャナで画像データを再読み取りし、読み取った画像中の文字情報とその位置情報とを属性に追加して、画像データを構造化する(s5,s6)。受信したファクシミリデータを自動的に構造化する場合は、例えば文字情報をユーザが確認するステップ(s2)を省略し、OCRによる文字抽出とルール表による文字情報の選択に従って自動的に文字情報を埋め込んで構造化する。
【0022】図3に、画像データを構造化したSVG文書の例を示す。タイトル欄に記載のように、この文書の内容は受信したファクシミリ文書であり、日付(2000年1月18日)とその位置(文字情報の存在範囲を長方形とし、その対角線上の2頂点の座標を記載)、並びに発信人とその位置、及び受取人の個人名とその位置とが属性として追加されている。これらの文字情報とその位置とが、ファクシミリデータからOCRで抽出され、ルール表で選択された文字情報と、その位置とである。
【0023】この発明では、文字情報と画像データ中でのその位置とを構造化文書の属性として埋め込むので、構造化文書を検索あるいは管理する場合、抽出した文字情報をキーワードとして検索できる。また検索した文字情報とその周辺の画像とを、画像データに再変換して表示できるので、画像データの検索や利用が容易になる。文字情報の抽出がOCRで容易に行え、文字情報の選択はルール表で的確に行えるので、多数の文字が含まれる画像データでも、有効な文字情報を容易に選択して埋め込める。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013