米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> ミノルタ株式会社

発明の名称 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2003−108453(P2003−108453A)
公開日 平成15年4月11日(2003.4.11)
出願番号 特願2001−389827(P2001−389827)
出願日 平成13年12月21日(2001.12.21)
代理人 【識別番号】100072349
【弁理士】
【氏名又は名称】八田 幹雄 (外4名)
【テーマコード(参考)】
5B021
5B082
【Fターム(参考)】
5B021 AA01 BB00 CC07 
5B082 HA05 HA08
発明者 勝田 長生
要約 課題
Webページの印刷物を読み取ってURLを文字認識し、そのWebサーバに接続してWebページの画像データを生成して出力する画像処理装置において、Webページの一部のみを印刷して得られた原稿であっても当該原稿にかかる部分のみのWebページの画像データを出力することができる画像処理装置を提供する。

解決手段
スキャナ11は、原稿を読み取って画像データを取得し、得られた画像データに含まれるURLおよび先頭から所定文字数の先頭文字列を文字認識する。ついで、認識したURL先のWebサーバ20から通信ネットワーク30を介してHTMLファイルを受信する。そして、受信したHTMLファイルから前記先頭文字列を検索し、検出した先頭文字列から所定範囲のHTMLファイルデータを用いてWebページの画像データを生成して出力する。
特許請求の範囲
【請求項1】 ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る原稿読取手段と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する所在情報認識手段と、前記第1の画像データに含まれる一部または全部の文字列を認識する文字列認識手段と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する文書ファイル転送要求送信手段と、前記サーバコンピュータから前記文書ファイルを受信する文書ファイル受信手段と、前記文書ファイルから前記文字列を検索する文字列検索手段と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する画像データ変換手段と、前記第2の画像データを他の機器に送信する画像データ送信手段と、を有することを特徴とする画像処理装置。
【請求項2】 ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る原稿読取手段と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する所在情報認識手段と、前記第1の画像データに含まれる一部または全部の文字列を認識する文字列認識手段と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する文書ファイル転送要求送信手段と、前記サーバコンピュータから前記文書ファイルを受信する文書ファイル受信手段と、前記文書ファイルから前記文字列を検索する文字列検索手段と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する画像データ変換手段と、前記第2の画像データを画像形成する画像形成手段と、を有することを特徴とする画像処理装置。
【請求項3】 前記文字列認識手段は、前記第1の画像データの先頭から所定文字数の先頭文字列を認識するものであり、前記文字列検索手段は、前記文書ファイルから前記先頭文字列を検索するものであり、前記画像データ変換手段は、前記文書ファイルのうち検索した前記文字列から始まる所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項1または2に記載の画像処理装置。
【請求項4】 前記文字列認識手段は、さらに前記第1の画像データの最後尾から所定数の最後尾文字列を認識するものであり、前記文字列検索手段は、さらに前記文書ファイルから前記最後尾文字列を検索するものであり、前記画像データ変換手段は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲の文書ファイルデータを第2の画像データに変換するものである、請求項3に記載の画像処理装置。
【請求項5】 前記第1の画像データに含まれる総文字数を計測する文字数計測手段をさらに有し、前記画像データ変換手段は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数を含む範囲の文書ファイルデータを第2の画像データに変換するものである、請求項3に記載の画像処理装置。
【請求項6】 前記転送要求は、前記文書ファイルを所定容量に分割した分割文書ファイルを転送するよう要求するものであり、前記文書ファイル転送要求送信手段は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、請求項1〜5のいずれか1項に記載の画像処理装置。
【請求項7】 ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る段階(1)と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する段階(2)と、前記第1の画像データに含まれる一部または全部の文字列を認識する段階(3)と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する段階(4)と、前記サーバコンピュータから前記文書ファイルを受信する段階(5)と、前記文書ファイルから前記文字列を検索する段階(6)と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する段階(7)と、前記第2の画像データを他の機器に送信する段階(8)と、を有することを特徴とする画像処理方法。
【請求項8】 ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る段階(1)と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する段階(2)と、前記第1の画像データに含まれる一部または全部の文字列を認識する段階(3)と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する段階(4)と、前記サーバコンピュータから前記文書ファイルを受信する段階(5)と、前記文書ファイルから前記文字列を検索する段階(6)と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する段階(7)と、前記第2の画像データを画像形成する段階(9)と、を有することを特徴とする画像処理方法。
【請求項9】 ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る手順(1)と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する手順(2)と、前記第1の画像データに含まれる一部または全部の文字列を認識する手順(3)と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する手順(4)と、前記サーバコンピュータから前記文書ファイルを受信する手順(5)と、前記文書ファイルから前記文字列を検索する手順(6)と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する手順(7)と、前記第2の画像データを他の機器に送信する手順(8)と、を画像処理装置に実行させることを特徴とする画像処理プログラム。
【請求項10】 ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る手順(1)と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する手順(2)と、前記第1の画像データに含まれる一部または全部の文字列を認識する手順(3)と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する手順(4)と、前記サーバコンピュータから前記文書ファイルを受信する手順(5)と、前記文書ファイルから前記文字列を検索する手順(6)と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する手順(7)と、前記第2の画像データを画像形成する手順(9)と、を画像処理装置に実行させることを特徴とする画像処理プログラム。
【請求項11】 請求項9または10に記載の画像処理プログラムを記録したコンピュータ読取可能な記録媒体。
発明の詳細な説明
【0001】
【発明の属する技術分野】本発明は、Webページの印刷物を読み取ってURLを文字認識し、そのWebサーバに接続してWebページの画像データを生成して出力する画像処理装置に関する。
【0002】
【従来の技術】近年、パソコンの普及に伴いインターネットの利用者が増大し、Webページを印刷する機会が増えるとともに、未だ紙媒体による情報伝播が相当量行われていることから、Webページの印刷物をコピーする機会も多くなっている。ところが、Webページはカラー画像が主流であるため、Webページの印刷物をコピーすると画像の劣化が目立ち易い。そこで、Webページの印刷物をコピーする際に、原稿のフッタ等に記録されているURLを文字認識しそのURLが示すWebサーバに接続してHTMLファイルを取得し、Webページの画像データを生成してこれを印刷することにより、画像劣化がなく最新の画像によるWebページの印刷物を取得し得る画像処理装置が多数提案されている(特開平10−283313号公報等)。
【0003】しかし、上述した従来の画像処理装置では、ユーザの所望する情報がWebページの一部のみに記載されておりWebページの一部のみを印刷して得られた原稿であったとしても、当該原稿に記載されたURLから当該WebページのHTMLファイルの全文書がダウンロードされ印刷されてしまい、原稿以外の部分、すなわち、ユーザの必要としない部分のWebページ印刷物が出力されるので、時間的にも経済的にも無駄であった。
【0004】
【発明が解決しようとする課題】本発明は、上記従来技術の有する問題点に鑑みなされたものであり、その目的とするところは、Webページの印刷物を読み取ってURLを文字認識し、そのWebサーバに接続してWebページの画像データを生成して出力する画像処理装置において、Webページの一部のみを印刷して得られた原稿であっても当該原稿にかかる部分のみのWebページの画像データを出力することができる画像処理装置を提供することにある。
【0005】
【課題を解決するための手段】本発明の上記目的は、以下の各手段により達成される。
【0006】(a) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る原稿読取手段と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する所在情報認識手段と、前記第1の画像データに含まれる一部または全部の文字列を認識する文字列認識手段と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する文書ファイル転送要求送信手段と、前記サーバコンピュータから前記文書ファイルを受信する文書ファイル受信手段と、前記文書ファイルから前記文字列を検索する文字列検索手段と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する画像データ変換手段と、前記第2の画像データを他の機器に送信する画像データ送信手段と、を有することを特徴とする画像処理装置。
【0007】(b) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る原稿読取手段と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する所在情報認識手段と、前記第1の画像データに含まれる一部または全部の文字列を認識する文字列認識手段と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する文書ファイル転送要求送信手段と、前記サーバコンピュータから前記文書ファイルを受信する文書ファイル受信手段と、前記文書ファイルから前記文字列を検索する文字列検索手段と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する画像データ変換手段と、前記第2の画像データを画像形成する画像形成手段と、を有することを特徴とする画像処理装置。
【0008】(c) 前記文字列認識手段は、前記第1の画像データの先頭から所定文字数の先頭文字列を認識するものであり、前記文字列検索手段は、前記文書ファイルから前記先頭文字列を検索するものであり、前記画像データ変換手段は、前記文書ファイルのうち検索した前記文字列から始まる所定範囲の文書ファイルデータを第2の画像データに変換するものである、(a)または(b)に記載の画像処理装置。
【0009】(d) 前記文字列認識手段は、さらに前記第1の画像データの最後尾から所定数の最後尾文字列を認識するものであり、前記文字列検索手段は、さらに前記文書ファイルから前記最後尾文字列を検索するものであり、前記画像データ変換手段は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲の文書ファイルデータを第2の画像データに変換するものである、(c)に記載の画像処理装置。
【0010】(e) 前記第1の画像データに含まれる総文字数を計測する文字数計測手段をさらに有し、前記画像データ変換手段は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数を含む範囲の文書ファイルデータを第2の画像データに変換するものである、(c)に記載の画像処理装置。
【0011】(f) 前記転送要求は、前記文書ファイルを所定容量に分割した分割文書ファイルを転送するよう要求するものであり、前記文書ファイル転送要求送信手段は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、(a)〜(e)のいずれか1つに記載の画像処理装置。
【0012】(g) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る段階(1)と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する段階(2)と、前記第1の画像データに含まれる一部または全部の文字列を認識する段階(3)と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する段階(4)と、前記サーバコンピュータから前記文書ファイルを受信する段階(5)と、前記文書ファイルから前記文字列を検索する段階(6)と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する段階(7)と、前記第2の画像データを他の機器に送信する段階(8)と、を有することを特徴とする画像処理方法。
【0013】(h) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る段階(1)と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する段階(2)と、前記第1の画像データに含まれる一部または全部の文字列を認識する段階(3)と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する段階(4)と、前記サーバコンピュータから前記文書ファイルを受信する段階(5)と、前記文書ファイルから前記文字列を検索する段階(6)と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する段階(7)と、前記第2の画像データを画像形成する段階(9)と、を有することを特徴とする画像処理方法。
【0014】(i) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る手順(1)と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する手順(2)と、前記第1の画像データに含まれる一部または全部の文字列を認識する手順(3)と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する手順(4)と、前記サーバコンピュータから前記文書ファイルを受信する手順(5)と、前記文書ファイルから前記文字列を検索する手順(6)と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する手順(7)と、前記第2の画像データを他の機器に送信する手順(8)と、を画像処理装置に実行させることを特徴とする画像処理プログラム。
【0015】(j) ネットワーク上でサーバコンピュータにより公開された文書ファイルの一部を印刷して得られた原稿を読み取って第1の画像データを得る手順(1)と、前記第1の画像データから前記文書ファイルの所在を表す所在情報を認識する手順(2)と、前記第1の画像データに含まれる一部または全部の文字列を認識する手順(3)と、前記所在情報に基づいて前記サーバコンピュータに前記文書ファイルの転送要求を送信する手順(4)と、前記サーバコンピュータから前記文書ファイルを受信する手順(5)と、前記文書ファイルから前記文字列を検索する手順(6)と、前記文書ファイルのうち検索した前記文字列を含む所定範囲の文書ファイルデータを第2の画像データに変換する手順(7)と、前記第2の画像データを画像形成する手順(9)と、を画像処理装置に実行させることを特徴とする画像処理プログラム。
【0016】(k) (i)または(j)に記載の画像処理プログラムを記録したコンピュータ読取可能な記録媒体。
【0017】
【発明の実施の形態】以下、本発明の実施の形態を、図面を参照して詳細に説明する。
【0018】図1は、本発明の第1の実施形態にかかる画像処理装置を含む画像処理システムの全体構成を示すブロック図である。本画像処理システムは、画像処理装置としてのスキャナ11とWebサーバ20とが通信ネットワーク30を介して、またスキャナ11とプリンタ40とがローカルインタフェースを介して、相互に通信可能に接続されてなるものである。
【0019】図2は、本実施形態にかかるスキャナ11の構成を示すブロック図である。図2において、スキャナ11は、CPU111、ROM112、RAM113、ハードディスク114、操作パネル部115、原稿読取部116、ローカルインタフェース117、およびネットワークインタフェース118を備えており、これらは信号をやり取りするためのバス119を介して相互に接続されている。
【0020】CPU111は、プログラムにしたがって上記各部の制御や各種の演算処理等を行う。ROM112は、各種プログラムやパラメータを格納する。RAM113は、作業領域として一時的にプログラムやデータを記憶する。ハードディスク114は、各種プログラムやパラメータを格納し、または画像処理により得られた画像データ等を一時的に保存するために使用される。本実施形態において、スキャナ11は後述する所定の動作を行うが、このためのスキャナ11の動作を制御するプログラムは、ROM112またはハードディスク114に格納されている。
【0021】操作パネル部115は、各種情報が表示される液晶タッチパネル、動作の開始を指示するスタートキー、動作の停止を指示するストップキー、各種設定条件を初期化するリセットキー等を備えている。
【0022】原稿読取部116は、所定の読み取り位置にセットされた原稿に蛍光ランプ等の光源で光を当て、その反射光をCCDやCIS等の受光素子で光電変換して、その電気信号から画像データ(ビットマップデータ)を生成する。原稿読取部116は、自動原稿搬送装置(ADF)を備えていてもよく、これにより複数枚の原稿をADFにより一枚ずつ所定の読み取り位置まで搬送して順次読み取ることができる。
【0023】ローカルインタフェース117は、プリンタやパソコン等の他の装置とネットワークを介さないで通信するためのインタフェースであり、USB、IEEE1394等のシリアルインタフェース、SCSI等のパラレルインタフェース、Bluetooth(ブルートゥース)、IEEE802.11、HomeRF、IrDA等の無線通信インタフェース等を使用することができる。
【0024】ネットワークインタフェース118は、ネットワークに接続しネットワーク上の他の機器と通信するためのインタフェースであり、イーサネット(登録商標)、トークンリング、FDDI等の規格が用いられる。
【0025】Webサーバ20は、WWWサーバ機能を有するコンピュータである。Webサーバ20は、WWWデータベースとしてネットワーク上でHTML形式による文書ファイルを公開し、クライアントからの要求に応じてHTMLファイルを転送する機能を有する。
【0026】通信ネットワーク30は、電話網、ISDN、パケット交換網等の公衆網、およびLAN、WAN、インターネット等のコンピュータネットワークを含むものである。
【0027】プリンタ40は、印刷イメージ(ビットマップデータ)の印刷出力を行う。
【0028】図3は、本実施形態におけるスキャナ11の画像処理の手順を示すフローチャートである。図3において、スキャナ11は、まずユーザから原稿読み取り命令があるまで待機する(S101のNO)。ユーザは、Webページの一部を印刷した原稿を原稿台の所定の位置にセットし、操作パネル115から必要な読み取り条件を設定して、操作パネル115のスタートキーを押すことにより原稿読み取り命令を入力する。スキャナ11は、ユーザから原稿読み取り命令の入力を受け付けると(S101のYES)、セットされた原稿を読み取って画像データを取得し(S102)、得られた画像データをハードディスク114に保存する。
【0029】ついで、原稿画像データの所定領域にあるURLを文字認識する(S103)。図4(a)は、本実施形態におけるWebページの一部を印刷した原稿の一例を示す図である。このように、Webページの一部を印刷して得られた原稿51には、文字列511からなる文字領域および図形または写真からなる画像領域512等で構成される本文以外に、たとえばヘッダやフッタ等の所定の領域に、WebページのURL513が表示されている。URLは「http://」で始まる文字列であり、かつURLの表示される領域は決まっているため、文字認識の対象をかかる領域に限定することによりURLを容易にかつ効率よく認識することができる。文字認識の方法としては、たとえば各文字画像の特微量と予め記憶されている辞書パターンとの一致の度合いに基づいて判別する方法等を用いることができる。
【0030】URLの文字認識処理の手順(S103)においてURLが認識されなかった場合は(S104のNO)、ハードディスク114に保存した原稿画像データをRAM113に読み出し、読み出した画像データをローカルインタフェース117を介して外部機器であるプリンタ40に送信する(S105)。一方、URL認識処理でURLが認識された場合は(S104のYES)、ハードディスク114に保存した原稿画像データをRAM113に読み出し、当該原稿画像データの文字領域の先頭から所定文字数の先頭文字列を文字認識する(S106)。先頭文字列の文字認識の具体的手順としては、読み出した原稿画像データを領域分離して文字領域を抽出し、さらに最初の文字領域から行、文字を順次切り出して先頭から所定文字数の文字画像データを得て、前述と同様の文字認識方法により文字認識を行う。
【0031】ついで、URLの文字認識処理の手順(S103)において認識されたURLで示されるWebページにかかるWebサーバ20に、ネットワークインタフェース118および通信ネットワーク30を介して、HTMLファイルの転送要求を送信する(S107)。つぎに、Webサーバ20からHTMLファイルを受信するまで待機し(S108のNO)、Webサーバ20から通信ネットワーク30およびネットワークインタフェース118を介してHTMLファイルを受信すると(S108のYES)、受信したHTMLファイルのタグ構造を解析して(S109)、さらにWebサーバ20に画像ファイル等のリンクファイルの転送要求を送信してリンクファイルを受信する。そして、受信したHTMLファイルから、先頭文字列の文字認識処理の手順(S106)で取得した先頭文字列を検索し(S110)、検出した先頭文字列から所定範囲のHTMLファイルデータを用いてWebページ画像データを生成する(S111)。Webページ画像データを生成するためのHTMLファイルデータの出力範囲を定める基準は特に限定されるものではなく、例えば、HTMLファイルデータに含まれる文字数や行数、生成する画像データの大きさ(ピクセル数)に応じたデータ量、HTMLファイルのデータ容量等を基準に当該出力範囲を定めることができる。これらの出力範囲は予め定められていてもよいし、ユーザにより原稿読み取り開始前に設定する構成としてもよい。そして、生成したWeb画像データをローカルインタフェース117を介してプリンタ40に送信する(S112)。
【0032】図4(b)は、図4(a)の原稿にかかるWebページのWebサーバ20から受信したHTMLファイルから生成されるWebページ画像データの全体を示す図である。図4(b)において、Web画像データ61は、文字列611と画像領域612等から構成されている。また、原稿51の文字列511は、先頭に文字列「AAAAA」を含んでいる。本実施形態において、スキャナ11は、Webサーバ20から受信したHTMLファイルから、原稿52の画像データを文字認識処理して得られた先頭文字列「AAAAA」を検索し、当該文字列「AAAAA」から所定範囲、例えば所定行数分のHTMLファイルデータのみを用いてWebページ画像データ(点線で囲まれた出力範囲)を生成するので、原稿51と概ね同じ内容のWebページ画像データを出力することができ、原稿52に含まれない不要なWebページ画像データを出力することがないので時間および経費の無駄を無くすことができる。
【0033】上記第1の実施形態においては、Webページ画像データの送信先をプリンタとして説明したが、画像データの出力先はプリンタに限られるものではなく、例えばデジタル複写機、ファクシミリ装置等の画像形成機能を有する多機能周辺機器、ディスプレイ等の画像表示装置、パソコン等の画像処理装置であってもよい。
【0034】図5は、本発明の第2の実施形態にかかる画像処理装置を含む画像処理システムの全体構成を示すブロック図である。本画像処理システムは、画像処理装置としてのデジタル複写機12とWebサーバ20とが通信ネットワーク30を介して相互に通信可能に接続されてなる。
【0035】図6は、本実施形態にかかるデジタル複写機12の構成を示すブロック図である。図6において、デジタル複写機12は、CPU121、ROM122、RAM123、ハードディスク124、操作パネル部125、原稿読取部126、ネットワークインタフェース128、およびバス129を有し、これら各部は第1の実施形態にかかるスキャナ11におけるものと同様の機能を有する。さらに、本実施形態において、デジタル複写機12は印刷部127を備えており、印刷部127は、画像処理後の画像データを設定条件に従って印刷する。
【0036】図7は、本実施形態におけるデジタル複写機12の画像処理の手順を示すフローチャートである。本実施形態におけるデジタル複写機12の画像処理の手順が前記第1の実施形態におけるスキャナ11の画像処理の手順と異なるのは、まず、URL認識処理でURLが認識された場合に(S204のYES)、原稿画像データの文字領域の先頭文字列だけでなく最後尾文字列をも文字認識し(S206)、Webサーバ20からHTMLファイルを受信すると(S208およびS209)、受信したHTMLファイルから先頭文字列および最後尾文字列を検索して(S210)、検出した先頭文字列から最後尾文字列までの範囲のHTMLファイルデータを用いてWebページ画像データを生成する点(S211)、および生成したWeb画像データを設定条件等に応じて必要な画像処理を施して印刷部127により印刷して出力する点(S212)にある。
【0037】図8(a)は、本実施形態におけるWebページの一部を印刷した原稿の他の一例を示す図であり、図8(b)は、当該WebページにかかるWebサーバ20から受信したHTMLファイルから生成されるWebページ画像データの全体を示す図である。原稿52は、文字列521および画像領域522等を含む本文と、WebページのURL523を含むフッタとから構成されており、文字列521は、先頭に文字列「AAAAA」を、最後尾に文字列「BBBBB」を含んでいる。また、Web画像データ62は、文字列621と画像領域622等から構成されている。本実施形態において、デジタル複写機12は、Webサーバ20から受信したHTMLファイルから、原稿52の画像データを文字認識処理して得られた先頭文字列「AAAAA」および最後尾文字列「BBBBB」を検索し、当該文字列「AAAAA」から文字列「BBBBB」までの範囲のHTMLファイルデータのみを用いてWebページ画像データ(点線で囲まれた出力範囲)を生成するので、原稿52に完全に一致するWebページ画像データを出力することができ、原稿52に含まれない不要なWebページ画像データを出力することがないので時間および経費の無駄を無くすことができる。
【0038】図9は、本発明の第3の実施形態にかかるデジタル複写機13の画像処理の手順を示すフローチャートである。本実施形態にかかるデジタル複写機13は前記第2の実施形態にかかるデジタル複写機12と同様の構成を有し、デジタル複写機12と同様に通信ネットワーク30を介してWebサーバ20と相互に通信可能に接続されている。
【0039】本実施形態におけるデジタル複写機13の画像処理の手順が前記第2の実施形態におけるデジタル複写機12の画像処理の手順と異なるのは、URL認識処理でURLが認識された場合に(S304のYES)、原稿画像データの文字領域の先頭文字列を文字認識するとともに(S306)、原稿画像データのすべての文字領域に含まれる総文字数をカウントし(S307)、Webサーバ20からHTMLファイルを受信すると(S308およびS309)、受信したHTMLファイルから先頭文字列を検索して(S311)、検出した先頭文字列から前記総文字数分の範囲のHTMLファイルデータを用いてWebページ画像データを生成する点(S312)にある。具体的には、原稿画像データの総文字数のカウント処理(S307)は、原稿画像データに含まれるすべての文字領域に対して文字認識処理を行って得られた文字コードを計測することにより行う。また、Webページ画像データの生成処理(S312)では、受信したHTMLファイルのHTML文書からHTMLタグを除いたテキスト部分について文字数をカウントし、検出した先頭文字列からカウントして前記総文字数分含まれる範囲のHTMLファイルデータを用いてWebページ画像データを生成するものである。これにより、デジタル複写機13は、前記第2の実施形態におけるデジタル複写機12と同様に、原稿に完全に一致するWebページ画像データを出力することができ、原稿に含まれない不要なWebページ画像データを出力することがないので時間および経費の無駄を無くすことができるものである。
【0040】図10は、本発明の第4の実施形態にかかるスキャナ14の画像処理の手順を示すフローチャートである。本実施形態にかかるスキャナ14は前記第1の実施形態にかかるスキャナ11と同様の構成を有し、スキャナ11と同様に通信ネットワーク30を介してWebサーバ20と、およびローカルインタフェースを介してプリンタ40と、それぞれ相互に通信可能に接続されている。
【0041】本実施形態におけるスキャナ14の画像処理の手順が前記第1の実施形態におけるスキャナ11の画像処理の手順と異なるのは、URL認識処理でURLが認識された場合に(S404のYES)、Webサーバ20に、認識したURLにかかるHTMLファイルを所定容量に分割したHTMLファイルデータを転送するよう転送要求を送信する点にある(S407)。そして、Webサーバ20から分割HTMLファイルデータを受信すると(S408)、受信した分割HTMLファイルデータから先頭文字列を検索して(S410)、先頭文字列から所定範囲のHTMLファイルデータを受信するまでWebサーバ20に分割HTMLファイルの転送要求を繰り返し(S411のNO)、先頭文字列から所定範囲のHTMLファイルデータを受信すると(S411のYES)、受信した先頭文字列から所定範囲のHTMLファイルデータを用いてWebページ画像データを生成するものである(S412)。所定容量に分割したHTMLファイルデータの転送要求は、HTTPプロトコルにおいて、byte−ranges−specifierのパラメータとして取得するHTMLファイルデータの容量を指定することにより行う。これにより、スキャナ14は、前記第1の実施形態にかかるスキャナ11と同様に、原稿と概ね同じ内容のWebページ画像データを出力することができ、原稿に含まれない不要なWebページ画像データを出力することがないので、画像データ出力にかかる時間および経費の無駄を無くすことができるばかりでなく、原稿より後部の不要なHTMLファイルデータをダウンロードすることがないので、Webサーバとの通信にかかる時間および経費の浪費をも防止することができるものである。
【0042】なお、本実施形態にかかるスキャナ14のWebサーバ20への上記転送要求の方法は、前記第2および第3の実施形態にかかるデジタル複写機12および13にも適用することが可能である。この場合、前者においては、先頭文字列から最後尾文字列までの範囲のHTMLファイルデータを受信するまで、後者においては、先頭文字列からカウントして前記総文字数分含まれる範囲のHTMLファイルデータを受信するまで、Webサーバ20に分割HTMLファイルの転送要求を繰り返すものである。
【0043】上記各実施形態では、先頭部分が文字領域である原稿について説明したが、先頭部分が文字領域でない原稿についても本発明の画像処理装置を用いることにより、原稿と概ね同じ内容のWebページ画像データを出力することができる。また、例えば、先頭部分が画像領域である原稿の場合、原稿画像データを領域分離してその位置情報から先頭文字列より前方に含まれる画像領域の数をカウントし、Webページ画像データを生成するためのHTMLファイルデータの出力範囲に前記カウントした画像領域にかかる画像ファイルのリンクのためのHTMLタグまでを含めることにより、原稿と完全に一致するWebページ画像データを出力することが可能である。図11(a)は、前記第2の実施形態におけるWebページの一部を印刷した原稿のさらに他の一例を示す図であり、図11(b)は、Webサーバ20から受信したHTMLファイルのHTML文書の一部を示す図である。原稿53は、文字列531および画像領域532等を含む本文と、WebページのURL533を含むフッタとから構成されており、文字列533は、先頭に文字列「AAAAA」を、最後尾に文字列「BBBBB」を含んでいる。また、HTML文書63は、本文文字列631とHTMLタグ文字列632から構成されるテキスト文書である。本実施形態の画像処理装置は、前記第2の実施形態と同様にして、HTML文書63の本文文字列631から、原稿53の画像ファイルを文字認識処理して得られた先頭文字列「AAAAA」および最後尾文字列「BBBBB」を検索する。さらに、原稿53の画像データを領域分離して先頭文字列「AAAAA」より前に含まれる画像領域532が1つ存在することを検知する。そして、HTML文書63の本文文字列631中の文字列「AAAAA」から文字列「BBBBB」までの範囲に加え、文字列「AAAAA」の直前にある画像ファイルリンクのためのHTMLタグである<IMG SRC=>や、リンク画像ファイルを示す”.jpg”や”.gif”等のファイル識別子を検出して、これを含めた範囲のHTMLファイルデータ(点線で囲まれた出力範囲)を用いてWebページ画像データを生成する。これにより、先頭部分が画像領域である原稿53に完全に一致するWebページ画像データを出力することができるものである。
【0044】また、上記各実施形態では、原稿画像データの文字領域の先頭文字列を文字認識して受信したHTMLファイルデータから検索することにより、原稿部分のWebページ画像データのみを出力するものであったが、文字認識する文字列は原稿画像データの文字領域のいずれの部分であってもよく、当該文字列の位置情報と照合することによりHTMLファイルから原稿部分のWebページ画像データのみを出力することが可能である。さらに、原稿画像データの文字領域の全ての文字列を文字認識することによっても同じ目的が達成されることはいうまでもない。
【0045】また、上記各実施形態では、Webサーバから受信したHTMLファイルの一部のみを用いてWebページ画像データを出力するものであったが、ユーザの選択により受信したHTMLファイルの全部を用いてWebページ画像データを出力することが可能な構成としても構わない。
【0046】上記各実施形態においては、本発明の画像処理装置をスキャナおよびデジタル複写機の例で説明したが、本発明の画像処理装置はこれらに限られるものではなく、例えばファクシミリ装置等の原稿読取機能を有する多機能周辺機器であってもよい。
【0047】また、上記各実施形態では、通信ネットワーク30上に接続されたファイルサーバとしてWebサーバの例で説明したが、当該ファイルサーバはこれに限られるものではない。また、公開される文書ファイルもHTMLファイルに限られるものではなく、例えばXML等のWebサイト言語であってもよい。
【0048】本発明による画像処理装置を構成する各手段、および画像処理方法は、専用のハードウエア回路によっても、プログラムされた画像処理装置によっても実現することができる。プログラムされた画像処理装置によって本発明を実現する場合、画像処理装置を動作させるプログラムは、フレキシブルディスクやCD−ROM等のコンピュータ読取可能な記録媒体によって提供されることができる。この場合、コンピュータ読取可能な記録媒体に記録されたプログラムは、通常、ROMやハードディスク等に転送され記憶される。また、このプログラムは、たとえば、単独のアプリケーションソフトとして提供されてもよいし、また、画像処理装置の一機能としてその装置のソフトウエアに組み込んでもよい。
【0049】上述した本発明の実施形態には、特許請求の範囲の請求項1〜11に記載した発明以外にも、以下の付記1〜5に示すような発明が含まれる。
【0050】[付記1] 段階(3)は、前記第1の画像データの先頭から所定文字数の先頭文字列を認識するものであり、段階(6)は、前記文書ファイルから前記先頭文字列を検索するものであり、段階(7)は、前記文書ファイルのうち検索した前記文字列から始まる所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項7または8に記載の画像処理方法。
【0051】[付記2] 段階(3)は、さらに前記第1の画像データの最後尾から所定数の最後尾文字列を認識するものであり、段階(6)は、さらに前記文書ファイルから前記最後尾文字列を検索するものであり、段階(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲の文書ファイルデータを第2の画像データに変換するものである、付記1に記載の画像処理方法。
【0052】[付記3] 前記第1の画像データに含まれる総文字数を計測する段階(10)をさらに有し、段階(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数を含む範囲の文書ファイルデータを第2の画像データに変換するものである、付記1に記載の画像処理方法。
【0053】[付記4] 前記転送要求は、前記文書ファイルを所定容量に分割した分割文書ファイルを転送するよう要求するものであり、段階(4)は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、請求項7もしくは8、または付記1〜3のいずれか1つに記載の画像処理方法。
【0054】[付記5] 手順(3)は、前記第1の画像データの先頭から所定文字数の先頭文字列を認識するものであり、手順(6)は、前記文書ファイルから前記先頭文字列を検索するものであり、手順(7)は、前記文書ファイルのうち検索した前記文字列から始まる所定範囲の文書ファイルデータを第2の画像データに変換するものである、請求項9または10に記載の画像処理プログラム。
【0055】[付記6] 手順(3)は、さらに前記第1の画像データの最後尾から所定数の最後尾文字列を認識するものであり、手順(6)は、さらに前記文書ファイルから前記最後尾文字列を検索するものであり、手順(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記最後尾文字列までの範囲の文書ファイルデータを第2の画像データに変換するものである、付記5に記載の画像処理プログラム。
【0056】[付記7] 前記第1の画像データに含まれる総文字数を計測する手順(10)をさらに画像処理装置に実行させるものであり、手順(7)は、前記文書ファイルのうち検索した前記先頭文字列から前記総文字数を含む範囲の文書ファイルデータを第2の画像データに変換するものである、付記5に記載の画像処理プログラム。
【0057】[付記8] 前記転送要求は、前記文書ファイルを所定容量に分割した分割文書ファイルを転送するよう要求するものであり、手順(4)は、前記文書ファイル受信手段が前記所定範囲を含む前記分割文書ファイルを受信するまで前記転送要求を順次送信することを特徴とする、請求項9もしくは10、または付記5〜7のいずれか1つに記載の画像処理プログラム。
【0058】[付記9] 付記5〜8のいずれか1つに記載の画像処理プログラムを記録したコンピュータ読取可能な記録媒体。
【0059】
【発明の効果】上述のとおり、本発明の画像処理装置によれば、Webページの印刷物を読み取ってURLを文字認識し、そのWebサーバに接続してWebページの画像データを生成して出力する画像処理装置において、Webページの一部のみを印刷して得られた原稿であっても当該原稿にかかる部分のみのWebページの画像データを出力することができる。したがって、原稿に含まれない部分、すなわち、ユーザの必要としない部分のWebページ画像データを出力することがないので、時間的にも経済的にも無駄を無くすことができる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013