Warning: fopen(data/log202007131921.log): failed to open stream: No space left on device in /home/jp321/public_html/header.php on line 106

Warning: flock() expects parameter 1 to be resource, boolean given in /home/jp321/public_html/header.php on line 107

Warning: fclose() expects parameter 1 to be resource, boolean given in /home/jp321/public_html/header.php on line 112
情報検索方法及び装置、ソフトウェア - 独立行政法人通信総合研究所
米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 独立行政法人通信総合研究所

発明の名称 情報検索方法及び装置、ソフトウェア
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2003−271663(P2003−271663A)
公開日 平成15年9月26日(2003.9.26)
出願番号 特願2002−67367(P2002−67367)
出願日 平成14年3月12日(2002.3.12)
代理人 【識別番号】100090893
【弁理士】
【氏名又は名称】渡邊 敏
【テーマコード(参考)】
5B075
【Fターム(参考)】
5B075 KK03 NK02 NK31 NR15 PP22 PQ02 PQ75 PR08 
発明者 伊藤 浩美 / 井佐原 均 / 河野 恭之 / 木戸出 正継
要約 課題
ネットワーク上に記録された情報から、時間的に適合する有用な情報を検索する技術を提供すること。

解決手段
情報端末において検索キーワードを入力すると、ネットワーク上のサーバーについて情報検索を行うと共に、検索結果から、各結果毎に該情報の時間情報を抽出する。そして、時間情報に基づいて検索結果に重み付けを行い、その重み順位を付けて結果を出力する。
特許請求の範囲
【請求項1】インターネット又はイントラネットのネットワーク上に単数又は複数の情報記憶サーバーを有するときに、該ネットワークに接続された情報端末から情報検索を行う方法であって、情報端末において検索キーワードを発生するステップ、該検索キーワードに基づいて情報記憶サーバー、又は該情報記憶サーバーから予め検索用情報を収集した検索用情報記憶サーバーの少なくともいずれかについて情報検索を行うステップ、該情報検索の検索結果から、各結果毎に該情報の時間情報を抽出するステップ、該時間情報に基づき、上記検索キーワード又は検索実行時間の少なくともいずれかに関連して該検索結果に重み付けを行うステップ、該重み付けに基づき検索結果を順位付けて出力するステップの各ステップを少なくとも備えたことを特徴とする情報検索方法。
【請求項2】前記時間情報が、該検索結果が当該情報記憶サーバー又は検索用情報記憶サーバーの少なくともいずれかにおいて記録、更新、削除された時間である請求項1に記載の情報検索方法。
【請求項3】前記時間情報が、予め時間情報を指示する文字列を指定しておき、該文字列が、該検索結果に含まれる文字列と所定のしきい値以上一致するときに、抽出される時間である請求項1又は2に記載の情報検索方法。
【請求項4】前記情報検索方法が、指定期間内に1個又は複数の処理を行う場合のプロセスを検索する方法である構成において、前記時間情報を、該処理自体に要する時間である第1時間情報と、該処理を行うために処理以外に要する時間である第2時間情報と、該指定期間内で、他に要する時間である第3時間情報と、該指定期間を示す期間情報とに分類し、最初に発生した検索キーワードから該時間情報のいずれかが得られたときに、他の時間情報の少なくともいずれかを得る検索キーワードを自動的に発生させて他の時間情報を得ると共に、複数の時間情報に基づき、検索キーワード又は検索実行時間の少なくともいずれかに関連して該検索結果に重み付けを行うことを特徴とする請求項1ないし3に記載の情報検索方法。
【請求項5】前記期間情報が旅行期間である構成において、前記第1時間情報が、行き先におけるイベント時間であり、前記第2時間情報が、該イベントの行われる場所までのアクセス時間であり、前記第3時間情報が、日常生活中で必要な/生じる生活時間である請求項4に記載の情報検索方法。
【請求項6】インターネット又はイントラネットのネットワーク上に単数又は複数の情報記憶サーバーを有するときに、該ネットワークに接続された情報端末から情報検索を行う情報検索装置であって、情報端末において検索キーワードを発生するキーワード発生部、該検索キーワードに基づいて情報記憶サーバー、又は該情報記憶サーバーから予め検索用情報を収集した検索用情報記憶サーバーの少なくともいずれかについて情報検索を行う情報検索部、該情報検索の検索結果から、各結果毎に該情報の時間情報を抽出する時間情報抽出部、該時間情報に基づき、上記検索キーワード又は検索実行時間の少なくともいずれかに関連して該検索結果に重み付けを行う検索結果評価部、該重み付けに基づき検索結果を順位付けて出力する検索結果出力部を少なくとも備えたことを特徴とする情報検索装置。
【請求項7】前記時間情報が、該検索結果が当該情報記憶サーバー又は検索用情報記憶サーバーの少なくともいずれかにおいて記録、更新、削除された時間である請求項6に記載の情報検索装置。
【請求項8】前記時間情報が、予め時間情報を指示する文字列を指定しておき、該検索結果に含まれる文字列との一致を調べて自動的に抽出する時間である請求項6又は7に記載の情報検索装置。
【請求項9】前記情報検索装置が、指定期間内に1個又は複数の処理を行う場合のプロセスを検索する構成において、前記時間情報を、該処理自体に要する時間である第1時間情報と、該処理を行うために処理以外に要する時間である第2時間情報と、該指定期間内で、他に要する時間である第3時間情報と、該指定期間を示す期間情報とに分類し、最初に発生した検索キーワードから該時間情報のいずれかが得られたときに、キーワード発生部において他の時間情報の少なくともいずれかを得る検索キーワードを自動的に発生させ、情報検索部及び時間情報抽出部によって他の時間情報を得ると共に、検索結果評価部において、複数の時間情報に基づき、検索キーワード又は検索実行時間の少なくともいずれかに関連して該検索結果に重み付けを行うことを特徴とする請求項6ないし8に記載の情報検索装置。
【請求項10】前記期間情報が旅行期間である構成において、前記第1時間情報が、行き先におけるイベント時間であり、前記第2時間情報が、該イベントの行われる場所までのアクセス時間であり、前記第3時間情報が、日常生活中で必要な/生じる生活時間である請求項9に記載の情報検索装置。
発明の詳細な説明
【0001】
【発明の属する技術分野】本発明は、ネットワーク上における情報検索方法及び装置に関する。特に、検索時に有効な情報を検索する技術に係るものである。
【0002】
【従来の技術】インターネットやイントラネットにおいて、近年では商用化が進み、それに蓄えられた情報量は飛躍的に増大している。この膨大な情報から情報検索を行うために、検索サイトと呼ばれるサービスが提供され、高速で有効な検索を行うための検索エンジンの開発も進められている。
【0003】例えば、Google(商標)というWWWサービスにおいては、「Googleは情報の散在を秩序正しくするように設計されています。編集や限定されたディレクトリや、販売された高額順の検索結果リストではなく、インターネットがもつ独自の構造にしたがってウェブ上の情報を整理し、検索サービスの本来あるべき姿を実現しています。」 とし、その具体的技術として、PageRank(商標)なる技術を用いると開示している。
【0004】すなわち、「PageRank(TM) は、Webの膨大なリンク構造を用いて、その特性を生かします。ページAからページBへのリンクをページAによるページBへの支持投票とみなし、Googleはこの投票数によりそのページの重要性を判断します。しかしGoogleは単に票数、つまりリンク数を見るだけではなく、票を投じたページについても分析します。「重要度」の高いページによって投じられた票はより高く評価されて、それを受け取ったページを「重要なもの」にしていくのです。こうした分析によって高評価を得た重要なページには高いPageRank(TM) (ページ順位)が与えられ、検索結果内の順位も高くなります。PageRank(TM) はGoogleにおけるページの重要度を示す総合的な指標であり、各検索に影響されるものではありません。むしろ、PageRank(TM) は複雑なアルゴリズムにしたがったリンク構造の分析にもとづく、各Webページそのものの特性です。 」として、リンク数を中心とした検索結果の重要度を決定する手法を用いている。
【0005】上記従来の方法は、検索結果の重要度、すなわち重み付けをする上で極めて有効であり、実際に多くリンクされる情報は、すでに該情報を参照した者が人為的にあるいは自動的に有用と判断したものであることが多いため、必要とされる情報を含む可能性が高い。しかし、この方法のみによると、例えば観光情報など、情報の有効性に時間的な制限がある情報については、十分な検索ができない問題がある。
【0006】すなわち、例えば寺院における仏像の特別公開などについて、観光情報を検索しようとしたときに、それが注目された公開であると従来の方法では多くのリンクが行われ、公開期間が終了してもそのリンクが削除されるとは限らないために、引き続き重要度の高い検索結果として出力されることになる。しかし、本例では明らかに公開期間が終了してしまえば、観光情報を探している検索者にとって無用な情報であり、却って検索効率を悪化を招いてしまう。
【0007】また、従来でも検索結果を新しく記録されたものから優先的に出力することはあるが、情報自体の時間的適合を判断するものではなく、特に検索者が必要とされる時間に適合したものについて検索結果への重み付けを行う技術ではなかった。
【0008】
【発明が解決しようとする課題】そこで、本発明は、上記従来技術が有していた問題を解決しようとするものであり、ネットワーク上に記録された情報から、時間的に適合する有用な情報を検索する技術の提供を目的とする。
【0009】
【課題を解決するための手段】上記の目的を達成するために、本発明の情報検索方法は、以下の特徴を備える。すなわち、インターネット又はイントラネットのネットワーク上に単数又は複数の情報記憶サーバーを有するときに、該ネットワークに接続された情報端末から情報検索を行う方法であって、次の各ステップを少なくとも含む。
(1) 情報端末において検索キーワードを発生するステップ、該検索キーワードに基づいて情報記憶サーバー、又は該情報記憶サーバーから予め検索用情報を収集した検索用情報記憶サーバーの少なくともいずれかについて情報検索を行うステップ、(2) 該情報検索の検索結果から、各結果毎に該情報の時間情報を抽出するステップ、(3) 該時間情報に基づき、上記検索キーワード又は検索実行時間の少なくともいずれかに関連して該検索結果に重み付けを行うステップ、(4) 該重み付けに基づき検索結果を順位付けて出力するステップである。
【0010】本発明では、検索結果について従来技術と異なり、検索結果の時間情報と、検索者が望む時間との関連性から重み付けを行うことで、時間的に適合する有用な情報を検索することができる。
【0011】前記時間情報が、該検索結果が当該情報記憶サーバー又は検索用情報記憶サーバーの少なくともいずれかにおいて記録、更新、削除された時間であってもよい。
【0012】また、前記時間情報が、予め時間情報を指示する文字列を指定しておき、該文字列が、該検索結果に含まれる文字列と所定のしきい値以上一致するときに、抽出される時間であってもよい。
【0013】さらに本発明では、インターネット又はイントラネットのネットワーク上に単数又は複数の情報記憶サーバーを有するときに、該ネットワークに接続された情報端末から情報検索を行う情報検索装置を提供することもできる。該装置には、情報端末において検索キーワードを発生するキーワード発生部、該検索キーワードに基づいて情報記憶サーバー、又は該情報記憶サーバーから予め検索用情報を収集した検索用情報記憶サーバーの少なくともいずれかについて情報検索を行う情報検索部、該情報検索の検索結果から、各結果毎に該情報の時間情報を抽出する時間情報抽出部、該時間情報に基づき、上記検索キーワード又は検索実行時間の少なくともいずれかに関連して該検索結果に重み付けを行う検索結果評価部、該重み付けに基づき検索結果を順位付けて出力する検索結果出力部の各部を少なくとも備える。
【0014】前記時間情報が、該検索結果が当該情報記憶サーバー又は検索用情報記憶サーバーの少なくともいずれかにおいて記録、更新、削除された時間でもよいし、予め時間情報を指示する文字列を指定しておき、該検索結果に含まれる文字列との一致を調べて自動的に抽出する時間であってもよい。
【0015】ここで、本発明による情報検索方法・装置が、指定期間内に1個又は複数の処理を行う場合のプロセスを検索する構成において、前記時間情報を、該処理自体に要する時間である第1時間情報と、該処理を行うために処理以外に要する時間である第2時間情報と、該指定期間内で、他に要する時間である第3時間情報と、該指定期間を示す期間情報とに分類することができる。
【0016】そして、最初に発生した検索キーワードから該時間情報のいずれかが得られたときに、他の時間情報の少なくともいずれかを得る検索キーワードを自動的に発生させ、他の時間情報を得ると共に、複数の時間情報に基づき、検索キーワード又は検索実行時間の少なくともいずれかに関連して該検索結果に重み付けを行ってもよい。
【0017】特に、期間情報が旅行期間である構成においては、第1時間情報が、行き先におけるイベント時間であり、第2時間情報が、該イベントの行われる場所までのアクセス時間であり、第3時間情報が、日常生活中で必要な/生じる生活時間である構成でもよい。
【0018】
【発明の実施の形態】以下、本発明の実施形態を図面に示した実施例に基づいて説明する。なお、実施形態は、本発明の主旨から逸脱しないかぎり適宜変更可能なものである。図1に本発明による情報検索装置(1)のブロック図を示す。本装置(1)ではインターネット(2)に無数に配置されている情報サーバーから所望の情報を検索する。なお、インターネットではなく限られた範囲のサーバー・端末のみで構成されるイントラネットにおいても全く同様の構成で本装置(1)を用いることができる。
【0019】本装置(1)は、主な構成要素として、演算・通信処理を行うCPU(4)と、現在時刻など時間をCPUに与えるクロック部(6)、情報を格納するハードディスクなどの外部記録手段(7)を備える。そして、キーボードなど入力装置(3)から入力された情報からCPU(4)のキーワード発生部(10)で検索すべきキーワードを発生させる。
【0020】キーワードの発生については、入力装置(3)から直接入力された語句でもよいし、自動的にさらに別の語句を付加したり、別に備えるシソーラスデータベースによって関連語を抽出したり、言語翻訳したり、文字種を変換したりして、さらに有効な検索ができるようにしてもよい。
【0021】例えば、観光情報を検索するための装置であれば、検索者が入力装置(3)で「奈良」と入力した場合にも、「観光」や「旅行」などの語句を付加してキーワードを発生させる。又、「奈良」を「なら」や「ナラ」に変換させてもよい。このように、本発明ではキーワード発生部(10)においてキーワードを発生させ、必ずしもキーボードによる入力だけでなく、他の装置などから与えられた情報を基に自由なキーワードを用いることができる。
【0022】キーワード発生部(10)によるキーワードを用い、インターネット(2)に接続され情報を記録してある情報記録サーバー(20)や、予めインターネット(2)から情報を検索用に収集し記録してある検索用情報記憶サーバー(21)から一致する情報を情報検索部(11)において検索する。検索用情報記憶サーバー(21)は図示のようにインターネット(2)を介して接続する構成ではなく、点線部(22)のように本装置(1)に直接接続される構成でもよい。又は両方の経路を備えていてもよい。
【0023】情報検索部(11)における検索には公知の様々な検索技術を用いることができるが、本発明では特に検索対象となる情報に含めて、該情報の記録日や更新日、削除情報が記録されるシステムにおいては削除日なども検索結果として取得するのが望ましい。また、本発明では時間情報を重視するため、可能な限り新しい情報を検索する必要があり、検索用情報記録サーバー(21)などによって検索の高速化を図るときには、その更新頻度が大きい方が望ましい。
【0024】検索結果は、一旦外部記録装置(7)に設ける検索結果データベース(30)に格納される。この段階では、公知の検索技術による検索結果と同等の順位により格納され、例えばキーワードの一致率や、前記従来技術で示したリンク数に応じた重要度による順位などにより並べられる。
【0025】本発明では、これら従来技術から、時間的に適合した情報を出力するために、次の時間情報抽出部(12)、検索結果評価部(13)を新たに加えて時間軸を中心とした検索結果の重み付けを行う。まず、時間情報抽出部(12)について説述する。
【0026】時間情報抽出部(12)では、検索結果データベース(30)中の検索結果から、時間に係わる情報が含まれていないかを調べ、含まれているときにはその情報を抽出する。抽出する方法では、例えば該情報の当該情報記録サーバー(20)への記録日や更新日、例えばWWW(World Wide Web)におけるhtmlファイルのdate情報などに着目する。これらの情報は、該情報の新しさを示す重要な指標であり、従来の手法で見られたように単に新しいものから並べるのではなく、絶対的な時間の経過から該情報の有用性の判断をも可能にする。
【0027】検索用情報記録サーバー(21)など、予め情報を取得して検索に利用するシステムでは、インターネット上の情報が増えたことで、システムが検索対象サイトにアクセスした時刻のキャッシュ情報と実際に存在するサイトの情報に違いがあることがある。そこで、上記に加えて、システム検索時刻を時間情報として抽出してもよい。
【0028】時間情報抽出部(12)で抽出する時間には、検索結果に含まれる「更新日」など、明示的に記述されている情報記載時間を用いることもできる。従来では、例えばhtmlファイルのdate情報は、該情報が人為的に作成された日や修正された日を示すことが多かったが、最近のWWWサイトではサイトへのアクセスを監視するアクセスカウンターなどのプログラムが自動的に働き、それに伴ってdate情報が書き換えられる場合が少なくない。従って、date情報などのシステム上の情報を抽出するよりも、情報中に明示的に記載された情報の方がより信頼性が高いことが考えられる。
【0029】これら記録・更新された時間を示す文字列は、外部記録装置(7)の時間指定文字列データベース(31)に予め備えておき、一致する文字列について検索結果から探す。本構成は、上記システム上の情報よりも、人為的に記入されたものであり、その情報の新しさを判断する上で極めて有効な情報になりうる。
【0030】また、検索結果から、時間情報を示すと考えられる情報を探すこともできる。すなわち、例えばイベントの開催日や開催時間などを抽出するために、あらかじめ時間指定文字列データベース(31)に、「開催日」「期間」「開場」などの文字列を備えておき、それらが検索結果に含まれるときに、その指示する時間情報を抽出する。
【0031】ここで、上記時間情報は「開催日」「期間」「開場」などイベントの時間情報に限らず、他の時間概念を含むことができる。整理して考えると、ある期間(期間情報)内に、1つ又は複数の処理を行うときに、その処理そのものに要する時間(第1時間情報)、その処理を行うために不可欠な準備・移動などに要する時間(第2時間情報)、その他、食事時間や睡眠・休憩時間、あるいは日照時間など期間内で凡そ制約を与える時間(第3時間情報)などの時間情報が考えられる。
【0032】旅行にあてはめると、イベントの開催時間などは第1時間情報であり、イベントまでの交通手段で要するアクセス時間などは第2時間情報、旅行者の起床時間や食事時間、休憩時間などの生活時間は第3時間情報と分類することができる。
【0033】そして、情報検索の目的であるイベントについて検索する場合でも、上記アクセス時間や生活時間についても本発明では検索可能とする。すなわち、例えば第1時間情報が時間情報抽出部(12)で抽出されたとき、キーワード発生部(10)では該イベント場所までのアクセス時間を抽出させるキーワードを発生する。例えば、博物館の開館時間が抽出されたとき、キーワード発生部(10)では博物館までの経路を検索するキーワード「博物館 電車経路」などを発生し、情報検索部(11)で検索する。
【0034】その結果として、電車の所要時間など第2時間情報を得ることができる。同様に、公園を訪問するときに明るくなければならなければ、「公園 日没」などのキーワードで検索して第3時間情報を抽出することもできる。
【0035】以上によって時間情報抽出部(12)で抽出された時間情報に基づき、検索結果データベース(30)内の検索結果を、検索結果評価部(13)で重み付けする。この際、本装置(1)ではクロック部(6)を備えており、検索者が検索を行う検索時刻を取得することにより、該時間情報と比較して検索結果の重み付けを行うことができる。また、キーワード発生部(10)において予め最適な時刻をキーワードに含めておき、これらキーワードとの比較によって検索結果の重み付けを行っても良い。
【0036】例えば、上記情報記録サーバー(20)への記録日や更新日を用いる例としては次のような技術が考えられる。すなわち、1年を経過した情報については、一律に所定の軽い重みを付けてもよいし、経過期間毎に重みを設定してもよく、それらの情報は外部記録装置(7)に記録しておくことができる。
【0037】また、さらに発展させて定期的に開催される催し、例えば「初詣」に関連する情報は、1年以上前に記録・更新された情報は、すべて最も軽い重みを設定するなど、キーワードや検索結果に含まれる語句に応じて設定する重みを変化させてもよい。これら情報の時間的有効性に係わる情報を大量に蓄積したデータベースを本装置(1)に備えることで、さらに実際的な検索結果の出力を図ることもできる。
【0038】「更新日」など明示的に記述されている情報記載時間を用いる場合には、更新日が検索時刻あるいはキーワードに適するか否かにより重み付けを行う。例えば、更新日が検索時刻から1週間以内では最も高い重みを設定し、逆に6ヶ月以上経過している情報については最も軽い重みとなるように段階的な重み付けを行う。これにより、「更新日」など信頼性の高い情報の新しさを強く検索結果に反映させることができる。
【0039】このような構成において、検索結果中に記録・更新された時間を示す文字列がない検索結果については、文字列がある検索結果に比して低い重み付けを行う構成でもよい。明示的な記述がない場合には、その情報の新しさを測る手段がなく、本発明のように時間的に適合した検索結果を得るためには不適である。従って、重み付けを低くしたり、前記システム上情報、例えばdate情報などと組み合わせて重み付けするようにしてもよい。
【0040】さらに、検索結果から時間情報を探す場合には、イベントの開催期間など、より具体的な時間的適合を判断できることが多く、特に重み付けの効果が高い。これらイベントなどでは時間的に適合せず、検索結果として出力する必要が小さい場合には、極めて小さな重みを設定し、逆に上記検索時刻やキーワードに合致する場合には、最大の重みを設定することが考えられる。
【0041】時間的な適合の有無を調べる際には、上述した時間の概念を組み合わせて評価することができる。例えばイベント時間だけが適合してもアクセス時間と組み合わせると適合しない場合も多く、第1時間情報ないし第3時間情報が期間情報と組み合わせて、検索したキーワードが適合するか否かを判断してもよい。以上により、本発明の特徴である時間的な適合を加味した検索結果の順位付けを図ることができる。
【0042】検索結果評価部(13)では、各検索結果について重み付けを行い、検索結果データベース(30)内の検索結果を順位付けする。該順位に従って、検索結果出力部(14)では本装置(1)から、好適な検索結果を出力する。出力される検索結果は例えばモニタなどの出力装置(5)で表示してもよいし、他の処理装置などで用いてもよい。
【0043】本発明では、以上の構成を備えるが、上記実施例に限らず検索ソフトウェアのアルゴリズムとして用いることのできる検索方法としても提供する。検索装置としては、パーソナルコンピュータにソフトウェアを組み込み、上記と同様の構成をとってもよいし、入力装置などを一体的に備えた専用端末として提供してもよい。
【0044】また、情報の検索対象としては、上述したWWWのhtmlに限らず、任意の情報を用いることができる。例えば、電子メールを用いた情報配信サービスを蓄積したデータベースを参照し、その受信日や含まれる文字列を参照する構成でもよい。
【0045】
【発明の効果】本発明の情報検索方法及び装置は、上述の構成を備えるので、以下の効果を奏する。すなわち、ネットワーク上に記録された膨大な情報から、時間的に適合する有用な情報を検索することが可能となり、検索効率の向上に寄与することができる。特に、ネットワークを通した情報の収集にはアクセスコストがかかるため、本発明によれば、無駄な情報へのアクセス、検索の繰り返しによるコスト上昇を抑制することができる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013