米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 株式会社野村総合研究所

発明の名称 文献情報分析装置及び文献情報分析方法
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2007−109183(P2007−109183A)
公開日 平成19年4月26日(2007.4.26)
出願番号 特願2005−302207(P2005−302207)
出願日 平成17年10月17日(2005.10.17)
代理人 【識別番号】110000279
【氏名又は名称】特許業務法人ウィルフォート国際特許事務所
発明者 三室 克哉 / 須藤 英介 / 高野 誠司 / 中居 隆
要約 課題
ユーザの使い勝手を向上させたマップを生成する。

解決手段
等高線101A,101B等は、マップ100に含まれる文献情報の分布密度を示す。マップ100には、複数のキーワード102も表示される。キーワード102は、マップ100を構成する文献情報群の各文献情報を特徴づける主要なキーワードである。マップ100には、発明内容や研究内容等の概要が記述された標的情報の座標を示す標的シンボル110も表示される。標的シンボル110の周囲には、マップ100の有する上下及び左右の座標軸それぞれに対応して、それぞれ一つまたは複数の案内語111が表示される。案内語111は、標的情報の周囲に分散して存在する顕在化された、または、潜在的なキーワードを示す。ユーザは、特許出願や研究開発の方向性を検討するための材料とすることができる。
特許請求の範囲
【請求項1】
それぞれ電子化された複数の文献情報をそれぞれ記憶する文献情報記憶部と、
前記記憶された各文献情報のうち所定の文献情報群から抽出される所定の複数のキーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、前記所定の文献情報群の各文献情報の座標をそれぞれ算出する文献座標算出部と、
前記所定の各キーワードを含む文献情報の総数及び前記所定の各キーワードの出現数に基づいて主成分分析を行うことにより、前記所定の各キーワードの座標をそれぞれ算出するキーワード座標算出部と、
前記文献座標算出部により算出された前記各文献情報の座標に基づいて前記各文献情報の分布密度を算出し、この算出された分布密度及び前記所定の各キーワードをそれぞれ可視化してマップ情報を生成するマップ生成部と、
ユーザにより指定される標的情報の座標を所定の主成分分析を行うことにより算出する標的座標算出部と、
前記算出された標的情報の座標に前記標的情報の存在を示す表示要素を対応付けて前記マップ情報に重ねて表示させる標的座標表示部と、
を備えた文献情報分析装置。
【請求項2】
前記標的座標算出部は、
前記標的情報を前記所定の文献情報群の一つに含めて、前記所定の各キーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、前記標的情報の座標を算出する第1モードと、
前記標的情報を前記所定の文献情報群に含めずに、前記所定の各キーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、前記標的情報の座標を算出する第2モードと、
の2種類のモードのいずれか一つで、前記標的情報の座標を決定可能である請求項1に記載の文献情報分析装置。
【請求項3】
前記マップ情報上において、前記標的情報の座標から所定の方向に位置するキーワードの存在を示すための案内語を抽出する案内語抽出部と、
この抽出された案内語を前記所定の方向に対応付けて前記マップ情報に重ねて表示させる案内語表示部と、
を備えた請求項1または請求項2のいずれかに記載の文献情報分析装置。
【請求項4】
前記案内語表示部に表示された前記案内語をユーザが選択することにより、
前記標的座標算出部は、前記選択された案内語を前記標的情報に含めて、前記標的情報の座標を再算出する請求項3に記載の文献情報分析装置。
【請求項5】
前記案内語抽出部は、前記所定の各キーワードのうち前記標的情報に含まれていないキーワードを、前記案内語として抽出する請求項3に記載の文献情報分析装置。
【請求項6】
前記案内語抽出部は、前記所定のキーワードのうち前記標的情報に含まれていないキーワードの座標と前記標的情報の座標との間の距離を算出し、この算出された距離が遠いキーワードを前記案内語として優先的に抽出する請求項5に記載の文献情報分析装置。
【請求項7】
前記案内語抽出部は、前記所定の各キーワードのうち前記マップ情報の境界近傍に位置する境界キーワードを検出し、この検出された境界キーワードを含む文献情報を前記文献情報記憶部から読み出して、この読み出された文献情報に含まれる単語群のうち前記所定の各キーワードとして抽出されていない単語の中から、前記案内語を抽出する請求項3に記載の文献情報分析装置。
【請求項8】
前記案内語抽出部は、前記読み出された文献情報に含まれる単語群のうち、予め指定された所定期間内における出現頻度が前記所定期間よりも前の期間における出現頻度よりも相対的に大きい単語であって、かつ、前記所定の各キーワードとして抽出されていない単語の中から、前記案内語を抽出する請求項7に記載の文献情報分析装置。
【請求項9】
前記案内語抽出部は、
前記所定の各キーワードのうち前記標的情報に含まれていないキーワードを前記案内語として抽出する第1抽出部と、
前記所定の各キーワードのうち前記マップ情報の境界近傍に位置する境界キーワードを検出し、この検出された境界キーワードを含む文献情報を前記文献情報記憶部から読み出して、この読み出された文献情報に含まれる単語群のうち前記所定の各キーワードとして抽出されていない単語の中から、前記案内語を抽出する第2抽出部と、
を備えて構成される請求項3に記載の文献情報分析装置。
【請求項10】
コンピュータを、
それぞれ電子化された複数の文献情報をそれぞれ記憶する文献情報記憶手段と、
前記記憶された各文献情報のうち所定の文献情報群から抽出される所定の複数のキーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、前記所定の文献情報群の各文献情報の座標をそれぞれ算出する文献座標決定手段と、
前記所定の各キーワードを含む文献情報の総数及び前記所定の各キーワードの出現数に基づいて主成分分析を行うことにより、前記所定の各キーワードの座標をそれぞれ算出するキーワード座標決定手段と、
前記文献座標決定手段により算出された前記各文献情報の座標に基づいて前記各文献情報の分布密度を算出し、この算出された分布密度及び前記所定の各キーワードをそれぞれ可視化してマップ情報を生成するマップ生成手段と、
ユーザにより指定される標的情報の座標を所定の主成分分析を行うことにより算出する標的座標決定手段と、
前記算出された標的情報の座標に前記標的情報の存在を示す表示要素を対応付けて前記マップ情報に重ねて表示させる標的座標表示手段として、
それぞれ機能させるプログラム。
【請求項11】
ユーザからの検索条件を取得するステップと、
前記検索条件に合致する複数の文献情報を検索するステップと、
前記検索された各文献情報に含まれる所定の複数のキーワードをそれぞれ抽出するステップと、
前記抽出された所定の各キーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、前記検索された各文献情報の座標をそれぞれ算出するステップと、
前記所定の各キーワードを含む文献情報の総数及び前記所定の各キーワードの出現数に基づいて主成分分析を行うことにより、前記所定の各キーワードの座標をそれぞれ算出するステップと、
前記文献座標決定手段により算出された前記各文献情報の座標に基づいて前記各文献情報の分布密度を算出するステップと、
前記算出された分布密度及び前記所定の各キーワードにそれぞれ所定の図形要素を対応付けることにより可視化して、マップ情報を生成するステップと、
ユーザにより指定される標的情報を取得するステップと、
前記取得された標的情報の座標を、所定の主成分分析を行うことにより算出するステップと、
前記算出された標的情報の座標に前記標的情報の存在を示す図形要素を対応付けて前記マップ情報に重ねて表示させるステップと、
前記標的情報を前記マップ情報上の所定の方向に移動させるための案内語を抽出するステップと、
この抽出された案内語を前記所定の方向に対応付けて前記マップ情報に重ねて表示させるステップと、
前記案内語表示部に表示された前記案内語がユーザにより選択された場合には、前記標的情報に前記選択された案内語を含めて、この標的情報の座標を再度算出し、この再度算出された座標に、前記標的情報に対応付けられる図形要素を移動させるステップと、
を含んだ文献情報分析方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、例えば、特許文献や学術文献等の文献情報を分析する文献情報分析装置及び文献情報分析方法に関する。
【背景技術】
【0002】
例えば、文献情報としての特許文献を調査することにより、研究開発の方向性を探ったり、あるいは事業計画の立案等を行うことができる。このために、膨大な特許文献群から所定の目的に合致する特許文献を抽出し、抽出された特許文献群を分析する。この分析結果を二次元平面に表現したものは、いわゆる特許マップとして知られている。
【0003】
しかし、膨大な特許文献群の中から目的に添った特許文献を選び出し、その内容をそれぞれ確認して特許マップを作成するためには、相当な手間がかかり、効率が低い。
【0004】
そこで、本出願人は、特許マップを自動的に作成可能な装置を先に提案している(特許文献1)。
【特許文献1】特開2005−149346号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
前記文献に記載の技術によれば、特許文献群の中から主要なキーワードを自動的に抽出し、特許文献の分布密度及び主要キーワードを配置してなる特許マップを容易に作成することができる。
【0006】
ところで、作成された特許マップを特許出願戦略や研究開発あるいは事業計画等に役立たせようとする場合、現在予定している出願内容や研究内容等が、特許マップ上においてどのような位置づけにあるかを把握する必要がある。しかし、前記文献に記載の装置では、現在予定している出願内容や研究内容等の位置づけを自動的に行うことができず、使い勝手に改善の余地がある。
【0007】
また、予定する出願内容や研究内容が現実に実行された場合、その実行結果が特許マップに与える影響を把握することができず、この点でも使い勝手に改善の余地がある。
【0008】
さらに、今後予定する出願内容や研究内容等の方向性を特許マップから探るのは、容易なことではない。従って、自動的に作成された特許マップの有効利用の観点からも改善の余地がある。
【0009】
そこで、本発明の目的は、生成されたマップ情報における標的情報の位置づけを把握できるようにした文献情報分析装置及び文献情報分析方法を提供することにある。本発明の他の目的は、マップ情報における標的情報の位置づけを示すと共に、標的情報に関するユーザの意思決定を支援することができるようにした文献情報分析装置及び文献情報分析方法を提供することにある。本発明のさらなる目的は、後述する実施形態の記載から明らかになるであろう。
【課題を解決するための手段】
【0010】
上記課題を解決すべく、本発明の一つの観点に従う文献情報分析装置は、それぞれ電子化された複数の文献情報をそれぞれ記憶する文献情報記憶部と、記憶された各文献情報のうち所定の文献情報群から抽出される所定の複数のキーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、所定の文献情報群の各文献情報の座標をそれぞれ算出する文献座標算出部と、所定の各キーワードを含む文献情報の総数及び所定の各キーワードの出現数に基づいて主成分分析を行うことにより、所定の各キーワードの座標をそれぞれ算出するキーワード座標算出部と、文献座標算出部により算出された各文献情報の座標に基づいて各文献情報の分布密度を算出し、この算出された分布密度及び所定の各キーワードをそれぞれ可視化してマップ情報を生成するマップ生成部と、ユーザにより指定される標的情報の座標を所定の主成分分析を行うことにより算出する標的座標算出部と、算出された標的情報の座標に標的情報の存在を示す表示要素を対応付けてマップ情報に重ねて表示させる標的座標表示部と、を備える。
【0011】
文献情報としては、例えば、特許文献(公開公報、登録公報等を含む)や学術論文等を挙げることができる。文献情報は、電子化されて文献情報記憶部に記憶されている。文献情報記憶部に記憶された複数の文献情報のうち、所定の文献情報群から所定の複数のキーワードが抽出される。所定の文献情報群とは、例えば、ユーザにより入力された検索条件に合致する文献情報の群として定義可能である。所定の複数のキーワードとは、例えば、所定の文献情報群の各文献情報をそれぞれ特徴付ける主要なキーワードである。
【0012】
文献座標算出部は、所定の複数のキーワードの組合せ及び所定の複数のキーワードの出現数に基づいて、主成分分析を行い、所定の文献情報群の各文献情報の座標をそれぞれ算出する。主成分分析とは、多変量解析の一手法であり、簡単に言えば、それぞれ多くの変量を含む各サンプル情報について、その相違を最も端的に表す幾つかの総合的指標(主成分)で代表させ、次元数を縮減させる分析方法である。
【0013】
同様にして、キーワード座標算出部は、主成分分析により、所定の各キーワードの座標をそれぞれ算出する。マップ生成部は、各文献情報の座標に基づいて、文献情報の分布密度を算出する。例えば、マップ生成部は、マップの全領域を複数のブロックに区切り、各ブロックに位置する文献情報の数を算出することによって、各ブロック毎の文献情報の粗密を検出可能である。マップ生成部は、例えば、文献情報の分布密度に対応する表示要素(例えば等高線等)と、キーワードの存在を示す表示要素(例えば、キーワードの文字そのもの、あるいはシンボル)とをマップ領域上に配置することにより、マップ情報を生成する。このマップ情報は、例えば、2次元平面に表現されるが、これに限らず、3次元空間に表現することもできる。
【0014】
マップ情報を視認したユーザは、標的情報を指定することができる。標的情報とは、ユーザが、そのマップ情報における位置付けを希望する情報であり、例えば、これから特許出願しようとする発明の概要を示す情報や、これから研究しようとする研究内容の概要を示す情報が該当する。ユーザは、例えば、標的情報をキーボードスイッチ等を介して、その場で入力することもできるし、あるいは、既に作成された文書ファイルを標的情報として指定することもできる。
【0015】
標的座標算出部が標的情報の座標を算出すると、標的座標表示部は、標的座標の存在を示す表示要素をマップ情報に重ねて表示させる。これにより、ユーザは、そのマップ情報における標的座標の位置づけを容易に把握することができる。
【0016】
本発明の実施形態では、標的座標算出部は、標的情報を所定の文献情報群の一つに含めて、所定の各キーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、標的情報の座標を算出する第1モードと、標的情報を所定の文献情報群に含めずに、所定の各キーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、標的情報の座標を算出する第2モードと、の2種類のモードのいずれか一つで、標的情報の座標を決定可能となっている。
【0017】
第1モードが選択された場合、所定の文献情報群の一つに標的情報が含まれるため、各文献情報の座標や各キーワードの座標をそれぞれ再度算出すれば、元のマップ情報とは異なるマップ情報が生成される。即ち、第1モードは、標的情報をマップ情報に反映させるモードである。これに対し、第2モードが選択された場合、標的情報は所定の文献情報群に含まれないため、標的情報が入力されてもマップ情報に影響を与えない。このように複数種類のモードを予め用意しておき、いずれか一つのモードをユーザが任意に選択可能とすれば、標的情報をマップ情報の基礎に含めた場合と含めない場合との相違を確認することができ、使い勝手が向上する。
【0018】
本発明の実施形態では、マップ情報上において、標的情報の座標から所定の方向に位置するキーワードの存在を示すための案内語を抽出する案内語抽出部と、この抽出された案内語を所定の方向に対応付けてマップ情報に重ねて表示させる案内語表示部と、を備えている。
【0019】
案内語とは、標的情報の周囲に存在するキーワードを示すための情報である。案内語として示されるキーワードは、マップ情報上に既に表示されている場合もあり得るし、マップ情報上に表示されていない場合もあり得る。案内語は、顕在化されたキーワードまたは潜在的キーワードのいずれかまたは双方をそれぞれ指し示すことができる。
【0020】
また、案内語抽出部は、標的情報の座標から所定の方向に位置するキーワードの存在を示すための案内語を、当該キーワードの座標と標的情報の座標との間の算出された距離に対応付けて抽出することができる。そして、案内語表示部は、抽出された案内語を、前記算出された距離に応じて、所定の方向に対応付けてマップ情報に重ねて表示させることができる。例えば、標的座標との距離が遠いキーワードから順番に、あるいは、標的座標との距離が近い順番に、案内語として表示させることができる。
【0021】
ユーザが、表示された案内語のいずれか一つまたは複数を採用し、その採用した案内語を標的情報に追加して再度入力することにより、この案内語の追加によって修正された標的情報の座標が計算し直され、マップ情報上に重ねて表示される。
【0022】
本発明の実施形態では、案内語表示部に表示された案内語をユーザが選択することにより、標的座標算出部は、選択された案内語を標的情報に含めて、標的情報の座標を再算出する。これにより、ユーザは、改めて標的情報を作り直すまでもなく、表示された案内語のいずれか一つまたは複数を選択するだけで、標的情報の表示位置(座標)を変化させることができる。
【0023】
本発明の実施形態では、案内語抽出部は、所定の各キーワードのうち標的情報に含まれていないキーワードを、案内語として抽出する。
【0024】
本発明の実施形態では、案内語抽出部は、所定のキーワードのうち標的情報に含まれていないキーワードの座標と標的情報の座標との間の距離を算出し、この算出された距離が遠いキーワードを案内語として優先的に抽出する。
【0025】
本発明の実施形態では、案内語抽出部は、所定の各キーワードのうちマップ情報の境界近傍に位置する境界キーワードを検出し、この検出された境界キーワードを含む文献情報を文献情報記憶部から読み出して、この読み出された文献情報に含まれる単語群のうち所定の各キーワードとして抽出されていない単語の中から、案内語を抽出する。これにより、マップ情報に表示されていない隠れたキーワードを案内語として顕在化させることができる。
【0026】
本発明の実施形態では、案内語抽出部は、読み出された文献情報に含まれる単語群のうち、予め指定された所定期間内における出現頻度が所定期間よりも前の期間における出現頻度よりも相対的に大きい単語であって、かつ、所定の各キーワードとして抽出されていない単語の中から、案内語を抽出する。
【0027】
ユーザは、標的座標を指定する際に、所定期間(例えば、現在から過去半年間、現在から過去1年間等)を指定することができる。案内語抽出部は、指定された所定期間内の出現頻度及び指定された所定期間より前の期間における出現頻度を、単語群の各単語毎にそれぞれ算出する。なお、所定期間より前の期間は、例えば、1年間や3年間等のように、ユーザの指定した期間、または、初期値として設定された期間に限定可能である。
【0028】
最近の出現頻度の方が過去の出現頻度よりも相対的に大きい単語であって、マップ情報上に表示されていないものを案内語として抽出することにより、最近の傾向を示す情報をユーザに与えることができる。
【0029】
本発明の実施形態では、案内語抽出部は、所定の各キーワードのうち標的情報に含まれていないキーワードを案内語として抽出する第1抽出部と、所定の各キーワードのうちマップ情報の境界近傍に位置する境界キーワードを検出し、この検出された境界キーワードを含む文献情報を文献情報記憶部から読み出して、この読み出された文献情報に含まれる単語群のうち所定の各キーワードとして抽出されていない単語の中から、案内語を抽出する第2抽出部と、を備えて構成される。
【0030】
本発明の他の観点に従うプログラムは、コンピュータを、それぞれ電子化された複数の文献情報をそれぞれ記憶する文献情報記憶手段と、記憶された各文献情報のうち所定の文献情報群から抽出される所定の複数のキーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、所定の文献情報群の各文献情報の座標をそれぞれ算出する文献座標決定手段と、所定の各キーワードを含む文献情報の総数及び所定の各キーワードの出現数に基づいて主成分分析を行うことにより、所定の各キーワードの座標をそれぞれ算出するキーワード座標決定手段と、文献座標決定手段により算出された各文献情報の座標に基づいて各文献情報の分布密度を算出し、この算出された分布密度及び所定の各キーワードをそれぞれ可視化してマップ情報を生成するマップ生成手段と、ユーザにより指定される標的情報の座標を所定の主成分分析を行うことにより算出する標的座標決定手段と、算出された標的情報の座標に標的情報の存在を示す表示要素を対応付けてマップ情報に重ねて表示させる標的座標表示手段として、それぞれ機能させる。このプログラムは、一つまたは複数のコンピュータ上で実行されることにより、所定の機能を実現可能である。
【0031】
本発明のさらに別の観点に従う文献情報分析方法は、ユーザからの検索条件を取得するステップと、検索条件に合致する複数の文献情報を検索するステップと、検索された各文献情報に含まれる所定の複数のキーワードをそれぞれ抽出するステップと、抽出された所定の各キーワードの組合せ及び出現数に基づいて主成分分析を行うことにより、検索された各文献情報の座標をそれぞれ算出するステップと、所定の各キーワードを含む文献情報の総数及び所定の各キーワードの出現数に基づいて主成分分析を行うことにより、所定の各キーワードの座標をそれぞれ算出するステップと、文献座標決定手段により算出された各文献情報の座標に基づいて各文献情報の分布密度を算出するステップと、算出された分布密度及び所定の各キーワードにそれぞれ所定の図形要素を対応付けることにより可視化して、マップ情報を生成するステップと、ユーザにより指定される標的情報を取得するステップと、取得された標的情報の座標を、所定の主成分分析を行うことにより算出するステップと、算出された標的情報の座標に標的情報の存在を示す図形要素を対応付けてマップ情報に重ねて表示させるステップと、標的情報をマップ情報上の所定の方向に移動させるための案内語を抽出するステップと、この抽出された案内語を所定の方向に対応付けてマップ情報に重ねて表示させるステップと、案内語表示部に表示された案内語がユーザにより選択された場合には、標的情報に選択された案内語を含めて、この標的情報の座標を再度算出し、この再度算出された座標に、標的情報に対応付けられる図形要素を移動させるステップと、を含む。
【発明を実施するための最良の形態】
【0032】
以下、図面に基づき、本発明の実施の形態を説明する。本実施形態に係る文献情報分析装置1は、マップ制御部10と、案内語制御部20及び情報蓄積部30を備えたコンピュータ装置として構成可能である。そして、文献情報分析装置1は、例えば、インターネットやLAN(Local Area Network)等の通信ネットワークを介して、クライアント端末2と双方向通信可能に接続されている。クライアント端末2は、例えば、パーソナルコンピュータや携帯情報端末(携帯電話を含む)等として構成可能である。
【0033】
マップ制御部10は、情報蓄積部30に記憶されている多数の文献情報に基づいて、技術マップ100を生成し、出力する。生成されたマップ100は、通信ネットワークを介して、クライアント端末2に送信される。マップ100は、クライアント端末2内に保存可能としてもよいし、クライアント端末2内に保存不能としてもよい。マップ制御部10の詳細はさらに後述する。
【0034】
案内語制御部20は、情報蓄積部30に記憶されている多数の文献情報に基づいて、キーワードを抽出し、このキーワードを案内語としてマップ100上に表示させる。案内語制御部20の詳細はさらに後述する。
【0035】
情報蓄積部30は、例えば、特許公開公報や登録公報、あるいは、科学技術論文等のような文献情報を多数記憶している。
【0036】
マップ100の構成を説明する。マップ100は、ユーザから指示された目的に添って生成されるものである。ユーザは、例えば、調査を希望する技術分野や特定のサーチワード等を指定することにより、情報蓄積部30に記憶されている多数の文献情報群の中から所定の文献情報群のみを選ぶことができる。ユーザによって選ばれた文献情報群の内容は、マップ制御部10によって解析され、マップ100が生成される。
【0037】
等高線101A,101B,101C及び101Dは、マップ100に含まれる文献情報の分布密度を示す表示要素である。例えば、等高線101Aは、そこに存在する文献情報の数が1以上B1未満であることを示し、等高線101Bは、そこに存在する文献情報の数がB1以上B2未満であることを示す(B1,B2は自然数)。このように、101Aから101B、101C、101Dへと向かうにつれて、そこに含まれる文献情報の数は段階的に増大する。
【0038】
マップ100には、複数のキーワード102も表示されている。これらのキーワード102は、マップ100を構成する文献情報群の各文献情報を特徴づける主要なキーワードであり、以下の説明では、主要キーワード102と呼ぶ場合がある。
【0039】
マップ100には、標的情報の座標を示す標的シンボル110が表示されている。標的情報とは、ユーザが、そのマップ100上での位置付け調査を希望する情報であり、例えば、発明内容の概略や研究内容の概要等を挙げることができる。
【0040】
標的シンボル110の周囲には、マップ100の有する上下及び左右の座標軸それぞれに対応して、それぞれ一つまたは複数の案内語111が表示されている。この案内語111は、標的情報の周囲に分散して存在する顕在化された、または、潜在的なキーワードを示す情報である。これによりユーザは、標的情報の内容を修正する場合のヒントを得ることができ、特許出願や研究開発の方向性を検討するための材料とすることができる。
以下、本実施形態のより詳細な実施例を説明する。なお、本発明の実施に必要な範囲内で、特開2005−149346号公報の開示内容を利用可能である。
【実施例1】
【0041】
図2は、文献情報分析装置1の機能構成を示すブロック図である。マップ制御部10は、例えば、マップ生成条件入力受付部11と、文献抽出部12と、文献座標算出部13と、キーワード抽出部14と、キーワード座標算出部15と、マップ生成部16及びマップ表示部17とを含んで構成することができる。
また、情報蓄積部30の一例として、文献データベース(図中、データベースを「DB」と略記)31と、単語データベース32と、インデックスデータベース33とを設けることができる。
文献データベース31は、複数の文献情報を記憶するものである。単語データベース32は、辞書として使用されるものである。インデックスデータベース33は、各文献にどのようなキーワードが含まれているかを管理するためのものである。
【0042】
マップ生成条件入力受付部11は、ユーザから指定されるマップ生成条件の入力を受け付けるためのものである。受け付けるとは、例えば、ユーザの指定するマップ生成条件を示す情報を通信インターフェースを介して電子情報として受信し、メモリ等に記憶させることを意味する。
【0043】
文献抽出部12は、ユーザから指定された条件に基づいて、文献データベース31及びインデックスデータベース33を検索することにより、ユーザの望む範囲内の文献情報を抽出するものである。文献座標算出部13は、抽出された文献情報を解析することにより、マップ100上における座標を算出するものである。例えば、文献座標算出部13は、抽出された各文献情報に含まれるキーワードの組合せ及び出現数に対して主成分分析を施すことにより、二次元平面上における各文献の座標をそれぞれ算出する。
【0044】
キーワード抽出部14は、抽出された文献情報を解析することにより、そこに含まれている複数のキーワードを抽出する。キーワード座標算出部15は、抽出されたキーワードの座標をそれぞれ算出するものである。例えば、キーワード座標算出部15は、キーワードを含む各文献情報の総数及び出現総数に対して主成分分析を施すことにより、二次元平面上における各キーワードの座標をそれぞれ算出するものである。なお、主成分分析は、多変量解析のための一手法であり、公知の技術であるため詳細を割愛する。
【0045】
マップ生成部16は、算出された各文献情報の座標及び各キーワードの座標に基づいて、マップ100を生成する。例えば、マップ生成部16は、有限の二次元平面を縦横に細かく区切って多数のブロック領域を設定し、各ブロック領域に存在する文献情報の数を算出する。これにより、マップ生成部16は、文献情報の分布密度を求め、この分布密度に対応する等高線101A等を設定する。
【0046】
マップ表示部17は、生成されたマップ100の構成に応じて所定の表示要素をそれぞれ割り当てることにより、ユーザが視認可能なマップ100を生成し、クライアント端末2に提供する。所定の表示要素としては、例えば、各等高線101A等を示すための輪郭線や各キーワードを示すための文字等を挙げることができる。このほかに、マップ100に対する操作を行うためのメニュー表示部等も追加される。
【0047】
ユーザは、クライアント端末2の端末画面に表示されたマップ100を閲覧することにより、指定した範囲の文献情報群がどのように分布しており、どのようなキーワードが使用されているか等を読みとることができる。
【0048】
そして、ユーザは、マップ100における位置づけ確認を希望する標的情報120を入力または指定する。標的情報120の入力方法としては、種々の方法を採用できる。例えば、マップ制御部10からクライアント端末2に、標的情報を入力するためのフォームを提供し、このフォームにユーザが手動で標的情報120を入力することができる。
あるいは、ユーザは、既に作成されてクライアント端末2の補助記憶装置2005等に記憶されている文書ファイルのファイル名を手動操作で選択することにより、この選択した文書ファイルを標的情報120として入力することもできる。より具体的には、ユーザは、補助記憶装置2005のディレクトリ階層を辿って、所定の文書ファイルを探しだし、このファイル名をクリック等して選択する。ユーザによって選択された文書ファイルのデータは自動的に読み出され、通信ネットワークCNを介して、文献分析装置1に送信され、標的情報120として入力される。
さらに、ユーザの音声を認識してテキストコードに変換するためのプログラムを設けることにより、ユーザは、標的情報120を口述で入力することもできる。
【0049】
案内語制御部20は、例えば、標的情報入力受付部21と、標的情報座標算出部22と、標的情報表示部23と、案内語抽出部24及び案内語表示部25とを含んで構成することができる。
【0050】
標的情報入力受付部21は、上述のような方法でユーザから入力される標的情報120を電子的に受け付けて記憶する。標的情報座標算出部22は、入力された標的情報120の座標を算出する。標的情報座標表示部23は、算出された座標に標的シンボル110を表示させる。
【0051】
案内語抽出部24は、文献データベース31及びインデックスデータベース33を参照することにより、標的情報120に関連づけられる一つ以上の案内語を抽出する。案内語表示部25は、抽出された案内語111を、その座標に応じた方向に対応付けて、マップ100に表示させる。
【0052】
図3は、文献情報分析装置1及びクライアント端末2のハードウェア構成の概略を示す構成説明図である。文献情報分析装置1は、上述のように、サーバコンピュータ等のように構成可能である。
【0053】
文献情報分析装置1は、例えば、通信インターフェース(図中、インターフェースを「I/F」と略記)1001と、CPU(Central Processing Unit)1002と、ROM(Read Only Memory)1003と、RAM(Random Access Memory)1004と、補助記憶装置1005を備えて構成することができる。
【0054】
補助記憶装置1005には、例えば、OS(Operating System)の他に、文献データベース31と、単語データベース32と、インデックスデータベース33と、案内語抽出プログラム1100と、表示制御プログラム1110と、主成分分析プログラム1120と、構造解析プログラム1130と、検索プログラム1140及びウェブサーバプログラム1150を、それぞれ記憶させることができる。
【0055】
文献データベース31には、上述のように、特許公開公報等の文献情報が予め記憶されている。単語データベース32には、例えば、助詞や接続詞等のようなキーワードに不適切な単語、同義語、類義語等が予め記憶されている。各文献情報に含まれているキーワードは、文献データベース31と単語データベース32とを用いることにより、それぞれ抽出することができる。インデックスデータベース33は、このようにして抽出された各文献情報毎のキーワードの所在をそれぞれ管理する。従って、インデックスデータベース33を用いることにより、多数の文献情報を記憶する文献データベース31の中から、必要な文献情報を速やかに検索することができる。
案内語抽出プログラム1100は、案内語抽出部24を実現するためのプログラムである。表示制御プログラム1110は、マップ100や標的シンボル110の描画処理等を行うプログラムである。主成分分析プログラム1120は、主成分分析を行うプログラムである。構造解析プログラム1130は、例えば、テキストマイニング等の手法に基づいて、テキストデータの構造を解析するプログラムである。検索プログラム1140は、入力された検索条件に基づいて、文献データベース31等を検索するプログラムである。ウェブサーバプログラム1150は、ウェブサーバ機能を実現するプログラムである。
【0056】
クライアント端末2の構成を説明する。クライアント端末2は、インターネット等の通信ネットワークCNを介して文献情報分析装置1に接続されており、例えば、通信インターフェース2001と、CPU2002と、ROM2003と、RAM2004及び補助記憶装置2005を備えて構成可能である。
【0057】
なお、以上の構成は例示であって、本発明はこれに限定されない。例えば、プログラムに代えて、プログラマブル・ロジック・デバイス等のようなハードウェア回路を用いて、各機能の少なくとも一部を実現可能な場合もある。
【0058】
文献情報分析装置1(以下、分析装置1とも呼ぶ)を用いた文献情報分析方法について説明する。図4は、マップ100を生成して出力するためのマップ制御処理の概要を示すフローチャートである。なお、以下に述べる各フローチャートも同様であるが、各フローチャートは、処理の概要を示しており、実際のプログラムとは相違する。
【0059】
まず、ユーザは、クライアント端末2のユーザインターフェースを介して、検索条件を入力する(S10)。検索条件は、例えば、「光触媒」等のようなキーワードを指定することにより、あるいは特許分類コードや文献の公開日等を指定することにより、行うことができる。
【0060】
分析装置1は、クライアント端末2から検索条件を取得すると(S11)、この検索条件に基づいてインデックスデータベース33及び文献データベース31を検索し、検索条件に合致する文献情報を全て抽出する(S12)。より具体的には、ユーザから指定されたキーワードを有する文献情報を抽出するために、インデックスデータベース33が使用される。そして、指定されたキーワードを有する文献情報が特定されると、その文献情報が文献データベース31から読み出される。そして、抽出された結果は、分析装置1からクライアント端末2に送信され(S13)、クライアント端末2の画面に表示される(S14)。
【0061】
ユーザは、クライアント端末2の画面を介して、抽出された文献の総数や文献名称等を確認し、抽出結果に承認を与える(S15)。なお、ユーザが抽出結果に満足しない場合、検索条件を変えて、再度検索を指示することができる。
【0062】
分析装置1は、ユーザの承認を確認すると、抽出された各文献情報からキーワードをそれぞれ抽出する(S16)。このキーワード抽出結果は、分析装置1からクライアント端末2に送信され(S17)、クライアント端末2の画面に表示される(S18)。ユーザは、キーワード抽出結果に所望するキーワードが含まれているか等を確認して、承認を与える(S19)。なお、ユーザがキーワード抽出結果に満足しない場合、再度のキーワード抽出を要求することもできる。
【0063】
分析装置1は、ユーザの承認を確認すると、主成分分析を行うことにより、抽出された各文献情報の座標をそれぞれ算出する(S20)。続いて、分析装置1は、各文献情報の座標に基づいて、文献情報の分布密度を算出する(S21)。
【0064】
分析装置1は、主成分分析を行うことにより、抽出された各キーワードの座標をそれぞれ算出する(S22)。そして、分析装置1は、マップ100を生成してクライアント端末2に送信する(S23)。ユーザは、クライアント端末2の画面に表示されたマップ100を確認する(S24)。
【0065】
図5は、マップ100を生成する様子を模式的に示す説明図である。分析装置1は、各文献情報の座標を算出し、文献座標管理テーブルT1に記憶させる。文献座標管理テーブルT1には、例えば、文献情報を特定するための文献番号に、その文献情報のX軸座標及びY軸座標とが対応付けられている。また、分析装置1は、抽出された各キーワード(主要キーワード)の座標を算出し、キーワード座標管理テーブルT2に記憶させる。キーワード座標管理テーブルT2は、例えば、キーワードと、そのキーワードが含まれている文献番号と、そのキーワードのX軸座標及びY軸座標がそれぞれ記憶されている。なお、図中では、キーワードが含まれている文献番号を一つのみ示しているが、そのキーワードが含まれる全ての文献番号を含めることができる。
【0066】
図5の下側に示すように、例えば、マップ100のX軸方法及びY軸方向をそれぞれ複数ずつ分割することにより、多数のブロック領域130をマップ100上に設定することができる。分析装置1は、各ブロック領域130に位置する文献情報の数をそれぞれ算出することにより、文献情報の分布密度を求める。
【0067】
図6は、表示されたマップ100に対して、ユーザが手動操作で標的情報120を入力する様子を示す説明図である。図6(a)は、標的情報120が入力される前のマップ100を示す。図6(b)に示すように、ユーザは、このマップ100に対して、標的情報120を手動で入力する。これにより、その標的情報120の座標が算出されて、標的シンボル110がマップ100上に表示される。
【0068】
標的シンボル110は、マップ100における標的情報120の位置づけを示すものである。ユーザは、標的シンボル110に基づいて、標的情報120がどのような位置づけにあるのかを把握し、戦略や方針の立案等に役立たせることができる。例えば、文献情報の密度が高い領域に標的情報120が位置する場合、ユーザは、研究開発が過密な分野での競争であることを自覚することができ、その過密分野での市場性等を考慮して、研究開発を続行するか否かについて判断することができる。逆に、文献情報の少ない領域に標的情報120が位置する場合、ユーザは、その分野の研究開発が遅れている理由や市場性等を考慮し、その過疎分野での研究開発を続行するか否かについて判断できる。
【0069】
図7は、標的情報の座標を算出し、標的シンボル110をマップ100に表示させるための処理を示すフローチャートである。
【0070】
上述のように、ユーザが、クライアント端末2のキーボードスイッチを介して文章を入力したり、あるいは、既に作成済みの文書ファイルを選択することにより、標的情報120を分析装置1に入力することができる(S31)。分析装置1は、クライアント端末2から入力された標的情報120をRAM1004等に記憶させる(S32)。
【0071】
ユーザは、標的情報120の座標表示に関する一つまたは複数の設定値を入力することもできる(S33)。入力可能な設定値としては、例えば、表示算出のモードや判定対象期間等を挙げることができる。ユーザにより入力された設定値は、分析装置1のRAM1004等に記憶される(S34)。
【0072】
なお、ユーザは、標的情報120として使用するファイルのアドレスのみを指定することも可能である。例えば、既に作成されたHTML(HyperText Markup Language)ファイル)等の文書ファイルがクライアント端末2と別のコンピュータ装置や記憶装置上に存在する場合、ユーザは、その文書ファイルの所在を示すURL(Uniform Resource Locator)等のアドレス情報を分析装置1に入力する。この場合、分析装置1は、ユーザから入力されたアドレス情報に基づいて文書ファイルにアクセスし、この文書ファイルをダウンロードして補助記憶装置1005等に記憶させる。分析装置1にプロキシサーバ機能またはこれと同様の機能を持たせることにより、このような構成を実現可能である。
【0073】
さて、分析装置1は、構造解析プログラム1130を実行することにより、ユーザから入力された標的情報120の構文を解析する(S35)。これにより、標的情報120に含まれる助詞や接続詞あるいは定型文等の不要な単語が除去され、キーワードだけが抽出される。この不要な単語の除去には、単語データベース32が使用される。
【0074】
次に、分析装置1は、標的情報120の座標に際して、標的情報120を文献情報群に反映させるか否かを選択する(S36)。即ち、本実施形態では、第1モードと第2モードとの複数種類の座標算出モードを予め用意してあり、ユーザが事前または事後に、いずれか一つのモードを自由に選択可能としている。
【0075】
第1モードは、標的情報120をマップ100に含まれる文献情報群の一つに含めて、標的情報120の座標を算出するモードである(S38)。これに対し、第2モードは、標的情報120を文献情報群に含めずに、標的情報120の座標を算出するモードである(S37)。
【0076】
第1,第2モードのいずれかに基づいて標的情報120の座標が算出されると、分析装置1は、この算出された座標に標的シンボル110を対応付けて、マップ100上に標的シンボル110を表示させる(S39)。ユーザは、クライアント端末2の画面を介して、標的情報120の位置づけを確認することができる(S40)。
【0077】
図8は、標的シンボル110の周囲に案内語111を配置させるための案内語制御処理の全体概要を示すフローチャートである。詳細は後述するが、分析装置1は、マップ100に含まれるキーワードから案内語を抽出する(S41)。この案内語は、既に抽出されているキーワード群の中から選ばれるため、既知案内語と呼ぶことができる。次に、分析装置1は、マップ100を構成する文献情報群に含まれる単語群の中から、主要キーワードとして表示されていない単語を案内語として抽出する(S42)。この案内語は、マップ100上に出現していないため、未知案内語と呼ぶことができる。
【0078】
そして、分析装置1は、標的シンボル110の周囲に、マップ100の各座標軸に添って、抽出された案内語をそれぞれ配置させる(S43)。簡単には、標的シンボル110の上下左右に、それぞれの方向に存在する案内語を配置させる。
【0079】
図9は、既知の案内語を抽出するための処理を示すフローチャートである。分析装置1は、標的情報120の座標を中心として、各座標軸方向に偏っている主要キーワードをそれぞれ抽出する(S52)。即ち、標的情報120の上下左右に分散するキーワードをそれぞれ抽出する。次に、分析装置1は、抽出されたキーワードが標的情報120に含まれているか否かを判定する(S53)。そのキーワードが既に標的情報120に含まれている場合(S53:NO)、案内語として抽出する意味はないため、次のキーワードについて判定する。これに対し、そのキーワードが標的情報120に含まれていない場合(S53:YES)、分析装置1は、そのキーワードを既知案内語の候補として登録する(S54)。以上のステップS52〜S54は、マップ100に表示されているキーワードについて一つずつ実行される(S51)。
【0080】
分析装置1は、登録された既知案内語候補(キーワード)の座標と標的情報120の座標との間の距離をそれぞれ算出し、各座標軸方向のそれぞれについて、標的情報120までの距離が遠い順に並べ替える(S55)。そして、分析装置1は、上位n1個の既知案内語を選択する(S56)。即ち、標的情報120からの距離の遠いキーワードが優先して選択される。
【0081】
図10〜図13を参照して、既知案内語を抽出する方法の一例を説明する。前記フローチャートでは、マップ100に表示されている各キーワード毎に、それぞれ判定するものとして述べたが、これに代えて、例えば、以下のように、既知案内語を抽出することもできる。
【0082】
図10は、マップ100の各座標軸X,Y方向に分散している表示済のキーワードを、各座標軸の方向毎に抽出する様子を示す。マップ100は、例えば、第1領域、第2領域、第3領域及び第4領域に分割して考えることができる。ここで、標的情報120の座標を原点とした場合、第1領域は正のY軸に、第2領域は正のX軸に、第3領域は負のY軸に、第4領域は負のX軸に、それぞれ対応する。
【0083】
分析装置1は、マップ100上に分散する各キーワードの座標が第1領域〜第4領域のいずれに存在するかを検出し、キーワード抽出テーブルT3に登録する。キーワード抽出テーブルT3には、第1〜第4の各領域毎に、そこに含まれるキーワード及びその座標が対応付けられている。
【0084】
図11は、既知案内語の候補を自動的に選択する様子を示す。分析装置1は、キーワード抽出テーブルT3に登録された既知案内語と標的情報120から抽出された単語とを比較することにより、標的情報120に含まれていないキーワードのみを、既知案内語候補テーブルT4に登録させる。
【0085】
図12は、登録された既知案内語の候補から所定数の案内語を自動的に選択する様子を示す。既知案内語候補テーブルT4には、例えば、第1〜第4領域毎に、そこに含まれるキーワード及び該キーワードと標的情報120までの距離がそれぞれ対応付けられて記憶されている。
【0086】
分析装置1は、距離の降順でキーワードを並べ替え、上位n1個の案内語候補を既知案内語として選択する。選択された既知案内語は、図13に示す既知案内語テーブルT5に登録される。既知案内語テーブルT5は、例えば、第1〜第4の各領域毎に、そこに含まれるキーワード及び標的情報120までの距離をそれぞれ対応付けて記憶する。
【0087】
図14は、未知の案内語を抽出するための処理を示すフローチャートである。S62〜S64の各ステップは、マップ100の境界に存在する主要キーワードの全てについてそれぞれ実行される(S61)。
【0088】
分析装置1は、マップ100を構成する文献情報群のうち、マップ100の境界(ここでは、境界の近傍を含めて「境界」と呼ぶ)に存在する主要キーワードを含む全ての文献情報を検出する。そして、分析装置1は、検出された各文献情報に含まれている単語の中から、最近比較的頻繁に使用されている単語を抽出する(S62)。即ち、主要キーワードとしてマップ100上にプロットされていないが、最近頻出している要注意のキーワードを発見する。これをアラート分析と呼ぶこともでき、後述の急騰スコアを算出することにより求められる。この処理の詳細は、別のフローチャートと共に後述する。
【0089】
分析装置1は、最近頻出する単語であるとして抽出された単語が、標的情報120に含まれているか否かを判定する(S63)。その単語が標的情報120に含まれていない場合(S63:NO)、分析装置1は、その単語が主要キーワードとして既にマップ100上に表示されているか否かを判定する(S64)。その単語が主要キーワードとしてマップ100に表示されていない場合(S64:NO)、分析装置1は、その単語を未知案内語の候補として登録する(S65)。次に、分析装置1は、未知案内語の候補を急騰スコアの降順で並べ替え(S66)、急騰スコアの高い単語をn2個だけ、未知案内語として選択する(S67)。
【0090】
次に、図15は、最近頻出する要注意単語(注目単語)を抽出するための急騰スコア算出処理を示すフローチャートである。
【0091】
分析装置1は、マップ100に含まれる文献情報群の全体から、判定対象期間内に利用されている単語をそれぞれ抽出する(S71)。判定対象期間とは、この判定処理の対象とする期間を意味し、例えば、ユーザにより選択された期間が設定される。ユーザが期間を設定しない場合は、予め設定されている初期値が使用される。例えば、ユーザが「1年間」と設定した場合、現在から1年前までの期間が判定対象期間となる。そして、判定対象期間よりも前の期間が、「判定対象期間外」となる。以下の説明では、判定対象期間を「対象期間」と略す場合がある。
【0092】
分析装置1は、マップ100を構成する文献情報群のうち、対象期間に公表または作成された文献情報の総数(e)を取得する(S72)。各文献情報には、その作成日や公開日等の情報が関連づけられている。また、分析装置1は、対象期間外の文献情報の総数(f)を取得する(S73)。
【0093】
そして、以下に述べる各ステップS75〜S84を、S71で抽出された全ての単語について実行するまで繰り返す(S74)。
【0094】
分析装置1は、S71で抽出された単語群に含まれる一つの単語について、その単語が、対象期間で利用された件数(a)を取得する(S75)。即ち、対象期間において、その単語が含まれている文献情報の数を検出する。もしも、100件の文献で使用されていた場合、(a)の値は100となる。同一文献の中における使用回数は問わない。
【0095】
分析装置1は、対象期間において、その単語が利用されていない件数(b)を取得する(S76)。この非利用件数(b)は、対象期間内の総文献数(e)から利用件数(a)を差し引いた値である。
【0096】
続いて、分析装置1は、対象期間よりも以前の状態について検査を行う。分析装置1は、対象期間外において、その単語が利用されている文献情報の総数(c)を取得し(S77)、対象期間外における当該単語の非利用件数(d)を算出する(S78)。この対象期間外の非利用件数(d)は、対象期間外の総文献数(f)から対象期間外の利用件数(c)を減算した値となる。
【0097】
そして、分析装置1は、対象期間内の利用件数(a)及び非利用件数(b)と、対象期間外の利用件数(c)及び非利用件数(d)とに基づいて、その単語の急騰スコアQを算出する(S79)。
【0098】
急騰スコアとは、その単語の注目度の高さを示す指標であり、例えば、下記数式1に基づいて算出することができる。
【0099】
Q=±(ad-bc)^2/((a+b)*(c+d)*(a+c)*(b+d))・・・(数式1)
【0100】
ここで、(ad-bc)の値を先に算出しておき、(ad-bc)≧0であればプラスの符号を、(ad-bc)<0であればマイナスの符号をQに与える。
【0101】
数式1に示すように、急騰スコアQが正の値をとる場合、その単語の対象期間における利用率は対象期間外の利用率よりも大きいことを意味する。即ち、正のQの値が大きいということは、その単語が比較的最近になって頻繁に利用されていることを示す。
【0102】
次に、分析装置1は、算出された急騰スコアQの有意水準を算出する(S80)。有意水準とは、偶然性を排除するためのレベルである。そして、分析装置1は、算出された急騰スコアQが正の値であるか否か(S81)、算出された急騰スコアQが予め設定された有意水準の閾値Th未満であるか否か(S82)をそれぞれ算出する。
【0103】
そして、分析装置1は、その単語の急騰スコアQが正の値であって(S81:YES)、かつ、その急騰スコアQの有意水準が閾値Th未満である場合(S82:YES)、その単語を急騰ワードとして登録する(S83)。これに対し、その単語の急騰スコアQが負の値であるか(S81:NO)、または、その急騰スコアQの有意水準が閾値Th以上である場合(S82:NO)、分析装置1は、その単語を破棄する(S84)。ここで、破棄するとは、急騰ワードとして登録しないことを意味し、その単語を含む文献情報から当該単語を削除する意味ではない。
【0104】
図16〜図19を参照して、未知案内語を抽出する方法の一例を説明する。上述した図14,図15に示すフローチャートでは、マップ100の境界に位置する各キーワード毎にそれぞれ抽出判定を行う場合を述べたが、以下のように抽出することもできる。
【0105】
図16は、マップ100の境界キーワードを抽出する様子を示す説明図である。図16の上側に示すように、マップ100の境界、即ち、マップ100の輪郭線から所定の幅だけ内側に寄った閾値線BLまでの領域に表示されるキーワードが、境界キーワードとして検出される。
【0106】
分析装置1は、第1〜第4の各領域毎に、それぞれ境界キーワードを検出し、境界キーワード抽出テーブルT6に登録する。境界キーワード抽出テーブルT6には、例えば、第1〜第4の各領域毎に、そこに含まれる境界キーワード及びその座標がそれぞれ対応付けられている。
【0107】
分析装置1は、マップ100を構成する文献情報群のうち、境界キーワード抽出テーブルT6に登録された境界キーワードを含む全ての文献情報をそれぞれ抽出する。分析装置1は、その文献番号を境界キーワードに対応付けて、境界キーワード含有文献管理テーブルT7に登録する。
【0108】
図17は、各単語の急騰スコアを算出する様子を示す模式図である。各単語W1〜W3毎に、判定対象期間内における利用件数(a)及び判定対象期間外における利用件数(c)がそれぞれ算出される。そして、判定対象期間内の総文献数(e)及び同期間外の総文献数(f)もそれぞれ算出される。従って、上述の通り、判定対象期間内の非利用件数(b)及び判定対象期間外の非利用件数(d)も、それぞれ算出することができる。
【0109】
図18は、急騰ワードとして登録された単語が未知案内語の候補として選択される様子を示す説明図である。
【0110】
急騰ワード登録テーブルT8には、例えば、第1〜第4の各領域毎に、そこに存在する単語と、算出された急騰スコア及び有意水準がそれぞれ対応付けられている。分析装置1は、急騰ワード登録テーブルT8に登録されている単語が、標的情報120に含まれているか否か、及び、キーワード抽出テーブルT3に登録されているか否かを、それぞれ判定する。そして、その単語が、標的情報120に使用されておらず、かつ、マップ100にも表示されていない場合、分析装置1は、その単語を未知案内語候補テーブルT9に登録させる。
【0111】
図19に示すように、未知案内語候補テーブルT9には、第1〜第4の各領域毎に、そこに存在する各候補単語及び急騰スコアがそれぞれ対応付けられている。分析装置1は、第1〜第4の各領域毎に、急騰スコアの降順で候補単語を並べ替え、上位n2個の候補単語を未知案内語として選択する。選択された未知案内語は、第1〜第4の各領域毎に、未知案内語テーブルT10にそれぞれ登録される。
【0112】
図20は、案内語表示処理を示すフローチャートである。分析装置1は、既知案内語テーブルT5を参照して、第1〜第4の各領域毎に、既知の案内語をそれぞれ取得する(S91)。同様に、分析装置1は、未知案内語テーブルT10を参照し、第1〜第4の各領域毎に、未知の案内語をそれぞれ取得する(S92)。そして、分析装置1は、第1〜第4の各領域毎に、未知案内語及び既知案内語をそれぞれ表示させる。
【0113】
ここで、分析装置1は、未知案内語の方を既知案内語よりも優先させて表示させることができる。既知案内語は、標的情報120からの距離が遠いとはいえ、既にマップ100上に表示されているのに対し、未知案内語はマップ100には表示されていない新規な単語であるため、ユーザへの刺激が大きいと考えられるためである。なお、これに限らず、既知案内語を未知案内語に優先させて表示させてもよく、あるいは、ユーザの希望に応じて、表示上の優先順位を変更させる構成でもよい。
【0114】
図21は、案内語111をユーザが選択することにより、標的シンボル110の表示位置を変化させるための処理を示すフローチャートである。分析装置1は、ユーザがクライアント端末2を介して、案内語111を選択したか否かを判定する(S100)。ユーザは、標的シンボル110の周囲に配置された複数の案内語の中から所望する案内語をいずれか一つまたは複数選択することができる。
【0115】
分析装置1は、ユーザによって案内語が選択されると(S100:YES)、選択された案内語を標的情報120に含めて、標的情報120の座標を算出し直し(S101)、標的シンボル110の表示位置を変化させる(S102)。
【0116】
本実施例は上述の構成を採用するため、以下の効果を奏する。本実施例では、標的情報120の座標を算出し、標的シンボル110をマップ100上に重ねて表示させる構成とした。従って、ユーザは、発明内容や研究内容等のマップ100における位置付けを容易に把握でき、特許出願や研究開発の戦略立案等に役立たせることができる。
【0117】
即ち、従来のキーワード配置型マップの場合、ある技術分野の文献数や主要なキーワードについては確認できるが、ユーザが、自分の意図する出願内容や研究内容がその技術分野において具体的にどのようなポジションをしめるのかまでを読みとるのは難しい。従って、コストと手間をかけてマップを作成しても、現況を再確認するだけに留まり、将来の計画立案や修正に有効利用することが難しかった。これに対し、本実施例では、ユーザの意向や目標を標的情報120に含めることにより、マップ100上の位置を容易に把握することができ、使い勝手が向上する。
【0118】
本実施例では、標的情報120をマップ100を構成する文献情報群の一つに含めて、標的情報120の座標を算出する第1モードと、標的情報120を文献情報群に含めずに、標的情報120の座標を算出する第2モードとを予め用意し、いずれか一つのモードをユーザが選択可能な構成とした。従って、標的情報120がマップ100に与える影響を確認したり(第1モード)、マップ100への影響を与えることなく標的情報120の位置を確認することができ(第2モード)、ユーザの使い勝手が向上する。
【0119】
本実施例では、標的情報120の上下左右に、顕在化されたまたは潜在的な案内語をそれぞれ表示させる構成とした。従って、ユーザは、自己の意図する発明内容等のマップ100における位置づけを把握するだけにとどまらず、標的情報120を移動させるための手がかり(案内語)を得ることができる。従って、ユーザは、発明内容や研究内容の方針修正等に利用することができ、使い勝手が向上する。
【0120】
本実施例では、案内語111をユーザが選択することにより、選択された案内語を標的情報120に含めて、標的情報120の座標を再算出する構成とした。従って、ユーザは、案内語を選択するだけで、標的情報120をマップ100上で移動させることができ、使い勝手が向上する。なお、ユーザは、所望の案内語を含んだ新たな標的情報120を分析装置1に入力することもできる。
【0121】
本実施例では、マップ100に表示されているキーワードのうち標的情報120に含まれていないキーワードを、案内語として抽出する構成とした。従って、ユーザは、表示されているキーワードと標的情報120との関係を容易に把握することができる。
【0122】
本実施例では、マップ100に表示されているキーワードと標的情報120との距離を算出し、この算出された距離が遠いキーワードを優先して表示させる構成とした。従って、ユーザは、標的情報120とマップ100上のキーワードとの距離感を含めて把握することができ、使い勝手が向上する。また、距離の遠い順に案内語が表示されるため、標的情報120の移動距離を大きくするための案内語を、ユーザは簡単に選択でき、この点でも使い勝手が向上する。
【0123】
本実施例では、マップ100の境界近傍に位置する境界キーワードを検出し、境界キーワードを含む文献情報が有する単語群のうち、マップ100に表示されていない単語の中から案内語を抽出して表示させる構成とした。従って、マップ100からは発見できないキーワードによって、ユーザの創作意欲等を刺激することができ、発明内容や研究内容の改善等に役立たせることができる。
【0124】
本実施例では、境界キーワードに関する文献情報に含まれる単語群のうち、予め指定された所定の判定対象期間内における出現頻度が、判定対象期間外における出現頻度よりも相対的に大きい単語であって、かつ、マップ100に使用されていない単語の中から、案内語を抽出する構成とした。従って、比較的最近になってから頻繁に使用されている新しい単語を、案内語としてユーザに提供することができる。
【0125】
本実施例では、マップ100に表示されているキーワードから抽出される既知の案内語と、マップ100を構成する文献情報群から抽出される新たな単語から抽出される未知の案内語との両方を、標的シンボル110の周囲に配置させる構成とした。従って、ユーザの使い勝手が向上すると共に、ユーザへ知的な刺激を与えることができる。
【0126】
本実施例では、未知の案内語を既知の案内語に優先して表示させる構成とした。従って、ユーザが未知の案内語を目にする可能性が増大し、ユーザに意外感を与えて、創作意欲に刺激を与えることができる。
【実施例2】
【0127】
図22は、本発明の第2実施例に係る文献情報分析装置1が出力するマップ100の構成例を示す。この実施例は、第1実施例の変形例に相当する。
【0128】
図22の上側には、ユーザによって案内語が選択された場合に、標的情報120の座標を再計算し、標的シンボル110の移動予定先をマップ100上に表示させる様子が示されている。
【0129】
また、図22の下側には、ユーザによって案内語が選択された場合に、標的情報120の座標を再計算して標的シンボル110を移動させ、移動元の位置をマップ100上に表示させる様子が示されている。
【0130】
このように、標的情報120の座標変化の予測または履歴をマップ100上に表示させることも可能であり、ユーザの使い勝手が向上する。
【0131】
なお、本発明は、上述した実施の形態に限定されない。当業者であれば、本発明の範囲内で、種々の追加や変更等を行うことができる。例えば、当業者であれば、前記各実施例を適宜組み合わせることができる。
【図面の簡単な説明】
【0132】
【図1】本発明の実施形態に係る文献情報分析装置の全体を示す説明図である。
【図2】文献情報分析装置の機能ブロック図である。
【図3】文献情報分析装置のハードウェア及びソフトウェアの構成概要を示す説明図である。
【図4】マップを生成し表示させる処理を示すフローチャートである。
【図5】文献座標管理テーブル及びキーワード座標管理テーブルとマップとの関係を示す説明図である。
【図6】マップに標的情報を入力した場合の状態を示す画面構成図である。
【図7】標的情報の座標を算出してシンボルを表示させる処理を示すフローチャートである。
【図8】案内語制御処理の全体を示すフローチャートである。
【図9】既知の案内語を抽出するための処理を示すフローチャートである。
【図10】マップ上のキーワードをその方向に応じて抽出する様子を示す説明図である。
【図11】キーワード抽出テーブルの内容と標的情報の内容に基づいて、既知の案内語の候補を抽出する様子を示す説明図である。
【図12】既知案内語候補を標的情報からの距離の降順で並替える様子を示す説明図である。
【図13】既知案内語テーブルを示す説明図である。
【図14】未知の案内語を抽出するための処理を示すフローチャートである。
【図15】急騰スコアを算出する処理を示すフローチャートである。
【図16】マップの境界に位置するキーワードを抽出する様子を示すフローチャートである。
【図17】判定対象期間の内外で、各単語の出現頻度を検出する様子を示す説明図である。
【図18】未知案内語の候補を抽出する様子を示す説明図である。
【図19】未知案内語候補テーブルを示す説明図である。
【図20】案内語表示処理を示すフローチャートである。
【図21】標的情報を移動させる処理を示すフローチャートである。
【図22】第2実施例に係る文献情報分析装置の出力するマップを示す画面構成図である。
【符号の説明】
【0133】
1…文献情報分析装置、2…クライアント端末、10…マップ制御部、11…マップ生成条件入力受付部、12…文献抽出部、13…文献座標算出部、14…キーワード抽出部、15…キーワード座標算出部、16…マップ生成部、17…マップ表示部、20…案内語制御部、21…標的情報入力受付部、22…標的情報座標算出部、23…標的情報座標表示部、23…標的情報表示部、24…案内語抽出部、25…案内語表示部、30…情報蓄積部、31…文献データベース、32…単語データベース、33…インデックスデータベース、100…マップ、101A,101B,101C,101D… 等高線、102…表示されたキーワード、110…標的シンボル、111…案内語、120…標的情報




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013