米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 株式会社日立製作所

発明の名称 例文検索システム
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開平6−12451
公開日 平成6年(1994)1月21日
出願番号 特願平4−170460
出願日 平成4年(1992)6月29日
代理人 【弁理士】
【氏名又は名称】小川 勝男
発明者 寺濱 幸徳 / 小澤 邦昭
要約 目的
例文検索システムに関し、主要語(検索文中の主語、動詞、目的語を一組と考えたもの)を検索キーワードとして、類似な主要語を格納した主要語関連辞書と、例文とその関連情報を格納した例文データベースを用いて、検索文に類似な例文を検索する例文検索システムを提供する。

構成
入力文(検索文)から、ステップ20で検索文中の主要語を抽出し、主要語が存在するときには、ステップ30で主要語、および検索文の関連情報を検索キーとして設定し、ステップ40では、検索キーに類似な主要語を主要語関連辞書1710から検索した結果を検索キーとし、ステップ50で、ステップ40で設定した検索キーにより、例文データベース180を用いて検索キーを含む、検索文に類似な例文を検索し、ステップ100で検索結果を表示する。
特許請求の範囲
【請求項1】例文を格納した例文データベースと、検索文から抽出した、主語、動詞および目的語からなる主要語を検索キーとして格納した主要語格納テーブルと、類似した主要語を格納した主要語関連辞書ファイルと、前記検索キーとなる主要語に類似した主要語を前記主要語関連辞書から検索する手段と、前記類似した主要語に一致した例文の主要語を、前記例文データベースから検索する手段とからなる例文検索システム。
【請求項2】請求項1記載の例文検索システムにおいて、前記主要語関連辞書中で意味的に代表となる主要語を表示する手段を設けた例文検索システム。
【請求項3】請求項1記載の例文検索システムにおいて、前記例文データベースは例文に関連する出典分野情報を有し、前記検索文の出典分野情報と同じ出典分野情報を有する例文を検索する手段を設けた例文検索システム。
【請求項4】請求項1記載の例文検索システムにおいて、検索文に関連して、他の例文との意味的な結び付きを表わした拡張情報を付加できるファイルと、前記例文データベースに例文に関連した拡張情報を付加した例文データベースを用いて、前記検索文と同じ関連情報を検索する手段とを設けた例文検索システム。
【請求項5】請求項1記載の例文検索システムにおいて、検索文の主要語に複合語が含まれる場合、前記複合語を分解するための情報を格納した複合表現分解辞書ファイルと、検索文の主要語を前記複合表現分解辞書より簡単な表現に置き換える手段と、置き換えた主要語に類似した主要語を、前記主要語関連辞書から検索する手段と、前記類似した主要語に一致した例文の主要語を、前記例文データベースから検索する手段とを設けた例文検索システム。
【請求項6】請求項1記載の例文検索システムにおいて、シソーラスによって、主要語中の1語を、他の主要語中の1語と関連しているという情報を格納した主要語類似辞書ファイルとを設けた例文検索システム。
発明の詳細な説明
【0001】
【産業上の利用分野】本発明は、予め蓄積されている例文の中から、検索文に類似な文を検索するシステムに係る。
【0002】
【従来の技術】例文を検索する従来技術が、特開平2−190972に述べられている。そこでは、例文を構成する単語毎に品詞分類、表記、品詞種類、活用型、意味等の文法情報に分類され格納されたテキストデータベースを用いて、検索対象を文法的に制約する情報を付加した検索キーワードにより、例文を検索するシステムについて述べられている。
【0003】
【発明が解決しようとする課題】上記従来技術は、例文を検索するにあたって、柔軟に例文検索を行なうために、対象を文法的に制約する情報を付加した1語の検索キーワードを用いている。ところが、複数の語がひとかたまりとなって、ある意味をなす場合の類似検索においては、1語のシソーラスによる検索だけでは、必ずしも的確に検索キーワードに対する類似な例文を検索できないか、あるいは、絞り込めないという問題がある。
【0004】本発明の目的は、検索文中において、構文解析により抽出した主要語(主語、動詞、目的語をまとめて、主要語と定義する。)を検索キーとして、これらの検索キーあるいは類似な検索キーを含む例文を検索することにある。
【0005】
【課題を解決するための手段】前記目的は、つまり、主要語がひとかたまりとなってある意味をなす場合に、その中の1語のキーワードでは、シソーラスをたどったとしても、類似例文を検索できない場合、検索文の主要語を意味的に類似な主要語に置き換え、その類似な主要語を含む例文を検索することによって達成される。
【0006】具体的には、検索文から構文解析により主要語を抽出し、抽出した主要語と意味的に類似な主要語とを関連付けて格納した主要語関連辞書を用いて、例文データベースから例文を検索する。例文の検索は、検索文からの主要語をキーワードとした検索する。例文の検索に失敗したときは、主要語関連辞書より検索文の主要語に意味的に類似な主要語(以下類似な主要語と記す)を検索し、その検索した主要語を用いて例文データベースより例文を検索する。例文検索手順を以下に示す。
【0007】(1)検索文から抽出した主要語を検索キーとして、例文を例文データベースより検索する。検索に成功したときは、該当する例文を表示装置に表示する。検索に失敗したときは、検索キーとした主要語に類似な主要語を主要語関連辞書より検索し、検索した類似な主要語を新たな検索キーとして、例文データベースより例文を検索する。類似な主要語を含む例文が例文データベースにない場合は、主要語類似辞書を用いて、字面の異なる主要語どうしを結び付けることにより、検索文に類似な例文を例文データベースから検索する。主要語類似辞書は、検索キーとなる主要語中の1語をシソーラスによって、他の主要語中の1語と関連しているという情報を格納したファイルである。また、検索キーとなる類似な主要語のほかに関連情報である、例文データベース中の例文の出典分野や、他の例文との意味的な結び付きなどを示す拡張情報を用いることにより、検索文に類似な例文を例文データベースから検索する。
【0008】主要語関連辞書に新たな主要語を追加する場合は、ユーザに主要語関連辞書中の代表的な主要語である代表語を表示することにより、どの代表語と類似関係にあるかユーザが選択することによって、主要語関連辞書に登録する。
【0009】(2)検索キーとなる主要語の中に複合語が含まれている場合、その複合語を分解して簡単な表現に置き換えるために、複合語を分解するための情報を格納した複合表現分解辞書を設けることにより、主要語中の複合語を分解した簡単な表現の主要語に置き換える。次に、簡単な表現に置き換えた主要語をもとに、主要語関連辞書を用いて、検索文に類似な例文を例文データベースから検索する。
【0010】(3)検索キーとなりうる主要語が検索文中に存在しない場合には、例文データベースの関連情報である出典分野や、拡張情報をユーザが検索することにより、検索文に類似な例文を例文データベースを用いて検索する。
【0011】なおかつ検索文に類似な例文を例文データベースから検索できなかった場合は、検索を失敗したことを示すメッセージを表示する。
【0012】
【作用】本発明では、読み込んだ検索文を構文解析し、主語、動詞、目的語(本明細書では、まとめて主要語と定義している)を抽出する。ただし、構文解析の結果、主語、動詞、目的語のいずれかを抽出できない場合であっても、抽出した主要語を基にして検索できる。つまり、検索文より抽出した主要語を検索キーとして設定し、主要語関連辞書を用いて検索キーとなる主要語と一致する主要語か、それに類似な主要語を選択して、検索キーとなる主要語を置き換えることにより、例文データベースから検索キーを含む例文を検索する。検索キーで、例文を検索できなかった場合には、主要語類似辞書を用いて検索キーとなる主要語と字面の異なる主要語どうしを結び付けることにより、例文データベースから検索キーを含む例文を検索する。これにより、単に検索文の各単語に対する類似表現を検索するだけではなく、主要語という複数語の組み合わせによって表わされる意味合いに類似な主要語を、主要語関連辞書を用いて検索することができ、検索文と意味的に類似な例文を検索することができる。また、検索文における主要語中に複合語が含まれる場合は、複合表現分解辞書を用いて複合語を簡単な表現に置き換えたものを、検索キーとすることにより、主要語関連辞書内の主要語を膨大に増やすことなく、例文データベースより例文を検索することができる。それでも検索文の主要語に類似な主要語を、主要語関連辞書から検索できなかった場合は、主要語中の1語をシソーラスによって、他の主要語と関連づけることにより、主要語間の字面が一致していなくても類似な例文を検索できる。また、検索キー以外に、検索文の関連情報として、出典分野や、他の例文との意味的結び付きを表わした拡張情報をユーザが付加することにより、例文データベース中に格納されている出典分野、拡張情報から該当する例文を検索することができる。これにより、検索キーにおいて主要語が欠落していたとしても、検索文と意味的に類似な例文を検索することができる。
【0013】以上の例文検索によっても、例文を検索できなかった場合は、検索に失敗したことを表示することにより、ユーザに検索に失敗したことを明確に示すことができる。
【0014】
【実施例】以下、本発明の第1の実施例を図1により説明する。なお、以下の実施例では、検索文より抽出された主要語による例文検索を主として説明する。
【0015】ステップ10では、検索の対象となる検索文を、図7に示す入力装置110より読み込む。ステップ20では、読み込んだ検索文を構文解析し、主要語(主語、動詞、目的語)を抽出し、図8に示す主要語抽出テーブル160の検索文欄1502に検索文を格納し、主要語欄1503の主語欄1504、動詞欄1505、目的語欄1506に、それぞれ抽出した主要語を格納する。その格納状況により、検索文中に主語、動詞、目的語がそれぞれ存在するかどうかを判定する。ここで用いる構文解析技術は周知の技術であり、その詳細は例えば、長尾 真監修、日本語情報処理(社団法人 電子通信学会)の第5章の構文解析に述べられているので、ここでは説明を省略する。ただし、ここでは構文解析を、形態素解析及び多品詞解消を含む広い意味で使う。ステップ20で主要語が検索文中に存在した場合、ステップ30で抽出した主要語の組み合わせで表現される検索キーを設定する。その詳細については、図2を用いて後述する。ステップ40では、ステップ30で設定された主要語で表現される検索キーと、検索キーに類似な主要語を格納した主要語関連辞書1710を用いて検索する。なお、主要語関連辞書1710の詳細な構成については、図13を用いて後述し、ステップ40の詳細については、図3を用いて後述する。次に、ステップ50では、ステップ40において検索した主要語をもとに検索キーとなる主要語を設定し、あらかじめ例文が格納された例文データベース180から、検索文に類似な例文を検索する。ステップ50の詳細については、図4を用いて後述する。次に、ステップ60では、ステップ50までで検索文に類似な例文を、例文データベースより検索できたかどうかを判定する。ステップ60で判定した結果、検索が成功しなかった場合、ステップ70でステップ40での検索時の検索キーが、1語であるかどうかを判定する。検索キーが1語である場合には、ステップ90で検索が失敗したことをユーザに確認できるように、図7に示す出力装置130に表示する。一方、ステップ70において、前記の検索キーが1語でない、つまり2語以上である場合には、ステップ80で前記の検索キー中の1語を減らす処理を行なう。ステップ70〜90の詳細については、図5を用いて後述する。ステップ100では、ステップ50で検索した結果を出力装置130(図7)に出力する。ステップ100の詳細については、図6を用いて後述する。
【0016】次に、ステップ30の詳細な説明をする。図2に示したように、まず、ステップ301において、検索キーとなる主要語を主要語検索キー格納テーブル160(図9)内の主要語格納テーブル1610(図11)の主要語欄1612の主語欄1613、動詞欄1614、目的語欄1615に格納する。次に、ステップ302において、検索するための情報として、ステップ301で格納した主要語とは別に、新たな情報を追加するかどうかをユーザに問い合わせる。問い合わせ方法は、出力装置130と入力装置110とによる通常の物であり、説明を省略する。ユーザが情報を追加しなかった場合には、主要語格納テーブル1610の主要語欄1612に格納された主要語により、ステップ40、ステップ50において例文データベース180から検索文に類似な例文を検索する。ステップ302においてユーザが情報を追加する場合は、ステップ303で、検索文の関連情報として出典分野情報を、主要語検索キー格納テーブル160の関連情報格納テーブル1620の出典分野欄1623に格納する。ステップ304では、ユーザがステップ301、ステップ303で主要語検索キー格納テーブルに格納された情報に、検索文に関連する情報をさらに追加する場合には、主要語検索キー格納テーブル160の主要語格納テーブル1610と関連情報格納テーブル1620の出典分野欄1623の各情報により、例文データベース180から検索文に類似な例文を検索する。ステップ304において、ユーザが検索文に関連する情報をさらに追加する場合には、ステップ305で、検索文の関連情報として検索文と他の検索文との意味的な結び付きを表わした拡張情報を、主要語検索キー格納テーブル160の関連情報格納テーブル1620の拡張情報欄1624に格納する。そこで、主要語検索キー格納テーブル160に格納されている関連情報により、例文データベース180から検索文に類似な例文を検索する。
【0017】主要語関連辞書1710の詳細を説明する。図13に示すように、主要語関連辞書1710は、主要語番号欄1711、関連基準語欄1712、代表語欄1713、関連語欄1714、例文番号欄1715から構成されている。ここで、関連基準語欄1712には、関連する主要語を結び付けるための基準となる語を格納し、代表語欄1713には、関連する主要語の中で代表となる語を格納する。関連語欄1714には、代表語欄1713に格納されている主要語に関連する主要語を格納する。また、例文番号欄1715には、前記例文番号欄1715の上段に格納されている主要語を含む例文が格納されている例文番号を格納する。
【0018】次にステップ40の詳細を図3を用いて説明をする。ステップ401において主要語検索キー格納テーブル160の情報は、主要語格納テーブル1610に格納されている情報のみかどうかを判定する。判定の結果、主要語格納テーブル情報のみである場合は、ステップ402で、主要語検索キー格納テーブル160の主要語格納テーブル1610に格納されている、検索文から抽出した主要語と一致する主要語を、主要語関連辞書1710の関連基準語欄1712と代表語欄1713、または関連基準語欄1712と関連語欄1714に格納されている主要語から検索する。一方、ステップ401において判定の結果、主要語検索キー格納テーブル160の情報として、主要語格納テーブル1610に格納されている主要語以外に、関連情報格納テーブル1620に検索文に関連する情報である出典分野情報や拡張情報が格納されているときには、ステップ403に行く。ステップ403では、主要語検索キー格納テーブル160の関連情報格納テーブル1620に格納されている、検索文に関する出典分野情報や拡張情報と、例文データベース180の出典分野欄182、または拡張情報欄183に格納されている拡張情報が一致する例文を検索する。ステップ404では、ステップ402で検索文から抽出した主要語と一致する主要語が、主要語関連辞書1710に存在するかどうか判定する。判定の結果、一致する主要語が主要語関連辞書1710にある場合には、ステップ405に進む。一方、一致する主要語が主要語関連辞書1710にない場合は、ステップ406に進む。ステップ406では、主要語関連辞書1710の代表語欄1713に格納されている主要語を表示し、ユーザが、検索文から抽出した主要語に関連すると思われる代表語を指定することにより、検索文から抽出した主要語が、指定した代表語の類似な主要語として、主要語関連辞書1710の関連語欄1714に登録する。ステップ405では、検索文から抽出した主要語を含む例文が、例文データベース180に存在するかどうかを判定する。判定した結果、抽出した主要語を含む例文が、例文データベース180の例文欄184に存在する場合は、ステップ50に行き、検索キーとなる主要語を含む例文を例文データベース180から検索する。一方、抽出した主要語を含む例文が、例文データベース180に存在しない場合は、ステップ407に行く。ステップ407では、検索文から抽出した主要語に類似な主要語を、主要語関連辞書1710を用いて検索する。つまり、検索文から抽出した主要語の中の1語と一致する語を、主要語関連辞書1710の関連基準語欄1712に格納された語から検索する。さらに、抽出した主要語の他の1語と一致する語を代表語欄1713、および関連語欄1714に格納された語から検索する。その結果、次のステップ408では、代表語欄1713、および関連語欄1714から検索された主要語と同じ列のうち、類似な主要語で例文番号欄1715に例文番号が格納されているものは、すべて検索文の主要語として主要語検索キー格納テーブル160の主要語格納テーブル1610に格納される。格納に当って類似な主要語に関しては、主要語格納テーブル1610の検索番号欄1611において、最初の検索番号は共通とし、後の検索番号を1から順に番号を振ったものを格納することとした。この検索キーを用いて、ステップ50において、検索キーとなる主要語を含む例文を例文データベース180から検索する。
【0019】次にステップ50の詳細な説明をする。図4に示したように、まず、ステップ501において主要語検索キー格納テーブル160の主要語格納テーブル1610の検索番号欄1611に格納されている検索番号のうち、最初の番号の共通なものの中で後の番号の小さい番号から順に主要語が格納されているかどうかを判定する。格納されている場合には、格納されている主要語をもとに、主要語関連辞書1710の例文番号欄1715に格納されている例文番号を用いて、主要語を含む例文を例文データベース180より検索する。次に、主要語検索キー格納テーブル1610において先ほど検索した主要語の次の類似な主要語について、再びステップ501から処理を繰り返す。ステップ501において、これまで処理を行なってきた主要語とは別の主要語が存在しないと判定された場合は、ステップ50の処理を終了し、ステップ60に行く。
【0020】次にステップ70〜ステップ90を図5を用いて詳細に説明する。まず、ステップ70において、主要語検索キー格納テーブル160の主要語格納テーブル1610に格納されている検索キーが1語、つまり検索キーとなる主要語が、1語で構成されているかどうかを判定する。判定の結果、検索キーが2語以上であった場合には、ステップ801に行く。ステップ801では、主要語検索キー格納テーブル160の主要語格納テーブル1610に格納されている主要語(主語、動詞、目的語)の中から減らしたい1語をユーザが選択する。次に、ステップ802において、ステップ801で選択した1語が誤っていないかどうかを表示し、ユーザに誤っていないかどうかの確認を促す。もし、ステップ701において、選択した1語が誤っていたときは、再度ステップ701にもどり、検索キーとなる主要語(主語、動詞、目的語)の中から削除したい1語をユーザが再び選択する。ステップ802において選択した1語に誤りがないときは、ステップ803に行く。ステップ803では、ステップ801で選択した前記検索キーとなる主要語の中の1語を削除した主要語を改めて検索キーとし、主要語検索キー格納テーブル160の主要語格納テーブル1610に格納する。次に、ステップ804では、ステップ803で設定した検索キーにより、主要語関連辞書1710を用いて、例文データベース180から、検索キーを含む例文を検索する。その結果、検索できたときは、ステップ70〜ステップ90の処理を終了し、検索できなかったときは、ステップ805に行く。ステップ805においては、検索キーとなる主要語(主語、動詞、目的語)のうち何れの語についても削除したかどうかを判定する。判定の結果、まだ削除したことのない語が、主要語中に存在する場合には、ステップ807に行く。ステップ807においては、ステップ805までに削除した1語を再び復活し、まだ削除したことのない主要語中の語を対象にしてステップ801から先ほどと同じ処理を行なう。一方、ステップ805において、判定の結果、削除したことのない語が、主要語中に存在しない場合には、ステップ806に行く。ステップ806においては、検索キーからステップ801でユーザが指定した1語を削除した主要語を、改めて検索キーとして主要語検索キー格納テーブル160の主要語格納テーブル1610に格納し、再びステップ70から処理を繰り返す。最初のステップ70において、検索キーとなる主要語を構成している語(主語、動詞、目的語)が1語であった場合には、ステップ90に行く。ステップ90においては、検索文から類似な例文を例文データベース180から、検索できなかったということから、検索が失敗したことをユーザに表示する処理を行なう。
【0021】以上でステップ70〜ステップ90の詳細な説明を終え、次にステップ100の詳細な説明をする。図6に示したように、まず、ステップ1001においては、検索された主要語を含む例文の例文番号を、主要語関連辞書1710の例文番号欄1715に格納されている例文番号から検索する。次に、ステップ1002において、ステップ1001で検索した例文番号と一致する例文を、例文データベース180の主要関連番号欄181と例文欄184から検索し、呼び出す。次に、ステップ1003において、ステップ1001で呼び出した例文を、図7の出力装置130により表示させる。
【0022】次に、前記の処理を具体的に説明するために、次に示す入力文(検索文)を例として取り上げる。「A氏は、来月行なわれる市長選挙に落ちるかもしれない。」まず、前記入力文に対して構文解析処理を行ない、主要語を抽出する。前記の検索文の場合、主語は「A氏」であり、動詞は「落ちる」、目的語は「選挙」となる。抽出した主要語を主要語抽出テーブル150の検索文欄1502、主要語欄1504の主語欄1504、動詞欄1505、目的語欄1506にそれぞれ格納する。検索番号欄1501には、最初の検索文であるときは、「1」を格納し、以降の検索文については、順次番号を増やしていく。次に、主要語抽出テーブル150に格納された主要語を検索キーとして設定し、主要語検索キー格納テーブル160の主要語格納テーブル1610の主要語欄1612の主語欄1613に「A氏」、動詞欄1614に「落ちる」、目的語欄1615に「選挙」をそれぞれ格納する。次に、ユーザがさらに検索文の関連情報を追加するかどうかを判断する。ユーザが主要語のみで検索文に類似な例文を検索すると判断すると、主要語検索キー格納テーブル160の主要語格納テーブル1610に格納されている主要語と一致する、主要語関連辞書1710の関連基準語欄1712に格納されている関連基準語を検索する。検索の結果、主要語関連辞書1710の主要語番号1に、抽出した主要語と一致する関連基準語である「選挙」が存在するため、これを検索する。次に、関連基準語に関連する代表語、および関連語情報の中から主要語検索キー格納テーブル160の主要語格納テーブル1610に格納されている主要語と一致するものを検索する。前記の検索文の場合、主要語関連辞書1710の関連語欄1714の中に、主要語中の1語である「落ちる」が存在するので、まず、これを検索する。次に、検索した関連語欄1714の関連語情報である「落ちる」に対応する例文番号を、例文番号欄1715から検索する。検索した結果、例文番号欄1715に例文番号が格納されている場合には、例文番号に該当する検索文を例文データベース180より検索する。関連語である「落ちる」に対応する例文番号が、例文番号欄1715に格納されていないので、このままでは、例文を検索できない。そこで、関連語である「落ちる」に類似な表現として格納されている、主要語関連辞書1710の代表語欄1713、および関連語欄1714に格納されている情報のうち、対応する例文番号が例文番号欄1715に格納されているものについて、全てを対象に検索を行ない、検索した結果を主要語検索キー格納テーブル160の主要語格納テーブル1610に順次格納する。前記の検索文の場合、関連語「落ちる」に類似な主要語で、しかも、例文番号情報が格納されている語としては、代表語欄1713に格納されている「敗れる」と、同じ関連語欄1714に格納されている「負ける」がある。これら2つの情報、および関連基準語情報欄1712に格納されている「選挙」を、主要語検索キー格納テーブル160の主要語格納テーブル1610に格納する。そのとき、検索文より抽出した主要語は不要なため、既に主要語検索テーブル1610の主要語欄1612に格納されている検索文から抽出した主要語は削除し、改めて主要語関連辞書1710より検索した主要語を格納する。なお、主要語格納テーブル1610の検索番号欄1611には、最初の番号は共通の番号を付与し、ハイフンの後の番号については、検索順に番号を付与した検索番号情報を格納する。以上設定した主要語をもとに、主要語関連辞書1710に格納された例文番号を用いて、例文データベース180より前記の検索文に類似な例文を検索する。すなわち、主要語関連辞書1710の例文番号欄1715に格納されている例文番号が、それぞれ1−1−A、1−1−Cであるので、例文データベース180より主要関連番号欄181に格納されている例文番号とを照合すると、例文欄184より「彼が選挙に敗れる。」という例文と、「Bさんは、市議会議員選挙に負けるかもしれない。」という例文が呼び出される。呼び出された例文は、図7の出力装置130に送られ、前記の検索文に類似な例文として表示出力される。以上が、実際に検索文を入力したときの検索文に類似な例文を検索する処理内容である。
【0023】次に、本実施例を実現する上でのハードウエア構成を図7に示す。入力文(検索文)は、入力装置110から入力され、例文検索は、CPU120で実行される。次に、例文検索結果は、出力装置130により表示される。記憶装置140は、大きく分けて、主要語抽出テーブル150、主要語検索キー格納テーブル160、主要語辞書170、例文データベース180、検索プログラム190を格納するエリアに分かれる。さらに、主要語検索キー格納テーブル160は、主要語格納テーブル1610、関連情報格納テーブル1620から構成されている。また、主要語辞書170は、主要語関連辞書1710、複合表現分解辞書1720、主要語類似辞書1730から構成されている。
【0024】なお、前記複合表現分解辞書1720と主要語類似辞書1730については、本発明の第2の実施例以降で詳細に説明する。
【0025】次に、本発明の第2の実施例を図17により説明する。
【0026】ステップ10´〜ステップ30´については、実施例1のステップ10〜ステップ30と同じ処理であるので、ここでは説明を省略する。ステップ30´の次は、ステップ3000に行く。ステップ3000においては、検索キーとなる主要語中に複合語が含まれている場合、複合表現分解辞書1720により、複合語を分解して基本的な表現に置き換え、検索文より抽出した検索キーとなる主要語が格納された、主要語検索キー格納テーブル160の主要語を再設定しなおす。そこで、ステップ3000について図18を用いて詳細に説明する。まず、ステップ3001においては、検索キーとなる主要語中に複合語が含まれているかどうかを判定する。判定の結果、検索キーとなる主要語中に複合語が含まれているときには、ステップ3002に行く。ステップ3002においては、検索キーとなる主要語中の複合語を複合表現分解辞書1720を用いて、基本的な表現に置き換える。ここで、複合表現分解辞書1720の詳細を説明する。複合表現分解辞書1720は、大きく分けて複合語を含む主要語欄1712と、基本的な表現の主要語欄1722から成り立っており、それぞれ主語欄1723、1726、動詞欄1724、1727、目的語欄1725、1728から構成されている。次に、ステップ3003では、ステップ3002において基本的な表現に置き換えた主要語を、主要語検索キー格納テーブル160の主要語格納テーブル1610の主要語欄1612の主語欄1613、動詞欄1614、目的語欄1615に格納する。以上で、ステップ3000の詳細な説明を終える。次のステップ40´〜ステップ100´については、実施例1のステップ40〜ステップ100と同じ処理あるので、ここでは説明を省略する。
【0027】次に、前記の実施例2の処理を具体的に説明するために、次に示す入力文(検索文)を例として取り上げる。「彼は、来週行なわれる市議会議員選挙に、落選するだろう。」まず、前記入力文に対して構文解析処理を行ない、主要語を抽出する。この場合、主語は「彼」であり、動詞は「落選する」、目的語は「市議会議員選挙」となる。次に、主要語抽出テーブル150の検索文欄1502に前記入力した検索文を格納し、主要語欄1503の主語欄1504、動詞欄1505、目的語欄1506に主要語をそれぞれ格納する。次に前記抽出した主要語中に、複合語が含まれているかどうかを判定する。判定の結果、主要語中には複合語「落選する」が存在するので、複合表現分解辞書150を用いて複合語を基本的な表現に置き換える。つまり、複合語を含む主要語欄1721の動詞欄1724に格納されている「落選する」から、基本的な表現の主要語欄1722の動詞欄1727に格納されている「落ちる」と目的語欄1728に格納されている「選挙」を参照する。そして、複合語「落選する」を「落ちる」と「選挙」に置き換える。さらに、検索文から抽出し、主要語検索キー格納テーブル160の主要語格納テーブル1610に格納された主要語から、複合語を基本的な表現に置き換えた主要語に置き換えて、主要語格納テーブル1610に格納する。以上の処理により検索キー格納テーブル160の主要語格納テーブル1610に格納された主要語をもとに、主要語関連辞書1710を用いて検索文に類似な例文を検索する。なお、主要語を用いて例文データベース180より例文を検索する場合については、実施例1で示した入力文(検索文)の例の場合と同様であるので、ここでは説明を省略する。例文データベース180より検索の結果、検索文に類似な例文は、例文欄184より「彼が選挙に敗れる。」という例文と、「Bさんは、市議会議員選挙に負けるかもしれない。」という例文となる。以上の例文は、図7の出力装置130に表示される。
【0028】次に、本発明の第3の実施例を図19により説明する。
【0029】ステップ10´´〜ステップ40´´については、実施例1のステップ10〜ステップ40と同じ処理であるので、ここでは説明を省略する。次に、ステップ4100では、ステップ40´´で設定した検索キーとなる主要語が、主要語関連辞書1710に格納されているかどうかを判定する。判定の結果、検索できなかったときは、ステップ4200に行く。ステップ4200においては、主要語類似辞書1730を用いて検索キーの類似語を検索する。ここで、主要語類似辞書1730は、シソーラスにおいて上位概念にくる語を基準語として、基準語欄1731に格納されており、基準語に属する類似語が、類似語欄1732に格納されている。つまり、ステップ4200においては、検索キーとなる主要語中の1語と一致する語を類似語欄1732に格納されている類似語から検索し、検索された類似語の上位概念にあたる語を、基準語欄1731に格納されている基準語から検索する。さらに、格納されていた検索キーとなる主要語で、主要語類似辞書1730を用いて検索を行なった語を、検索された基準語に置き換える。次に、ステップ4300においては、ステップ4200において、類似語から基準語が検索できたかどうかを判定する。判定の結果、結局上位概念となる基準語を検索できなかったときは、ステップ4400に行く。ステップ4400においては、主要語関連辞書1710の関連基準語欄1712と代表語欄1713に、それぞれ主要語中の1語を格納する。以上ステップ4400で更新した主要語関連辞書1730をもとに、再度ステップ40´´からの処理を繰り返す。一方、ステップ4300において、判定の結果、検索できたときは、前記置き換えられた検索キーとなる主要語をもとに、再度ステップ40´´からの処理を繰り返す。ところで、ステップ4100において、主要語類似辞書1730を用いることなく検索キーとなる主要語に類似な主要語を、主要語関連辞書1710より検索できたときは、ステップ50´´に行く。なお、ステップ50´´〜ステップ100´´についても、実施例1のステップ50〜ステップ100と同じ処理であるので、ここでは説明を省略する。
【0030】次に、前記の実施例3の処理を具体的に説明するために、次に示す入力文(検索文)を例として取り上げる。「Cさんは、市議選に敗れるだろう。」まず、前記入力文に対して構文解析処理を行ない、主要語を抽出する。この場合、主語は「Cさん」であり、動詞は「落選する」、目的語は「市議選」となる。これら検索文と主要語を主要語抽出テーブル150の検索文欄1502に前記入力した検索文を格納し、主要語欄1503の主語欄1504、動詞欄1505、目的語欄1506にそれぞれ格納する。次に、主要語関連辞書1710を用いて類似な主要語を検索する。前記の検索文の場合、主要語関連辞書1710の関連基準語欄1712に格納されている関連基準語の中に、一致するものが存在しないために、主要語類似辞書1730を用いて、検索キーとなる主要語中の1語の類似語を検索する。前記の検索文の場合、検索キーとなる主要語中の目的語である「市議選」について、主要語類似辞書1730を用いて、上位概念である基準語を検索する。検索の結果、目的語「市議選」の上位概念となる語は、基準語欄1731に格納されている「選挙」であるので、検索キーとなる主要語のうち目的語である「市議選」を「選挙」に置き換える。次に、置き換えた主要語を主要語検索キー格納テーブル160の主要語格納テーブル1610に格納し、主要語関連辞書1710を用いて検索文に類似な例文を検索する。なお、主要語を用いて例文データベース180より例文を検索する場合については、実施例1で示した入力文(検索文)の例の場合と同様であるので、ここでは説明を省略する。例文データベース180より検索の結果、検索文に類似な例文は、例文欄184より「彼が選挙に敗れる。」という例文と、「Bさんは、市議会議員選挙に負けるかもしれない。」という例文となる。以上の例文は、図7の出力装置130に表示される。
【0031】次に、本発明の第4の実施例を図20により説明する。
【0032】ステップ10´´´〜ステップ100´´´については、実施例1のステップ10〜ステップ100と同じ処理であるので、ここでは説明を省略する。ただし、ステップ30´´´は、前記実施例1のステップ30とは異なり、主要語の組み合わせのみによる検索キーの設定を行なう。一方、ステップ20´´´において、検索文中に主要語である主語、動詞、目的語のいずれも存在しないとき、ステップ5100に行く。ステップ5100においては、検索キー格納テーブル160の関連情報格納テーブル1620に、検索文の関連情報として出典分野情報と、他の例文との意味的な結び付きを示す拡張情報を関連情報欄1622の出典分野欄1623の分野欄1625や、詳細情報欄1626、拡張情報欄1624に格納する。次に、ステップ5200においては、関連情報格納テーブル1620に格納された検索文の関連情報である出典分野情報と拡張情報を呼び出す。次に、ステップ5300において、ステップ5200で呼び出した関連情報を検索キーとして、前記の検索キーと同じ関連情報を例文データベース180の出典分野欄182、および拡張情報欄183に持つ例文を、例文欄184より検索する。その結果、ステップ5400において、例文検索が成功したときには、ステップ100´´´において、例文検索結果を表示し、検索に失敗したときは、ステップ90´´´において、検索失敗の表示を行なう。
【0033】次に、前記の実施例4の処理を具体的に説明するために、次に示す入力文(検索文)を例として取り上げる。「こんにちは。」まず、入力文に対して構文解析処理を行ない、主要語を抽出する。しかし、前記検索文の場合、主要語を抽出するのは不可能であるため、前記検索文には、主要語である主語、動詞、目的語を主要語抽出テーブル150に格納することができない。つまり、検索文中に主要語が存在しないことになる。そこで、前記検索文に関連する情報である出典分野、拡張情報を、前記主要語検索キー格納テーブル160の関連情報格納テーブル1620の出典分野欄1623の分野欄1625には、「あいさつ」を格納し、詳細情報欄1626には、例えば「人の家を訪問するとき」、拡張情報欄1624には「昼間に使う表現」をそれぞれ格納する。次に、格納した関連情報を検索キーとして、例文データベース180を用いて検索文に関連する例文を検索する。その結果、例文データベース180の出典分野情報欄182に、前記検索キーと同じ「人の家を訪問するとき」が格納されていることから、例文欄184に格納されている「ごめんください。」が検索され、呼び出される。検索された例文は、図7の出力装置130に表示される。
【0034】
【発明の効果】本発明においては、検索文より抽出した主要語(主語、動詞、目的語)に類似な主要語を、主要語関連辞書を用いて検索することにより、その類似な主要語を含む例文を検索可能とした。つまり、検索文より主要語を抽出し、その主要語を含む例文を例文デーベースを用いて検索する。抽出した主要語を含む例文が、例文データベースに存在しないときは、検索文より抽出した主要語に類似な主要語を、主要語関連辞書を用いて検索することにより、その類似な主要語を含む、検索文と意味的に類似な例文を例文データベースを用いて検索可能とした。また、検索文より主要語が抽出できないときは、検索文の関連情報から例文データベースを用いて、検索文に関連する例文を検索することも可能とした。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013