米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 株式会社エヌ・ティ・ティ・データ

発明の名称 フレーズ生成装置、フレーズ生成方法、及びプログラム
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2003−178057(P2003−178057A)
公開日 平成15年6月27日(2003.6.27)
出願番号 特願2001−379546(P2001−379546)
出願日 平成13年12月13日(2001.12.13)
代理人 【識別番号】100095407
【弁理士】
【氏名又は名称】木村 満
【テーマコード(参考)】
5B009
5B075
【Fターム(参考)】
5B009 VA02 
5B075 ND03 NK32 PP24 PQ75 PR04 UU06
発明者 城塚 音也 / 北内 啓
要約 課題
フレーズの候補を効率的に生成することができる。

解決手段
入力部11は文書DB13に記憶されている文書を指定するためのキーワードを入力する。全文検索部16は、全文検索用インデックスファイル12を参照して、入力されたキーワードから、文書DB13に記憶されている文書を抽出し、抽出した文書をリストした文書リストを生成する。文書リスト分配部17は、文書リストを更にn個の文書サブリストに分割する。第kの単語抽出部18(k=1,2,・・・,n)は、形態素解析法を用い、k番目の文書サブリストから単語を抽出する。第kの単語組合せ部19(k=1,2,・・・,n)は、抽出された単語を言語ルール記憶ファイル15に記憶されている言語ルールを参照して、フレーズ候補を生成する。表示部20は、生成したフレーズ候補を表示する。
特許請求の範囲
【請求項1】キャッチフレーズ、広告コピー、商品名等のフレーズを生成するフレーズ生成装置であって、文書を記憶する文書記憶手段と、前記文書記憶手段に記憶されている文書を指定するためのキーワードを入力するキーワード入力手段と、前記キーワード入力手段により入力されたキーワードから、前記文書記憶手段に記憶されている文書を抽出する文書抽出手段と、前記文書抽出手段により抽出された文書から単語を抽出する単語抽出手段と、前記単語抽出手段により抽出された単語を組み合わせてフレーズを生成する単語組合せ手段と、を備えることを特徴とするフレーズ生成装置。
【請求項2】キーワードと、該キーワードを含む文書を指定する文書指定情報とに対応するインデックスデータを登録するインデックスデータ登録手段をさらに備え、前記文書抽出手段は、前記インデックスデータ登録手段に登録されているインデックスデータを参照し、前記キーワードを含む文書を検索する文書検索手段と、前記文書検索手段により検索された文書について、前記キーワードの出現頻度に基づいたキーワードの重要度を算出するキーワード重要度算出手段と、を備え、前記キーワード重要度算出手段により算出されたキーワードの重要度の高い順に、前記文書記憶手段に記憶されている文書を抽出する、ことを特徴とする請求項1に記載のフレーズ生成装置。
【請求項3】前記文書抽出手段により抽出されたキーワードの重要度の高い順で文書を指定する情報を備える文書リストを生成する文書リスト生成手段を備え、前記単語抽出手段は、前記文書リストに示された文書から単語を抽出し、前記単語組合せ手段は、前記単語語抽出手段により抽出された単語を組み合わせてフレーズを生成する、ことを特徴とする請求項2に記載のフレーズ生成装置。
【請求項4】前記文書リスト生成手段により生成された文書リストから、単語の重要度の高い順で、かつ、交互に所定の個数の文書サブリストを生成する文書サブリスト生成手段と、前記単語抽出手段と、前記単語組合せ手段とは、前記文書サブリスト生成手段が生成した各文書サブリストごとに備え、各前記単語抽出手段は、対応する前記文書サブリストに示された文書から単語を抽出し、各前記単語組合せ手段は、前記単語語抽出手段により抽出された単語を組み合わせてフレーズを生成する、ことを特徴とする請求項3に記載のフレーズ生成装置。
【請求項5】フレーズが取り得るルールを記憶するルール記憶手段を備え、前記単語組合せ手段は、前記単語抽出手段により抽出された単語を、前記ルール記憶手段に記憶されているルールに従い、フレーズを生成することを特徴とする請求項1または4に記載のフレーズ生成装置。
【請求項6】キャッチフレーズ、広告コピー、商品名等のフレーズを生成するフレーズ生成方法であって、予め記憶されている文書を指定するためのキーワードを入力し、入力したキーワードから、予め記憶されている文書を抽出し、抽出した文書から単語を抽出し、抽出した単語を組み合わせてフレーズを生成する、ことを特徴とするフレーズ生成方法。
【請求項7】予め登録されている、キーワードと、該キーワードを含む文書を指定する文書指定情報とを対応するインデックスデータを参照し、前記キーワードを含む文書を検索し、検索した文書について、前記キーワードの出現頻度に基づいたキーワードの重要度を算出し、算出したキーワードの重要度の高い順に、予め記憶されている文書を抽出する、ことを特徴とする請求項6に記載のフレーズ生成方法。
【請求項8】抽出したキーワードの重要度の高い順で文書を指定する情報を備える文書リストを生成し、前記文書リストに示された文書から単語を抽出し、抽出した単語を組み合わせてフレーズを生成する、ことを特徴とする請求項7に記載のフレーズ生成方法。
【請求項9】生成した文書リストから、前記重要度の高い順で、かつ、交互に所定の個数の文書サブリストを生成し、前記文書サブリストごとに、該文書サブリストに示された文書から単語を抽出し、前記文書サブリストごとに、該文書サブリストに示された文書から抽出した単語を組み合わせてフレーズを生成する、ことを特徴とする請求項8に記載のフレーズ生成方法。
【請求項10】抽出した単語を、予め記憶されているフレーズが取り得るルールに従い、フレーズを生成する、ことを特徴とする請求項6または9に記載のフレーズ生成方法。
【請求項11】キャッチフレーズ、広告コピー、商品名等のフレーズを生成するプログラムであって、予め記憶されている文書を指定するためのキーワードを入力する手順、入力したキーワードから、予め記憶されている文書を抽出する手順、抽出した文書から単語を抽出する手順、抽出した単語を組み合わせてフレーズを生成する手順、を実行させるプログラム。
発明の詳細な説明
【0001】
【発明の属する技術分野】この発明は、キャッチフレーズ、広告コピー、商品名、メールアドレス等(以下、単にフレーズという)の候補を生成するフレーズ生成装置、フレーズ生成方法、及びプログラムに関する。
【0002】
【従来の技術】従来、上記フレーズの候補を生成するには、以下に示す3通りの方法が用いられている。
(1)辞書中の単語をランダムに組み合わせてフレーズ候補を生成する方法。
(2)ある分野に関係するフレーズ候補を生成する場合には、予め、当該分野に関係のある単語を集めた辞書を人手により作成し、その辞書中の単語を組み合わせてフレーズ候補を生成する方法。
(3)すべての単語同士の関係度が定義された単語辞書を予め用意し、ユーザがある分野に関係するキーワードをいくつか入力すると、入力されたキーワードについて関連性の強い単語を単語辞書から選択し、選択した単語を組み合わせて上記フレーズ候補を生成する方法。
【0003】
【発明が解決しようとする課題】しかしながら、(1)の方法では、辞書中の単語をランダムに組み合わせてフレーズ候補を生成するので、キャッチフレーズ、広告コピー、商品名等には関係のない単語を含む、適当でないフレーズ候補が多数生成されるという問題点があった。(2)の方法では、予め、当該分野に関係のある単語を集めた辞書を人手により作成し、辞書中の単語を組み合わせてフレーズ候補を生成するので、(1)の方法が有する上記問題点は発生しないが、当該分野に関係のある単語を集めた辞書を作成するには、時間と費用とが膨大にかかるという問題点があった。(3)の方法では、すべての単語同士の関係度が定義された単語辞書を予め用意しているので、(2)の方法と同様、(1)の方法が有する上記問題点は発生しないが、上記単語辞書を作成するには時間と費用とが膨大にかかるという問題点があった。また、(3)の方法では、ユーザにより入力されたある分野に関連するキーワードごとに、関連性の強い単語を単語辞書から選択するので、入力されたキーワードについての関連性の強い単語を算出するに際して、メモリ空間を膨大に必要とするという問題点があった。
【0004】この発明は、上述した問題点に鑑み、フレーズの候補を効率的に生成することが可能なフレーズ生成装置等を提供することを目的とする。また、この発明は、無駄なフレーズ候補の生成を防止することが可能なフレーズ生成装置等を提供することを目的とする。また、この発明は、フレーズを生成する際のコストを抑えることができるフレーズ生成装置等を提供することを目的とする。また、この発明は、フレーズを生成するに際して、使用するメモリ空間を抑えることができるフレーズ生成装置等を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するために、この発明の第1の観点に係るフレーズ生成装置は、キャッチフレーズ、広告コピー、商品名等のフレーズを生成するフレーズ生成装置であって、文書を記憶する文書記憶手段と、前記文書記憶手段に記憶されている文書を指定するためのキーワードを入力するキーワード入力手段と、前記キーワード入力手段により入力されたキーワードから、前記文書記憶手段に記憶されている文書を抽出する文書抽出手段と、前記文書抽出手段により抽出された文書から単語を抽出する単語抽出手段と、前記単語抽出手段により抽出された単語を組み合わせてフレーズを生成する単語組合せ手段と、を備えることを特徴とする。
【0006】このような構成によれば、入力したキーワードから、記憶手段に記憶されている文書を抽出し、抽出した文書の中の単語を組み合わせてフレーズを生成するので、無駄なフレーズ候補の生成を防止することができるとともに、フレーズ候補を生成するに際して、使用するメモリ空間を抑えることができ、加えて、所定の単語辞書を制作する必要がないため、フレーズ候補の生成に要するコストを削減することができる。つまり、このような構成によれば、フレーズの候補を効率的に生成することができる。
【0007】キーワードと、該キーワードを含む文書を指定する文書指定情報とに対応するインデックスデータを登録するインデックスデータ登録手段をさらに備え、前記文書抽出手段は、前記インデックスデータ登録手段に登録されているインデックスデータを参照し、前記キーワードを含む文書を検索する文書検索手段と、前記文書検索手段により検索された文書について、前記キーワードの出現頻度に基づいたキーワードの重要度を算出するキーワード重要度算出手段と、を備え、前記キーワード重要度算出手段により算出されたキーワードの重要度の高い順に、前記文書記憶手段に記憶されている文書を抽出するようにしてもよい。
【0008】前記文書抽出手段により抽出されたキーワードの重要度の高い順で文書を指定する情報を備える文書リストを生成する文書リスト生成手段を備え、前記単語抽出手段は、前記文書リストに示された文書から単語を抽出し、前記単語組合せ手段は、前記単語語抽出手段により抽出された単語を組み合わせてフレーズを生成するようにしてもよい。
【0009】前記文書リスト生成手段により生成された文書リストから、重要度の高い順で、かつ、交互に所定の個数の文書サブリストを生成する文書サブリスト生成手段と、前記単語抽出手段と、前記単語組合せ手段とは、前記文書サブリスト生成手段が生成した各文書サブリストごとに備え、各前記単語抽出手段は、対応する前記文書サブリストに示された文書から単語を抽出し、各前記単語組合せ手段は、前記単語語抽出手段により抽出された単語を組み合わせてフレーズを生成するようにしてもよい。
【0010】フレーズが取りうるルールを記憶するルール記憶手段を備え、前記単語組合せ手段は、前記単語抽出手段により抽出された単語を、前記ルール記憶手段に記憶されているルールに従い、フレーズを生成するようにしてもよい。
【0011】また、この発明の第2の観点に係るフレーズ生成方法は、キャッチフレーズ、広告コピー、商品名等のフレーズを生成するフレーズ生成方法であって、予め記憶されている文書を指定するためのキーワードを入力し、入力したキーワードから、予め記憶されている文書を抽出し、抽出した文書から単語を抽出し、抽出した単語を組み合わせてフレーズを生成する、ことを特徴とする。
【0012】このような構成によれば、入力したキーワードから、記憶手段に記憶されている文書を抽出し、抽出した文書の中の単語を組み合わせてフレーズを生成するので、無駄なフレーズ候補の生成を防止することができるとともに、フレーズ候補を生成するに際して、使用するメモリ空間を抑えることができ、加えて、所定の単語辞書を制作する必要がないため、フレーズ候補の生成に要するコストを削減することができる。つまり、このような構成によれば、フレーズの候補を効率的に生成することができる。
【0013】予め登録されている、キーワードと、該キーワードを含む文書を指定する文書指定情報とを対応するインデックスデータを参照し、前記キーワードを含む文書を検索し、検索した文書について、前記キーワードの重要度を算出し、算出したキーワードの重要度の高い順に、予め記憶されている文書を抽出するようにしてもよい。
【0014】抽出したキーワードの重要度の高い順で文書を指定する情報を備える文書リストを生成し、前記文書リストに示された文書から単語を抽出し、抽出した単語を組み合わせてフレーズを生成するようにしてもよい。
【0015】生成した文書リストから、重要度の高い順で、かつ、交互に所定の個数の文書サブリストを生成し、前記文書サブリストごとに、該文書サブリストに示された文書から単語を抽出し、前記文書サブリストごとに、該文書サブリストに示された文書から抽出した単語を組み合わせてフレーズを生成するようにしてもよい。
【0016】抽出した単語を、予め記憶されているフレーズが取り得るルールに従い、フレーズを生成するようにしてもよい。
【0017】また、この発明の第3の観点に係るプログラムは、キャッチフレーズ、広告コピー、商品名等のフレーズを生成するプログラムであって、予め記憶されている文書を指定するためのキーワードを入力する手順、入力したキーワードから、予め記憶されている文書を抽出する手順、抽出した文書から単語を抽出する手順、抽出した単語を組み合わせてフレーズを生成する手順、を実行させる。
【0018】このような構成によれば、入力したキーワードから、記憶手段に記憶されている文書を抽出し、抽出した文書の中の単語を組み合わせてフレーズを生成するので、無駄なフレーズ候補の生成を防止することができるとともに、フレーズ候補を生成するに際して、使用するメモリ空間を抑えることができ、加えて、所定の単語辞書を制作する必要がないため、フレーズ候補の生成に要するコストを削減することができる。つまり、このような構成によれば、フレーズの候補を効率的に生成することができる。
【0019】
【発明の実施の形態】以下、この発明の実施の形態に係るフレーズ生成装置、フレーズ生成方法を説明する。図1は、この発明の実施の形態に係るフレーズ生成装置の構成を示すブロック図である。この実施形態のフレーズ生成装置は、図1に示すように、入力部11と、全文検索用インデックスファイル12と、文書DB(データベース)13と、単語辞書14と、言語ルール記憶ファイル15と、全文検索部16と、文書リスト分配部17と、第1の単語抽出部18から第nの単語抽出部18と、第1の単語組合せ部19から第nの単語組合せ部19と、表示部20と、ワーク領域部21と、表示データ生成部22とから構成されている。
【0020】全文検索用インデックスファイル12、文書DB(データベース)13、単語辞書14、及び言語ルール記憶ファイル15は、図示しない内蔵されたハードディスク装置、又は図示しない外付けされた外部記憶装置により構成されている。ワーク領域部21は、RAM(Random Access Memory)等により構成されている。
【0021】全文検索部16、文書リスト分配部17、第1の単語抽出部18から第nの単語抽出部18、第1の単語組合せ部19から第nの単語組合せ部19、及び表示データ生成部22は、図示しないCPUが、フレーズ候補を生成するための制御プログラムを実行することにより実現される。
【0022】入力部11は、カーソルキー、数字入力キー及び各種機能キー等を備えたキーボード、及びマウスを備え、例えば、キーボード及びマウスにより指定された、フレーズを生成するためのキーワードを全文検索部16に出力する。
【0023】全文検索用インデックスファイル12は、キャッチフレーズ、広告コピー、商品名、メールアドレス等のフレーズの候補を生成するため必要となる文書を指定するインデックスデータを記憶する。インデックスデータは、図2に示すように、フレーズを生成するに際して必要となるキーワードと、このキーワードを有する文書を指定するID(以下、文書指定IDという)とからなるデータ項目を備える。
【0024】文書DB13は、フレーズを生成するときに援用される各分野の文書を記憶する。
【0025】単語辞書は、文書に含まれている単語を抽出する際に使用されるとともに、抽出された単語を用い、後述する言語ルールを参照してフレーズ候補を生成する際に使用される。この単語辞書に登録されている単語には、品詞の種類が記述され、さらに、品詞の中の動詞にはさらに、自動詞、他動詞に分類表示されている。
【0026】言語ルール記憶ファイル15は、文書から抽出された単語の組からフレーズ候補を生成するための言語ルールが記憶されている。上記言語ルールとして、例えば、図4に示すようなルールがある。
1)形容詞の後に名詞を接続することを許可するルール 例えば、「美しいダイヤモンド」
2)動詞の後に名詞を接続することを許可するルール 例えば、「躍らす心」
3)名詞の後に名詞を接続すること許可するルール 例えば、「検査結果」
4)名詞の後に自動詞を接続する場合には、名詞と動詞の間に「は」、「が」、「も」が入るというルール 例えば、「心が躍る」
5)名詞の後に他動詞を接続する場合には、名詞と動詞の間に「を」、又は「に」を入るというルール 例えば、「心を躍らす」
6)名詞の後に名詞を接続する場合には、2つの名詞を直接つなげるときと、名詞と名詞との間に「の」を入れるというルール 例えば、「検査結果」、「検査の結果」
【0027】全文検索部16は、入力部11より入力されたキーワードについて、全文検索用インデックスファイル12を検索し、キーワードを有するインデックスデータをすべて読み出す。また、全文検索部16は、読み出した文書の全てについて、TF(Term Frequency)/IDF(Inverse Document Frequency)法を用い、キーワードの出現頻度に基づいたキーワードとしての単語の重要度(以下、単に重要度という)を算出する。さらに、全文検索部16は、文書の重要度を参照し、フレーズを生成する際に使用される文書を示す文書リスト200を生成し、生成した文書リスト200を文書リスト分配部17に出力する。
【0028】上記文書リスト200は、図3(a)に示すように、キーワード、文書指定ID、及び重要度を項目に備えている。そして、文書リスト200は、重要度で降順にリストされている。
【0029】文書リスト分配部17は、全文検索用インデックスファイル12より入力された文書リスト200から、図3(b)に示す第1の文書サブリスト300から第nの文書サブリスト300を生成する。
【0030】すなわち、文書リスト分配部17は、全文検索用インデックスファイル12より入力された文書リスト200のうち、重要度がn+1(n=0,1,2,3,・・・)番目の文書リストデータを第1の文書サブリスト300のリストデータとし、重要度がn+2(n=0,1,2,3,・・・)番目の文書リストデータを第2の文書サブリスト300のリストデータとし、以下同様にして、第3の文書サブリスト300から第nの文書サブリスト300を生成する。
【0031】また、文書リスト分配部17は、作成した第1の文書サブリスト300を第1の単語抽出部18に出力し、第2の文書サブリスト300を第2の単語抽出部18に出力し、以後順次、第3の文書サブリスト300から第nの文書サブリスト300のそれぞれを、第3の単語抽出部18から第nの単語抽出部18に出力する。
【0032】第k(k=1,2,・・・,n)の単語抽出部18は、第kの文書サブリスト300に示された文書サブリストデータ中の重要度の高いものから順次読み出し、読み出した文書サブリストデータ中に示された文書指定IDにより示された文書を文書DB13から読み出す。また、第k(k=1,2,・・・,n)の単語抽出部18は、単語辞書14を参照し、読み出した文書中に含まれる単語を、形態素解析法を用いて所定の個数読み出し、読み出した所定の個数の単語の組を単語組合せ部19に出力する。
【0033】第k(k=1,2,・・・,n)の単語組合せ部19は、第k(k=1,2,・・・,n)の単語抽出部18から受けた単語の組を用い、言語ルール記憶ファイル15に記憶されている言語ルールに従ったフレーズを生成する。
【0034】表示部20は、CRT(Cathode Ray Tube)、液晶表示装置により構成され、各種入力情報を入力する入力画面、及び例えば生成したフレーズ候補を表示する表示画面を表示する。
【0035】ワーク領域部21は、RAM、ハードディスク等により構成され、全文検索部16、文書リスト分配部17、第k(k=1,2,・・・,n)の単語抽出部18及び第k(k=1,2,・・・,n)の単語組合せ部19の各構成部が、上述したような処理を実行する際の作業領域として使用される。
【0036】表示データ生成部22は、フレーズ候補を表示部20に表示させる表示データを生成する。
【0037】次に、この実施形態に係るフレーズ生成装置の動作を説明する。
【0038】図5及び図6は、この実施形態に係るフレーズ生成装置の動作を示すフローチャートである。なお、この実施形態に係るフレーズ生成装置において生成するフレーズとして、宝石業界で使用されるフレーズを生成する場合を例にあげて説明する。
【0039】操作者は、図7(a)に示すフレーズ生成指示画面500を表示部20に表示させるための指示を、入力部11に入力すると、入力部11は、フレーズ生成指示画面500を表示するための表示データを生成するように指示を表示データ生成部22に出力する。
【0040】上記フレーズ生成指示画面500は、キーワード入力欄501、フレーズを生成する際に組み合わせる単語の数を入力する組合せ単語数入力欄502、及び「OK」ボタン503を備えている。キーワード入力欄501は、文書DBからフレーズ候補を生成する際に必要となる文書を抽出するためのキーワードを入力する欄である。組合せ単語数入力欄は、フレーズ候補を作成する際の単語の数を入力する欄である。
【0041】表示データ生成部22は、入力部11よりフレーズ生成指示画面500を表示させる表示データを生成するようにとの指示を受けると、当該表示データを生成し、生成した表示データを表示部20に出力する。
【0042】表示部20は、上記表示データを受けると、受けた表示データをもとにして、上記フレーズ生成指示画面500を表示する(ステップS1)。
【0043】操作者により、入力部11を使用して、表示部20に表示されているフレーズ生成指示画面500中のキーワード入力欄501に、例えば「宝石」と入力するとともに、組合せ単語数入力欄502に、例えば「4」と入力し、その後、「OK」ボタン503をクリックすると、表示部20は、入力された「4」を単語抽出部18(k=1,2,3,・・・)に入力するとともに、全文検索部16にキーワード「宝石」を入力する(ステップS2)。
【0044】すると、全文検索部16は、全文検索用インデックスファイル12を参照し、キーワードが「宝石」を含む文書を文書DB13から読み出す。その後、全文検索部16は、読み出した文書中に「宝石」という単語の重要度をTF・IDF法を用いて算出する。次に、全文検索部16は、図3(a)に示す文書リストを生成するための文書リストデータを生成する(ステップS3)。
【0045】続いて、全文検索部16は、生成した文書リストデータについて、重要度で降順にソートする。その後、全文検索部16は、ソートされた文書リストデータを用いて、図3(a)に示す、重要度が降順となる文書リスト200を生成し、生成した文書リスト200を文書リスト分配部17に出力する(ステップS4)。
【0046】文書リスト分配部17は、上記文書リスト200を受けると、受けた文書リスト200のうち、重要度がn+1(n=0,1,2,3,・・・)番目の文書リストデータを第1の文書サブリスト300のリストデータとし、重要度がn+2(n=0,1,2,3,・・・)番目の文書リストデータを第2の文書サブリスト300のリストデータとし、以下同様にして、第3の文書サブリスト300から第nの文書サブリスト300を生成する(ステップS5)。
【0047】その後、文書リスト分配部17は、作成した第1の文書サブリスト300を第1の単語抽出部18に出力し、第2の文書サブリスト300を第2の単語抽出部18に出力し、以後順次、第3の文書サブリスト300から第nの文書サブリスト300のそれぞれを、第3の単語抽出部18から第nの単語抽出部18に出力する(ステップS6)。
【0048】第kの単語抽出部18(k=1,2,・・・,n)は、文書リスト分配部17より第kの文書サブリスト300を受けると、第kの文書サブリスト300に示された文書サブリストデータを重要度が高いものから順次読み出し、読み出した文書サブリストデータ中の文書指定IDにより示された文書を文書DB13から読み出す(ステップS7)。
【0049】続いて、第kの単語抽出部18(k=1,2,・・・,n)は、単語辞書14を参照し、読み出した文書中から、先に入力部11より入力された、フレーズを生成する際に組み合わせる単語の数として、抽出した文書の中から4つの単語を読み出し、読み出した4つの単語からなる単語の組を第kの単語組合せ部19(k=1,2,・・・,n)に出力する(ステップS8)。
【0050】その後、第kの単語組合せ部19(k=1,2,・・・,n)は、第kの単語抽出部18(k=1,2,・・・,n)から受けた単語の組を用い、言語ルール記憶ファイル15に記憶されている言語ルールを参照して複数のフレーズ候補を生成する(ステップS9)。
【0051】例えば、第kの単語組合せ部19(k=1,2,・・・,n)は、第kの単語抽出部19(k=1,2,・・・,n)より、「ダイヤモンド」、「心」、「ときめく」、「美しい」という4つの単語の組を受けたとすると、以下のようなフレーズ候補を生成する。
(1)心がときめく美しいダイヤモンド(名詞+「が」+自動詞+形容詞+名詞の関係)
(2)美しい心がときめくダイヤモンド(形容詞+名詞+「が」+自動詞+名詞の関係)
(3)ダイヤモンドがときめく美しい心(名詞+「が」+自動詞+形容詞+名詞の関係)
(4)美しいダイヤモンドがときめく心(形容詞+名詞+「が」+自動詞+名詞の関係)
(5)ときめく美しい心ダイヤモンド(動詞+形容詞+名詞+名詞の関係)
(6)ときめく美しい心のダイヤモンド(動詞+形容詞+名詞+「の」+名詞の関係)
(7)ときめく美しいダイヤモンド心(動詞+形容詞+名詞+名詞の関係)
(8)ときめく美しいダイヤモンドの心(動詞+形容詞+名詞+「の」+名詞の関係)
【0052】次に、第kの単語組合せ部19(k=1,2,・・・,n)は、生成した複数のフレーズ候補をワーク領域部21に記憶させる(ステップS10)。
【0053】その後、表示データ生成部22は、ワーク領域部21に記憶されている、第kの単語組合せ部19(k=1,2,・・・,n)により生成されたフレーズ候補を読み出し、図7(b)に示すフレーズ候補表示画面550を生成するための表示データを生成し、生成した表示データを表示部20に出力する(ステップS11)。
【0054】上記フレーズ候補表示画面550は、図7(b)に示すように、抽出された単語を表示する表示欄551、生成されたフレーズ候補を表示する表示欄552、「終了」ボタン553、及び「続き」ボタン554を備えている。
【0055】表示部20は、表示データ生成部22より上記表示データを受けると、図7(b)に示すフレーズ候補表示画面550を表示する(ステップS12)。
【0056】その後、表示データ生成部22は、表示部20から「終了」ボタン553がクリックされたか否かを判断する(ステップS13)。表示データ生成部22は、表示部20から「終了」ボタン553がクリックされたと判断した場合には(ステップS13;YES)、操作者が自己が望むフレーズが表示されてフレーズ生成処理を終了させたもの、又は、操作者が未だ自己が望むフレーズが表示されていないがフレーズ生成処理を打ち切らせたものとして、フレーズ生成処理を終了する。
【0057】一方、表示データ生成部22は、表示部20から「終了」ボタン553がクリックされなかったと判断しない場合(ステップS13;NO)、すなわち「続き」ボタン554がクリックされた場合には、その旨を第kの単語組合せ部19(k=1,2,・・・,n)に出力する。その後、フレーズ生成装置は、処理をステップS8に移行し、上述した処理を行う。
【0058】なお、第kの単語組合せ部19(k=1,2,・・・,n)は、再び単語を抽出するに際し、先に抽出した単語の組以外の単語の組からなる単語を抽出する。例えば、第kの単語組合せ部19(k=1,2,・・・,n)は、先に「ダイヤモンド」、「心」、「ときめく」、「美しい」という単語の組を抽出している場合には、それ以外の新たな単語の組、例えば、「ダイヤモンド」、「心」、「ときめく」、「指輪」を抽出する。
【0059】この実施形態のフレーズ生成装置によれば、入力されたキーワードから文書DB13に記憶されている文書を抽出し、第kの単語抽出部18(k=1,2,・・・,n)が抽出した文書に含まれている単語を抽出するので、フレーズ候補を生成する際に抽出する単語の数を抑えることができる。
【0060】また、このフレーズ生成装置によれば、キーワードとして所定の分野に関連する単語である場合には、当該分野についてのフレーズ候補を絞って生成することができる。
【0061】また、このフレーズ生成装置によれば、第kの単語抽出部18(k=1,2,・・・,n)及び第kの単語組合せ部19(k=1,2,・・・,n)のように、複数の単語抽出部及び単語組合せ部により、選択された文書から単語を抽出し、抽出した単語からフレーズ候補を生成するので、フレーズ候補を迅速に生成することができる。
【0062】また、このフレーズ生成装置によれば、キーワードの重要度が高い順の文書から、フレーズ候補を生成するので、所定の分野に関連するフレーズ候補を効率よく生成することができる。
【0063】この実施形態に係るフレーズ生成装置は、キーワードをもとにして選択された文書から、第kの単語抽出部18(k=1,2,・・・,n)が所定の数の単語を抽出し、その抽出した単語をもとにして、第kの単語組合せ部19(k=1,2,・・・,n)がフレーズ候補を生成するように構成されているが、これ以外として、フレーズ候補を生成するために適さない単語、例えば、公序良俗を侵す虞がある単語や、フレーズに使用したくないものであると明らかに分かっている単語を登録した使用禁止単語登録DBを備え、抽出した単語が使用禁止単語登録DBに登録されているかを検査したのち、フレーズ候補を生成するような構成にしてもよい。
【0064】この実施形態に係るフレーズ生成装置は、キーワードを含む文書をもとにしてフレーズ候補を生成するような構成になっているが、これ以外として、キーワードの重要度が所定の基準値未満のものについては、フレーズ候補を生成するに際して、使用しないようにしてもよい。すなわち、この実施形態に係るフレーズ生成装置を構成する全文検索部16が有する機能に、更に、重要度が所定の基準値以上の文書を選別する機能を備えるようにする。こうすることで、一層、フレーズ候補の生成が迅速になるとともに、メモリ使用を抑えることができる。
【0065】この実施形態に係るフレーズ生成装置は、全文検索部16により、入力部11から入力された1つキーワードを含む文書を抽出する構成になっているが、これ以外として、入力部11から複数のキーワードを入力し、これらのキーワードの全てを含む文書、又はこれらのキーワードのいずれか1つを含む文書を抽出するような構成であってもよい。
【0066】この実施形態に係るフレーズ生成装置は、文書に対するキーワードの重要度を算出する方法として、TF/IDF法を用いているが、これ以外の方法を用いてもよいことはいうまでもない。
【0067】
【発明の効果】以上この発明によれば、フレーズの候補を効率的に生成することができる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013