米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> ソニー株式会社

発明の名称 情報処理システムおよび情報処理方法
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開平9−6798
公開日 平成9年(1997)1月10日
出願番号 特願平7−151414
出願日 平成7年(1995)6月19日
代理人 【弁理士】
【氏名又は名称】稲本 義雄
発明者 暦本 純一 / 長尾 確 / 北野 宏明
要約 目的
簡単かつ迅速に、データを処理できるようにする。

構成
CCDビデオカメラ31で、本41のカラーコード42を取り込み、カラーコード識別部61でこれを識別する。音声認識部62では、マイクロホン32で取り込んだ音声を認識する際、カラーコード識別部61で識別したカラーコード42に対応する分野の辞書を対話辞書63が有する複数の辞書の中から選択し、参照する。
特許請求の範囲
【請求項1】 現実世界のオブジェクトを識別する識別情報を取り込む取込手段と、所定の情報を記憶する記憶手段と、前記記憶手段に記憶されている記憶情報の中から、前記取込手段により取り込まれた前記識別情報に関連する情報を選択し、処理する処理手段とを備えることを特徴とする情報処理システム。
【請求項2】 前記処理手段により処理された情報を出力する出力手段をさらに備えることを特徴とする請求項1に記載の情報処理システム。
【請求項3】 前記取込手段は、ビデオカメラまたはバーコードリーダであることを特徴とする請求項1に記載の情報処理システム。
【請求項4】 前記記憶手段は、音声認識のための辞書を記憶しており、前記処理手段は、前記識別情報に関連する辞書を優先的に選択することを特徴とする請求項1に記載の情報処理システム。
【請求項5】 前記記憶手段は、仮想現実世界の情報を記憶しており、前記処理手段は、前記識別情報に関連する前記仮想現実世界の情報を選択することを特徴とする請求項1に記載の情報処理システム。
【請求項6】 所定のキーワードと現実世界の位置情報を取り込む取込手段と、所定の情報を、前記キーワードと位置情報に対応してハイパーメディアとして記憶する記憶手段と、前記記憶手段に記憶されている記憶情報の中から、前記取込手段により取り込まれた前記キーワードと位置情報に関連する情報を選択する選択手段と、前記選択手段により選択された前記ハイパーメディアとしての情報を出力する出力手段とを備えることを特徴とする情報処理システム。
【請求項7】 現実世界のオブジェクトを識別する識別情報を取り込み、記憶されている情報の中から、取り込まれた前記識別情報に関連する情報を選択し、選択された情報を処理することを特徴とする情報処理方法。
【請求項8】 所定のキーワードと現実世界の位置情報を取り込み、前記キーワードと位置情報に対応してハイパーメディアとして記憶されている記憶情報の中から、取り込まれた前記キーワードと位置情報に関連する情報を選択し、選択された前記ハイパーメディアとしての情報を出力することを特徴とする情報処理方法。
発明の詳細な説明
【0001】
【産業上の利用分野】本発明は、情報処理システムおよび情報処理方法に関し、特に所望の情報を迅速かつ確実に得ることができるようにした情報処理システムおよび情報処理方法に関する。
【0002】
【従来の技術】最近、音声認識システムの開発が進み、各種の分野で応用されている。この音声認識システムにおいては、ユーザの会話をマイクロホンを介して取り込み、その特徴を分析して、単語として認識するようにしている。
【0003】そして不明な単語が認識された場合においては、文脈情報(会話の流れ)から分析を行うようにしている。これにより、例えば、「我輩は猫であるの著者は誰ですか。」といった文章をユーザが音声入力した場合、この質問を分析し、コンピュータにより、その回答を出力させることができる。
【0004】
【発明が解決しようとする課題】しかしながら、例えば、「この本の著者は誰ですか。」といった文章が入力された場合、「この本」の単語を認識することができたとしても、「この本」が具体的にどの本を指すのか特定しなければ、その質問に対する回答を行うことができない。このような代名詞により、指称されるされる意味を会話の文脈だけから判断することは困難である。
【0005】また、音声認識の認識率を向上させるには、できるだけ多くの語彙を辞書に登録しておき、これを参照するようにすればよいが、語彙の数が多くなると、それだけ認識に時間がかかることになる。また、誤認識のおそれも多くなる。
【0006】本発明はこのような状況に鑑みてなされたものであり、迅速かつ簡単に、データを処理することができるようにするものである。
【0007】
【課題を解決するための手段】請求項1に記載の情報処理システムは、現実世界のオブジェクトを識別する識別情報を取り込む取込手段と、所定の情報を記憶する記憶手段と、記憶手段に記憶されている記憶情報の中から、取込手段により取り込まれた識別情報に関連する情報を選択し、処理する処理手段とを備えることを特徴とする。
【0008】請求項6に記載の情報処理システムは、所定のキーワードと現実世界の位置情報を取り込む取込手段と、所定の情報を、キーワードと位置情報に対応してハイパーメディアとして記憶する記憶手段と、記憶手段に記憶されている記憶情報の中から、取込手段により取り込まれたキーワードと位置情報に関連する情報を選択する選択手段と、選択手段により選択されたハイパーメディアとしての情報を出力する出力手段とを備えることを特徴とする。
【0009】請求項7に記載の情報処理方法は、現実世界のオブジェクトを識別する識別情報を取り込み、記憶されている情報の中から、取り込まれた識別情報に関連する情報を選択し、選択された情報を処理することを特徴とする。
【0010】請求項8に記載の情報処理方法は、所定のキーワードと現実世界の位置情報を取り込み、キーワードと位置情報に対応してハイパーメディアとして記憶されている記憶情報の中から、取り込まれたキーワードと位置情報に関連する情報を選択し、選択されたハイパーメディアとしての情報を出力することを特徴とする。
【0011】
【作用】請求項1に記載の情報処理システムにおいては、取込手段が、現実世界のオブジェクトを識別する識別情報を取り込み、記憶手段が、所定の情報を記憶し、処理手段が、記憶手段に記憶されている記憶情報の中から、取込手段により取り込まれた識別情報に関連する情報を選択し、処理する。
【0012】請求項6に記載の情報処理システムにおいては、取込手段が、所定のキーワードと現実世界の位置情報を取り込み、記憶手段が、所定の情報を、キーワードと位置情報に対応してハイパーメディアとして記憶し、選択手段が、記憶手段に記憶されている記憶情報の中から、取込手段により取り込まれたキーワードと位置情報に関連する情報を選択し、出力手段が、選択手段により選択されたハイパーメディアとしての情報を出力することを特徴とする。
【0013】請求項7に記載の情報処理方法においては、記憶されている情報の中から、取り込まれた識別情報に関連する情報が選択され、選択された情報が処理される。
【0014】請求項8に記載の情報処理方法においては、キーワードと位置情報に対応してハイパーメディアとして記憶されている記憶情報の中から、取り込まれたキーワードと位置情報に関連する情報が選択され、選択されたハイパーメディアとしての情報が出力される。
【0015】
【実施例】以下に本発明の実施例を説明するが、特許請求の範囲に記載の発明の各手段と以下の実施例との対応関係を明らかにするために、各手段の後の括弧内に、対応する実施例(但し一例)を付加して本発明の特徴を記述すると、次のようになる。但し勿論この記載は、各手段を記載したものに限定することを意味するものではない。
【0016】請求項1に記載の情報処理システムは、現実世界のオブジェクトを識別する識別情報を取り込む取込手段(例えば図2のCCDビデオカメラ31)と、所定の情報を記憶する記憶手段(例えば図2の対話辞書63)と、記憶手段に記憶されている記憶情報の中から、取込手段により取り込まれた識別情報に関連する情報を選択し、処理する処理手段(例えば図2の音声認識部62)とを備えることを特徴とする。
【0017】請求項2に記載の情報処理システムは、処理手段により処理された情報を出力する出力手段(例えば図2のテレビジョン受像機33)を備えることを特徴とする。
【0018】請求項6に記載の情報処理システムは、所定のキーワードと現実世界の位置情報を取り込む取込手段(例えば図8のステップS21)と、所定の情報を、キーワードと位置情報に対応してハイパーメディアとして記憶する記憶手段(例えば図6のデータベース12)と、記憶手段に記憶されている記憶情報の中から、取込手段により取り込まれたキーワードと位置情報に関連する情報を選択する選択手段(例えば図8のステップS23)と、選択手段により選択されたハイパーメディアとしての情報を出力する出力手段(例えば図1の出力部5)とを備えることを特徴とする。
【0019】図1は、本発明の情報処理システムの一般的な構成例を表している。この実施例においては、携帯端末10が入力部1を備え、現実世界オブジェクト13のデータを取り込むようになされている。入力部1は、CCDビデオカメラ、バーコードリーダ、マイクロホンなどにより構成される。現実世界オブジェクト13としては、テーブル、キャビネット、ドア、壁、コンピュータ、オフィス機器、文書、ホルダなど、種々のものが考えられる。
【0020】検出部2は、例えばGPS装置、PHS装置(簡易無線電話)などよりなり、衛星その他を介して伝送されてくる電波を受信して、現在時刻や現在位置を検出する。
【0021】入力部3は、例えばキーボード、トラックボールなどにより構成され、ユーザID、その他のデータを入力するとき操作される。
【0022】合成部4は、入力部1より供給される現実世界オブジェクト13のデータ、検出部2より供給される時刻データや位置データ、入力部3より供給されるユーザIDなどのデータを合成し、通信部6に供給している。通信部6は、入力されたデータをネットワーク11に出力するとともに、ネットワーク11より伝送されてきたデータを取り込み、ディスプレイ、スピーカなどより構成される出力部5に出力する。
【0023】ネットワーク11は、ワイヤレス、あるいは所定の通信回線を介して構成され、データベース12に接続されている。
【0024】次に、その動作について説明する。通信部6は、データベース12にアクセスするとき、入力部1から現実世界オブジェクト13の所定のものの識別コード(ID)をCCDビデオカメラで読み取る。この読み取られた識別データは、合成部4を介して通信部6に供給される。通信部6は、このデータをネットワーク11を介してデータベース12に供給する。
【0025】データベース12は、入力された識別コードに対応する検索処理を行い、得られた検索結果をネットワーク11を介して通信部6に出力する。通信部6は、このデータを出力部5に供給し、画像データは、そのディスプレイに表示させるとともに、音声データはスピーカから出力させる。
【0026】なお、この実施例においては、データベース12をネットワーク11を介して携帯端末10に接続するようにしたが、データベース12を携帯端末10に内蔵させるようにすることも可能である。
【0027】図2は、図1に示した実施例を音声認識システムに応用した例を表している。この実施例においては、携帯端末10が、入力部1としてのCCDビデオカメラ31と、マイクロホン32を有しており、また、出力部5として、パームトップのテレビジョン受像機(TV)33を有している。この他、図1における通信部6も有しているが、便宜上、図2においては省略されている。また、ネットワーク11は、ワイヤレスネットワークにより構成されるが、図2においては、その図示は省略されている。
【0028】データベース12は、例えば図書館に配置されているコンピュータ51により構成されている。CCDビデオカメラ31は、現実世界オブジェクト13の1つとしての本41の所定の位置に印刷されているカラーコード42を読み取り、その読み取った画像データをNTSC方式のビデオ信号として、コンピュータ51のカラーコード識別部61に供給している。カラーコード識別部61は、入力されたビデオ信号からカラーコードを識別し、その識別結果を音声認識部62と自然言語処理部64に出力している。
【0029】音声認識部62には、対話辞書63が接続されており、音声認識部62は、この対話辞書63のデータを利用して、マイクロホン32より入力された音声データを認識する処理を実行する。
【0030】音声認識部62の出力は、自然言語処理部64に供給され、解析されるようになされている。自然言語処理部64の出力は、会話メッセージ発生部65に供給され、会話メッセージ発生部65は、入力に対応する会話メッセージを発生し、音声合成部66と視覚メッセージ発生部67に出力している。
【0031】音声合成部66は、会話メッセージ発生部65より供給された会話メッセージを音声信号に変換し、テレビジョン受像機33のスピーカ(図示せず)に供給するようになされている。
【0032】視覚メッセージ発生部67は、会話メッセージ発生部65からの入力に対応する視覚メッセージ(文字データ)を発生し、スーパインポーズ部68に出力している。スーパインポーズ部68は、視覚メッセージ発生部67より入力された文字データと、ビデオカメラ31より供給されたビデオデータとを合成し、テレビジョン受像機33に供給し、表示させるようになされている。
【0033】次に、その動作について説明する。ユーザは、例えば、「この本の著者は誰ですか。」の音声を出力し、その回答をコンピュータ51より得たいと思うとき、CCDビデオカメラ31で対象とする本41のカラーコード42を読み取らせる。カラーコード識別部61は、CCDビデオカメラ31より入力されるビデオ信号からカラーコードを識別し、その識別結果(ID番号)を音声認識部62に出力する。音声認識部62は、このID番号の入力に対応して図3のフローチャートに示す処理を実行する。
【0034】すなわち、最初にステップS1において、ID番号が入力されたか否かを判定し、ID番号が入力されていないと判定された場合、ステップS2に進み、予め設定されているデフォルトの参照順位で、対話辞書63に記憶されている複数の辞書を順次参照して、マイクロホン32より入力された音声の認識処理を実行する。
【0035】これに対して、ステップS1において、ID番号が入力されたと判定された場合、ステップS3に進み、入力されたID番号に対応する分野の辞書を第1番目の参照順位に設定する。そして、対話辞書63に記憶されている複数の辞書のうち、第1番目の参照順位に設定された辞書を参照して、マイクロホン32より入力された音声データの認識処理を実行する。
【0036】例えば、音声認識部62は、入力されたID番号から、その本41の著者、タイトルを判定することができる。そして、その本の分野(フィールド)を判定する。この分野とは、例えば、政治、経済、物理、運動といったような分野である。対話辞書63は、こういった分野別に辞書を有している。音声認識部62は、マイクロホン32より入力された音声データを認識するに際し、第1番目の参照順位に選定された分野の辞書から順次参照を行う。マイクロホン32より入力される音声は、CCDビデオカメラ31で、そのカラーコード42を取り込んだ本41に関する音声である可能性が高い。その結果、この現実世界における本41の分野に関する辞書を参照して音声認識処理を行うと、より的確に、短時間で、音声認識を完了することができる。
【0037】音声認識部62で認知された結果は、自然言語処理部64に供給され、解析される。この解析に際しても、カラーコード識別部61で識別されたID番号が利用される。これにより、例えば、「この本」の音声が認識された場合において、「この本」が意味するところの本をID番号で特定される本として認識する。従って、例えば、ID番号が「我輩は猫である」のタイトルの本のものである場合においては、その著者は「夏目漱石」と判定する。
【0038】そこで、自然言語処理部64は、例えば、「この本の著者は夏目漱石です。」の会話メッセージを発生させるように、会話メッセージ発生部65を制御する。会話メッセージ発生部65は、音声合成部66を制御し、「この本の著者は夏目漱石です。」の音声メッセージを発生させる。この音声メッセージは、テレビジョン受像機33のスピーカより出力される。
【0039】一方、会話メッセージ発生部65が発生した会話メッセージは、視覚メッセージ発生部67に入力され、視覚メッセージ、すなわち文字、あるいは図形に変換される。いまの場合、「この本の著者は夏目漱石です。」の文字列(文章)が発生され、スーパインポーズ部68において、CCDビデオカメラ31が出力するビデオ信号にスーパインポーズされ、テレビジョン受像機33のディスプレイに供給、表示される。
【0040】このようにして、簡単かつ確実に、音声認識部62において使用する辞書を特定の分野の辞書に切り替えることができる。その結果、認識率を向上させることができるばかりでなく、より迅速な認識処理を行うことが可能となる。
【0041】また、「この本」といった、曖昧な表現に対する分析も、迅速かつ確実に、行うことが可能となる。
【0042】図4は、他の実施例を表している。この実施例においては、雑誌広告43にカラーコード44が印刷されている。この雑誌広告43には、例えば、所定の自動車の宣伝広告が印刷されている。
【0043】このカラーコード44を、CCDビデオカメラ31で取り込むと、この取り込んだビデオ信号がコンピュータ81の位置データベース91に供給される。位置データベース91は、入力されたビデオ信号からカラーコード44を識別し、対応するID番号に変換する。
【0044】また、位置データベース91は、仮想世界93のデータを記憶している。この仮想世界93には、各種の商品を扱う仮想世界の販売店などが形成されている。データベース91は、この仮想世界93の中から、CCDビデオカメラ31より取り込んだID番号に対応する商品を取り扱っている店を検索する。
【0045】すなわち、位置データベース91は、図5のフローチャートに示す処理を実行する。最初にステップS11においてID番号が入力されるまで待機し、ID番号が入力されたときステップS12に進み、入力されたID番号に対応する仮想世界の情報を読み出し、これを出力する。
【0046】そして、検索された店のデータを3D(3次元)ビジュアライザ92に供給し、ビデオ信号に変換させ、このビデオ信号は、携帯端末10のテレビジョン受像機33のディスプレイ34に供給され、表示される。
【0047】これにより、ユーザは、雑誌広告43に掲載されている自動車のより詳しい情報を仮想世界93から(仮想世界93の販売店から)得ることができる。
【0048】従って、自動車販売者は、雑誌に各種の広告を行い、その広告にカラーコードを付しておくとともに、その広告する商品を取り扱う販売店を仮想世界93に形成しておくことで、より効果的な販売促進を行うことができる。
【0049】図6は、本発明のさらに他の実施例を表している。この実施例においては、携帯端末10が、インターネットなどに代表されるネットワーク11に接続されている。このネットワーク11には、WWW(World Wide Web)のシステムが構築されており、各種の情報プロバイダ101から各種の情報がハイパーテキストに代表されるハイパーメディアとして提供されている。従って、各ユーザは、情報を一元的に識別するアドレスとしてのURL(Universal Resource Locator)を指定することで、各種の情報にアクセスすることが可能となされている。
【0050】データベース12は、ネットワーク11を介してWWWに接続されており、WWWに情報を提供している情報提供者の緯度、経度、高度などの位置情報を記憶している。そして、この位置情報は、WWWに登録されている情報にURLでリンクしている。
【0051】すなわち、例えば、情報プロバイダ101から、WWWに所定の情報を登録するとき、その表示画面には、例えば図7に示すような項目が表示される。情報プロバイダ101では、この各項目に必要な入力を行う。この実施例においては、URLとして、http://www.taxim.co.jpが入力され、緯度として、40°13’10”が、また経度として、135°40’05”が、それぞれ入力されている。さらに、情報のタイトルとして、「タキシムドパリ銀座店」が、またキーワードとして「レストラン」と「フランス料理」が、それぞれ入力されている。
【0052】このような所定の項目に、所定の入力を行った後、登録キーを操作すると、WWWに、タキシムドパリ銀座店のタイトルの情報(ファイル)が登録される。ファイルの中身には、必要な文字(テキスト)や図形を書き込むことができる。そして、ハイパーメディアとして、所定の文字に所定のURLを対応させることができる。
【0053】またこの時、データベース12には、ファイルの中身は登録されないが、図7に示した各項目が登録される。
【0054】この実施例においては、携帯端末10が、検出部2として、GPS装置20を有している。従って、携帯端末10の現在位置が、常に分かるようになっている。
【0055】この実施例の場合、ネットワーク11には、この他、カーナビゲーションシステム10Aや、街頭キオスク10Bが接続されている。カーナビゲーションシステム10AもGPS装置20Aを有しており、常に現在位置を検出するようになされている。また、街頭キオスク10Bは固定されているため、固定した位置情報を発生する。
【0056】なお、現在位置を知るには、GPSの他、PHS(簡易無線電話)を用いるようにしてもよい。この場合、現在位置は、現在、どのセルの中にいるかということから判定される。
【0057】いま、例えば、ユーザが携帯端末10を携帯して、銀座、またはその周辺に到着したとする。そして、その近傍のレストランで食事をしたいと思ったとき、携帯端末10において、図8のフローチャートに示す処理を実行する。
【0058】すなわち、最初にステップS21において、キーワードと現在位置を入力する。いま、検索したいのはレストランであるから、キーボードを操作して、「レストラン」の文字をキーワードとして入力する。現在位置は、GPS装置22により検出され、自動的に設定されている。
【0059】図9は、携帯端末10において、検索を指令する場合における携帯端末10のディスプレイ34の表示例を表している。キーワードには、「レストラン」の文字が入力されている。また、緯度と経度は、GPS装置20により検出したものが自動的に設定されている。
【0060】この状態において、検索ボタンを操作すると、携帯端末10の通信部6はステップS22に進み、データベース12にアクセスする。そして、キーワードと現在位置の情報をデータベース12に出力する。
【0061】データベース12は、このキーワードと位置情報の供給を受けたとき、そのキーワードに対応されており、かつ、現在位置から所定の距離(例えば1km)の範囲内の位置情報が対応されているURL(すなわちレストラン)を検索する。そして、データベース12は、検索した結果を携帯端末10に伝送する。
【0062】携帯端末10は、ステップS23において、データベース12より供給された検索結果を取得し、そのディスプレイ34に検索結果を表示させる。これにより、携帯端末10のディスプレイ34には、図10に示すように、現在位置から1kmの範囲内のレストランの名称が表示される。このレストランの名称には、そのレストランに関する、より詳細な情報を取得するためのURLが対応されている。
【0063】そこで、ユーザはステップS24に進み、表示されているレストランの中から所望のレストランを選択する(所望のURLを選択する)。
【0064】この時、携帯端末10はステップS25に進み、WWWにアクセスし、ステップS24で選択したURLに対応する情報の検索を要求する。WWWにおいては、この要求に対応して指定されたURLに対応する情報を検索し、携帯端末10に出力する。
【0065】携帯端末10は、WWWより供給された情報をステップS26で取得し、ディスプレイ34に表示させる。
【0066】例えば、図10に示すレストランのうち、「タキシムドパリ銀座店」を選択したとき、図11に示すように、WWWからこの「タキシムドパリ銀座店」の情報(ファイル)が読みだされ、表示される。
【0067】以上のようにして、現在位置の周辺のレストランに関する情報を、簡単かつ確実に、得ることができる。各情報プロバイダは、WWWに登録している情報を常に最新の情報に更新しているので、ユーザは、最新の情報を迅速に得ることができる。
【0068】なお、図6の実施例においては、データベース12をWWWと別個に構成するようにしたが、これをWWWに含めてシステムを構築することも可能である。
【0069】以上、本発明を説明したが、本発明は上記した実施例以外の各種の情報処理システムに適応することが可能である。
【0070】
【発明の効果】以上の如く、請求項1に記載の情報処理システムおよび請求項7に記載の情報処理方法によれば、現実世界のオブジェクトを識別する識別情報を取り込み、記憶されている情報の中から取り込まれた識別情報に関連する情報を選択し、処理するようにしたので、簡単、迅速かつ確実に、所望のデータを選択し、処理することが可能となる。
【0071】請求項6に記載の情報処理システムおよび請求項8に記載の情報処理方法によれば、記憶情報の中から、取り込まれたキーワードと位置情報に関連する情報を選択し、出力するようにしたので、簡単、確実、迅速に、所望の情報を検索することが可能となる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013