米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 楽器;音響 -> 日本電気株式会社

発明の名称 メタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2007−108541(P2007−108541A)
公開日 平成19年4月26日(2007.4.26)
出願番号 特願2005−301058(P2005−301058)
出願日 平成17年10月14日(2005.10.14)
代理人 【識別番号】100104400
【弁理士】
【氏名又は名称】浅野 雄一郎
発明者 冨田 祐介
要約 課題
携帯端末を有する各自に対して、欲する通話音声データだけを聞かせる。

解決手段
通話を再現するためのメタデータ付き通話音声データ提供システムに、基地局201,202を介して通話を行う携帯端末101,102と、前記携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベース302と、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を携帯端末に配布し、携帯端末を有する各自に対して、欲するに通話音声データだけを提供するためのメタデータ作成部303とを備える。
特許請求の範囲
【請求項1】
通話を再現するためのメタデータ付き通話音声データ提供システムにおいて、
基地局を介して通話を行う携帯端末と、
前記携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベースと、
前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を前記携帯端末に配布し、携帯端末を有する各自に対して欲するに通話音声データだけを提供するためのメタデータ作成部とを備えることを特徴とするメタデータ付き通話音声データ提供システム。
【請求項2】
前記メタデータ作成部は、
前記データベースに格納された通話音声データを音声認識する音声認識部と、
キーワードを格納し、前記音声認識部で音声認識された言語がキーワードと一致する場合、一致する言語をメタデータとする処理を行う言語処理部とを備えることを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
【請求項3】
さらに、発言者判別部を備え、前記発言者判別部は携帯端末からの通話音声データの発言者を判別し、通話音声データを発言者毎に前記データベース毎に格納させ、前記メタデータ作成部は、発言者の通話音声データの先頭にインデックスを付け、発言者の通話音声データに対するメタデータを作成し、前記データベースの領域に格納させ、前記通話音声データのメタデータを前記キーワードのメタデータと共に配布することを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
【請求項4】
通話音声データを提供するためメタデータの情報を提供する際にパスワードを記載したメールを、通話を行った携帯端末に発行することを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
【請求項5】
通話を行った携帯端末以外で予め登録されている複数の関係者の携帯端末に対してパスワードを記載したメールを発行することを特徴とする、請求項4に記載のメタデータ付き通話音声データ提供システム。
【請求項6】
前記メタデータ作成部は、少なくとも3台の携帯端末間で行う通話に対して、メタデータを作成することを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
【請求項7】
携帯端末間で行った通話の通話音声データを携帯端末に格納し通話終了後に携帯端末に格納した通話音声データを前記データベースに格納させ、前記メタデータ作成部にメタデータ作成を行わせることを特徴とする、請求項1に記載のメタデータ付き通話音声データ提供システム。
【請求項8】
携帯端末の通話を再現するためのメタデータ付き通話音声データ提供方法において、
携帯端末からの通話音声データを格納する工程と、
格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出する工程と、
検出したキーワードに対してメタデータを作成する工程と、
検出されたキーワードが格納されている領域にインデックスを付ける工程と、
作成されたメタデータを格納する工程と、
通話を行った携帯端末に対してパスワードを記載したメールを発行する工程と、
メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布する工程と、
携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供する工程とを備えることを特徴とするメタデータ付き通話音声データ提供方法。
【請求項9】
携帯端末の通話を再現するためのメタデータ付き通話音声データ提供をコンピュータで実行するプログラムにおいて、
携帯端末からの通話音声データを格納する手順と、
格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出する手順と、
検出したキーワードに対してメタデータを作成する手順と、
検出されたキーワードが格納されている領域にインデックスを付ける手順と、
作成されたメタデータを格納する手順と、
通話を行った携帯端末に対してパスワードを記載したメールを発行する手順と、
メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布する手順と、
携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供する手順とを備えることを特徴とする、メタデータ付き通話音声データ提供をコンピュータで実行するプログラム。
【請求項10】
携帯端末間の通話を再現するためのメタデータ付き通話音声データ提供サーバーにおいて、
携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベースと、
前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を前記携帯端末に配布し、携帯端末を有する各自に対して欲するに通話音声データだけを提供するためのメタデータ作成部とを備えることを特徴とするメタデータ付き通話音声データ提供システムサーバー。
【請求項11】
サーバーに通話音声データを格納し通話の再現を行う携帯端末において、
携帯端末の発呼時に前記サーバーに対して通話音声データ蓄積の許可を行う通話音声データ蓄積許可部と、
前記サーバーで、前記携帯端末からの通話音声データを格納し、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードを格納した領域にインデックスを付け、メタデータを格納させ、メタデータを配布するためのパスワードが記載されたメールが携帯端末に対して発行された場合、前記サーバーに対してメタデータの配布を要求するメタデータ配布要求部と、
配布されたメタデータを表示する表示部と、
前記表示部に表示されたメタデータから通話音声データのメタデータを選択し、欲する通話音声データだけを前記サーバーから取得する通話音声データ取得部とを備えることを特徴とする携帯端末。
発明の詳細な説明
【技術分野】
【0001】
本発明は基地局を介して電話による会話を行う携帯端末に関する。特に、本発明は、各携帯端末からそれぞれ通話音声データを受信し格納し各自が欲する通話音声データを再現し提供するメタデータ付き通話音声データ提供システム、方法、プログラム、サーバー及び携帯端末に関する。
【背景技術】
【0002】
近年、携帯端末の普及が著しく、携帯端末を用いた電話による会話が頻繁に行われているが、人間は電話で話した内容の全てを記憶しているとは限らず、後から関係者へ情報展開をする際に電話で話した内容を上手に伝えることができず、報告漏れがあったりするという問題を有する。
さらに、ボイスレコーダーを用いて会話を録音しただけの場合は、複数の発言者からの声を一度に録音してしまうため、誰の音声かを容易に判断し、発言者を区別することが困難であるという問題がある。
【0003】
さらに、ボイスレコーダーを用いて会話を録音しただけの場合は、電話での通話音声データを全て聞くことなく、携帯端末を有する各自に対して欲する通話音声データだけを再現して聞かせることが困難であるという問題がある。
従来、後利用しにくい携帯電話の会話内容を有効に活用するため、携帯電話を用いて、音声通信伝送および通信伝送を行う無線通信手段と、音声通信伝送によるやりとりデータをWeb上に設けた通信者用のサーバーに転送する手段を備えたことを特徴とする携帯電話を用いたデータ処理装置としたものであり、さらに、通信者用のサーバー上に自動的に転送する際に、音声通信伝送によるやりとりデータを音声認識手段によりテキストデータ化する手段を備えたものであり、さらに、やりとりデーターをマークアップ言語形式で管理して保存する手段を備えたものもある(例えば、特許文献1参照)。
【0004】
しかしながら、上記特許文献1では、テキストデータであるため、実際の会話内容を通話音声データとして聞くことができないという問題がある。
また、従来、電話端末装置において、通話者の会話を妨げることなく会話に関連する情報を容易に検索、表示するため、音声入力部からの会話音声に対し、音声認識部が認識処理を行い、言語処理部は音声認識部の認識結果を解析し単語抽出を行い、検索キーワード確定部は抽出された単語から情報検索に適切なキーワードを確定し、表示部に表示し、検索部はユーザーが検索対象指定部によって指定したキーワードに関する情報を情報格納部から検索し、表示部にその内容を表示するものもある(例えば、特許文献2参照)。
【0005】
しかしながら、上記特許文献2では、キーワードに関する情報を表示部に表示するため、実際の会話内容を通話音声データとして聞くことができないという問題がある。
また、従来、音声データに、その音声データに関連した情報を付加したデータを順次生成/記録し、付加された情報に応じた音声データを抽出可能とする音声処理装置および音声処理方法を提供するため、A/D変換器は、マイクロフォンが集音した信号をディジタル信号(音声データ)に変換し、音声認識処理部は、音声データを認識処理し認識可能な音声データのみを抽出し、声紋照合処理部は、抽出された音声データに基づいて声紋照合処理を行い、予め登録された声紋データに合致する発話者を特定し、データ入力部は、付加データDATAを入力し、メタデータ作成部は、特定された発話者と付加データDATAに基づいてメタデータを作成し、フレームデータ生成部は、音声データと当該音声データに対応するメタデータを合成してフレームデータを生成するものもある(例えば、特許文献3参照)。
【0006】
しかしながら、上記特許文献3では、特定の発話者の音声を判断し聞くことが可能であるが、携帯端末を有する各自に対して、欲する通話音声データだけを聞かせることが困難であるという問題がある。
また、従来、カラーバー映像部によって区切られたビデオデータA,ビデオデータB,……,ビデオデータEを、データ蓄積装置の個々に異なる記憶領域に、ファイルA,ファイルB,……,ファイルEとして記憶し、ビデオデータの分別整理がきわめて容易となるものがある(例えば、特許文献4参照)。
【0007】
しかしながら、上記特許文献4では、ビデオデータを通話音声データに置き換えても、携帯端末を有する各自に対して、欲する通話音声データだけを聞かせることができないという問題がある。
【0008】
【特許文献1】特開2004−129168号公報
【特許文献2】特開平11−252281号公報
【特許文献3】特開2005−181391号公報
【特許文献4】特開2000−023069号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
したがって、本発明は上記問題点に鑑みて、携帯端末を有する各自に対して、欲する通話音声データだけを聞かせるためのメタデータ付き通話音声データ提供システムを提供することを目的とする。
【課題を解決するための手段】
【0010】
本発明は前記問題点を解決するために、通話を再現するためのメタデータ付き通話音声データ提供システムにおいて、基地局を介して通話を行う携帯端末と、前記携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベースと、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を前記携帯端末に配布し、携帯端末を有する各自に対して欲するに通話音声データだけを提供するためのメタデータ作成部とを備えることを特徴とするメタデータ付き通話音声データ提供システムを提供する。
【0011】
さらに、前記メタデータ作成部は、前記データベースに格納された通話音声データを音声認識する音声認識部と、キーワードを格納し、前記音声認識部で音声認識された言語がキーワードと一致する場合、一致する言語をメタデータとする処理を行う言語処理部とを備える。
さらに、発言者判別部を備え、前記発言者判別部は携帯端末からの通話音声データの発言者を判別し、通話音声データを発言者毎に前記データベース毎に格納させ、前記メタデータ作成部は、発言者の通話音声データの先頭にインデックスを付け、発言者の通話音声データに対するメタデータを作成し、前記データベースの領域に格納させ、前記通話音声データのメタデータを前記キーワードのメタデータと共に配布する。
【0012】
さらに、通話音声データを提供するためメタデータの情報を提供する際にパスワードを記載したメールを、通話を行った携帯端末に発行する。
さらに、通話を行った携帯端末以外で予め登録されている複数の関係者の携帯端末に対してパスワードを記載したメールを発行する。
さらに、前記メタデータ作成部は、少なくとも3台の携帯端末間で行う通話に対して、メタデータを作成する。
【0013】
さらに、携帯端末間で行った通話の通話音声データを携帯端末に格納し通話終了後に携帯端末に格納した通話音声データを前記データベースに格納させ、前記メタデータ作成部にメタデータ作成を行わせる。
さらに、本発明は、携帯端末の通話を再現するためのメタデータ付き通話音声データ提供方法において、携帯端末からの通話音声データを格納する工程と、格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出する工程と、検出したキーワードに対してメタデータを作成する工程と、検出されたキーワードが格納されている領域にインデックスを付ける工程と、作成されたメタデータを格納する工程と、通話を行った携帯端末に対してパスワードを記載したメールを発行する工程と、メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布する工程と、携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供する工程とを備えることを特徴とするメタデータ付き通話音声データ提供方法を提供する。
【0014】
さらに、本発明は、携帯端末の通話を再現するためのメタデータ付き通話音声データ提供をコンピュータで実行するプログラムにおいて、携帯端末からの通話音声データを格納する手順と、格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出する手順と、検出したキーワードに対してメタデータを作成する手順と、検出されたキーワードが格納されている領域にインデックスを付ける手順と、作成されたメタデータを格納する手順と、通話を行った携帯端末に対してパスワードを記載したメールを発行する手順と、メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布する手順と、携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供する手順とを備えることを特徴とする、メタデータ付き通話音声データ提供をコンピュータで実行するプログラム。
【0015】
さらに、本発明は、携帯端末間の通話を再現するためのメタデータ付き通話音声データ提供サーバーにおいて、携帯端末からの通話音声データを格納する領域と、通話音声データのメタデータを格納する領域を有するデータベースと、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードに対して前記データベースの領域にインデックスを付け、メタデータを前記データベースの領域に格納させ、前記データベースに格納されたメタデータの情報を前記携帯端末に配布し、携帯端末を有する各自に対して欲するに通話音声データだけを提供するためのメタデータ作成部とを備えることを特徴とするメタデータ付き通話音声データ提供システムサーバーを提供する。
【0016】
さらに、本発明は、サーバーに通話音声データを格納し通話の再現を行う携帯端末において、携帯端末の発呼時に前記サーバーに対して通話音声データ蓄積の許可を行う通話音声データ蓄積許可部と、前記サーバーで、前記携帯端末からの通話音声データを格納し、前記通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードを格納した領域にインデックスを付け、メタデータを格納させ、メタデータを配布するためのパスワードが記載されたメールが携帯端末に対して発行された場合、前記サーバーに対してメタデータの配布を要求するメタデータ配布要求部と、配布されたメタデータを表示する表示部と、前記表示部に表示されたメタデータから通話音声データのメタデータを選択し、欲する通話音声データだけを前記サーバーから取得する通話音声データ取得部とを備えることを特徴とする携帯端末を提供する。
【発明の効果】
【0017】
以上説明したように、本発明によれば、携帯端末からの通話音声データを格納し、格納された通話音声データを音声認識処理しシーンを区分けするキーワードを検出し、検出したキーワードに対してメタデータを作成し、検出されたキーワードが格納されている領域にインデックスを付け、作成されたメタデータを格納し、通話を行った携帯端末に対してパスワードを記載したメールを発行し、メールを受け取った携帯端末から要求に対してメタデータの情報を携帯端末に配布し、携帯端末からのメタデータの選択に対して携帯端末を有する各自に対して欲する通話音声データだけを提供するようにしたので、誰がどのようなシーンで発言をしたのかといった情報を知ることが可能になり、電話での通話音声データを全て聞くことなく、携帯端末を有する各自に対して、欲する通話音声データだけを再現して聞かせることが可能になる。
【発明を実施するための最良の形態】
【0018】
以下、本発明の実施の形態について図面を参照して説明する。
図1は本発明に係るメタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。本図に示すように、メタデータ付き通話音声データ提供システムでは、代表的に、携帯端末ネットワーク200には基地局201、202が接続され、基地局201、202には携帯端末101、102がそれぞれ接続され、さらに、携帯端末ネットワーク200にはメタデータ付通話音声データ提供サーバー300が接続され、携帯端末101、102を有する各自に対して、欲する通話音声データだけを聞かせる機能をコンピュータのプログラムで実行する。
【0019】
メタデータ付通話音声データ提供サーバー300は携帯端末101、102の間にて通話が行われた通話音声データを取得し、取得した通話音声データに対してメタデータを作成し、作成したメタデータを携帯端末101、102に配布し、メタデータを配布された携帯端末101、102を有する各自に対して、メタデータで選択された通話音声データを提供する。
【0020】
詳細には、メタデータ付通話音声データ提供サーバー300には発言者判別部301、データベース302、メタデータ作成部303が設けられ、さらに、データベース302には通話音声データ格納領域302A、メタデータ格納領域302Bが設けられる。
ここに、発言者判別部301は携帯端末ネットワーク200を介して入力する通話音声データを携帯端末101、102の発言者毎に判別する。
【0021】
なお、通話音声データには送信元、送信先のアドレスが付いているので、送信元情報を用いて発言者毎に判別が行われる。
通話音声データ格納領域302Aは、発言者判別部301で判別された通話音声データを分離し、携帯端末101、102毎に格納する。
メタデータ作成部303は、通話音声データ格納領域302Aに格納された通話音声データに対してインデックスを付け、インデックスを付けた通話音声データに対してメタデータを作成し、作成されたメタデータをデータベース302の通話音声データ格納領域302Bに格納する。
【0022】
図2は図1におけるメタデータ付通話音声データ提供サーバー300の発言者判別部301による発言者判断を説明する図である。
発言者判別部301にはメタデータ付通話音声データ提供サーバー300により携帯端末101、102から取得された通話音声データが交互に入力する。
すなわち、入力する通話音声データでは、本図(a)に示すように、携帯端末101の通話音声データ101−1に対して、携帯端末102の通話音声データ102−1が応答し、
通話音声データ102−1に対して携帯端末101の通話音声データ101−2が応答し、
通話音声データ101−2に対して携帯端末102の通話音声データ102−3が応答し、
通話音声データ102−3に対して携帯端末101の通話音声データ101−4が応答し、
通話音声データ101−4に対して携帯端末102の通話音声データ102−5が応答し、
通話音声データ102−5に対して携帯端末101の通話音声データ101−6が応答し、
通話音声データ101−6に対して携帯端末102の通話音声データ102−7が応答し、
通話音声データ102−7に対して携帯端末101の通話音声データ101−8が応答し、
通話音声データ101−8に対して…以下同様に通話が終了するまで続くとする。
【0023】
発言者判別部301は、交互に入力する通話音声データに対して、本図(b)に示すように、携帯端末101の通話音声データ101−1、101−2、…、101−8、…、携帯端末102の通話音声データ102−1、102−2、…、102−8、…、を判別する。
なお、通話音声データは送信元情報で判別されるので、発言者判別部301では携帯端末101、102から同時に通話音声データが入力されても判別は可能である。
【0024】
図3は図1におけるデータベース302の通話音声データ格納領域302Aに格納される通話音声データを示す図である。本図に示すように、通話音声データ格納領域302Aには、発言者判別部301により判別された携帯端末101の通話音声データ101−1〜101−7、…、携帯端末の通話音声データ102−1〜102−7、…が別々に格納される。
【0025】
図4は図1におけるメタデータ作成部303の概略構成を示すブロック図である。本図に示すように、メタデータ作成部303には発言者区分部303Aが設けられ、発言者区分部303Aは通話音声データ格納領域302Aに格納されている携帯端末101、102毎の通話音声データに対してインデックスを付け、インデックスに対して、発言者の通話音声データを区分けするメタデータを作成しデータベース302のメタデータ格納領域302Bに格納する。
【0026】
さらに、メタデータ作成部303にはシーン区分部303Bが設けられ、シーン区分部303Bは通話音声データから特定のキーワードを検出し、検出したキーワードを基に通話音声データに対してシーン分けしデータベース302の通話音声データ格納領域302Aに格納されているキーワードに対してインデックスを付け、検出されたキーワードに対してメタデータを作成しデータベース302のメタデータ格納領域302Bに格納する。
【0027】
詳細には、シーン区分部303Bには音声認識部304、言語処理部305が設けられる。
ここに、音声認識部304はデータベース302の通話音声データ格納領域302Aに格納されている通話音声データを入力し、音声認識の解析を行う。
言語処理部305は予めキーワードを格納し、音声認識部304で音声認識された言語に対して格納されたキーワードと一致する場合、一致した言語をメタデータとする処理を行う。
【0028】
キーワードの一例としては、「今週末はどうする?」、「場所は何処にする?」、「値段はどうする?」、「出発は何時にする?」、「誰にする?」、「色は何色にする?」、「厚さはどうする?」、「長さはどうする?」、「温度はどうする?」、「重さはどうする?」、「高さはどうする?」、「大きさはどうする?」、「幅はどうする?」、「材料はどうする?」がある。
さらに、携帯端末を有する各自により所望のキーワードを追加するようにしてもよい。
【0029】
図5はメタデータ作成部303により通話音声データ格納領域302Aに対して付けるインデックス例を説明する図である。
本図に示すように、メタデータ作成部303の発言者区分部303Aにより、携帯端末101の通話音声データ101−1〜101−8、…の先頭の通話音声データ101−1にはインデックス1が付けられ、携帯端末102の通話音声データ102−1〜102−8、…の先頭の通話音声データ102−1にはインデックス2が付けられる。
【0030】
このインデックス1、2で携帯端末101、102のいずれか一方の通話音声データの選択が可能になる。
さらに、シーン区分部303Bにより、検出されたキーワードにより通話音声データをシーン分けし、キーワードがある通話音声データの位置にインデックスが付けられる。
例えば、携帯端末101の通話音声データ101−3にキーワード1として「今週はどうする?」が検出された場合には、キーワード1に対してインデックス3が付けられる。
【0031】
さらに、携帯端末101の通話音声データ101−5にキーワード2として「場所は何処にする?」が検出された場合には、キーワード2に対してインデックス4が付けられる。
さらに、携帯端末102の通話音声データ102−2にキーワード3として「値段はどうする?」が検出された場合には、キーワード3に対してインデックス5が付けられる。
【0032】
さらに、携帯端末102の通話音声データ102−6にキーワード4として「出発は何時にする?」が検出された場合には、キーワード4に対してインデックス6が付けられる。
図6はメタデータ作成部303で作成されるメタデータの例である。本図に示すように、メタデータ作成部303は、発言者区分について携帯端末101の通話音声データに対するメタデータ、携帯端末101の通話音声データのシーン区分に対してキーワード1、2、…に対するメタデータを作成し、各メタデータに対してインデックス1、3、4、…を付ける。
【0033】
さらに、メタデータ作成部303は、発言者区分について携帯端末102の通話音声データに対するメタデータ、携帯端末102の通話音声データのシーン区分に対してキーワード3、4、…に対するメタデータを作成し、各メタデータに対してインデックス2、5、6、…を付ける。
インデックス1、2でデータベース302の通話音声データ格納領域302Aに格納されている携帯端末101、102の通話音声データの検索が行われ、インデックス3、4、5、6、…で、携帯端末101、102を有する各自に対して、欲する通話音声データだけを検索することを可能にする。
【0034】
図7は図1における携帯端末101、102の各々について本発明に係る概略構成を示すブロック図である。本図に示すように、携帯端末101、102の各々には通話音声データ蓄積許可部111が設けられ、通話音声データ蓄積許可部111は、携帯端末101、102の一方から他方に発呼がある場合、メタデータ付通話音声データ提供サーバー300から相手の電話番号と共に「通話音声データを蓄積します。よろしいですか?」との表示、音声案内が携帯端末101、102の各々に対して行われ、この表示、に対して、携帯端末101、102の各々からメタデータ付通話音声データ提供サーバー300に対して通話音声データ蓄積の許可を行う。
【0035】
さらに、携帯端末101、102の各々にはメタデータ配布要求部112が設けられ、メタデータ配布要求部112は、メタデータ付通話音声データ提供サーバー300から通話音声データの格納、メタデータ作成が終了した場合、メタデータを配布するためのパスワードが記載されたメールが携帯端末101、102に発行され、メタデータ付通話音声データ提供サーバー300に対してメタデータの配布を要求することが可能になる。
【0036】
携帯端末101、102の各々の表示部113にはメタデータ付通話音声データ提供サーバー300から配布されたメタデータが表示される。
携帯端末101、102の各々には通話音声データ取得部114が設けられ、通話音声データ取得部114は、表示部113の表示を参照して、携帯端末101、102のいずれかの通話音声データの取得を選択し、キーワードの選択を行い、通話音声データを取得する。
【0037】
図8は図7の表示部113に表示されるメタデータ例を説明する図である。本図(a)に示すように、携帯端末101の通話音声データ取得選択、携帯端末102の通話音声データ取得選択が表示される。
本図(b)に示すように、通話音声データ取得部114により携帯端末101の通話音声データ取得選択が行われた場合には、キーワード1の選択、キーワード2の選択、…が表示される。
【0038】
本図(c)に示すように、通話音声データ取得部114により携帯端末102の通話音声データ取得選択が行われた場合には、キーワード3の選択、キーワード4の選択、…が表示される。
本図(d)に示すように、通話音声データ取得部114により本図(b)、本図(c)でいずれかのキーワードが選択された場合、再生、中止、巻戻、早送の表示が行われ、通話音声データ取得部114により再生が選択された場合にはキーワードで区分けされた通話音声データの再生が行われる。
【0039】
さらに、通話音声データ取得部114により中止が選択された場合には再生が中止される。
さらに、通話音声データ取得部114により巻戻、早送が選択された場合には再生の調整が可能になる。
図9はメタデータ付通話音声データ提供サーバー300の一連の動作例を説明するフローチャートである。
【0040】
本図に示すように、ステップ401において、メタデータ付通話音声データ提供サーバー300の発言者判別部301では、携帯端末101、102の一方から他方に発呼があると、通話音声データを蓄積するという許可があるか否かを判断する。許可がなければ、又は発呼に対して相手側が電話に出ない場合には、本動作を起動せず、処理を終了する。
ステップ402において、相手側が電話に出て、通話音声データの蓄積の許可があった場合には、基地局201、202を介して、メタデータ付通話音声データ提供サーバー300では携帯端末101、102から通話音声データを取得し、発言者判別部301では、取得された通話音声データに対して、携帯端末101、102のいずれの発言者であるかの判別を行う。
【0041】
ステップ403において、発言者の判別が行われた通話音声データに対して発言者毎に、通話音声データの先頭にインデックスを付けてデータベース302の通話音声データ格納領域302Aに格納する。
ステップ404において、通話音声データ格納領域302Aに格納された発言者毎の通話音声データに対して音声認識の解析を行い、特定されたキーワードを検出し、検出されたキーワードにより通話音声データのシーン区分を行う。
【0042】
ステップ405において、格納された通話音声データで検出されたキーワードにインデックスを付ける。
ステップ406において、通話音声データ格納領域302Aに格納された発言者毎の通話音声データ、検出されたキーワードに対してメタデータを作成し、メタデータ格納領域302Bに格納する。
【0043】
ステップ407において、メタデータ付通話音声データ提供サーバー300から携帯端末101、102の各々に対して、メタデータを配布するためのパスワードが記載されたメールを発行し、メタデータの配布が可能である旨を知らせる。
ステップ408において、携帯端末101、102の各々から選択されたメタデータに基づき発言者、通話音声データの区分けについてメタデータ格納領域302Bを検索し、検索結果として、シーン区分けされた発言者の通話音声データを携帯端末101、102に提供し、処理を終了する。
【0044】
図10は携帯端末101、102の一連の動作を説明するフローチャートである。本図に示すように、ステップ411において、携帯端末101、102の一方から他方に発呼を行う場合に、メタデータ付通話音声データ提供サーバー300に対して、通話音声データ蓄積許可部111により通話音声データの蓄積の許可を行う。
【0045】
ステップ412において、メタデータ付通話音声データ提供サーバー300で発行され、パスワードが記載されたメールを受信したかを判断する。受信しない場合には処理を終了する。
ステップ413において、メールを受信した場合にはメタデータ付通話音声データ提供サーバー300に対して、メタデータ配布要求部112によりメタデータ配布の要求を行う。
【0046】
ステップ414において、メタデータ付通話音声データ提供サーバー300から配布されたメタデータを表示部113に表示し、表示されたメタデータから通話音声データ取得部114により発言者の選択が行われる。
ステップ415において、表示されたメタデータから通話音声データ取得部114により通話音声データに対してシーン区分の選択が行われる。
【0047】
ステップ416において、発言者の選択、シーン区分の選択に応じた通話音声データの取得がOKか否かの判断を行う。別の取得を行う場合にはステップ413に進む。取得がOKならば処理を終了する。
したがって、本発明によれば、メタデータの配布により、誰がどのようなシーンで発言をしたのかといった情報を知ることが可能になり、電話での通話音声データを全て聞くことなく、携帯端末101、102を有する各自に対して、欲する通話音声データだけを再現して聞かせることが可能になる。
【実施例1】
【0048】
好ましくは、通話中、携帯端末101、102内に会話内容の通話情報を格納し、通話終了後に携帯端末101、102からメタデータ付通話音声データ提供サーバー300にアクセスし、メタデータを作成することも可能である。これにより汎用性が増す。
【実施例2】
【0049】
図11は図1の第1の変形例であり、メタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。本図に示すように、図1と比較して、好ましくは、少なくとも3台の携帯端末101、102、103間で通話を行う場合にも本発明の適用が可能である。これにより汎用性が増す。
【実施例3】
【0050】
図12は図1の第2の変形例であり、メタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。本図に示すように、図1と比較して、好ましくは、通話を行った携帯端末101、102以外の関係者が有する複数の携帯端末103、104に対して、メタデータ付通話音声データ提供サーバー300はパスワードを記載したメタデータを配布し、アクセス可能にする。なお、関係者が有する携帯端末の情報がメタデータ付通話音声データ提供サーバー300に登録されているとする。これにより汎用性が増す。
【実施例4】
【0051】
図1のメタデータ付通話音声データ提供サーバー300では、携帯端末101、102の発言者を判別したが、以下のように、発言者を判別せずに、通話音声データに対してシーン区分を行うようにしてもよい。
図13はメタデータ作成部303により通話音声データ格納領域302Aに対して付けるインデックス例を説明する図である。
【0052】
メタデータ付通話音声データ提供サーバー300はデータベース302の通話音声データ格納領域302Aに対して、携帯端末101、102から交互に取得した通話音声データをそのまま格納し、
携帯端末102の通話音声データ102−2にキーワード1として「値段はどうする?」が検出された場合には、キーワード1に対してインデックス1が付けられる。
【0053】
さらに、携帯端末101の通話音声データ101−3にキーワード2として「今週はどうする?」が検出された場合には、キーワード2に対してインデックス2が付けられる。
さらに、携帯端末101の通話音声データ101−5にキーワード3として「場所は何処にする?」が検出された場合には、キーワード3に対してインデックス3が付けられる。
【0054】
さらに、携帯端末102の通話音声データ102−6にキーワード4として「出発は何時にする?」が検出された場合には、キーワード4に対してインデックス4が付けられる。
メタデータ付通話音声データ提供サーバー300によるメタデータの作成、配布、携帯端末101、102によるメタデータの表示、選択の説明は前述と同様であるので省略する。
【0055】
このようにして、発言者を判別する必要がなく、欲する情報だけを知りたい場合には有利となり、汎用性が増す。
【産業上の利用可能性】
【0056】
以上、携帯端末について説明を行ったが、これに限らず、携帯電話機、PHS(簡易携帯電話機)、PDA(携帯情報端末)、固定電話機、IP(Internet Protocol)電話機にも利用可能である。
【図面の簡単な説明】
【0057】
【図1】本発明に係るメタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。
【図2】図1におけるメタデータ付通話音声データ提供サーバー300の発言者判別部301による発言者判断を説明する図である。
【図3】図1におけるデータベース302の通話音声データ格納領域302Aに格納される通話音声データを示す図である。
【図4】図1におけるメタデータ作成部303の概略構成を示すブロック図である。
【図5】メタデータ作成部303により通話音声データ格納領域302Aに対して付けるインデックス例を説明する図である。
【図6】メタデータ作成部303で作成されるメタデータの例である。
【図7】図1における携帯端末101、102の各々について本発明に係る概略構成を示すブロック図である。
【図8】図7の表示部113に表示されるメタデータ例を説明する図である。
【図9】メタデータ付通話音声データ提供サーバー300の一連の動作例を説明するフローチャートである。
【図10】携帯端末101、102の一連の動作を説明するフローチャートである。
【図11】図1の第1の変形例であり、メタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。
【図12】図1の第2の変形例であり、メタデータ付き通話音声データ提供システムの概略構成を示すブロック図である。
【図13】メタデータ作成部303により通話音声データ格納領域302Aに対して付けるインデックス例を説明する図である。
【符号の説明】
【0058】
101、102、103、104…携帯端末
111…通話音声データ蓄積許可部
112…メタデータ配布要求部
113…表示部
114…通話音声データ取得部
200…携帯端末ネットワーク
201、202、203、204…基地局
300…メタデータ付通話音声データ提供サーバー
301…発言者判別部
302…データベース
302A…通話音声データ格納領域
302B…メタデータ格納領域
303…メタデータ作成部
303A…発言者区分部
303B…シーン区分部
304…音声認識部
305…言語処理部




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013