米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 埼玉日本電気株式会社

発明の名称 携帯端末における受信音声情報から文字画像情報への変換方法及び該変換方法を実行する機能を有する携帯端末
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2003−274004(P2003−274004A)
公開日 平成15年9月26日(2003.9.26)
出願番号 特願2002−72515(P2002−72515)
出願日 平成14年3月15日(2002.3.15)
代理人 【識別番号】100099830
【弁理士】
【氏名又は名称】西村 征生
【テーマコード(参考)】
5D015
5K027
5K039
5K067
【Fターム(参考)】
5D015 KK02 LL05 LL10 
5K027 AA11 BB01 CC08 FF01 FF22 HH20 MM17
5K039 BB04 EE01 JJ09
5K067 AA21 BB04 BB21 DD51 EE02 FF02 FF23 FF31 GG11
発明者 代田 博文
要約 課題
周囲の人に不快感を与えることなく、さらに周囲の人に気兼ねすることなく、確実に伝言内容を確認する。

解決手段
制御部は、着信有りを検知した時は、発信者に伝言を促す旨の応答メッセージを無線送信部を介して送信する。次に、制御部は、発信者が伝言を送っているか否かを調べ、伝言を送っている場合は、一旦、伝言内容を記憶部に記憶させた後、音声認識部に音声認識処理を行わせる。制御部は、音声認識部から認識結果を受け取ると、一旦、記憶部に記憶させ、伝言メモが残されている旨のメッセージを、主表示部9に表示させる。次に、制御部は、このメッセージを確認したユーザが所定の再生操作を行うと、伝言メモの認識結果を、主表示部9に表示させる。
特許請求の範囲
【請求項1】 通話機能を有する携帯端末において受信した音声情報を対応する文字画像情報に変換する方法であって、受信した音声情報を記憶する音声情報記憶ステップと、所定の音声情報を対応付けられた文字画像情報に変換して出力する文字画像情報出力ステップとを含むことを特徴とする携帯端末における受信音声情報から文字画像情報への変換方法。
【請求項2】 前記文字画像情報出力ステップは、前記音声情報記憶ステップが実行された後であって、前記音声情報記憶ステップの実行によって記憶された記憶内容の再生操作が行われる前に実行されることを特徴とする請求項1記載の携帯端末における受信音声情報から文字画像情報への変換方法。
【請求項3】 前記文字画像情報出力ステップは、前記音声情報記憶ステップの実行によって記憶された記憶内容の再生操作が行われた後に実行されることを特徴とする請求項1記載の携帯端末における受信音声情報から文字画像情報への変換方法。
【請求項4】 前記文字画像情報出力ステップで出力された文字画像情報を表示手段に表示する表示制御ステップを含むことを特徴とする請求項1、2又は3記載の携帯端末における受信音声情報から文字画像情報への変換方法。
【請求項5】 前記携帯端末は、折畳可能な筐体を備えると共に、前記表示手段は、折畳時に内側となる側に配設されていることを特徴とする請求項4記載の携帯端末における受信音声情報から文字画像情報への変換方法。
【請求項6】 前記携帯端末は、折畳可能な筐体を備えると共に、前記表示手段は、折畳時に外側となる側に配設されていることを特徴とする請求項4記載の携帯端末における受信音声情報から文字画像情報への変換方法。
【請求項7】 前記文字画像情報出力ステップで出力された文字画像情報を引用して所定の文章作成の編集を行う引用ステップを含むことを特徴とする請求項1乃至6のいずれか1に記載の携帯端末における受信音声情報から文字画像情報への変換方法。
【請求項8】 前記文字画像情報出力ステップでは、不特定話者音声認識を行うことを特徴とする請求項1乃至7のいずれか1に記載の携帯端末における受信音声情報から文字画像情報への変換方法。
【請求項9】 音声情報を受信した後に発信者を識別して発信者情報を得る発信者識別ステップを含み、前記文字画像情報出力ステップでは、前記発信者情報に基づいて、特定話者音声認識を行うことを特徴とする請求項1乃至7のいずれか1に記載の携帯端末における受信音声情報から文字画像情報への変換方法。
【請求項10】 音声情報を受信する通信手段と、受信した音声情報を対応する文字画像情報に変換する変換手段とを備えた携帯端末であって、前記変換手段は、受信した前記音声情報を記憶する記憶手段と、所定の音声情報を対応付けられた文字画像情報に変換して出力する文字画像情報出力手段とを有することを特徴とする受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末。
【請求項11】 前記文字画像情報出力手段から出力された文字画像情報を表示手段に表示する表示制御手段を備えたことを特徴とする請求項10記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末。
【請求項12】 折畳可能な筐体を備えると共に、前記表示手段は、折畳時に内側となる側に配設されていることを特徴とする請求項11記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末。
【請求項13】 折畳可能な筐体を備えると共に、前記表示手段は、折畳時に外側となる側に配設されていることを特徴とする請求項11記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末。
【請求項14】 前記文字画像情報出力手段から出力された文字画像情報を引用して所定の文章作成の編集を行うための引用手段を備えたことを特徴とする請求項10乃至13のいずれか1に記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末。
【請求項15】 前記文字画像情報出力手段は、不特定話者音声認識を行うことを特徴とする請求項10乃至14のいずれか1に記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末。
【請求項16】 前記音声情報を発信した発信者を識別して発信者情報を得る発信者識別手段を備え、前記文字画像情報出力手段は、前記発信者情報に基づいて、特定話者音声認識を行うことを特徴とする請求項10乃至14のいずれか1に記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末。
発明の詳細な説明
【0001】
【発明の属する技術分野】この発明は、通話機能を有する携帯端末における受信音声情報から文字画像情報への変換方法及び該変換方法を実行する機能を有する携帯端末に関する。
【0002】
【従来の技術】従来より、携帯電話機には、例えば、着信時にユーザが電話に出ることができない場合に、発信者からの用件を伝言メモとして録音する機能が備えられている。このような機能を有する例えば折畳型の携帯電話機101には、図20に示すように、携帯電話機本体の構成各部を制御する制御部102と、制御部102が実行する処理プログラムや、電話帳情報、伝言メモ内容、着信履歴情報等の各種データ等を記憶するための記憶部103と、無線電波の送受信を行うアンテナ104と、音声やデータを変調してアンテナ105を介して無線電波として送信すると共に、無線電波をアンテナ105を介して受信して音声やデータに復調し、所定のプロトコルに従って通話やデータ通信を行うために用いられる無線通信部106と、各種操作キー等からなる操作部107と、例えば液晶表示装置からなる表示部108と、着信を通知するためのLEDからなる着信通知ランプ109と、着信通知ランプ109を構成する各LEDを駆動するためのLED駆動部110と、着信通知用の楽曲を出力するリンガー発生器111と、リンガー発生器111を駆動するためのリンガー駆動部112と、受話音声を出力するスピーカ113と、送話音声を入力するマイクロフォン114とを備えている。
【0003】ユーザは、予め伝言メモの設定を行い、着信時に発信者に伝言を促す旨の応答メッセージが送信され、発信者のメッセージの送信によって伝言メモが録音されるようにしておく。制御部102は、着信の有無を監視し、着信有りを検知した時は、発信者に伝言を促す旨の応答メッセージを無線送信部106を介して送信する。次に、制御部102は、発信者が伝言を送っているか否かを調べ、伝言を送っている場合は、一旦、伝言メモ内容を記憶部103に記憶させる。制御部102は、伝言メモが残されている旨のメッセージを、表示部108に表示させる。次に、制御部102は、ユーザによって再生操作が行われか否か監視し、このメッセージを確認したユーザが所定の再生操作を行うと、伝言メモの内容を、スピーカ113から出力させる。
【0004】
【発明が解決しようとする課題】しかしながら、上記従来の携帯電話機では、伝言メモの再生時に、スピーカ113から出力される再生音が周囲の人にとっては騒音と感じられ、不快感を与えてしまうという問題があった。また、特にユーザが急いで再生したい場合で、かつ周囲の人に対して内容を秘密としたいときに、再生ができずに不便を感じるという問題があった。
【0005】この発明は、上述の事情に鑑みてなされたもので、周囲の人に不快感を与えることなく、さらに周囲の人に気兼ねすることなく、確実に再生内容を確認することができる携帯端末における受信音声情報から文字画像情報への変換方法及び該変換方法を実行する機能を有する携帯端末を提供することを目的としている。
【0006】
【課題を解決するための手段】上記課題を解決するために、請求項1記載の発明は、通話機能を有する携帯端末において受信した音声情報を対応する文字画像情報に変換する方法に係り、受信した音声情報を記憶する音声情報記憶ステップと、所定の音声情報を対応付けられた文字画像情報に変換して出力する文字画像情報出力ステップとを含むことを特徴としている。
【0007】請求項2記載の発明は、請求項1記載の携帯端末における受信音声情報から文字画像情報への変換方法に係り、上記文字画像情報出力ステップは、上記音声情報記憶ステップが実行された後であって、上記音声情報記憶ステップの実行によって記憶された記憶内容の再生操作が行われる前に実行されることを特徴としている。
【0008】請求項3記載の発明は、請求項1記載の携帯端末における受信音声情報から文字画像情報への変換方法に係り、上記文字画像情報出力ステップは、上記音声情報記憶ステップの実行によって記憶された記憶内容の再生操作が行われた後に実行されることを特徴としている。
【0009】請求項4記載の発明は、請求項1、2又は3記載の携帯端末における受信音声情報から文字画像情報への変換方法に係り、上記文字画像情報出力ステップで出力された文字画像情報を表示手段に表示する表示制御ステップを含むことを特徴としている。
【0010】請求項5記載の発明は、請求項4記載の携帯端末における受信音声情報から文字画像情報への変換方法に係り、上記携帯端末は、折畳可能な筐体を備えると共に、上記表示手段は、折畳時に内側となる側に配設されていることを特徴としている。
【0011】請求項6記載の発明は、請求項4記載の携帯端末における受信音声情報から文字画像情報への変換方法に係り、上記携帯端末は、折畳可能な筐体を備えると共に、上記表示手段は、折畳時に外側となる側に配設されていることを特徴としている。
【0012】請求項7記載の発明は、請求項1乃至6のいずれか1に記載の携帯端末における受信音声情報から文字画像情報への変換方法に係り、上記文字画像情報出力ステップで出力された文字画像情報を引用して所定の文章作成の編集を行う引用ステップを含むことを特徴としている。
【0013】請求項8記載の発明は、請求項1乃至7のいずれか1に記載の携帯端末における受信音声情報から文字画像情報への変換方法に係り、上記文字画像情報出力ステップでは、不特定話者音声認識を行うことを特徴としている。
【0014】請求項9記載の発明は、請求項1乃至7のいずれか1に記載の携帯端末における受信音声情報から文字画像情報への変換方法に係り、音声情報を受信した後に発信者を識別して発信者情報を得る発信者識別ステップを含み、上記文字画像情報出力ステップでは、上記発信者情報に基づいて、特定話者音声認識を行うことを特徴としている。
【0015】請求項10記載の発明に係る受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末は、音声情報を受信する通信手段と、受信した音声情報を対応する文字画像情報に変換する変換手段とを備え、上記変換手段は、受信した上記音声情報を記憶する記憶手段と、所定の音声情報を対応付けられた文字画像情報に変換して出力する文字画像情報出力手段とを有することを特徴としている。
【0016】請求項11記載の発明は、請求項10記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末に係り、上記文字画像情報出力手段から出力された文字画像情報を表示手段に表示する表示制御手段を備えたことを特徴としている。
【0017】請求項12記載の発明は、請求項11記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末に係り、折畳可能な筐体を備えると共に、上記表示手段は、折畳時に内側となる側に配設されていることを特徴としている。
【0018】請求項13記載の発明は、請求項11記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末に係り、折畳可能な筐体を備えると共に、上記表示手段は、折畳時に外側となる側に配設されていることを特徴としている。
【0019】請求項14記載の発明は、請求項10乃至13のいずれか1に記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末に係り、上記文字画像情報出力手段から出力された文字画像情報を引用して所定の文章作成の編集を行うための引用手段を備えたことを特徴としている。
【0020】請求項15記載の発明は、請求項10乃至14のいずれか1に記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末に係り、上記文字画像情報出力手段は、不特定話者音声認識を行うことを特徴としている。
【0021】請求項16記載の発明は、請求項10乃至14のいずれか1に記載の受信音声情報から文字画像情報への変換方法を実行する機能を有する携帯端末に係り、上記音声情報を発信した発信者を識別して発信者情報を得る発信者識別手段を備え、上記文字画像情報出力手段は、上記発信者情報に基づいて、特定話者音声認識を行うことを特徴としている。
【0022】
【発明の実施の形態】以下、図面を参照して、この発明の実施の形態について説明する。説明は、実施例を用いて具体的に行う。
◇第1実施例図1は、この発明の第1実施例である折畳型の携帯電話機の構成を示す斜視図であって、同携帯電話機の筐体が開いた状態を正面側から見た図、図2は、同携帯電話機の構成を示す斜視図であって、同携帯電話機の筐体が開いた状態を背面側から見た図、図3は、同携帯電話機の構成を示す斜視図であって、同携帯電話機の筐体が閉じた状態を示す図、図4は、同携帯電話機の構成を示すブロック図、図5は、同携帯電話機の音声認識部の構成を示すブロック図、図6は、同携帯電話機の動作を説明するためのフローチャート、また、図7乃至図10は、同携帯電話機の主表示部の画面表示例を示す図である。
【0023】この例の携帯電話機1は、図1乃至図3に示すように、折畳可能な筐体2を備えると共に、本来の通話機能に加えて、例えばインターネットに接続してホームページの閲覧や電子メールの送受信が可能なデータ通信機能とを有し、図1乃至図4に示すように、当該携帯電話機本体の構成各部を制御する制御部(変換手段の一部、引用手段、表示制御手段)と、制御部3が実行する処理プログラムや、電話帳情報、伝言メモ内容、着信履歴情報等の各種データ等を記憶するための記憶部(変換手段の一部、記憶手段)4と、無線電波の送受信を行うアンテナ5と、音声やデータを変調してアンテナ5を介して無線電波として送信すると共に、無線電波をアンテナ5を介して受信して音声やデータに復調し、所定のプロトコルに従って通話やデータ通信を行うために用いられる無線通信部(通信手段)6と、受信した不特定話者の音声情報を例えば文字情報に変換する音声認識部(変換手段の一部、文字画像情報出力手段)7と、各種操作キー等からなる操作部8と、折畳時に内側となる側に配設され液晶表示装置からなる主表示部(表示手段)9と、折畳時に外側となる側に配設され液晶表示装置からなる補助表示部11と、着信を通知するためのLEDからなる着信通知ランプ12と、着信通知ランプ12を構成する各LEDを駆動するためのLED駆動部13と、着信音を出力するリンガー発生器14と、リンガー発生器14を駆動するためのリンガー駆動部15と、受話音声を出力するスピーカ16と、送話音声を入力するマイクロフォン17と、バッテリパック等からなる電源部18とを備えている。
【0024】筐体2は、ヒンジ部19で相互に結合された上側筐体21と下側筐体22とからなり、ヒンジ部19は、上側筐体21と下側筐体22とを回動自在に結合して当該携帯電話機1に折畳可能な構造を付与している。制御部3は、主表示部9や補助表示部11を制御するための音声認識制御プログラムや、ホームページを閲覧するためのプログラムとしてのブラウザ、電子メールを作成したり送受信するためのプログラムとしてのメーラ等の記憶部4に記憶された各種処理プログラムを実行し、記憶部4に確保された各種レジスタやフラグを用いて、構成各部を制御し、音声認識制御処理等を行う。
【0025】記憶部4は、ROM、RAM等の半導体メモリからなり、制御部3が実行する音声認識制御プログラム等の各種処理プログラムが記憶されたプログラム記憶部と、各種情報等が記憶された情報記憶部とを有すると共に、制御部3がプログラム実行時に用いる各種レジスタやフラグが確保されている。例えば、音声認識制御プログラムには、着信し伝言メモが録音された後に、音声認識部に音声認識処理を行わせ、所定の再生操作によって認識結果を表示部に表示させるための手順が記述されている。情報記憶部には、氏名、電話番号、電子メールアドレス等が記憶された個人情報記憶領域と、受信音声情報格納領域とが設けられている。個人情報記憶領域には、電話帳情報としての氏名、電話番号、電子メールアドレス等が記憶されている。
【0026】音声認識部7は、音声の短時間スペクトルを求める音響分析処理部23と、各単語毎に多数話者のスペクトル系列を分類(クラスタ化)して、各クラスタの中心の又は各クラスタに属する音声の平均のスペクトル系列を求める分類処理部24と、分類処理部24で得られたスペクトル系列を標準パターンとして蓄積する標準パターン蓄積部25と、入力音声と標準パターンとのマッチングを行って類似度を計算し最も類似度の高い標準パターンの単語を認識結果として出力する単語識処理部26とを有している。音響分析処理部23は、高域強調処理の後、音声の短時間スペクトルを例えば10[ms]〜20[ms]毎に求める。スペクトル分析には、例えば通常15〜20個の帯域フィルタ群や8〜12次の線形予測モデルが用いられる。スペクトル距離尺度としては、帯域フィルタ分析の場合は、フィルタ出力の特徴ベクトル間のユークリッド距離、線形予測分析の場合は、各種のLPCスペクトル距離尺度が用いられる。
【0027】単語識処理部26は、発生速度の変動に対処するために、入力音声と標準パターンの時間軸を非線形に伸縮させてマッチングし、対応する短時間スペクトル間の距離を単語全体に亘って累積し、累積距離が最小となる標準パターンの単語名を出力する。上記累積距離の計算を効率的に実行するために、動的計画法(DP:DynamicProgramming)の手法を導入したDPマッチング法が広く用いられる。単語認識処理部26は、未知入力音声に対しては、全単語の全標準パターンと、例えばDPマッチングを行って、類似度としての距離を計算し、最も類似度の高い標準パターンの単語を認識結果として出力する。
【0028】操作部8は、下側筐体22の折畳時に内側となる面に、ブラウザを起動させてホームページを閲覧するためのブラウザモード選択キー8a、操作を決定するために用いられる決定キー8b、操作メニューを表示させるためのメニューキー8c、文字入力モードを切り換えるための入力モード切換キー8d、主表示部9に表示された表示画面上のカーソルを上下左右方向へ移動させるためのカーソルキー8e、電話帳を登録したり検索するための電話帳キー8f、音声通話を行うために用いる通話開始キー8g、操作を1つ前の状態へ戻すクリアキー8h、電源の入切りを行ったり各種操作を中止するために用いられる電源キー8i、数字等を入力するためのテンキー8j等が、配列されてなっている。
【0029】主表示部9は、上側筐体21の折畳時に内側となる面に配設され例えば透過型の液晶表示装置からなっている。液晶表示装置は、液晶パネルと、液晶パネルの後方に配置されたバックライトとを有している。液晶パネルは、例えばTFT方式パネルであり、TFTと透明画素電極とが多数形成されているTFT基板と、TFT基板と数[μm]の間隙を介して対向して固定され、着色層(カラーフィルタ)が形成された対向基板と、上記間隙に封入された液晶層と、TFT基板、対向基板の外側に配設された一対の偏向板とを有している。補助表示部11は、上側筐体21の折畳時に外側となる面の中央部に配設され、例えば透過型の液晶表示装置からなり、現在時刻や着信通知等の表示がなされる。 補助表示部11の液晶表示装置は、上述した主表示部9の液晶表示装置と略同一の構成とされている。
【0030】次に、図6乃至図10を参照して、この例の携帯電話機1の動作について説明する。まず、予め伝言メモの設定を行っておく。電源投入後、制御部3は、ユーザによる入力操作や着信を待機する待受モードに入り、主表示部9には待受画面を表示させる。ユーザがメニューキー8cを押下した後、カーソルキー8e等を押下して所定の操作を行うと、制御部3は、図7に示すように、主表示部9に伝言メモ設定画面を表示させる。ここで、ユーザが「オン」を選択操作すると、着信時に発信者に伝言を促す旨の応答メッセージが送信されることとなる。さらに、ここで、伝言メモ内容を表示させるための設定を行う。
【0031】また、標準パターン蓄積部25には、予め、個人による音質の変動を代表するような多数の標準パターンが例えば単語毎に用意され蓄積されている。すなわち、音響分析処理部23に話者の音声が入力されると、音響分析処理部23は、音声の短時間スペクトルを求め、分類処理部24は、各単語毎に多数話者のスペクトル系列を分類(クラスタ化)して、各クラスタの中心の又は各クラスタに属する音声の平均のスペクトル系列を求める。標準パターン蓄積部25は、分類処理部24で得られたスペクトル系列を標準パターンとして蓄積する。この例では、これらの標準パターンは、工場出荷時には、標準パターン蓄積部25に格納されている。
【0032】この例では、携帯電話機1は、ユーザが操作部8を用いて所定の設定操作を行うことによって、音を消すマナーモードに切り換わった状態で用いられる。制御部3は、着信の有無を監視し(ステップST11(図6))、着信有りを検知した時は、発信者に伝言を促す旨の応答メッセージを無線送信部6を介して送信する。次に、制御部3は、発信者が伝言を送っているか否かを調べ(ステップST12)、発信者が例えば「明日の10時に駅前のハンバーガショップで待っています。」といった内容の伝言を送っている場合は、一旦、この伝言内容を記憶部4に記憶させ(ステップST13)、この後、音声認識部7に音声認識処理を行わせる(ステップST14)。なお、ここで、制御部3は、現在録音中である旨のメッセージの表示を、図8に示すように、主表示部9に行わせる。
【0033】音声認識部7では、まず、音響分析処理部23が、記憶部4から読み出された伝言内容の音声情報の短時間スペクトルを求める。次に、単語識処理部26が、入力音声と標準パターン蓄積部25に蓄積されている標準パターンとのマッチングを行って類似度を計算し最も類似度の高い標準パターンの単語を認識結果として出力する。制御部3は、音声認識部7から認識結果を受け取ると、一旦、記憶部4に記憶させ、伝言メモが残されている旨のメッセージを、図9に示すように、主表示部9に表示させる。次に、制御部3は、再生操作が行われか否か監視し(ステップST15)、このメッセージを確認したユーザが所定の再生操作を行うと、伝言メモの認識結果を、図10に示すように、主表示部9に表示させる(ステップST16)。
【0034】このように、この例の構成によれば、録音された伝言メモの内容を音声認識して主表示部に表示させるので、マナーモード等を選択して音を消すことによって、周囲の人に不快感を与えることなく、さらに周囲の人に気兼ねすることなく、主表示部9に表示された再生内容を確認することができる。特に、聴覚障害者にとっても、再生内容を容易に確認することができる。また、視覚によって再生内容を知ることができるので、聴覚によるよりも伝言内容を確実に認識することができ、利便性を向上させることができる。また、音声情報に代えて文字情報を記憶部4に記憶させることによって、記憶部4のメモリ容量を節約し、メモリ資源を有効利用することができる。
【0035】◇第2実施例図11は、この発明の第2実施例である折畳型の携帯電話機の動作を説明するためのフローチャートである。この例が上述した第1実施例と大きく異なるところは、音声認識処理をユーザによる再生操作の後に行うように構成した点である。これ以外の構成は、上述した第1実施例と略同一であるので、その説明を省略する。
【0036】次に、図11を参照して、この例の携帯電話機1の動作について説明する。この例でも、予め伝言メモの設定を行っておく。また、標準パターン蓄積部25には、予め、個人による音質の変動を代表するような多数の標準パターンが例えば単語毎に用意され蓄積されている。制御部3は、着信の有無を監視し(ステップST21(図11))、着信有りを検知した時は、発信者に伝言を促す旨の応答メッセージを無線送信部6を介して送信する。次に、制御部3は、発信者が伝言を送っているか否かを調べ(ステップST22)、伝言を送っている場合は、一旦、伝言内容を記憶部4に記憶させる(ステップST23)。次に、制御部3は、再生操作が行われか否か監視し(ステップST24)、ユーザが所定の再生操作を行うと、音声認識部7に音声認識処理を行わせる(ステップST25)。制御部3は、音声認識部7から認識結果を受け取ると、記憶部4に記憶させると共に、伝言メモの認識結果を、主表示部9に表示させる(ステップST26)。
【0037】この例の構成によれば、第1実施例で述べたのと略同一の効果を得ることができる。加えて、ユーザの再生操作後に音声認識を行わせるので、ユーザの都合に応じて音声認識を行わせることができる。例えば、ユーザにとって伝言メモを文字で確認する必要がなくなったときは、伝言内容表示の設定を解除して、音声で確認することができるので、無用な処理を行わなくても良い。
【0038】◇第3実施例図12乃至図16は、この発明の第3実施例である折畳型の携帯電話機の主表示部の画面表示例を示す図である。この例が上述した第1実施例と大きく異なるところは、音声認識結果としての文字情報を電子メール本文に引用可能なように構成した点である。これ以外の構成は、上述した第1実施例と略同一であるので、その説明を簡略にする。この例の携帯電話機では、記憶部4のプログラム記憶部には、制御部3が実行する表示制御プログラムが記憶されている。この表示制御プログラムには、所定の操作によって電子メール画面と伝言メモ表示画面とを分割表示するための手順と、伝言メモ表示画面の範囲指定された複写内容を電子メール画面上の指定された複写位置に複写して表示する手順とが記述されている。
【0039】次に、図12乃至図16を参照して、この例の携帯電話機1の動作について説明する。この例では、制御部3は、音声認識の認識結果の伝言メモを主表示部9に表示させた場合には、図12に示すように、伝言メモの内容と同時に、伝言メモ表示画面上の複写箇所を指定するための複写キー9aと、複写箇所を確定するための選択キー9bと、例えば電子メール画面へ移動するための移動キー9cとを表示させる。ユーザが、表示された伝言メモの内容を確認し、例えば、その内容が緊急性が高く、かつ、他の者に伝達する必要があると判断し、電子メールを新規に作成しようとしたときは、メニューキー8cを押下した後、カーソルキー8e等を押下して所定の操作を行う。
【0040】これにより、制御部3は、図13に示すように、主表示部9にサブメニュー画面を表示させる。ユーザがカーソルキー8eによってカーソルの表示位置を移動させて、「新規メール作成」を選択すると、制御部3は、図14に示すように、主表示部9に新規メール入力画面を表示させる。ユーザは題名及び宛先を入力した後、制御部3は、図15に示すように、本文入力画面を主表示部9に表示させる。制御部3は、同図に示すように、本文入力画面には、入力された本文と共に、本文入力画面上の複写先を指定するための複写キー9dと、複写先を確定するための選択キー9eと例えば伝言メモ表示画面へ移動するための移動キー9fと、本文入力画面と伝言メモ表示画面とを分割表示するための画面分割キー9gと、送信キー9hと、保存キー9iとを主表示部9に表示させる。ここで、ユーザが画面分割キー9gを選択すると、制御部3は、図16に示すように、主表示部に、本文入力画面と伝言メモ表示画面とを分割表示させる。ユーザは、伝言メモ表示画面上で、複写キー9aを選択した後、所定の表示領域をカーソルキー8iを用いて複写範囲を範囲指定し、選択キー9bによって確定する。次に、ユーザが、本文入力画面上で、複写先の位置を指定し、選択キー9eを選択すると、複写内容が複写される。この後、送信キー9iの選択によって、本文の内容が送信される。
【0041】この例の構成によれば、第1実施例で述べたのと略同一の効果を得ることができる。加えて、伝言メモの内容を、例えば電子メールの本文中にこのまま複写して引用して本文を編集することができるので、電子メールの本文を正確にかつ迅速に作成することができる。
【0042】◇第4実施例図17は、この発明の第4実施例である折畳型の携帯電話機の音声認識部の構成を示すブロック図、また、図18は、同携帯電話機の動作を説明するためのフローチャートである。この例が上述した第1実施例と大きく異なるところは、発信者を識別して発信者情報を得て、音声認識部は、この発信者情報に基づいて、特定話者音声認識を行うように構成した点である。これ以外の構成は、上述した第1実施例と略同一であるので、その説明を簡略にする。
【0043】この例の携帯電話機では、記憶部4のプログラム記憶部には、制御部3が実行する音声認識制御プログラムが記憶されている。この例の音声認識制御プログラムには、着信し伝言メモが録音された後に、発信者が予め設定された音声認識対象者か否かを判断し、音声認識対象の者である場合に、音声認識部に特定話者音声認識処理を行わせ、所定の再生操作によって認識結果を表示部に表示させるための手順が記述されている。また、記憶部4の情報記憶部の個人情報記憶領域には、音声認識対象者の欄に、音声認識対象者である旨の標識が付されている。また、この例では、音声認識部7Aは、図17に示すように、音声の短時間スペクトルを求める音響分析処理部31と、単語音声の短時間スペクトルの時系列を標準パターンとして蓄積する標準パターン蓄積部32と、特定話者の入力音声の短時間スペクトルの時系列と標準パターンとのマッチング(例えばDPマッチング)を行って直接類似度を計算して認識結果を出力する単語識処理部33とを有している。
【0044】次に、図18を参照して、この例の携帯電話機1の動作について説明する。まず、予め音声認識対象者の設定を行っておく。例えば、比較的頻繁に通話を行う特定の者を音声認識対象者として登録しておき、この音声認識対象者から着信があった場合に、伝言メモの内容に対して音声認識処理が実行されるようにしておく。また、音声認識部7Aには特定話者としての音声認識対象者の学習用音声を入力し、標準パターンを登録しておく。この例では、音声認識対象者を変更する場合は、標準パターンの更新を行う。次に、第1実施例で行った方法で、伝言メモの設定を行っておく。
【0045】制御部3は、着信の有無を監視し(ステップST31(図18))、着信有りを検知した時は、発信者に伝言を促す旨の応答メッセージを無線送信部6を介して送信する。次に、制御部3は、発信者が伝言を送っているか否かを調べ(ステップST32)、伝言を送っている場合は、一旦、伝言内容を記憶部4に記憶させる(ステップST33)。次に、制御部3は、発信者の電話番号に基づいて、記憶部4の電話帳情報を調べ、当該発信者が音声認識対象者か否かを判断し(ステップST34)、発信者が音声認識対象者である場合は、ステップST35へ進む。ステップST35では、制御部3は、音声認識部7に音声認識処理を行わせる。次に、制御部3は、再生操作が行われか否か監視し(ステップST36)、伝言有りのメッセージを確認したユーザが所定の再生操作を行うと、伝言メモの認識結果を、主表示部9に表示させる(ステップST37)。一方、ステップST34で、制御部3が、発信者が音声認識対象者ではないと判断した場合は、ステップST38へ進み、再生操作が行われか否か監視し、伝言有りのメッセージを確認したユーザが所定の再生操作を行うと、伝言メモの内容を音声出力させる(ステップST39)。
【0046】この例の構成によれば、第1実施例で述べたのと略同一の効果を得ることができる。加えて、音声認識部の構成を簡略化しコストを低減することができる。
【0047】以上、この発明の実施例を図面を参照して詳述してきたが、具体的な構成はこの実施例に限られるものではなく、この発明の要旨を逸脱しない範囲の設計の変更等があってもこの発明に含まれる。例えば、上述した実施例では、携帯端末として、携帯電話機を用いる場合について述べたが、携帯電話機に限らず、例えば、簡易型携帯電話(PHS)端末でも、無線通信機能を有した携帯情報端末(PDA)でも、さらにテレビ電話機でも良く、携帯電話機の場合と略同一の効果を得ることができる。また、携帯電話機の場合は、必ずしも折畳可能な携帯電話機でなくても良い。、また、携帯電話機1をマナーモード等を選択して音を消した状態で用いる場合について述べたが、もちらん、伝言内容を表示するのと同時に音声を出力しても良い。これによって、一段と確実に伝言内容を認識することができる。
【0048】また、主表示部9に限らず、補助表示部11に伝言メモの内容を表示させるようにしても良い。また、第1実施例では、不特定多数の話者の音声を認識するために、複数の標準パターンを用いる場合について述べたが、平均的特徴を用いる方法によっても良い。また、標準パターンとして、単語音声の短時間スペクトルの時系列そのものではなく、音素の短時間スペクトルを登録し、音素認識結果と単語辞書の音素記号系列との間で単語の類似度を計算するようにしても良い。音素の標準パターンに代えて、音節、半音節、VCV音節等の標準パターンを用いるようにしても良い。
【0049】また、例えば、音声認識結果を、漢字に変換せずにカタカナで出力するようにしても良い。また、音声認識結果を、視覚化情報として、文字に限らず、例えば手話等の動作を動画によって、表示するようにしても良い。また、受信した音声情報に限らず、ユーザ自身が音声を録音して例えば文字情報に変換して電子メール本文に引用して使用しても良い。この際、図19に示すように待受中音声メモ画面を表示させて自分自身の音声の録音を行う。これによって、電子メールを迅速にかつ簡単に作成することができる。また、第3実施例で、電子メール画面と伝言メモ表示画面とで画面を分割して表示する場合について述べたが、割り込み画面としても良いし、切り換えて別々に全画面を表示させるようにしても良い。
【0050】また、主表示部及び補助表示部を、透過型の液晶表示装置を用いて構成する場合について述べたが、反射型の液晶表示装置を用いて構成するようにしても良い。この場合、照明装置としては、バックライトに代えて、フロントライトを用いる。また、照明装置の光源は、LEDに限らず、例えば蛍光灯でも良い。また、主表示部及び補助表示部を、透過型の液晶表示装置を用いて構成する場合について述べたが、反射型の液晶表示装置を用いて構成するようにしても良い。この場合、照明装置としては、バックライトに代えて、フロントライトを用いる。主表示部や補助表示部として液晶表示素子から構成したものを用いる場合について述べたが、例えば、LEDを用いた自発光ディスプレイを用いても良い。自発光ディスプレイとしては、ほかに、エレクトロルミネッセンス素子を用いたディスプレイ、蛍光表示管を用いたディスプレイ、プラズマディスプレイ、又は電界電子放射型ディスプレイを用いても良い。
【0051】
【発明の効果】以上説明したように、この発明によれば、録音された伝言メモの内容を文字画像情報に変換して表示手段に表示させるので、音を消すことによって、周囲の人に不快感を与えることなく、さらに周囲の人に気兼ねすることなく、表示手段に表示された再生内容を確認することができる。特に、聴覚障害者にとっても、伝言内容を容易に確認することができる。また、視覚によって再生内容を知ることができるので、聴覚によるよりも伝言内容を確実に認識することができ、利便性を向上させることができる。また、音声情報に代えて文字画像情報を記憶手段に記憶させることによって、記憶手段のメモリ容量を節約し、メモリ資源を有効利用することができる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013