Warning: fopen(data/log202007132235.log): failed to open stream: No space left on device in /home/jp321/public_html/header.php on line 106

Warning: flock() expects parameter 1 to be resource, boolean given in /home/jp321/public_html/header.php on line 107

Warning: fclose() expects parameter 1 to be resource, boolean given in /home/jp321/public_html/header.php on line 112
音声メッセージの取り込みと取り出しを行う方法及び装置 - ヒューレット・パッカード・カンパニー
米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> ヒューレット・パッカード・カンパニー

発明の名称 音声メッセージの取り込みと取り出しを行う方法及び装置
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2003−110708(P2003−110708A)
公開日 平成15年4月11日(2003.4.11)
出願番号 特願2002−246828(P2002−246828)
出願日 平成14年8月27日(2002.8.27)
代理人 【識別番号】100082946
【弁理士】
【氏名又は名称】大西 昭広
【テーマコード(参考)】
5D045
5K015
5K039
【Fターム(参考)】
5D045 AB00 AC01 DB01 
5K015 AA07 GA02
5K039 CC01 EE01 HH03 JJ02 JJ03 JJ07 JJ09 KK09
発明者 ドナルド・エックス・スミス II
要約 課題
メッセージの印刷によるコピーとメッセージの音声によるコピーを提供する音声メッセージ・システムを提供する。

解決手段
本発明はメッセージの取り込みと取り出しを行う装置及び方法から成る。音声メッセージは受信され、録音される。音声メッセージは機械可読表現にコード化され、テキスト表現に変換される。機械可読表現とテキスト表現は少なくとも1つの記憶媒体に出力される。
特許請求の範囲
【請求項1】音声入力メッセージを受け取って記録するステップと、音声入力メッセージを機械可読表現にコード化するステップと、音声入力メッセージをテキスト表現に変換するステップと、機械可読表現とテキスト表現の少なくとも1つを少なくとも1つの記憶媒体に出力するステップを含む音声メッセージの取り込み及び取り出しの方法。
【請求項2】機械可読表現がグラフィック表現である請求項1に記載の方法。
【請求項3】音声メッセージのコード化のステップが、さらにバーコード表現向けの所定形式のデータ・ファイル標準にコード化するステップを含む請求項1に記載の方法。
【請求項4】出力のステップがさらに機械可読表現とテキスト表現の少なくとも1つを表示装置に転送するステップを含む請求項1に記載の方法。
【請求項5】ボイス・レコーダから取り出した音声メッセージの機械可読表現と、ボイス・レコーダから取り出した音声メッセージのテキスト表現の少なくとも1つを記憶している機械可読媒体。
【請求項6】機械可読表現が、バーコード表現向けの所定形式のデータ・ファイル標準に実装された2次元バーコードを含む請求項5に記載の機械可読媒体。
【請求項7】テキスト表現が第1の領域に印刷され、機械可読表現が第1の領域以外の領域に印刷される、請求項5に記載の機械可読媒体。
【請求項8】音声信号を受け取って録音する操作可能なボイス・レコーダが接続し、音声信号を取り出す操作可能な音声信号処理回路がボイス・レコーダに接続し、音声信号処理回路がプロセッサを備え、音声信号処理回路がさらにプロセッサに接続する操作可能なメモリを備え、音声信号を受け取って音声信号を機械可読表現にコード化する操作可能な音声信号デジタル・エンコーダが音声信号処理回路に接続し、音声信号を受け取って音声信号をテキスト表現に変換する操作可能な音声−テキスト変換機が音声信号処理回路に接続し、機械可読表現とテスト表現の少なくとも1つを受け取り、機械可読表現とテキスト表現を少なくとも1つの出力媒体に提供する操作可能な出力ポートが接続する音声メッセージ取り込み及び取り出し装置。
【請求項9】操作可能な出力ポートが印刷装置に接続する請求項8に記載の音声メッセージ取り込み及び取り出し装置。
【請求項10】操作可能な出力ポートが走査装置に接続する請求項8に記載の音声メッセージ取り込み及び取り出し装置。
発明の詳細な説明
【0001】
【発明の属する技術分野】本発明は電気通信に関し、特に音声メッセージの自動的な取り込みと取り出しに関する。
【0002】
【従来の技術】音声メッセージング・システムは、当技術分野ではよく知られており、特に留守番電話、ボイス・メール・サービス、パーソナル・コンピュータに電話メッセージを取り込んで再生するパーソナル・コンピュータベースのソフトウェアなどの形を取る。音声メッセージング・システムは、一般に着信に応答し、発信者に向けて着信側からの短いメッセージを再生し、発信者のメッセージを録音して後で再生できるようにする。従来技術による音声メッセージング・システムでは、メッセージを印刷したもの、すなわちメッセージの「ハードコピー」や、他の場所に簡単にコピー又は転送できる音声メッセージを提供しない。
【0003】音声メッセージング・システムの中には、電気通信事業者が提供する発信者ID(識別)データを利用して発信者の電話番号と名前を音声メッセージに関連付けるものや、発信者の識別情報に基づいて着信音を変えるものもある。残念ながら、「発信者ID」を適用できない通信加入者や、このサービスに代金を払いたくない加入者もいる。さらに、発信者識別の技術を使用するとこうしたシステムではメッセージ自体(伝言メモに類似した)の内容のハードコピーを自動生成できなくなる。
【0004】他の音声メッセージング・システムには、音声認識技術を組み込んで電話呼び出しを開始したり、発信者の情報を関連付けたりするものもあるが、音声認識システムは現在の音声認識技術自体に技術的な限界があるため、成果は限定的なものにすぎない。
【0005】他の音声認識システムには、デジタル化された音声メッセージを「発信者ID」のデータから得られる発信者の識別情報に関連付け、音声メッセージのデジタル・コピーの作成を可能にするものもある。このようなシステムの一例として、米国特許第5,651,055号に開示されているDigital Secretaryがある(Argade、Lucent Technologies,Inc.に譲渡)。残念ながら、このデジタル・コピーにはメッセージの人間可読テキスト表現は含まれない。人間が簡単に利用できるように、メッセージ自体の内容をハードコピー形式で表したものはない。
【0006】
【発明が解決しようとする課題】メッセージの印刷によるコピーとメッセージの音声によるコピーを提供する音声メッセージ・システムがあれば、音声認識によって正確に発信者を識別せず、音声を印字出力に正しく変換できない従来技術によるシステムの限界を克服できる。
【0007】
【課題を解決するための手段】簡単に言うと、本発明はメッセージの取り込みと取り出しを行う装置及び方法から成る。音声メッセージは受信され、録音される。音声メッセージは機械可読表現にコード化され、テキスト表現に変換される。機械可読表現とテキスト表現は少なくとも1つの記憶媒体に出力される。
【0008】
【発明の実施の形態】以下に示す実施態様の例の詳細な説明と添付図面を併せて参照することによって、本発明の機能を容易に理解できるであろう。
【0009】本発明は、受け取った音声メッセージを人間可読テキスト表現と対応する機械可読表現に変換する方法及び装置を提供する。人間可読テキスト表現によって本質的に読みやすく移植可能な形式のメッセージを提供し、機械可読表現によって音声認識技術の現状の限界を考慮に入れて人間可読テキスト表現の内容を検証できる。簡単に言うと、音声メッセージング・システムは、例えば標準電話回線から音声入力メッセージを受け取り、音声入力メッセージの内容を録音する。次に、この音声入力メッセージを関連する機械可読表現と人間可読テキスト表現に変換し、さらにこれらを選択可能な複数の媒体の少なくとも1つに送信し、所定の受信者が後で取り出すことができる。
【0010】図1は、音声メッセージング・システムを示す高レベル・ブロック図である。音声メッセージング・システムは、音声入力メッセージ102を録音するボイス・レコーダ104を介して音声入力メッセージ102を受け取る。本ボイス・レコーダ104は、メッセージを取り出して再生できるようにテープ、磁気ディスク、又は半導体メモリに記録する、留守番電話、ボイス・メール・メッセージング・システム、及びパーソナル・コンピュータベースのファームウェア、ハードウェア、又はソフトウェアなど、当技術分野で一般的に知られている多くの形の少なくとも1つを取ることができるが、これらに限定されるわけではない。同様に、音声入力メッセージ102は、例えば電話回線やデジタル通信アクセス回線(図示せず)を介して受け取られるアナログ信号又はデジタル信号など、使用するボイス・レコーダの個々の実装に適したいかなる形を取ってもよい。当技術分野で一般に知られているように、こうしたレコーダ自体がメッセージの記憶及び取り出しを管理する機能を備えている。このような機能には、例えば音声再生、長期保存、削除、転送などがあるが、これらには限定されない。
【0011】マスタ処理モジュール108は、プロセッサ110とメモリ112を備えている。これらは当技術分野で一般に使用されており、マスタ処理モジュール108の動作を管理しやすくする。プロセッサ110は、マイクロプロセッサ(”PENTIUM(登録商標)”や”POWER PC”など)、ASIC(Application−Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、デジタル信号プロセッサ、マイクロコントローラなどであってもよい。メモリ112は、読み出し専用メモリ(ROM)、ランダム・アクセス・メモリ(RAM)、書換可能ディスク・メモリ、追記型ディスク・メモリ(WORM)、電気的消去可能ROM(EEPROM)など、当技術分野で知られる任意の種類でよいが、これらには限定されない。メモリ112には、プロセッサが実行する命令と変数が格納される。マスタ処理モジュール108は、音声入力メッセージ106を取り出し、取り出した音声入力メッセージ106の機械可読表現114と人間可読テキスト表現116を生成する。ここで、機械可読表現114と人間可読テキスト表現116が音声メッセージング・システムから出力される。これについては、以下で詳しく説明する。
【0012】図2は、マスタ処理モジュール108、及び機械可読表現114と人間可読テキスト表現116を送信できる選択可能な様々な形の媒体のいくつかを示す詳細なブロック図である。マスタ処理モジュール108は、音声メッセージ処理モジュール202、音声メッセージ・デジタル・エンコーダ204、及び音声−テキスト変換機206を備えている。音声メッセージ処理モジュール202は、取り出した音声入力メッセージ106を音声メッセージ・デジタル・エンコーダ204と音声−テキスト変換機206に送信し、一方ではこのメッセージが削除されるまでメモリ112内にコピーを保持して後続のアクセスに備える。また、音声メッセージ処理モジュール202は、特に音声入力メッセージ106に対する条件の指定やフィルタなど、当技術分野で一般的に知られている処理を施すことでこのようなメッセージを処理するように選択的にプログラミングしてもよい。一実施態様では、音声−テキスト変換機206は、話し手のアクセント、抑揚、及び発音の違いに関わらず発音された単語を認識できるように、発音された単語の中で認識可能な語彙が制限されている。語彙の制限の例には、0から9までの数字、「電話してください」という語句、又はユーザーが選択して追加する他の一般的な単語や語句などがあるが、これらには限定されない。
【0013】音声メッセージ・デジタル・エンコーダ204は、取り出した音声入力メッセージがデジタル化された後、又は記憶と印刷が可能な表現に変換された後でも、この音声入力メッセージ106の機械可読表現114を生成する。音声入力メッセージ106の機械可読表現114は多くの形態を取ることができ、業界標準に準拠してもしなくてもよい。業界標準の少なくとも1つは2次元(2D)バーコード又は3次元(3D)バーコードである。2Dバーコード標準の既知の例として、Code 16k及びPDF(Portable Data File)417の2つがある。これらは様々な所定形式のデータ・ファイル標準の中の少なくとも2つと考えられる。一般に従来の(すなわち1次元)バーコードがあるデータベースでデータに索引を付けるために使用される一意の識別子のみを表すのに対して、Code 16kなどの2次元(2D)標準はバーコードの垂直冗長を除去して多層の水平バーコード表現を作成するので、結果として得られる機械可読表現114においてデータを直接コード化できる。従って、関連する項目に対応するすべてのデータがバーコード自体に含まれるようなバーコードを構成できる。音声メッセージ・デジタル・エンコーダ204には、バーコード・プリンタやバーコードの電子表現を生成できるソフトウェアのなどのバーコード・コード化装置の既知の技術を組み込むことができる。PDF 417標準は、バーコードの読み取りに高度なエラー訂正機能が組み込まれた2D標準である。さらに、別の標準としてIntacta Technologiesのグラフィック形式”INTACTA.CODE”がある。これは、白黒の点の小さなパターンによってバイナリ情報のグラフィック表現を作成する特許された技術である。
【0014】音声メッセージ・デジタル・エンコーダ204は、取り出した音声入力メッセージ106の機械可読表現114を以上の任意の標準で選択的に生成できる。当技術分野では他にも多くのグラフィック標準が一般的に知られており、同様に音声メッセージ・デジタル・エンコーダ204の操作に組み込むことができる。
【0015】音声−テキスト変換機206では、当技術分野でよく知られた音声認識技術を使用して、取り出した音声入力メッセージ106の人間可読テキスト表現116を生成する。認識可能な言葉(単語又は語句)のライブラリと音声メッセージとの相互参照によって、音声メッセージをテキストに変換する。音声−テキスト変換機206で実行するプロセスは、音声メッセージ処理モジュール202のメモリ112内に格納されたソフトウェアによって実現できるが、音声−テキスト変換機206自体の中にハードコード化することもできる。音声−テキスト変換機206は、取り出した音声入力メッセージ106を人間可読テキスト表現116に変換する機能を実行する。このテキスト表現は、音声−テキスト変換機206によるメッセージの内容の最適な近似である。
【0016】機械可読表現114と人間可読テキスト表現116が生成されると、マスタ処理モジュール108はその少なくとも1つを書式化し、複数のユーザ選択可能媒体の少なくとも1つに出力する。出力先の媒体は手動でも選択できるが、マスタ処理モジュール108内のシステム・ソフトウェア又はハードウェアによってプログラム的に選択することもできる。本発明の一実施態様では、機械可読表現114と人間可読テキスト表現116は、パーソナル・コンピュータのディスプレイ、個人用携帯型情報端末(Personal Digital Assistants:PDA)のディスプレイ、又はテレビのモニタなどの表示装置208に出力される。人間可読テキスト表現116は表示装置208で表示でき、機械可読表現114は一般にパーソナル・コンピュータ、PDA、又はテレビに接続されるオーディオ・スピーカなど、表示装置208に接続できるオーディオ・スピーカ210で再生できる。本実施態様では、マスタ処理モジュール108は、機械可読表現114と人間可読テキスト表現116をそれぞれ表示及び再生する特定のファームウェア、ハードウェア、又はソフトウェアに適した任意の形式に変換するように選択的にプログラムできる。機械可読表現114と人間可読テキスト表現116は、表示されたメッセージに関するユーザーの分析に基づいて、メモリ112から取り出して別の媒体に出力したり、メモリ112から削除することができる。
【0017】本発明の別の実施態様では、機械可読表現114と人間可読テキスト表現116は、モデム(又はネットワーク・インターフェース・カード、ケーブル・モデムなどの当技術分野で一般的に知られている他のリモート接続装置(図示せず))などのリモート・データ・ネットワーク・アクセス装置212に出力される。リモート・データ・ネットワーク・アクセス装置212は、当技術分野で一般に使用される装置(モデムなど)を介してページャ・ネットワーク220やインターネット222又は他のデータ・ネットワーク(図示せず)などの様々なリモート・ロケーションに機械可読表現114と人間可読テキスト表現116を送信できる。このために、前述の装置は機械可読表現114と人間可読テキスト表現116にGUID(global unique identifier)を割り当て、それらを一意に識別して宛先の遠隔地にあるシステムに送信するのが好ましい。GUIDは、当技術分野ではよく知られているように、遠隔地のメッセージを一意に識別するための索引として利用できる。機械可読表現114と人間可読テキスト表現116をページャ・ネットワーク220に送信すると、これらをページャ・ネットワーク220の設定又はメモリ112のプリセットの少なくとも1つで要求するページャ224に送信できる。機械可読表現114と人間可読テキスト表現116をインターネット222又は他のデータ・ネットワークに送信すると、これらをインターネット222又は他のデータ・ネットワークの設定又はメモリ112のプリセットの少なくとも1つで要求する電子メール・アカウント226又はネットワーク・ベースの送信アカウント228に送信できる。ネットワーク・ベースの送信アカウント228は、WWW(World WideWeb)上のHTMLベースのメッセージ・ボード又はHTMLベースの電子メール・アカウントなど、当技術分野で一般に知られている任意の形を取ることができるが、これには限定されない。音声メッセージ・デジタル・エンコーダ204は、機械可読表現114を例えば.TIF、.JPG、.GIF、.BMPなど、多くの一般的なグラフィック・ファイル形式のいずれかで印刷可能なイメージ・ファイルとして出力できる。また、機械可読表現114は、例として.WAVや.MP3などを含む多くの一般的な音声ファイル形式のいずれかの形式のマルチメディア・グラフィック・ファイル、マルチメディア音声ファイルとして出力することもできる。
【0018】本発明のさらに別の実施態様では、機械可読表現114と人間可読テキスト表現 116が印刷装置214に出力され、機械可読表現114と人間可読テキスト表現116のハードコピーを作成する。音声メッセージング・システムに使用可能な印刷装置214に出力してハードコピーとして提供する場合、機械可読表現114を人間可読テキスト表現116と同じハードコピーの面に出力でき、所定の選択可能領域に人間可読テキスト表現116を印刷できる。機械可読表現114は同じページの他の領域に印刷でき、機械可読表現114自体をハードコピーの背景に組み込むことができる。また、機械可読表現114は、人間可読テキスト表現116が印刷される面ではなく、ハードコピーの裏面に印刷することもできる。当業者は、機械可読表現114と人間可読テキスト表現116を同じ用紙又は異なる用紙に出力する他の方法も認識できよう。本発明は、この点については限定されない。いずれの形式の印刷出力でも、機械可読表現114のテキストの内容が追加された、「伝言」メモより有効なフォームが自動的に生成される。機械可読表現114の読み取り及び再生に適した走査装置216を使用して機械可読表現114の内容を接続されたオーディオ・スピーカ210に出力することで、人間可読テキスト表現116の内容を確認できる。
【0019】本発明のさらに別の実施態様では、機械可読表現114と人間可読テキスト表現116が別の媒体218に出力され、表示装置208とスピーカ210、印刷装置214と走査装置216とスピーカ210、及び遠隔ネットワーク・アクセス装置212の少なくとも1つに必要な接続を確立できる他のハードウェア装置(図示せず)に転送される。他の媒体218は、RAM、EEPROM、書換可能ディスク・メモリ、テープ、追記型ディスク・メモリでもよい。機械可読表現114と人間可読テキスト表現116の受け取りに他の媒体を使用できることは当業者には理解できよう。特許請求の範囲を構成する上で、こうしたメモリは外部メモリ媒体であると考えられる。
【0020】図3は、本発明に従って音声メッセージを受け取り、処理し、出力する方法を示す流れ図である。図1に関連して説明したように、ステップ302でボイス・レコーダ104は音声メッセージを受け取り、記録する。ステップ304で、ボイス・レコーダ104を使用して音声メッセージを確認する。当業者は理解できるように、こうしたプロセスは一般に手動であり、必要なメッセージを保存するか破棄するかをボタン、スイッチなどで選択する。決定ステップ306で、記録された音声メッセージを削除するか取り出して処理するかを決定する。保持する場合は、図2に関連して上述したように、ステップ308でマスタ処理モジュール108(特に音声メッセージ処理モジュール202)が音声メッセージを取り出す。ステップ310で、マスタ処理モジュール108は音声メッセージの機械可読表現114と人間可読テキスト表現116を生成する。ステップ312で、機械可読表現114と人間可読テキスト表現116の少なくとも1つを出力する媒体を選択する。この選択は、手動の処理でもよいし、マスタ処理モジュール108内のファームウェア、ハードウェア、又はソフトウェアで実行するプログラム処理でもよい。ステップ314で、音声メッセージの機械可読表現114と人間可読テキスト表現116は使用可能かつ選択可能な複数の媒体から選択した少なくとも1つへの出力に合わせて書式化される。ステップ316で、マスタ処理モジュール108から受け取ったコマンドの指示どおりに処理済みの表現が出力される。ステップ318はオプションであり、選択した出力媒体の音声メッセージを確認してメッセージがもはや必要ではないと判断した場合はマスタ処理モジュール108のメモリ112とボイス・レコーダ104のいずれか又は両方からメッセージを削除する。
【0021】図4は、本発明による機械可読媒体の第1の実施態様を示す図である。本実施態様では、機械可読表現114と人間可読テキスト表現116が印刷装置214に送られ、ここでメッセージの印字出力、すなわち「ハードコピー」が作成される。発信者ID情報406(発信者の名前、電話番号、及び状況説明文で構成される)と人間可読テキスト表現の出力408はハードコピー402の表面に、機械可読表現出力410はハードコピー404の裏面に印字される。本実施態様では、1次元バーコード形式を使用して機械可読表現を出力する(410)。発信者IDは無線及び有線通信プロバイダによって提供される当技術分野で既知の電気通信サービスであり、名前と電話番号(いずれか又は両方)で発信者を識別する。
【0022】図5は、本発明による機械可読媒体の第2の実施態様を示す図である。本実施態様では、機械可読表現114と人間可読テキスト表現116が印刷装置214に送られ、ここでハードコピー502が作成される。両方の表現の出力はハードコピー502の同じ面に印刷される。本実施態様では、Code 16kによる2次元(2D)バーコード形式を使用して機械可読表現を出力する(508)。発信者ID情報504と人間可読テキスト表現出力506はハードコピー502の第1の領域に順次印刷され、機械可読表現出力508はハードコピー502の第2の領域に印刷される。例えば図5に示すように、人間可読テキスト表現116全体をハードコピー502に印刷し、それに続けて同じメッセージの機械可読表現114を印刷するようなレイアウトをファームウェア又はソフトウェアのプログラムに記述できる。あるいは、ソフトウェアは、ハードコピー502の上部から人間可読テキスト表現116の一部を印刷し、機械可読表現114のメッセージの対応する部分をそれに続けて印刷してもよい。この方法では、ハードコピー502の各ページに人間可読テキスト表現116の一部と人間可読テキスト表現116のその部分に対応する機械可読表現114が出力され、人間可読テキスト表現116の後続の部分は後続のページに出力される。当業者は、よく知られているウォーターマーキング技術を利用した別の例を理解するであろう。この技術では、人間可読テキスト表現116がページ上に生成され、機械可読表現114がホログラフィック・イメージとして印刷される。ホログラフィック・イメージは、そのような読み取りに適した走査装置を使用しないと簡単には検出できない。機械可読媒体の他の実施態様では、ファームウェア、ソフトウェア、ハードウェアの1つ以上によって、複数の使用可能なレイアウトのうちから1つをプログラムで選択できる。
【0023】図6は、本発明による機械可読媒体の第3の実施態様を示す図である。本実施態様では、機械可読表現114と人間可読テキスト表現116が印刷装置214に送られ、ここでハードコピー602が作成されて両方の表現がその同じ面に出力される。本実施態様では、”INTACTA.CODE”グラフィック形式を使用してメッセージの機械可読表現を出力する。選択可能な所定の領域604はファームウェア又はGUIによってプログラム的に定義され、発信者ID情報606と人間可読テキスト表現出力608がその領域に印刷される。機械可読表現の出力610は、選択可能な定義済み領域604の外部に印刷され、ハードコピー602の背景のデザインに組み込まれる。機械可読表現出力610を背景デザインに組み込む場合、背景デザインに調和するように処理されるので、機械可読表現出力610は見た目には美しく、わかりにくい。
【0024】本発明は、音声メッセージ技術の領域では先端であることが当業者には理解できよう。音声メッセージのハードコピー版はアーカイブされ、必要な期間だけ保持できる。簡単に読むことができるテキスト表記には、そのメッセージのより正確な機械可読表現が添付される。こうした実施態様のいずれにおいても、出力技術に合わせて人間可読テキスト表現116を検証できる。音声認識技術によって疑わしいテキスト変換が生成された場合、機械可読表現114を再生して耳で聞き、人間可読テキスト表現116(図2を参照)の内容が正確かどうかを確認できる。この作業は、機械可読表現114のハードコピーの走査や、マルチメディア音声ファイル形式の機械可読表現114の再生など、多くの形を取ることができる。機械可読表現114と対応する人間可読テキスト表現116の生成によって、読みやすく移植可能なメッセージを提供するとともに、音声認識技術の現状の制限を考慮に入れてメッセージの内容を正確に解釈できるようにする。
【0025】当業者には本発明の様々な側面において変形や変更を施した他の実施態様が明らかなこと、及び記述した特定の実施態様によって本発明が制限されないことは言うまでもない。従って、本発明及び本発明の基本的な原理と添付の特許請求の範囲に示すその精神と範囲に適合するあらゆる変更、変形、同等物を対象とするものである。
【0026】以下に本発明の実施態様の例を列挙する。
〔実施態様1〕音声入力メッセージを受け取って記録するステップと、音声入力メッセージを機械可読表現にコード化するステップと、音声入力メッセージをテキスト表現に変換するステップと、機械可読表現とテキスト表現の少なくとも1つを少なくとも1つの記憶媒体に出力するステップを含む音声メッセージの取り込み及び取り出しの方法。
〔実施態様2〕機械可読表現がグラフィック表現である実施態様1に記載の方法。
〔実施態様3〕音声メッセージのコード化のステップが、さらにバーコード表現向けの所定形式のデータ・ファイル標準にコード化するステップを含む実施態様1に記載の方法。
〔実施態様4〕出力のステップがさらに機械可読表現とテキスト表現の少なくとも1つを表示装置に転送するステップを含む実施態様1に記載の方法。
〔実施態様5〕ボイス・レコーダから取り出した音声メッセージの機械可読表現と、ボイス・レコーダから取り出した音声メッセージのテキスト表現の少なくとも1つを記憶している機械可読媒体。
〔実施態様6〕機械可読表現が、バーコード表現向けの所定形式のデータ・ファイル標準に実装された2次元バーコードを含む実施態様5に記載の機械可読媒体。
〔実施態様7〕テキスト表現が第1の領域に印刷され、機械可読表現が第1の領域以外の領域に印刷される、実施態様5に記載の機械可読媒体。
〔実施態様8〕音声信号を受け取って録音する操作可能なボイス・レコーダが接続し、音声信号を取り出す操作可能な音声信号処理回路がボイス・レコーダに接続し、音声信号処理回路がプロセッサを備え、音声信号処理回路がさらにプロセッサに接続する操作可能なメモリを備え、音声信号を受け取って音声信号を機械可読表現にコード化する操作可能な音声信号デジタル・エンコーダが音声信号処理回路に接続し、音声信号を受け取って音声信号をテキスト表現に変換する操作可能な音声−テキスト変換機が音声信号処理回路に接続し、機械可読表現とテスト表現の少なくとも1つを受け取り、機械可読表現とテキスト表現を少なくとも1つの出力媒体に提供する操作可能な出力ポートが接続する音声メッセージ取り込み及び取り出し装置。
〔実施態様9〕操作可能な出力ポートが印刷装置に接続する実施態様8に記載の音声メッセージ取り込み及び取り出し装置。
〔実施態様10〕操作可能な出力ポートが走査装置に接続する実施態様8に記載の音声メッセージ取り込み及び取り出し装置。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013