米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 楽器;音響 -> 株式会社ワイ・アール・ピー高機能移動体通信研究所

発明の名称 音声符号化パラメータ符号化方法及び装置
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2002−366195(P2002−366195A)
公開日 平成14年12月20日(2002.12.20)
出願番号 特願2001−167913(P2001−167913)
出願日 平成13年6月4日(2001.6.4)
代理人 【識別番号】100106459
【弁理士】
【氏名又は名称】高橋 英生 (外3名)
【テーマコード(参考)】
5D045
5J064
【Fターム(参考)】
5D045 CC07 DA06 DA11 
5J064 AA01 BA13 BA16 BB01 BB03 BB04 BB12 BC11 BC16 BD02
発明者 麓 照夫 / 佐々木誠司
要約 目的


構成
特許請求の範囲
【請求項1】 デジタル化され所定時間長のフレームに分割された音声信号から取得した音声符号化パラメータを符号化する音声符号化パラメータ符号化方法であって、前記音声符号化パラメータとしての音声ピッチを、差分量子化法と均一量子化法の選択によりいずれかの量子化法により量子化ピッチを得るフレームと、前後のフレームの量子化ピッチを用いて計算した複数の補間ピッチ候補から選択した補間ピッチのインデックスにより量子化するフレームとの組み合わせにより符号化するステップ、前記音声符号化パラメータとしての有声/無声情報を、限定された数の代表有声/無声情報から選択した代表有声/無声情報のインデックスにより符号化するステップ、前記音声符号化パラメータとしてのハーモニックスペクトル振幅列を、線形予測モデルによる線形予測係数もしくはそれより導かれる線スペクトル対とゲインに分離し、線形予測係数もしくは線スペクトル対については、ベクトル量子化器などの量子化器により量子化するフレームと、前後のフレームの量子化線形予測係数もしくは線スペクトル対から線形補間器により求めた複数の候補点から選択した候補点のインデックスにより補間量子化するフレームとの組み合わせにより符号化するステップ、前記線形予測係数の量子化により発生するフレームのハーモニックスペクトルパワーの変化に応じて前記ゲインを補正し補正ゲインを得るステップ、および、該補正ゲインを対数化し、そのまま第1のゲイン量子化器で均一量子化するフレームと、前のフレームの前記第1のゲイン量子化器の量子化ゲインを基準とした差分量子化器の出力値と、前後のフレームの前記第1の量子化器の出力の複数の補間候補の選択により求めた補間量子化器の出力値から、誤差の少ない方を選んで量子化する第2のゲイン量子化器により量子化するフレームとの組み合わせにより前記補正ゲインを符号化するステップを含むことを特徴とする音声符号化パラメータ符号化方法。
【請求項2】 前記補正ゲインを得るステップは、線形予測モデル化前のハーモニック振幅列の二乗和により得られるハーモニックスペクトルパワーと、量子化線形予測係数と量子化前のゲインを用いて線形予測モデルにより得られるハーモニックスペクトル振幅値の二乗和から求めたハーモニックスペクトルパワーの比を、前記ゲインに乗算することにより補正ゲインを計算するものであることを特徴とする請求項1記載の音声符号化パラメータ符号化方法。
【請求項3】 デジタル化され所定時間長のフレームに分割された音声信号から取得した音声符号化パラメータを符号化する音声符号化パラメータ符号化装置であって、前記音声符号化パラメータとしての音声ピッチを、差分量子化法と均一量子化法の選択によりいずれかの量子化法により量子化するフレームと、前後のフレームの量子化ピッチを用いて計算した複数の補間ピッチ候補から選択した補間ピッチのインデックスにより量子化するフレームの組み合わせにより符号化する手段と、前記音声符号化パラメータとしての有声/無声情報を、限定された数の代表有声/無声情報から選択した代表有声/無声情報のインデックスにより符号化する手段と、前記音声符号化パラメータとしてのハーモニックスペクトル振幅列を、線形予測モデルによる線形予測係数もしくはそれより導かれる線スペクトル対とゲインに分離し、線形予測係数もしくは線スペクトル対については、ベクトル量子化器などの量子化器により量子化するフレームと、前後のフレームの量子化線形予測係数もしくは線スペクトル対から線形補間器により求めた複数の候補点から選択した候補点のインデックスにより補間量子化するフレームの組み合わせにより符号化する手段と、前記線形予測係数の量子化により発生するフレームのハーモニックスペクトルパワーの変化に応じて上記ゲインを補正し補正ゲインを得る手段と、該補正ゲインを対数化し、そのまま第1のゲイン量子化器で均一量子化するフレームと、前のフレームの前記第1のゲイン量子化器の量子化ゲインを基準とした差分量子化器の出力値と、前後のフレームの前記第1の量子化器の出力の複数の補間候補の選択により求めた補間量子化器の出力値から、誤差の少ない方を選んで量子化する第2のゲイン量子化器により量子化するフレームの組み合わせにより前記補正ゲインを符号化する手段とを有することを特徴とする音声符号化パラメータ符号化装置。
発明の詳細な説明
【0001】
【発明の属する技術分野】本発明は、音声信号をデジタル化して所定の時間間隔毎にその特徴を表す音声符号化パラメータを取得し、取得した音声符号化パラメータを符号化する音声符号化パラメータ符号化方法及び装置に関するものであり、その符号化した音声符号化パラメータを伝送または蓄積し、伝送先または蓄積先から必要な時に音声符号化パラメータを復元し、復元した音声符号化パラメータから音声信号を合成して音声を伝えるデジタル携帯電話やデジタル音声蓄積装置などに使用して好適なものである。
【0002】
【従来の技術】デジタル化された音声信号は、データ圧縮、誤り処理、多重化などさまざまなデジタル信号処理が可能になるため、固定電話や移動電話に限らず音声を利用するマルチメディアシステムなどに広く取り入れられている。アナログの音声信号をデジタル化するには、一般に入力音声周波数帯域の2倍以上の標本化周波数で標本化し、耳で識別できない程度の量子化ステップで量子化が必要なため、アナログ信号と比較し広い伝送周波数帯域幅を必要とする。そのため、一旦デジタル化された音声信号は、要求される音声品質に応じてさまざまな符号化方式や変調方式によりデータの圧縮が行われている。高い音声データの圧縮率が得られる方法として、音声の持つ特徴を積極的に利用する分析合成型の音声符号化方式とそこから得られた音声符号化パラメータを効率的に量子化する方法が考えられている。
【0003】例えば、衛星携帯電話に一部使用されているMBE(Multi-Band Excitation)方式もしくはIMBE(Improved Multi-Band Excitation)方式は、この分析合成型の音声符号化方式の一種で、音声を所定の時間周期(20msec)で所定の時間長さのセグメントを取り出してフレームを構成し、そのフレーム毎に、音声ピッチ(又はその逆数としての音声基本周波数)、フレームの音声の周波数スペクトルから得られる音声ハーモニックスペクトル振幅列、周波数スペクトルを適当な周波数領域に分割した周波数バンド毎の有声/無声情報(Voiced/Unvoiced情報、又はV/UV情報)を音声符号化パラメータとし、各フレームに対して、音声ピッチは8ビット均一量子化、バンド毎のV/UV情報v[k](kはバンドの番号)は0/1の2進数で表したバイナリ値でKビット量子化(K:最大バンド数で最大12ビットの可変長)、音声ハーモニック振幅列はフレーム間予測差分値を2次元変換しそのDCT(離散コサイン変換)係数を(75−K)ビットで量子化して4.15kbpsの音声符号化速度を得ている。
【0004】図8は、一般的な音声符号化伝送装置の構成を示した図である。音声入力端子301から入力された標本化・量子化された音声デジタル信号を、音声符号化パラメータ抽出部302で所定の時間周期で所定の時間長さのセグメントを取り出してフレームを構成し、そのフレーム毎に音声符号化パラメータを抽出する。抽出する音声符号化パラメータは音声符号化方式により異なり、例えば前記のMBE方式では、音声ピッチ、音声ハーモニックスペクトル振幅列、各周波数バンドのV/UV情報である。パラメータ符号化部303は、抽出した音声符号化パラメータを効果的に符号化して符号量を低減せしめ、送信部304を介して伝送路305に送り出す。受信部306で受け取った信号は、パラメータ復号化部307で音声符号化パラメータを復元し、音声合成部308は音声符号化パラメータ抽出部302と逆の動作により合成音声を作成し音声出力端子309から音声デジタル信号を出力する。
【0005】図9は前記MBE方式の場合における前記音声符号化パラメータ抽出部302のブロック構成図である。デジタル入力音声信号は入力端子301から基本周波数推定部401に入力され、ここで音声の基本周波数が推定される。基本周波数の推定値は、時間遅れの自己相関関数が最大となる時間の逆数値として計算される。周波数スペクトル計算部402では、ハミング窓等の窓関数によりフレームから切り出した有限長の音声信号を周波数分析して音声周波数スペクトルを得る。基本周波数修正部403は、推定された音声基本周波数と前記窓関数により合成されるスペクトルと前記音声周波数スペクトルとの誤差最小条件で、A−b−S(Analysis-by-Synthesis)手法により修正音声基本周波数ωoとハーモニックスペクトル振幅列を同時に求める。有声強度計算部404は修正音声基本周波数ωoに基づいて、周波数帯域を複数の周波数バンドk(k=1,2,...,K)に分割し、各周波数バンド毎に合成された合成スペクトルと音声周波数スペクトルの誤差を計算し、閾値判定によりV/UV情報v[k]を出力する。スペクトル包絡計算部405はV/UV情報v[k]により、有声バンドではA−b−S手法で求めた各ハーモニックスペクトル振幅、無声バンドでは各ハーモニックの周波数帯域での周波数スペクトルのルート二乗平均値をスペクトル包絡|A(ω)|として出力する。
【0006】図10は前記IMBE方式の場合におけるパラメータ符号化部303のブロック構成図である。入力端子501に入力された音声基本周波数ωoは、基本周波数量子化部502で、予め定めた量子化範囲及び量子化ステップで8ビットに均一量子化し、その量子化値B0を出力端子503に出力する。入力端子504に入力されたV/UV情報v[k]は、V/UV情報量子化部505で、例えば周波数バンド数Kが12の場合は12個の0又は1の情報で表した2進数12ビット値B1として出力端子506に出力する。入力端子507に入力されたスペクトル包絡|A(ω)|は、離散的なハーモニックスペクトル振幅列|A(ωi)|、(i=1,2,3,....,N、N:ハーモニック本数)として入力される。
【0007】まず対数変換部508で対数変換後、減算器509で前フレームのハーモニックスペクトル振幅列から予測した予測ハーモニックスペクトル振幅列521との差(これを「予測差分値列」と呼ぶことにする)が計算され、ブロック変換部510に渡される。ブロック変換部510では予測差分値列をハーモニックの順位により6種類に順次分類して2次元データとし、次のDCT(離散コサイン変換)部511に渡しDCT係数が計算され量子化部512に渡され、DCT係数の次数により予め選定した均一量子化法とベクトル量子化法の組み合わせにより、予測差分値列の符号化データB2が出力端子513に出力される。量子化復元部514、逆DCT部515およびブロック復元部516は、量子化された予測差分値列を復元し、加算器517で予測ハーモニックスペクトル振幅列521と加算し、現フレームの入力スペクトル包絡の量子化スペクトル包絡値が復元される。その量子化スペクトル包絡値はフレーム遅延部518で1フレーム遅延し、新たに入力される次フレームの音声基本周波数ωoと前フレームの基本周波数を元にしてスペクトル包絡予測部519で次フレームのスペクトル包絡値を予測し、その予測値を前記減算器509に導き、次フレームのスペクトル包絡の量子化に備える。
【0008】このMBE方式の原理は、D.W.Griffin and J.S.Lim "Multi-band ExcitationVocoder", IEEE Transactions on Acoustics, speech, and signal processing, vol.36,No.8,August 1988, pp1223-1235に記載されている。又、符号化器の構成方法はIMBE方式の音声符号化手順として、USP-5491722(Methods for speech transmission,Feb.13,1996)により詳しく開示されている。
【0009】一方、ハーモニックスペクトル振幅列の量子化を更に効率化するため、ハーモニック振幅列を線形予測モデル(LPC)でモデル化し、そのLPCモデル化係数(線形予測係数とゲイン)を量子化する方法も考案されている。(A.M.Kondoz"Digital Speech", John Wiley & Sons, Ltd,1995, pp256-261)LPCモデル化を、式(1)に示す。
【数1】

ハーモニックスペクトル振幅列は、振幅Gで繰り返しがピッチ周期のパルス列を音源信号とするJ次のLPC合成フィルタH(ω)の出力スペクトルとしてモデル化し、可変長であるハーモニック振幅列を振幅値(または利得、ゲイン)GとJ個(たとえば10個)のLPC係数akで表したものである。また、このLPC係数は線スペクトル対(LSP)に変換すれば、補間特性が優れていることは良く知られており、このモデル化とLPC係数のフレーム補間を併用することで、更に低ビットレート化ができることも提案されているが、音質の劣化を伴うことも報告されている。このように、音声をデジタル化して低ビットレートの音声符号化を実現する方法として、音声合成モデルに基づく音声符号化パラメータを抽出して符号化を行う分析合成型の音声符号化方式が提案され、一部実用に供されている。
【0010】
【発明が解決しようとする課題】以上述べた分析合成型の音声符号化方式は、低ビットレート音声符号化に有効であるが、分析条件によっては分析合成型特有の音質劣化を伴いやすい。分析合成型の音声符号化方式の合成音質改善方法として、音声フレーム更新周期を短く設定することにより、音声フレーム内での音声パラメータの変化を少なくし、分析合成型でありながら高音質化を図る方法が考えられている。フレーム更新周期を短く設定した場合の符号化音声品質の改善効果については、麓他“業務用移動体通信向けの音声符号化方式の検討”,電子情報通信学会全国大会,D-14-2,p171,Mar.2000で報告されている。音声フレームの更新周期を短縮すれば、符号化ビット数が増大するので、符号化パラメータを補間等により再生し、パラメータの冗長性を削減することが必要になる。しかし、単純な補間によりパラメータのビット数を削減すれば大きな劣化が発生する。この様に、分析合成型音声符号化方式の低ビットレート化とフレーム更新周期の短縮による音声品質向上を両立するためには、音声符号化パラメータの効率的な量子化方法の課題があり、特に補間により符号化パラメータを再生することを利用して低ビットレート化を行う場合には、補間方法と音質劣化のバランスを十分考慮しながら量子化法を設計するという課題がある。
【0011】そこで本発明は、分析合成型の音声符号化方式において、低ビットレート化とフレーム更新周期の短縮による音声品質の向上を両立させることのできる音声符号化パラメータ符号化方法および装置を提供することを目的としている。
【0012】
【課題を解決するための手段】上記目的を達成するために、本発明の音声符号化パラメータ符号化方法は、デジタル化され所定時間長のフレームに分割された音声信号から取得した音声符号化パラメータを符号化する音声符号化パラメータ符号化方法であって、前記音声符号化パラメータとしての音声ピッチを、差分量子化法と均一量子化法の選択によりいずれかの量子化法により量子化ピッチを得るフレームと、前後のフレームの量子化ピッチを用いて計算した複数の補間ピッチ候補から選択した補間ピッチのインデックスにより量子化するフレームとの組み合わせにより符号化するステップ、前記音声符号化パラメータとしての有声/無声情報を、限定された数の代表有声/無声情報から選択した代表有声/無声情報のインデックスにより符号化するステップ、前記音声符号化パラメータとしてのハーモニックスペクトル振幅列を、線形予測モデルによる線形予測係数もしくはそれより導かれる線スペクトル対とゲインに分離し、線形予測係数もしくは線スペクトル対については、ベクトル量子化器などの量子化器により量子化するフレームと、前後のフレームの量子化線形予測係数もしくは線スペクトル対から線形補間器により求めた複数の候補点から選択した候補点のインデックスにより補間量子化するフレームとの組み合わせにより符号化するステップ、前記線形予測係数の量子化により発生するフレームのハーモニックスペクトルパワーの変化に応じて前記ゲインを補正し補正ゲインを得るステップ、および、該補正ゲインを対数化し、そのまま第1のゲイン量子化器で均一量子化するフレームと、前のフレームの前記第1のゲイン量子化器の量子化ゲインを基準とした差分量子化器の出力値と、前後のフレームの前記第1の量子化器の出力の複数の補間候補の選択により求めた補間量子化器の出力値から、誤差の少ない方を選んで量子化する第2のゲイン量子化器により量子化するフレームとの組み合わせにより前記補正ゲインを符号化するステップを含むものである。また、前記補正ゲインを得るステップは、線形予測モデル化前のハーモニック振幅列の二乗和により得られるハーモニックスペクトルパワーと、量子化線形予測係数と量子化前のゲインを用いて線形予測モデルにより得られるハーモニックスペクトル振幅値の二乗和から求めたハーモニックスペクトルパワーの比を、前記ゲインに乗算することにより補正ゲインを計算するものである。
【0013】さらに、本発明の音声符号化パラメータ符号化装置は、デジタル化され所定時間長のフレームに分割された音声信号から取得した音声符号化パラメータを符号化する音声符号化パラメータ符号化装置であって、前記音声符号化パラメータとしての音声ピッチを、差分量子化法と均一量子化法の選択によりいずれかの量子化法により量子化するフレームと、前後のフレームの量子化ピッチを用いて計算した複数の補間ピッチ候補から選択した補間ピッチのインデックスにより量子化するフレームの組み合わせにより符号化する手段と、前記音声符号化パラメータとしての有声/無声情報を、限定された数の代表有声/無声情報から選択した代表有声/無声情報のインデックスにより符号化する手段と、前記音声符号化パラメータとしてのハーモニックスペクトル振幅列を、線形予測モデルによる線形予測係数もしくはそれより導かれる線スペクトル対とゲインに分離し、線形予測係数もしくは線スペクトル対については、ベクトル量子化器などの量子化器により量子化するフレームと、前後のフレームの量子化線形予測係数もしくは線スペクトル対から線形補間器により求めた複数の候補点から選択した候補点のインデックスにより補間量子化するフレームの組み合わせにより符号化する手段と、前記線形予測係数の量子化により発生するフレームのハーモニックスペクトルパワーの変化に応じて上記ゲインを補正し補正ゲインを得る手段と、該補正ゲインを対数化し、そのまま第1のゲイン量子化器で均一量子化するフレームと、前のフレームの前記第1のゲイン量子化器の量子化ゲインを基準とした差分量子化器の出力値と、前後のフレームの前記第1の量子化器の出力の複数の補間候補の選択により求めた補間量子化器の出力値から、誤差の少ない方を選んで量子化する第2のゲイン量子化器により量子化するフレームの組み合わせにより前記補正ゲインを符号化する手段とを有するものである。
【0014】このように、本発明においては、音声ピッチの符号化に対しては、対数変換したピッチに対して、差分量子化法と均一量子化法を切り換えて、入力音声ピッチとの誤差が少ない方を選択して量子化するフレームと、フレーム間ピッチの複数個の補間点から一番近い補間点候補の番号を選択し、その選択番号で量子化するフレームを、フレーム繰り返しにより切り換えて使用することにより、ピッチの符号化ビット数を減少させている。また、有声/無声情報(V/UV情報)の符号化に対しては、予め多くの音声フレームに対してV/UV情報とその発生頻度を取得し、その中から固定数の代表V/UV情報を予め選定し、その代表V/UV情報の中からそのフレームのV/UV情報に最も似た代表V/UV情報の番号(インデックス)で符号化する手段をとる。また、V/UV情報の伝送を行わないフレームを適宜挿入し、V/UV情報が送られていないフレームの復号に対しては、前後のフレームのうち、大きい音声エネルギーを持った方のフレームのV/UV情報を用いて復元するようにしている。以上2つの手段により、V/UV情報の符号化ビット数を減少させている。さらに、ハーモニックスペクトル振幅列の符号化に関しては、そのハーモニックスペクトル振幅列を自己回帰型J次線形予測モデル(ARモデル)でモデル化し、線形予測係数(LPC)とゲインで表現する。LPC係数はLSP(線スペクトル対)に変換した後、ベクトル量子化によりフレームあたりJ個のLSPをベクトル量子化するフレームと、量子化されたLSPのフレーム間の複数補間点から一番近い補間点候補の番号を選択し、その選択番号で量子化するフレームの組み合わせにより量子化する。また、ゲインはLSPのベクトル量子化および補間により量子化した線形予測係数から線形予測モデルにより復元した場合の、ハーモニック振幅の誤差のため発生するフレームパワーの変化を補正し、補正したゲインの対数値を均一量子化するフレームと、前フレームからの差分量を量子化した場合と、前後のフレーム間の補間値を選択した場合の誤差が少ない方のゲインを選択するフレームの組み合わせにより量子化する手段をとる。以上のような2段構成でハーモニックスペクトル振幅列の量子化を行うことにより、線形予測係数の量子化誤差により発生するフレームパワーの変化を抑えつつ、低ビットでのハーモニック振幅列の符合化を行うことができる。
【0015】
【発明の実施の形態】本発明の音声符号化パラメータ符号化方法および該符号化方法が適用された音声符号化パラメータ符号化装置の一実施の形態について、前記分析合成型音声符号化方法であるMBEもしくはIMBE音声符号化方法に適応した場合を例にとって説明する。なお、この音声符号化パラメータ符号化装置は、前記図8に示したパラメータ符号化部303に対応するものであり、音声符号化パラメータ抽出部302により抽出された音声符号化パラメータ、すなわち、音声ピッチ(またはその逆数である音声基本周波数ωo)、音声ハーモニックスペクトル振幅列および各周波数バンドの有声/無声情報(V/UV情報)を効率的に符号化する。
【0016】図1は本発明による音声符号化パラメータ符号化方法が適用された音声符号化パラメータ符号化装置の一構成例を示すブロック図である。例えば前記図9で示した音声符号化パラメータ抽出部で得られた音声ピッチ(又は音声基本周波数ωo)は入力端子101に入力され、対数変換部102で音声ピッチが対数変換され、対数音声ピッチP[n](nはフレーム番号)を得る。対数音声ピッチは文献(Thomas Eriksson and Hong-Goo Kang, "Pitch Quantization in low Bit-Rate Speech Coding", ICASSP '99, pp489-492,1999)に述べられているように、対数ピッチの変化量に対する人間の検知限界値が、対数ピッチの値の影響をあまり受けないことが知られている。そのため、量子化ステップ幅を均一にすることが出来るため都合の良い変換となっている。
【0017】対数ピッチP[n]は入力切換部103でフレーム毎(またはサブフレーム化されている場合はサブフレーム毎)に交互に切り換えられて、2つの出力端子104または116のいずれかに出力される。104に出力された場合は均一量子化部105と減算部112に導かれる。均一量子化部105では一定の量子化ステップで均一に量子化され、その量子化対数ピッチP1'[n](106)がピッチ比較部108に入力される。一方、減算部112では入力された対数ピッチと遅延部111から受け取った前フレームの量子化対数ピッチとから差分対数ピッチを得て差分量子化部113に入力する。遅延部111は、直前フレームの量子化対数ピッチを現在フレームに渡すためのものである。差分量子化部113では均一の差分量子化ステップ、もしくは差分値ゼロを基準として差分入力振幅の増加につれて差分量子化ステップが拡大する様に設定した不均一量子化ステップで差分量子化を行い、加算部114で差分の基準とした前フレームの量子化対数ピッチと加算し、差分量子化による量子化対数ピッチP2'[n]を107に出力する。ピッチ比較部108では、P1'[n]とP2'[n]を比較し、量子化前の対数ピッチP[n]との誤差が少ない方の量子化対数ピッチを選択し、均一量子化インデックスN1と差分量子化インデックスN2のうち選択された方の量子化器の出力したインデックスをピッチ符号としてピッチ符号切換部110の一方の入力に出力する。N1とN2のインデックス(選択番号)は番号の重複が無い様に配置することで出力されたインデックス番号からどちらの量子化方法が選択されたかが判る。出力端子109にはピッチ比較部108で選択された量子化器からの量子化対数ピッチP'[n]を出力する。
【0018】入力切換部103のもう一方の出力116に現れた対数ピッチP[n]は、遅延部111の入出力端から得られる現フレームと前フレームの量子化対数ピッチを用いて、補間ピッチ候補作成部117で作成した複数の補間ピッチ候補と、補間点比較部119で比較され、最も現在フレームの対数ピッチ116に近いピッチを与えた補間点インデックスN3をピッチ補間符号としてピッチ符号切換部110のもう一方の入力に出力する。ピッチ符号切換部110は入力切換部103の動きに合せてピッチ符号を切り替えて出力する【0019】図2は、図1の補間ピッチ候補作成部117の働きを説明する図である。図2に示した例は、補間点候補数を4としその選択番号(インデックス)により2ビットで量子化した例である。現在フレームの前方フレームの量子化対数ピッチをP'[n+1]、後方フレームの量子化対数ピッチをP'[n-1]とし、その間を直線で結んだ間を均等に分割する4点を×印で示す。この4点の補間ピッチ候補のうち、最も入力対数ピッチP[n]に近い補間量子化ピッチP'[n]が選択され、この補間量子化ピッチを与えるインデックスとして、この例では2を選択する。P[n]はP'[n+1]とP[n-1]の間のフレームのピッチであり、例えば、フレームを2つのサブフレームに分割されている場合には、P[n]は現フレームの第1サブフレーム、P'[n+1]が現フレームの第2サブフレームの量子化ピッチ、P'[n-1]は前フレームの第2サブフレームの量子化ピッチに対応している。なお、図2の補間ピッチ候補の配置ではP'[n+1]とP'[n-1]は補間ピッチ候補に入れていないが、補間ピッチ候補を両端のP'[n+1]とP'[n-1]を含んで設定することも出来る。その場合には、P'[n+1]とP'[n-1]以外の補間ピッチ候補は2点となる。図2の例の様に補間ピッチ候補の位置を両端を除いて設定すると、1ビットでも両端を除く2点を選択できることになるため、図2の補間点配置は補間点に与えるビット数が1ビットとか2ビットとかの少ない場合に有効といえる。
【0020】再度、図1に戻り、有声/無声情報(V/UV情報)は入力端子131から入力され、フレーム間引き部133でV/UV情報がフレーム(またはサブフレーム)間引きされる。例えば2フレーム(または2サブフレーム)に対して1回のみV/UV情報が出力され、有声/無声比較部134に入力される。代表有声/無声情報コードブック132は予め多くの音声フレームから取得したV/UV情報から後で述べる方法で、発生頻度の高いものから限定個数を選んで格納したものである。現在入力されたV/UV情報値b1と最も近い距離の代表V/UV情報値b1'を有声/無声比較部134で選択し、その代表V/UV情報のインデックスを有声/無声符号135として出力する。V/UV情報値b1(又はb1')は音声周波数スペクトルを音声基本周波数の例えば3倍の区間間隔で区切った周波数バンド毎のV/UV情報値v[k]、k=1,2,...,K(V[k]は0又は1)を2進数の各ビットに割り振った2進数値で表わされている。
【数2】

上記V/UV情報値の距離はb1とb1'の差の絶対値で表すものとする。また、代表V/UV情報は、音声基本周波数により決まるバンド数毎に独立に設定する。
【0021】代表V/UV情報は以下の方法で選定し作成することが出来る。すなわち、予め多くの音声フレームから多くのV/UV情報値を得ておき、バンド数K毎に分類する。各バンド数毎に分類されたV/UV情報値の集合{b1i}から各b1iの発生頻度を集計する。例えば、バンド数が5個の場合に対しては、b1の値は0〜31の整数値をとり、おのおのb1値に対して発生頻度が集計される。例えば2ビットでV/UV情報を量子化する場合は、この中から4種類の代表V/UV情報を選択する必要がある。この選択のためには、発生頻度の上位から順に4つ選択する方法が考えられるが、場合によっては隣接した代表V/UV情報値が選ばれることがあり、代表V/UV情報値として適当でない場合が発生する。特にバンド数Kが大きい場合には発生頻度の高い代表V/UV情報値が隣接して存在する可能性が高い。
【0022】このため、発生頻度の最も低いV/UV情報の発生頻度を、隣接するV/UV情報の発生頻度に配分しながら順次消去し、最終的に目的数の代表V/UV情報の数まで削減する方法が有効となる。図3はV/UV情報(V/UVパターン)の候補数を順次削除する場合に、最も発生頻度の低いV/UVパターンを消去する方法について説明する図である。ここで、最も発生頻度の低いV/UVパターンの発生頻度をq[n]とするとq[n]をq1とq2に分けてそれぞれ隣接するV/UVパターンの発生頻度q[n-l1]とq[n+l2]に加算配分する。q1とq2の配分量は隣接V/UVパターンの発生頻度q[n-l1]とq[n+l2]の大きさと、隣接V/UVパターンまでの距離l1とl2の近さに応じて下式により決める。
【数3】

【0023】再度、図1に戻り、スペクトル包絡の符号化について説明する。スペクトル包絡はハーモニックスペクトル振幅列として離散的なスペクトルが入力端子140に入力され、スペクトル修正部141に入力される。スペクトル修正部141の動作は後で説明する。スペクトル修正部141で修正されたスペクトル列は、線形予測モデル化部142で自己回帰型線形予測モデルでモデル化し、ゲインGと高次(例えばJ次、J=10)の線形予測係数(LPC係数a[j]、j=1,2,3,...,J、Jは予測次数)に変換される。更に、LPC係数a[j]は線スペクトル対(LSP)F[j]に変換される。LSPは0からπまでの値を持ち、線形補間による聴感上の劣化が少ないため、スペクトル包絡のモデル化の係数として広く一般に用いられている。LSPに変換されたLPC係数はLSP量子化部143でLSPコードブック144を用いてベクトル量子化され、そのコードブックのインデックスがLSP符号切換部146に出力される。ここでLSP量子化部143は、1フレーム(または1サブフレーム)おきに量子化を行うなどして量子化を行うフレーム数を削減する。一方、量子化されたLSPはLSP補間部145に入り、直前と直後に量子化された量子化LSPとの間で複数のLSP補間候補を計算し、LSP補間候補から現在フレームのLSPに最も近いLSP補間候補を選択し、そのLSP補間候補番号をLSP符号切換部146へ出力する。LSP量子化部143で量子化を行わなかったフレームは、このLSP補間により量子化を行うことで符号量の増大を抑えている。LSP符号切換部146ではフレーム毎(またはサブフレーム毎)にLSP量子化部143またはLSP補間部145からの量子化インデックスを切り換えてLSP符号として出力端子154へ出力する。
【0024】ここでスペクトル修正部141の機能とその目的について説明する。線形予測モデルでハーモニックスペクトル振幅列をモデル化する場合、多くのスペクトル点があった方が良いが、逆にモデルに合わないスペクトルが有ればモデル化に歪を与え、モデル化後のスペクトル誤差が増大する。一般に音声の0次のハーモニックスペクトル振幅(直流成分)は他のハーモニックスペクトル振幅に比べて低く、モデル化誤差が発生しやすい。また、0次ハーモニックスペクトル振幅は、音声復号時には不要な成分であるため(音声信号には直流成分は殆ど含まれないため)、モデル化しやすいレベルに調整変更しても良いといえる。以上の理由で、スペクトル修正部141では線形予測モデルでモデル化しやすい様に0次のハーモニックスペクトル振幅を修正する。具体的には、次式により2次のハーモニック振幅H2を係数αで補正した値を0次ハーモニック振幅に置きかえる。
【数4】

ここで、H0'は置き換えた0次ハーモニックスペクトル振幅、H1、H2、H3はそれぞれ1次、2次、3次のハーモニックスペクトル振幅である。また、ハーモニックスペクトル振幅列はピッチ周波数によってはそのサンプル個数が少なくなるため、入力されたハーモニックスペクトル振幅列を離散スペクトル間で補間生成を行う。ここではハーモニックスペクトル振幅の対数値を周波数に対して線形で補間し、補間スペクトルデータを作成する。
【0025】ハーモニック復元部153は、量子化されたLSP符号から復元したLPC係数akと量子化前のLPCゲインGにより、前記LPCモデル化式(1)からピッチ周波数の高調波のスペクトル振幅を計算して復元されたハーモニックスペクトル振幅とし誤差計算部152へ出力する。誤差計算部152では、元の入力ハーモニックスペクトル振幅列A[l]とのスペクトルパワーの誤差を計算し、ゲイン補正部147に入力する。ゲイン補正部147では線形予測モデル化部142のゲインGに対して誤差計算部152の出力に基づいてパワー誤差の補正を行い、補正されたゲインがゲイン量子化部148に入力され、ここで補正後の対数ゲインが均一量子化される。均一量子化されたゲインのゲイン符号はゲイン符号切換部151の一方の入力に出力される。このゲイン量子化部148では、1フレーム(または1サブフレーム)おきに量子化を行うなどして量子化を行うフレームを削減する。
【0026】量子化を行わなかったフレームに対しては、ゲイン差分量子化部149又はゲイン補間量子化部150で量子化を行うことで符号量の増大を抑える。ゲイン差分量子化部149では、ゲイン量子化部148で量子化しなかったフレームの対数ゲインを直前にゲイン量子化部148で量子化した量子化ゲインを基準として差分量子化する。また、ゲイン補間量子化部150では、同様に、ゲイン量子化部148で量子化しなかったフレームの対数ゲインを、直前および直後のフレームの量子化ゲインから線形補間で求めた補間ゲイン候補の中から一番誤差の少ない補間ゲインを選択して補間量子化する。そして、ゲイン差分量子化部149とゲイン補間量子化部150の出力のうち最も量子化誤差の少ないゲインのゲイン符号をゲイン符号切換部151のもう一方の入力に出力する。ここでは、ゲイン差分量子化部149とゲイン補間量子化部150のそれぞれのゲイン符号が重複の無い様にすることでどちらの量子化法が選択されたがわかるので選択符号を送る必要はない。ゲイン符号切換部151では、フレーム毎(またはサブフレーム毎)にゲイン量子化部148のゲイン符号と、ゲイン差分量子化部149またはゲイン補間量子化部150のゲイン符号を切り換えてLSPゲイン符号として出力端子155へ出力する。
【0027】このように、LSP量子化に伴うハーモニックスペクトル振幅の変化によって発生するフレームパワー誤差を、量子化前のゲインへ補正することで、特に音声発生時や消滅時などの過渡状態で発生しやすいフレーム(またはサブフレーム)の音声振幅の過大な誤差による雑音発生を抑えることができる。
【0028】次に、本発明による前記図1に示した音声符号化パラメータ符号化部の処理の流れについて説明する。図4は音声基本周波数ωoの量子化の流れ図である。図4で701から処理が開始される。702で量子化する音声基本周波数ωo、フレーム番号mを設定する。次に703で対数ピッチPを計算し、704でmの偶奇を判断し、もし偶数(EVEN)ならば705及び706で、それぞれ均一量子化と差分量子化を行い、均一量子化ピッチP_uと均一量子化インデックスIndex_u、及び差分量子化ピッチP_dと差分量子化インデックスIndex_dを計算する。
【0029】次に、708で差分量子化誤差(|P_d−P|)を判定し、ある閾値Thより小さい場合は、710でmフレーム目のピッチP[m](これを偶数フレームの意味でP[2n]と表す)をP_d、そのインデックスIndex[m](これを偶数フレームの意味でIndex[2n]と表す)をIndex_dとする。一方、708で|P_d−P|がTh以上であると判定された場合は、707で均一量子化誤差(|P_u−P|)と差分量子化誤差(|P_d−P|)を比較し、均一量子化誤差が小さい場合は709でmフレーム目のピッチP[2n]をP_u、そのインデックスIndex[2n]をIndex_uとし、逆の場合は710でピッチP[2n]をP_d、Index[2n]をIndex_dとする。また、mフレーム目のピッチP[2n]は711で2フレーム時間遅延してP[2n-2]とし、差分量子化706の基準対数ピッチとして、次の偶数フレームを差分量子化する時の基準対数ピッチとして使用する。
【0030】また、704でmが奇数の場合は713でピッチ補間候補から選択される。ピッチ補間候補は、すでに図2に示した手法により、前後のフレームの量子化対数ピッチ間を複数個に均等分割した補間ピッチ候補の集合{Pinpol[2n-1]i}(i=0,1,2,3...,N-1、Nは補間候補点数)として712で計算される。ピッチ補間候補の選択は、m=2n-1フレームの対数ピッチP[2n-1]との誤差絶対値が最も小さい補間候補点を選択し、そのインデックス番号Index[2n-1]を奇数フレームの量子化されたピッチ補間符号として714で設定される。なお、713中のargmin_i(x)関数(argminの下にiが記された関数)は、iをパラメータとして評価してxが最小となるiを返す関数である。また、偶数フレームの場合のピッチ符号は709又は710で選択された量子化法のインデックスIndex_d又はIndex_uがIndex[2n]として同様に714で設定される。この様にして設定された偶数フレームのピッチ符号と奇数フレームのピッチ補間符号が715に出力される。図4に示した本発明による音声基本周波数の符号化法を用いれば、例えば、ピッチ符号に4ビット、ピッチ補間符号に1ビットを用いて、良好に2フレーム分の音声基本周波数の符号化が出来る。
【0031】図5はV/UV情報の符号化の流れ図である。801から処理が開始し、802で音声基本周波数をωoに、フレームのV/UV情報値をvに、フレーム番号をmに設定する。803ではωoに対するバンド数Kを求める。
【数5】

ここで、floor(x)はxを超えない最大の整数値を示す関数、Bは各バンドに含まれるハーモニックの本数であり、符号化に先立ち予め決めておくもので、3程度が使用される。804でmの偶奇を判定し、805で、mが偶数の場合には予め選出したバンド数k毎の代表V/UV情報値のデータ806の中から最も入力されたV/UV値vに近い値を持った代表V/UV情報値VCB[K][i]のインデックスiを選びIndexV/UV[2n]とし、807で有声/無声符号に設定する。処理フレームが奇数の場合は、有声/無声符号は間引かれて出力されない。図5に示した本発明によるV/UV情報の符号化法を用いれば、例えば、有声/無声符号に2ビットを用いて、良好に2フレーム分のV/UV情報の符号化が出来る。
【0032】図6はハーモニックスペクトル振幅列の符号化の流れ図である。901から処理が開始し、902でハーモニックスペクトル振幅をA[l]に、フレーム番号をmにセットする。903で0次のハーモニックスペクトル振幅A[0]を第2次のハーモニックスペクトル振幅A[2]をα倍したもので補正する。補正係数αの決定方法は前記(4)式で示した方法等で決定する。904で補正されたハーモニックスペクトル振幅列の対数値を線形補間し、スペクトル列の本数を増加する。905では補間して増加したスペクトル列を(1)式で示した線形予測モデルでのモデル化曲線上の値としてモデル化を行い、LPC係数a[j]、LPCゲインGを計算する。さらにLPC係数a[j]は後の処理で有効な線スペクトル対(LSP:Line Spectrum Pair)F[j]に変換する。
【0033】906で現在のフレーム番号の偶数・奇数を判断し、偶数の場合にはF[j]を907にてベクトル量子化テーブル908を用いてベクトル量子化し、量子化LSPベクトルF'[j]とその量子化LSPベクトルのインデックスLSPindex0を得、LSPindex0は914へ出力する。また、量子化LSPベクトルF'[j]は910でフレーム遅延した量子化LSPベクトルと共に、911でLSP補間候補を線形補間により計算する。一方、906で現在のフレーム番号が奇数の場合は、911で計算したLSP補間候補の中から、量子化前の現在フレームのLSPベクトルF[j]に最も近い値を持つLSP補間候補F'[j]を選出し、選出したLSP補間候補のインデックスをLSPindex1として914に出力する。914ではフレーム番号が偶数の場合にはLSP符号としてLSPindex0、奇数の場合にはLSPindex1を出力する。
【0034】914でLSP符号を出力した後、偶数フレームおよび奇数フレームの量子化LSPは909で量子化LSP係数F'[j]から量子化LPC係数a'[j]にし、912にて量子化LPC係数a'[j]と量子化前のLPCゲインGから、前記モデル化式(1)により、量子化された音声基本周波数の高調波のスペクトル振幅値により、ハーモニック振幅列A'[l]を復元する。913では、量子化前のハーモニック振幅列A[l]の2乗和と復元されたハーモニック振幅列A'[l]の2乗和との比からLSP量子化によるゲイン変化率dgを計算する。
【0035】一方、915において、905でモデル化されたLPCゲインGに対し913で計算したゲイン変化率dgを用いて補正対数ゲインG'=log(dg×G)を計算する。916でフレーム番号の偶(EVEN)/奇(ODD)を判断し、偶数フレームのLPCゲインは、917で対数ゲインG'を均一量子化し、均一量子化ゲインGu'を得て、そのインデックスGindex0を922に出力する。また、均一量子化ゲインGu'は918でフレーム遅延したものと共に補間量子化920へ出力する。
【0036】919では、現在フレームの対数LPCゲインと均一量子化した1つ前のフレーム(偶数フレーム)の量子化対数ゲインとの間で差分量子化し、量子化ゲインGd'とそのインデックスGindex_dを計算する。920では前後のフレームの均一量子化ゲインから補間ゲイン候補を線形補間等で選出し、現在フレーム(奇数フレーム)のG'と最も近い補間ゲイン候補を選び、量子化ゲインGi'とそのインデックスGindex_iを計算する。921では、奇数フレームの量子化LPCゲインGd'およびGi'から量子化前のLPCゲインG'に近い方のインデックスを選択しGindex1として922へ出力する。922では、ゲインインデックスをフレームの偶数、奇数にあわせてGindex0とGindex1を切り換えてLPCゲイン符号Gindexとして出力し923でこの処理は終了する。
【0037】図6に示した本発明によるハーモニックスペクトル振幅列の符号化法を用いれば、例えば、LSP符号に17ビット、LSPゲイン符号に8ビット(均一量子化に5ビット+差分量子化と補間量子化に3ビット)の合計25ビットで2フレーム(または2サブフレーム)分のハーモニックスペクトル振幅列の符号化が出来る。図4、図5、図6に示した音声符号化パラメータの符号化手順に従えば、2フレーム(または2サブフレーム)分の音声符号化パラメータを、直接法と差分法と補間法を組み合わせて効率的に量子化すると同時に、量子化によるフレームのパワーの変化を抑えた音声符号化パラメータの低ビット量子化法を提供することができる。例えば、音声1フレーム分の20msec(10msecのサブフレームの2サブフレーム分に相当)を、32ビットで符号化することができ、その結果、1.6kbpsの低ビットレートの音声符号化方法を実現することができる。
【0038】このような本発明の音声符号化パラメータ符号化方法を用いて符号化された符号化音声を復号する場合には、前記図8におけるパラメータ復号化部307で上述と逆の処理を行って音声基本周波数(あるいは音声ピッチ)、有声/無声情報およびハーモニックスペクトル振幅列を復元し、それを用いて音声合成部308で合成音声を作成すればよい。このような音声復号化部および音声合成部の一例について説明する。
【0039】図7は、前記図1に示した音声符号化パラメータ符号化装置により符号化された符号化音声を復号する音声復号化部と音声合成部の一構成例を示すブロック図である。図示しない受信部を介して、音声符号化パラメータとしての、有声/無声情報、ピッチ情報、LSP符号、LSPゲイン符号がそれぞれ端子1001、1004、1006、1009に入力される。有声/無声符号1001は有声/無声符号復号部1003に入力され、ここで前記図1の音声符号化パラメータ符号化部における代表有声/無声情報コードブック132と同じ内容の代表有声/無声情報コードブック1002を用いて有声/無声情報が復元される。伝送されなかったフレームの有声/無声情報は前後のフレームからのフレームパワーの大きいフレームの有声/無声情報で代用される。ピッチ符号1004は、ピッチ復号部1005に入力され、その符号値により均一/差分量子化法が判断されて、対応する逆量子化法によりピッチが復元される。補間によりピッチを符号化したフレームのピッチに対しては、ピッチ符号をピッチの補間符号として前後のフレームのピッチから符号化時に行った補間の逆動作によりピッチを復元する。
【0040】LSP符号1006は、LSP復号部1008で図1の音声符号化パラメータ符号化部のLSPコードブック144と同じ内容のLSPコードブック1007を用いてLSPが復元される。補間によりLSPを符号化したフレームのLSPに対しては、前後のフレームのLSPを用いて、符号化時の逆動作によりLSPを復元する。LSPゲイン符号1009は、ゲイン復号部1010で図1のゲイン量子化部148の逆動作によりLSPゲインを復号する。また、LSPゲインを差分又は補間量子化を行ったフレームに対しては、LSP符号値から対応する逆量子化法を判断してLSPゲインを復号する。LSP復号部1008の出力のLSPと、ゲイン復号部1010の出力のLSPゲインから、ハーモニック振幅計算部1011で、前記式(1)に示したLPC合成法を用いてハーモニック振幅列を復元する。
【0041】無声ゲイン設定部1012では、雑音発生部1013の出力をランダムな雑音スペクトルとみなして、有声/無声信号が無声の周波数バンドの雑音スペクトルパワーが、対応する周波数バンドのハーモニック振幅列のパワーに一致する様に、雑音スペクトルのレベルを周波数バンド毎に調整する。逆FFT部1014では周波数バンド毎にレベル調整された雑音スペクトルを、実部はゼロ周波数に対し対称に負周波数側に拡張し、虚部はゼロ周波数に対し極性を反転して負周波数側に拡張して逆FFTを行い、その結果得られる実部のみの時間軸の音声信号を得る。フレーム補間部1015では、逆FFTで得られた時間軸の音声信号を、フレーム間で補間合成を行い無声部の音声合成信号を得る。
【0042】一方、有声ゲイン設定部1016では、有声/無声信号が有声の周波数バンドに対しては、ハーモニック振幅値をハーニック振幅列計算部から得られた対応する周波数バンド内のハーモニック振幅列の値に設定し、それ以外の周波数バンド内のハーモニック振幅値をゼロとする。ハーモニック合成部1017では、その初期位相が位相再生部1018からの各ハーモニック初期位相であり、その振幅が有声ゲイン設定部1016で設定されたハーモニック振幅値である正弦波により生成し、その総和として有声の周波数バンドの音声合成信号を得る。ここで、位相再生部1018は、フレーム間で各ハーモニックの位相連続性を保つ様に、各ハーモニック正弦波の初期位相を設定すると同時に、初期位相の連続性に擾乱を与えて、単純な正弦波合成に起因するバズ音の発生を防止する。フレーム補間部1019ではフレーム間の振幅変化を滑らかにし、フレーム間での急激なレベル変化を防止している。有声バンドの音声合成信号と無声バンドの音声合成信号は、加算器1020で加算され、ポストフィルタ部1021で聴感上の音質改善フィルタ処理を行った後、最終的な合成音声信号が端子1022に出力される。
【0043】なお、上記においては、ハーモニックスペクトル振幅列を線スペクトル対(LSP)とゲインで量子化したが、線形予測係数(LPC係数)とゲインで量子化するようにしてもよい。また、以上の説明では、判りやすくするために、図1の入力切換部103や、ピッチ符号切換部110、フレーム間引き部133、LSP符号切換部146、ゲイン符号切換部151等はフレーム毎に切換ることとして説明したが、特にフレーム毎の切換に限定するものではなく、異なる周期に変更しても、関連する技術者、研究者には容易に必要な箇所を変更して実現することが可能である。
【0044】
【発明の効果】以上述べた様に、本発明の音声符号化パラメータ符号化方法及び装置によれば、音声のフレーム毎に、音声ピッチ、各スペクトルバンドのV/UV情報、及びハーモニックスペクトル振幅列からなる音声符号化パラメータで表した分析合成型の音声符号化方法において、音声ピッチを、対数ピッチとして差分量子化または均一量子化するフレームと、フレーム間補間インデックスで量子化するフレームの切り換えにより符号化することで、大幅に符号化ビット数を低下することが出来る。また、V/UV情報を音声基本周波数の範囲で決まるバンド数毎に、予め準備した代表V/UV値のインデックス番号で符号化することで、合理的にV/UV符号化ビット数を削減することが出来る。更に、V/UV情報をフレーム毎に間引いて、V/UV情報を伝送しないフレームのV/UV情報は、前後のフレームから類推する方法により更にV/UV符号化ビット数を削減することが出来る。
【0045】音声ハーモニックスペクトル振幅列は、0次のハーモニック振幅値をモデル化しやすい値に修正後、自己回帰型線形予測モデルでモデル化し、そのモデル化係数である線形予測係数とゲインにより表現する。線形予測係数は、ベクトル量子化して伝送するフレームと、すでに量子化された線形予測係数からフレーム間補間により、最も誤差の少ない補間候補のインデックス番号で量子化することで少ないビット数で符号化できる。一方、ゲインは、量子化された線形予測係数から、ハーモニックスペクトル振幅列を復元し、モデル化と線形予測係数の量子化によるフレームのパワーの変化率によって補正した後、その対数ゲインを均一量子化するフレームと、前のフレームからの差分量子化もしくは前後のフレームからの補間量子化から誤差の少ない方で量子化するフレームの組み合わせで量子化する。これらにより、ハーモニックスペクトル振幅列の量子化によるフレームの音声レベル変化を抑つつ、音声ハーモニックスペクトル振幅列を低ビットで符号化することができる。以上本発明によれば、分析合成型の音声符号化方法及び装置において、符号化ビットレートを大きく低下する方法及び装置を提供することが出来る。また、分析合成型の音声符号化方法及び装置において、音声符号化のフレーム更新周期を早くして符号化音声品質を向上させ、かつ符号化ビット数の増大を防いだ音質の良い分析合成型の音声符号化方法及び装置を提供することが出来る。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013