米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 楽器;音響 -> カシオ計算機株式会社

発明の名称 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2007−199515(P2007−199515A)
公開日 平成19年8月9日(2007.8.9)
出願番号 特願2006−19310(P2006−19310)
出願日 平成18年1月27日(2006.1.27)
代理人 【識別番号】100090033
【弁理士】
【氏名又は名称】荒船 博司
発明者 井手 博康
要約 課題
ピッチ波形の単位で音声信号の線形予測係数を算出することにより、音質の向上を図る。

解決手段
線形予測フィルタと励起信号によって入力音声を符号化する音声符号化装置100は、入力された音声信号からピッチ波形を抽出するピッチ抽出部1と、ピッチ抽出部1により抽出されたピッチ波形の単位で前記音声信号の線形予測分析を行い、線形予測係数を算出する線形予測分析部3とを有し、線形予測分析部3により算出された線形予測係数から作成された線形予測フィルタに励起信号を入力して合成音声を算出し、入力された音声信号と算出された合成音声の誤差が最小となる励起信号を選択するように構成される。
特許請求の範囲
【請求項1】
線形予測フィルタと励起信号によって入力音声を符号化する音声符号化装置であって、
入力された音声信号からピッチ波形を抽出する抽出手段と、
前記抽出手段により抽出されたピッチ波形の単位で前記入力された音声信号から線形予測係数を算出する算出手段と、
前記算出手段により算出された線形予測係数を用いて前記線形予測フィルタを生成する生成手段と、
前記生成手段により生成された線形予測フィルタに励起信号を駆動信号として入力して算出された合成音声と前記入力された音声信号との誤差が最小となるような励起信号を選択する選択手段と、
を備えることを特徴とする音声符号化装置。
【請求項2】
前記算出手段は、前記ピッチ波形のピッチ長が予め指定された値よりも短い場合、複数のピッチ波形をまとめた単位で前記線形予測係数を算出し、
前記線形予測フィルタに入力される励起信号を、前記複数のピッチ波形の各々のピッチ長に合わせて繰り返す繰り返し手段を備えることを特徴とする請求項1に記載の音声符号化装置。
【請求項3】
前記算出手段は、前記ピッチ長が予め指定された値よりも短い場合、予め指定された個数のピッチ波形をまとめることを特徴とする請求項2に記載の音声符号化装置。
【請求項4】
前記算出手段は、前記ピッチ長が予め指定された値よりも短い場合、予め指定された固定長を超えない最大長までピッチ波形をまとめることを特徴とする請求項2に記載の音声符号化装置。
【請求項5】
前記ピッチ波形のピッチ長の時間軸における変化が所定値より大きいか否かを判定する判定手段と、
前記判定手段により、前記ピッチ長の変化が所定値以下であると判定された場合、所定間隔で間引いた線形予測係数の補間処理を行う補間手段と、を備え、
前記判定手段により、前記ピッチ長の変化が所定値より大きいと判定された場合、線形予測係数の間引き及び前記補間手段による補間処理を行わないことを特徴とする請求項1〜4の何れか一項に記載の音声符号化装置。
【請求項6】
前記判定手段は、ピッチ長間に予め指定された固定値以上の差があるか否かを判定することを特徴とする請求項5に記載の音声符号化装置。
【請求項7】
前記判定手段は、ピッチ長間に、特定のピッチ長に予め指定された比率を乗算した値以上の差があるか否かを判定することを特徴とする請求項5に記載の音声符号化装置。
【請求項8】
ピッチ単位で算出された線形予測係数から線形予測フィルタを生成し、当該線形予測フィルタに、符号化された音声信号から生成された励起信号を入力して合成音声を出力する出力手段を備えることを特徴とする音声復号装置。
【請求項9】
線形予測フィルタと励起信号によって音声信号を符号化する音声符号化方法であって、
前記音声信号からピッチ波形を抽出し、
前記抽出されたピッチ波形の単位で前記音声信号から線形予測係数を算出し、
前記算出された線形予測係数を用いて前記線形予測フィルタを生成し、
前記生成された線形予測フィルタに励起信号を駆動信号として入力して算出された合成音声と前記音声信号との誤差が最小となるような励起信号を選択することを特徴とする音声符号化方法。
【請求項10】
ピッチ単位で算出された線形予測係数から線形予測フィルタを生成し、当該線形予測フィルタに、符号化された音声信号から生成された励起信号を入力して合成音声を出力することを特徴とする音声復号方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法に関する。
【背景技術】
【0002】
携帯電話等で利用されている音声符号化方法の多くは、入力された音声信号から線形予測フィルタを算出し、当該音声信号に近い励起信号を探し、当該励起信号と線形予測係数の双方のパラメータを符号として出力する方式に基づいている(例えば、非特許文献1参照。)。
【0003】
図9に、従来の音声符号化装置300の構成を示す。線形予測分析部30では、入力された音声信号の線形予測分析を行うことにより線形予測係数が算出される。ここで、音声信号の時間軸上における一定の長さをひとまとめとして、当該一定長の単位で線形予測係数が算出される。音声符号化装置300の生成符号量を減らすために、前記一定長をひとまとめとして、一つおきに線形予測係数を符号化するため、補間部31では、間引いた線形予測係数が、その前後の線形予測係数から補間して生成される。
【0004】
線形予測フィルタ部32では、補間後の線形予測係数から線形予測フィルタが生成される。適応符号帳探索部34の適応符号帳から取り出された適応符号と、雑音符号帳探索部35の雑音符号帳から取り出された雑音符号は、それぞれ、アンプ36、37で増幅後、合成部38で合成され、合成後の信号が、上記生成された線形予測フィルタによりフィルタリングされる。
【0005】
誤差算出部33では、フィルタリング後の信号と、入力された音声信号との誤差が算出される。誤差算出部33で算出された誤差が最小となるときの雑音符号及び適応符号を表すインデックスと、一つおきの線形予測係数が、符号として音声符号化装置300から出力される。一般に線形予測係数は、5〜7ms程度の間隔で算出されるが、伝送符号中の線形予測係数は、10〜15msの間隔で送信され、受信側で補間処理を行う場合が多い。
【非特許文献1】音声符号化規格JT−G729
【発明の開示】
【発明が解決しようとする課題】
【0006】
しかしながら、上述の従来の音声符号化方法では、入力音声の特徴に関らず、一定長の単位で線形予測係数を算出して補間処理を行っているため、補間処理によって生成される線形予測係数が、入力音声に対して適切でない場合(特に過渡期)があり、音質の低下を招いていた。
【0007】
本発明の課題は、ピッチ波形の単位で音声信号の線形予測係数を算出することにより、音質の向上を図ることである。
【課題を解決するための手段】
【0008】
上記課題を解決するため、請求項1に記載の発明は、線形予測フィルタと励起信号によって入力音声を符号化する音声符号化装置であって、入力された音声信号からピッチ波形を抽出する抽出手段と、前記抽出手段により抽出されたピッチ波形の単位で前記入力された音声信号から線形予測係数を算出する算出手段と、前記算出手段により算出された線形予測係数を用いて前記線形予測フィルタを生成する生成手段と、前記生成手段により生成された線形予測フィルタに励起信号を駆動信号として入力して算出された合成音声と前記入力された音声信号との誤差が最小となるような励起信号を選択する選択手段と、を備えることを特徴としている。
【0009】
請求項2に記載の発明は、請求項1に記載の音声符号化装置において、前記算出手段は、前記ピッチ波形のピッチ長が予め指定された値よりも短い場合、複数のピッチ波形をまとめた単位で前記線形予測係数を算出し、前記線形予測フィルタに入力される励起信号を、前記複数のピッチ波形の各々のピッチ長に合わせて繰り返す繰り返し手段を備えることを特徴としている。
【0010】
請求項3に記載の発明は、請求項2に記載の音声符号化装置において、前記算出手段は、前記ピッチ長が予め指定された値よりも短い場合、予め指定された個数のピッチ波形をまとめることを特徴としている。
【0011】
請求項4に記載の発明は、請求項2に記載の音声符号化装置において、前記算出手段は、前記ピッチ長が予め指定された値よりも短い場合、予め指定された固定長を超えない最大長までピッチ波形をまとめることを特徴としている。
【0012】
請求項5に記載の発明は、請求項1〜4の何れか一項に記載の音声符号化装置において、前記ピッチ波形のピッチ長の時間軸における変化が所定値より大きいか否かを判定する判定手段と、前記判定手段により、前記ピッチ長の変化が所定値以下であると判定された場合、所定間隔で間引いた線形予測係数の補間処理を行う補間手段と、を備え、前記判定手段により、前記ピッチ長の変化が所定値より大きいと判定された場合、線形予測係数の間引き及び前記補間手段による補間処理を行わないことを特徴としている。
【0013】
請求項6に記載の発明は、請求項5に記載の音声符号化装置において、前記判定手段は、ピッチ長間に予め指定された固定値以上の差があるか否かを判定することを特徴としている。
【0014】
請求項7に記載の発明は、請求項5に記載の音声符号化装置において、前記判定手段は、ピッチ長間に、特定のピッチ長に予め指定された比率を乗算した値以上の差があるか否かを判定することを特徴としている。
【0015】
請求項8に記載の音声復号装置は、ピッチ単位で算出された線形予測係数から線形予測フィルタを生成し、当該線形予測フィルタに、符号化された音声信号から生成された励起信号を入力して合成音声を出力する出力手段を備えることを特徴としている。
【0016】
請求項9に記載の音声符号化方法は、線形予測フィルタと励起信号によって音声信号を符号化する音声符号化方法であって、前記音声信号からピッチ波形を抽出し、前記抽出されたピッチ波形の単位で前記音声信号から線形予測係数を算出し、前記算出された線形予測係数を用いて前記線形予測フィルタを生成し、前記生成された線形予測フィルタに励起信号を駆動信号として入力して算出された合成音声と前記音声信号との誤差が最小となるような励起信号を選択することを特徴としている。
【0017】
請求項10に記載の音声復号方法は、ピッチ単位で算出された線形予測係数から線形予測フィルタを生成し、当該線形予測フィルタに、符号化された音声信号から生成された励起信号を入力して合成音声を出力することを特徴としている。
【発明の効果】
【0018】
本発明によれば、ピッチ波形の単位で音声信号から線形予測係数を算出することにより、線形予測を行う波形から過渡期の波形が分離されやすくなり、線形予測の精度と音質の向上を図ることが可能となる。
【0019】
また、ピッチ長が予め指定された値より短い場合、複数のピッチ波形を一つにまとめてから線形予測分析を行い、各々のピッチ長に応じて励起信号の繰り返し処理を行うことにより、符号化効率の向上を図ることができる。
【0020】
更に、ピッチ長の急激な変化があるところでは、線形予測係数の間引き及び補間処理を行わずにそのまま出力することにより、劣化が激しい場所を効率的に発見し、音質を向上させることが可能となる。
【発明を実施するための最良の形態】
【0021】
以下、図面を参照して、本発明の実施形態について説明する。
まず、本実施形態における構成について説明する。
【0022】
図1に、本実施形態に係る音声符号化装置100の構成を示す。音声符号化装置100は、図1に示すように、ピッチ抽出部1、算出位置決定部2、線形予測分析部3、補間部4、線形予測フィルタ部5、誤差算出部6、適応符号帳探索部7、雑音符号帳探索部8、アンプ9、10、合成部11、繰り返し処理部12により構成される。
【0023】
ピッチ抽出部1は、入力された音声信号からピッチ波形を抽出する。ピッチとは、図3に示すような波形の繰り返しの単位である。人間の音声波形を分析すると、ある周期(ピッチ周期)で繰り返しの波形が連続的に存在することが多い。ピッチの抽出とは、入力された音声信号からピッチ周期を検出し、そのピッチ周期毎に音声信号を時間軸上で区切っていく処理のことである。図3では、p0〜p3がピッチ長として抽出された場合を示している。
【0024】
ピッチ周期の検出方法は特に限定されないが、例えば、特開平11−45098号公報に記載された方法を利用することができる。この方法では、入力された音声信号から有音声区間を抽出し、抽出した有音声区間を処理対象音声波形とし、その処理対象音声波形の時間軸上における既に決定済みの区切り点を基点に、予め定めた区間の音声波形をコピーし、コピー区間の音声波形を前記時間軸上の既に決定済みの区切り点を基点に所定サンプリング点ずつ平行移動し、平行移動ごとにそれぞれの平行移動点におけるコピー区間の音声波形と処理対象音声波形との相関を求め、相関の最も大きくなる平行移動点を次の区切り点として求める。そして、求められたそれぞれの区切り点間を処理対象音声波形のピッチ周期とする。
【0025】
算出位置決定部2は、ピッチ単位で線形予測係数を算出するために、線形予測係数の算出位置を決定する。
【0026】
線形予測分析部3は、算出位置決定部2で算出された算出位置で、入力された音声信号の線形予測分析を行い、線形予測係数を算出する。n次の線形予測フィルタは式(1)のように表される。
【数1】


ここで、{ai|i=1,…,n}が線形予測係数である。
【0027】
線形予測分析の1手法として自己相関法がある。自己相関法では、例えば、線形予測分析に用いるm個の入力信号のサンプルを{si|i=0,…,m-1}とすると、自己相関係数{ri|i=0,…,n}を式(2)のように算出し、式(3)が成立する線形予測係数{ai|i=1,…,n}を算出する。
【数2】


【数3】


式(3)は、レビンソン・ダービンアルゴリズムを用いて解くことが可能である(非特許文献1参照)。
【0028】
ピッチ長が予め指定された値よりも短い場合、符号化効率を向上させるために、複数のピッチ波形を一つにまとめてから線形予測分析を行う。複数のピッチ波形をまとめる簡単な方法として、予め決められた個数のピッチ波形を一つにまとめる方法がある。この場合、例えば、ピッチ長が3ms未満であれば、2ピッチをまとめるものとする。また、予め指定された固定長を超えない最大長分のピッチ波形をまとめるようにしてもよい。即ち、予め指定された固定長をcとしたとき、c以下で最大長となる分だけピッチ波形をまとめる。
【0029】
本実施形態では、生成符号量を減らすため、ピッチ一つおきに線形予測係数を符号化するので、補間部4は、間引く対象となる線形予測係数を、その前後の線形予測係数から補間して生成し、補間処理後の線形予測係数を線形予測フィルタ部5に出力する。補間方法としては、例えば、間引く対象となる線形予測係数の前後の線形予測係数をLSP(Line Spectrum Pair)係数に変換し、変換後の前後の係数を加算して2で除算した後、線形予測係数に戻す処理を行う。
【0030】
このとき、補間部4は、間引く対象となる線形予測係数の前後の線形予測係数のピッチ長を比較し、その差が予め指定された固定値を超えているか否かを判定し、当該固定値を超えていた場合には間引きを行わないようにする。例えば、間引き対象のピッチ波形の時間的に前のピッチ長をpm-1とし、時間的に後のピッチ長をpm+1とし、予め指定された固定値をαとすると、|pm-1−pm+1|>αの場合に間引きを行わないようにする。
【0031】
また、間引く対象となる線形予測係数の前後の線形予測係数のピッチ長の差が、特定のピッチ長の一定比率(特定のピッチ長に、予め指定された比率を乗算した値)を超えているか否かを判定し、当該一定比率を超えている場合に間引きを行わないようにしてもよい。例えば、間引き対象のピッチ波形の時間的に前のピッチ長をpm-1とし、時間的に後のピッチ長をpm+1とし、予め指定された比率をβ(0〜1の値)とすると、|pm-1−pm+1|>pm-1・βの場合に間引きを行わないようにする。
【0032】
線形予測フィルタ部5は、式(1)に従って線形予測係数から線形予測フィルタを合成(生成)する。また、線形予測フィルタ部5は、適応符号帳探索処理(図6参照)において、適応符号帳の適応符号に対し、上記線形予測フィルタによるフィルタリング処理を施し、誤差算出部6に出力する。また、線形予測フィルタ部5は、雑音符号帳探索処理(図7参照)において、雑音符号帳の雑音符号と、適応符号帳探索処理(図6参照)で最終的に得られた励起信号を合成した信号に対し、上記線形予測フィルタによるフィルタリング処理を施し、誤差算出部6に出力する。
【0033】
誤差算出部6は、音声符号化装置100に入力された音声信号と、線形予測フィルタ部5でのフィルタリング処理後の信号との誤差を算出し、適応符号帳探索部7及び雑音符号帳探索部8に出力する。
【0034】
適応符号帳探索部7は、これまでに利用した励起信号を格納した適応符号帳を有し、適応符号帳から適応符号を取り出し、誤差算出部6で算出された、線形予測フィルタ部5でフィルタリング処理された当該適応符号と入力された音声信号との誤差が、それまで得られた誤差の中で最小となるような適応符号を選択する(図6参照)。また、適応符号帳探索部7は、適応符号帳探索処理(図6参照)及び雑音符号帳探索処理(図7参照)の後、最終的に得られた励起信号を適応符号帳に追加することで、適応符号帳を更新する。
【0035】
雑音符号帳探索部8は、白色雑音信号(雑音符号)を格納した雑音符号帳を有し、雑音符号帳から雑音符号を取り出し、誤差算出部6で算出された、線形予測フィルタ部5でフィルタリング処理された信号と、入力された音声信号との誤差が、それまで得られた誤差の中で最小となるような雑音信号を選択する(図7参照)。ここで、線形予測フィルタ部5でのフィルタリングの対象となる信号は、雑音符号帳から取り出された雑音符号に、適応符号帳探索処理において決定された励起信号を加えた信号である。
【0036】
アンプ9、10は、それぞれ、適応符号帳から取り出された適応符号、雑音符号帳から取り出された雑音符号の振幅値を所定の増幅率で増幅(調整)する。
【0037】
合成部11は、雑音符号帳から取り出された増幅後の雑音符号と、適応符号帳探索処理において励起信号として決定した増幅後の適応符号を合成する。
【0038】
繰り返し処理部12は、上述のように、複数のピッチ波形が一つにまとめられた場合、図4に示すように、入力された励起信号を、複数のピッチ波形の各々のピッチ長に合わせて繰り返す処理を行い、繰り返し処理後の励起信号を線形予測フィルタ部5に出力する。図4では、ピッチ長1のピッチ波形と、ピッチ長2のピッチ波形が一つにまとめられた場合、各々のピッチ長に合わせて励起信号を繰り返す例を示している。
【0039】
このように構成された音声符号化装置100は、適応符号帳探索処理及び雑音符号帳探索処理において励起信号として最終的に得られた適応符号帳のインデックス及び雑音符号帳のインデックスと、ピッチ一つおきに間引かれた線形予測係数と、ピッチ長を表す信号と、アンプ9、10における増幅率を表す信号を符号化信号として出力する。
【0040】
図2に、本発明の実施形態に係る音声復号装置200の構成を示す。音声復号装置200は、音声符号化装置100で符号化された信号を復号するための装置であり、図2に示すように、適応符号帳探索部21、雑音符号帳探索部22、アンプ23、24、合成部25、繰り返し処理部26、補間部27、線形予測フィルタ部28により構成される。
【0041】
適応符号帳探索部21は、適応符号帳の中から、入力された適応符号帳のインデックスに対応する適応符号を探索して取り出し、アンプ23に出力する。
【0042】
雑音符号帳探索部22は、雑音符号帳の中から、入力された雑音符号帳のインデックスに対応する雑音符号を取り出し、アンプ24に出力する。
【0043】
アンプ23、24は、それぞれ、入力された適応符号、雑音符号を増幅し、合成部25に出力する。合成部25は、アンプ23、24からそれぞれ入力された適応符号及び雑音符号を合成する。
【0044】
繰り返し処理部26は、入力されたピッチ長に応じて、入力された適応符号及び雑音符号の繰り返し処理を行うことによって励起信号を生成し、当該励起信号を線形予測フィルタ部28に出力する。
【0045】
補間部27は、符号化信号として入力されなかった線形予測係数がある場合、線形予測係数の補間処理を行い、補間処理後の線形予測係数を線形予測フィルタ部28に出力する。補間部27での補間処理は、補間部4における補間方法と同様の方法を適用することができる。
【0046】
線形予測フィルタ部28は、入力された線形予測係数から、式(1)に従って線形予測フィルタを合成(生成)し、入力された励起信号に対して、その生成された線形予測フィルタによるフィルタリング処理を施すことによって合成音声を生成し、出力する。
【0047】
次に、本実施形態における動作について説明する。
まず、図5のフローチャートを参照して、音声符号化装置100において実行される音声符号化処理について説明する。
【0048】
まず、音声符号化装置100に入力された音声信号からピッチ波形が抽出され(ステップS1)、抽出されたピッチ波形に基づいて、線形予測係数の算出位置が決定される(ステップS2)。このときピッチ長が指定された値よりも短い場合、複数のピッチ波形が1つにまとめられる。次いで、ステップS2で算出された算出位置で、入力された音声信号の線形予測分析が行われ、線形予測係数が算出される(ステップS3)。次いで、間引き対象の線形予測係数が、その前後の線形予測係数から補間して生成される(ステップS4)。次いで、式(1)に従って、線形予測係数から線形予測フィルタが合成される(ステップS5)。
【0049】
次いで、入力された音声信号との誤差が最も小さくなるような励起信号を適応符号帳及び雑音符号帳から探索する適応符号帳探索処理及び雑音符号帳探索処理が行われる(ステップS6、S7)。ステップS6の適応符号帳探索処理、ステップS7の雑音符号帳探索処理については、後に、それぞれ図6、図7を参照して詳細に説明する。
【0050】
適応符号帳探索処理及び雑音符号帳探索処理が終了すると、これらの処理によって得られた励起信号が適応符号帳に追加することによって適応符号帳が更新され(ステップS8)、当該励起信号を表す適応符号帳のインデックス及び雑音符号帳のインデックスと、ピッチ一つおきに間引かれた線形予測係数と、ピッチ長を表す信号が符号化信号として出力され、本音声符号化処理が終了する。
【0051】
次に、図6のフローチャートを参照して、適応符号帳探索処理(図5のステップS6)について説明する。
【0052】
まず、適応符号帳から最初の適応符号が取り出され、処理対象の適応符号として設定される(ステップS11)。次いで、適応符号帳の全ての適応符号についての処理が終了したか否かが判定される(ステップS12)。ステップS12において、当該処理が終了していないと判定された場合(ステップS12;NO)、複数のピッチが一つにまとめられているときに、各々のピッチ長に合わせて現在の適応符号を繰り返して取り出す繰り返し処理が行われる(ステップS13)。
【0053】
次いで、現在の処理対象の適応符号に対し、ステップS5で合成された線形予測フィルタによるフィルタリング処理が施され(ステップS14)、フィルタリング後の信号と、入力された音声信号との誤差が算出される(ステップS15)。次いで、ステップS15で算出された誤差が、本探索処理開始以降に得られた誤差の中で最小であるか否かが判定される(ステップS16)。
【0054】
ステップS16において、誤差が最小ではないと判定された場合(ステップS16;NO)、適応符号帳の次の適応符号が処理対象として設定され(ステップS18)、当該適応符号に対して、ステップS12〜S17の処理が繰り返される。
【0055】
ステップS16において、誤差が最小であると判定された場合(ステップS16;YES)、現在の処理対象の適応符号が、励起信号候補として設定される(ステップS17)。次いで、適応符号帳の次の適応符号が処理対象として設定され(ステップS18)、当該適応符号に対して、ステップS12〜S17の処理が繰り返される。
【0056】
適応符号帳の全ての適応符号についてステップS13〜S17の処理が終了すると(ステップS12;YES)、本適応符号帳探索処理が終了し、最終的に励起信号候補として残った適応符号のインデックスが符号化信号のデータとして選択されることになる。
【0057】
次に、図7のフローチャートを参照して、雑音符号帳探索処理(図5のステップS7)について説明する。
【0058】
まず、雑音符号帳から最初の雑音符号が取り出され、処理対象の雑音符号として設定される(ステップS21)。次いで、雑音符号帳の全ての雑音符号についての処理が終了したか否かが判定される(ステップS22)。ステップS22において、当該処理が終了していないと判定された場合(ステップS22;NO)、複数のピッチが一つにまとめられているときに、各々のピッチ長に合わせて現在の雑音符号を繰り返す繰り返し処理が行われる(ステップS23)。
【0059】
次いで、図6の適応符号帳探索処理で最終的に励起信号として設定された適応符号と、現在処理対象の雑音符号が合成され(ステップS24)、合成後の信号に対し、ステップS5で合成された線形予測フィルタによるフィルタリング処理が施される(ステップS25)。そして、フィルタリング後の信号と、入力された音声信号との誤差が算出される(ステップS26)。次いで、ステップS26で算出された誤差が、本探索処理開始以降に得られた誤差の中で最小であるか否かが判定される(ステップS27)。
【0060】
ステップS27において、誤差が最小ではないと判定された場合(ステップS27;NO)、雑音符号帳の次の雑音符号が処理対象として設定され(ステップS29)、当該雑音符号に対して、ステップS22〜S28の処理が繰り返される。
【0061】
ステップS27において、誤差が最小であると判定された場合(ステップS27;YES)、現在の処理対象の雑音符号が、励起信号候補として設定される(ステップS28)。次いで、雑音符号帳の次の雑音符号が処理対象として設定され(ステップS29)、当該雑音符号に対して、ステップS22〜S28の処理が繰り返される。
【0062】
雑音符号帳の全ての雑音符号についてステップS23〜S28の処理が終了すると(ステップS22;YES)、本雑音符号帳探索処理が終了し、最終的に励起信号候補として残った雑音符号のインデックスが符号化信号のデータとして選択されることになる。
【0063】
次に、図8のフローチャートを参照して、音声復号装置200において実行される音声復号処理について説明する。
【0064】
まず、適応符号帳から、入力された符号化信号に含まれる適応符号帳のインデックスに対応する適応符号が取り出されるとともに(ステップT1)、雑音符号帳から、当該符号化信号に含まれる雑音符号帳のインデックスに対応する雑音符号が取り出される(ステップT2)。
【0065】
次いで、入力されたピッチ長に応じて、適応符号及び雑音符号の繰り返し処理を行うことによって励起信号が作成され(ステップT3)、その生成された励起信号を適応符号帳に追加することによって適応符号帳が更新される(ステップT4)。
【0066】
次いで、符号化信号として入力されなかった線形予測係数がある場合は、その線形予測係数の補間処理が行われる(ステップT5)。次いで、線形予測係数から式(1)に従って線形予測フィルタが合成される(ステップT6)。
【0067】
次いで、上記作成された励起信号に対し、ステップT6で合成された線形予測フィルタを用いてフィルタリング処理を施すことによって再生音声が合成され(ステップT7)、本音声復号処理が終了する。
【0068】
以上のように、本実施形態の音声符号化装置100及び音声復号装置200によれば、ピッチ波形の単位で音声信号の線形予測係数を算出することにより、線形予測を行う波形から過渡期の波形が分離されやすくなり、線形予測の精度と音質の向上を図ることが可能となる。
【0069】
また、ピッチ長が予め指定された値より短い場合、複数のピッチ波形を一つのピッチ波形としてまとめてから線形予測分析を行い、各々のピッチ長に応じて励起信号の繰り返し処理を行うことにより、符号化効率の向上を図ることができる。
【0070】
更に、ピッチ長の急激な変化があるところでは、線形予測係数の間引き及び補間処理を行わずにそのまま符号化することにより、劣化が激しい場所を効率的に発見し、音質を向上させることが可能となる。
【図面の簡単な説明】
【0071】
【図1】本発明の実施形態に係る音声符号化装置の構成を示すブロック図。
【図2】本発明の実施形態に係る音声復号装置の構成を示すブロック図。
【図3】音声信号の波形と、音声信号から抽出されるピッチを示す図。
【図4】励起信号と、ピッチ長で繰り返す励起信号を示す図。
【図5】本実施形態の音声符号化装置において実行される音声符号化処理を示すフローチャート。
【図6】適応符号帳探索処理を示すフローチャート。
【図7】雑音符号帳探索処理を示すフローチャート。
【図8】本実施形態の音声復号装置において実行される音声復号処理を示すフローチャート。
【図9】従来の音声符号化装置の構成を示すブロック図。
【符号の説明】
【0072】
1 ピッチ抽出部(抽出手段)
2 算出位置決定部
3 線形予測分析部(算出手段)
4 補間部(判定手段)
5 線形予測フィルタ部(生成手段)
6 誤差算出部
7 適応符号帳探索部(選択手段)
8 雑音符号帳探索部(選択手段)
9、10、23、24 アンプ
11 合成部
12 繰り返し処理部(繰り返し手段)
21 適応符号帳探索部
22 雑音符号帳探索部
25 合成部
26 繰り返し処理部
27 補間部
28 線形予測フィルタ部(出力手段)
100 音声符号化装置
200 音声復号装置




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013