米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 楽器;音響 -> カシオ計算機株式会社

発明の名称 音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2007−193043(P2007−193043A)
公開日 平成19年8月2日(2007.8.2)
出願番号 特願2006−10319(P2006−10319)
出願日 平成18年1月18日(2006.1.18)
代理人 【識別番号】100090033
【弁理士】
【氏名又は名称】荒船 博司
発明者 井手 博康
要約 課題
音声符号化における演算量を低減させる。

解決手段
音声符号化装置100は、入力された音声信号に対して周波数変換(例えば、変形離散コサイン変換)を施す周波数変換部13と、前記音声信号の周波数帯域毎に、周波数帯域の重要度を算出する帯域重要度算出部19と、その算出された重要度の高い順番で、周波数変換部13で得られた周波数変換係数に対するエントロピー符号化(例えば、レンジコーダによる符号化)を行うエントロピー符号化部20を備える。エントロピー符号化部20は、エントロピー符号化による生成符号量と、予め設定された目標符号量を比較し、当該生成符号量が目標符号量になるまで、重要度の高い順番でエントロピー符号化を行う。
特許請求の範囲
【請求項1】
音声信号に対して周波数変換を施す周波数変換手段と、
前記音声信号の周波数帯域毎に、周波数帯域の重要度を算出する重要度算出手段と、
前記重要度算出手段により算出された重要度の高い順番で、前記周波数変換手段で得られた周波数変換係数のエントロピー符号化を行う符号化手段と、
前記エントロピー符号化による生成符号量と、予め設定された目標符号量を比較する比較手段と、を備え、
前記符号化手段は、前記生成符号量が前記目標符号量になるまで、前記重要度の高い順番で周波数変換係数のエントロピー符号化を行うことを特徴とする音声符号化装置。
【請求項2】
前記符号化手段は、前記生成符号量が前記目標符号量になるまで、前記重要度の高い順番で周波数変換係数のエントロピー符号化を行った後、前記目標符号量となるために符号化の対象となった周波数帯域の周波数変換係数に対して周波数帯域順に再度エントロピー符号化を行うことを特徴とする請求項1に記載の音声符号化装置。
【請求項3】
前記比較手段は、周波数帯域順に再度行われたエントロピー符号化による生成符号量と前記目標符号量を更に比較し、
前記比較手段により、再度のエントロピー符号化による生成符号量が前記目標符号量を超えている場合、前記符号化手段は、生成符号の中から予め指定された周波数帯域の周波数変換係数を削除し、当該削除後に残った周波数帯域の周波数変換係数に対して再度エントロピー符号化を行うことを特徴とする請求項2に記載の音声符号化装置。
【請求項4】
前記符号化手段は、前記エントロピー符号化としてレンジコーダによる符号化を用いることを特徴とする請求項1〜3の何れか一項に記載の音声符号化装置。
【請求項5】
入力された音声信号を一定長のフレームに分割するフレーム化手段と、
前記フレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて当該音声信号の振幅を調整する振幅調整手段と、
前記周波数変換手段により、前記振幅が調整された音声信号に周波数変換が施された後、当該周波数変換により得られる周波数変換係数の周波数帯域を、人間の聴覚の特性に基づいて、低域ほど狭く、高域ほど広く分割する帯域分割手段と、
前記帯域分割手段により得られた各帯域毎に、周波数変換係数の絶対値の最大値を検索する検索手段と、
前記検索手段により各帯域毎に得られた最大値が、各帯域で予め設定された量子化ビット数以下になるようなシフトビット数を算出するシフト数算出手段と、
各帯域毎に、帯域中の周波数変換係数に対し、前記シフト数算出手段により算出されたシフトビット数分のシフト処理を施すシフト処理手段と、を備え、
前記符号化手段は、前記シフト処理が施されたデータに対し、エントロピー符号化を施すことを特徴とする請求項1〜4の何れか一項に記載の音声符号化装置。
【請求項6】
前記周波数変換手段は、前記周波数変換として変形離散コサイン変換を用いることを特徴とする請求項1〜5の何れか一項に記載の音声符号化装置。
【請求項7】
音声信号に対する周波数変換係数について、生成符号量が予め設定された目標符号量になるまで、周波数帯域の重要度の高い順番でエントロピー符号化が施された音声信号を復号する復号手段と、
前記復号手段により得られた周波数変換係数に対し、周波数逆変換を施す周波数逆変換手段と、
を備えることを特徴とする音声復号装置。
【請求項8】
音声信号に対して周波数変換を施し、
前記音声信号の周波数帯域毎に、周波数帯域の重要度を算出し、
前記算出された重要度の高い順番で周波数変換係数のエントロピー符号化を行い、
前記エントロピー符号化による生成符号量と、予め設定された目標符号量を比較し、
前記生成符号量が前記目標符号量になるまで、前記重要度の高い順番でエントロピー符号化を行うことを特徴とする音声符号化方法。
【請求項9】
音声信号に対する周波数変換係数について、生成符号量が予め設定された目標符号量になるまで、周波数帯域の重要度の高い順番でエントロピー符号化が施された音声信号を復号し、
前記復号された周波数変換係数に対し、周波数逆変換を施すことを特徴とする音声復号方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、音声符号化装置、音声復号装置、音声符号化方法及び音声復号方法に関する。
【背景技術】
【0002】
従来から、音声信号に対し周波数変換とエントロピー符号化を施して、生成符号量を目標値に制御する音声符号化方法が知られている。このような音声符号化方法として、特許文献1には、周波数変換係数をエントロピー符号化する際に、生成符号量が目標値に達するまで、符号化する周波数変換係数を減らしながら、符号化を繰り返す方法が知られている。
【特許文献1】特開2005−128404号公報
【発明の開示】
【発明が解決しようとする課題】
【0003】
しかしながら、上述の従来の音声符号化方法は、生成符号量が目標値に達するまで何度も同様のエントロピー符号化を繰り返す必要があるため、演算量(処理量)が増大してしまうという問題があった。
【0004】
本発明の課題は、音声符号化における演算量を低減させることである。
【課題を解決するための手段】
【0005】
上記課題を解決するため、請求項1に記載の音声符号化装置は、音声信号に対して周波数変換を施す周波数変換手段と、前記音声信号の周波数帯域毎に、周波数帯域の重要度を算出する重要度算出手段と、前記重要度算出手段により算出された重要度の高い順番で、前記周波数変換手段で得られた周波数変換係数のエントロピー符号化を行う符号化手段と、前記エントロピー符号化による生成符号量と、予め設定された目標符号量を比較する比較手段と、を備え、前記符号化手段は、前記生成符号量が前記目標符号量になるまで、前記重要度の高い順番で周波数変換係数のエントロピー符号化を行うことを特徴としている。
【0006】
請求項2に記載の発明は、請求項1に記載の音声符号化装置において、前記符号化手段は、前記生成符号量が前記目標符号量になるまで、前記重要度の高い順番で周波数変換係数のエントロピー符号化を行った後、前記目標符号量となるために符号化の対象となった周波数帯域の周波数変換係数に対して周波数帯域順に再度エントロピー符号化を行うことを特徴としている。
【0007】
請求項3に記載の発明は、請求項2に記載の音声符号化装置において、前記比較手段は、周波数帯域順に再度行われたエントロピー符号化による生成符号量と前記目標符号量を更に比較し、前記比較手段により、再度のエントロピー符号化による生成符号量が前記目標符号量を超えている場合、前記符号化手段は、生成符号の中から予め指定された周波数帯域の周波数変換係数を削除し、当該削除後に残った周波数帯域の周波数変換係数に対して再度エントロピー符号化を行うことを特徴としている。
【0008】
請求項4に記載の発明は、請求項1〜3の何れか一項に記載の音声符号化装置において、前記符号化手段は、前記エントロピー符号化としてレンジコーダによる符号化を用いることを特徴としている。
【0009】
請求項5に記載の発明は、請求項1〜4の何れか一項に記載の音声符号化装置において、入力された音声信号を一定長のフレームに分割するフレーム化手段と、前記フレーム毎に、フレームに含まれる音声信号の振幅の最大値に基づいて当該音声信号の振幅を調整する振幅調整手段と、前記周波数変換手段により、前記振幅が調整された音声信号に周波数変換が施された後、当該周波数変換により得られる周波数変換係数の周波数帯域を、人間の聴覚の特性に基づいて、低域ほど狭く、高域ほど広く分割する帯域分割手段と、前記帯域分割手段により得られた各帯域毎に、周波数変換係数の絶対値の最大値を検索する検索手段と、前記検索手段により各帯域毎に得られた最大値が、各帯域で予め設定された量子化ビット数以下になるようなシフトビット数を算出するシフト数算出手段と、各帯域毎に、帯域中の周波数変換係数に対し、前記シフト数算出手段により算出されたシフトビット数分のシフト処理を施すシフト処理手段と、を備え、前記符号化手段は、前記シフト処理が施されたデータに対し、エントロピー符号化を施すことを特徴としている。
【0010】
請求項6に記載の発明は、請求項1〜5の何れか一項に記載の音声符号化装置において、前記周波数変換手段は、前記周波数変換として変形離散コサイン変換を用いることを特徴としている。
【0011】
請求項7に記載の音声復号装置は、音声信号に対する周波数変換係数について、生成符号量が予め設定された目標符号量になるまで、周波数帯域の重要度の高い順番でエントロピー符号化が施された音声信号を復号する復号手段と、前記復号手段により得られた周波数変換係数に対し、周波数逆変換を施す周波数逆変換手段と、を備えることを特徴としている。
【0012】
請求項8に記載の音声符号化方法は、音声信号に対して周波数変換を施し、前記音声信号の周波数帯域毎に、周波数帯域の重要度を算出し、前記算出された重要度の高い順番で周波数変換係数のエントロピー符号化を行い、前記エントロピー符号化による生成符号量と、予め設定された目標符号量を比較し、前記生成符号量が前記目標符号量になるまで、前記重要度の高い順番でエントロピー符号化を行うことを特徴としている。
【0013】
請求項9に記載の音声復号方法は、音声信号に対する周波数変換係数について、生成符号量が予め設定された目標符号量になるまで、周波数帯域の重要度の高い順番でエントロピー符号化が施された音声信号を復号し、前記復号された周波数変換係数に対し、周波数逆変換を施すことを特徴としている。
【発明の効果】
【0014】
本発明によれば、エントロピー符号化を行う前に、予め周波数帯域毎に重要度を算出し、生成符号量が目標符号量になるまで、周波数帯域の重要度の高い順番で周波数変換係数の符号化を行うことにより、従来のように何度も符号化をやり直すことがなく、演算量を削減させることが可能となる。
【発明を実施するための最良の形態】
【0015】
以下、図面を参照して、本発明の実施形態について詳細に説明する。
まず、本実施形態における構成について説明する。
【0016】
図1に、本実施形態に係る音声符号化装置100の構成を示す。音声符号化装置100は、図1に示すように、フレーム化部11、レベル調整部12、周波数変換部13、帯域分割部14、最大値検索部15、シフト数算出部16、シフト処理部17、量子化部18、帯域重要度算出部19、エントロピー符号化部20により構成される。音声符号化装置100への入力信号は、例えば、16kHzサンプリングで16bit量子化されたデジタル音声等とする。
【0017】
フレーム化部11は、入力された音声信号を、符号化(圧縮)の処理単位である一定長のフレームに分割し、レベル調整部12に出力する。ここで、1つのフレームには、m個(m≧1)のブロックが含まれる長さにする。1ブロックは、1回のMDCT(Modified Discrete Cosine Transform:変形離散コサイン変換)を行う単位であり、MDCTの次数分の長さを有する。MDCTのタップ長は512タップが理想的である。
【0018】
レベル調整部12は、フレーム毎に、入力された音声信号のレベル調整(振幅調整)を行い、レベル調整された信号を周波数変換部13に出力する。レベル調整とは、1フレーム中に含まれる信号の振幅の最大値を、指定されたビット(以下、制圧目標ビット)数に収まるようにすることである。音声信号では、10ビット程度に制圧することが考えられる。レベル調整は、例えば、1フレーム中の信号の最大振幅をnbit、制圧目標ビット数
をNとすると、フレーム中の信号を全て、式(1)を満たすshift_bit数分LSB(Least
Significant Bit:最下位ビット)側にシフトすることによって実現できる。
【数1】


なお、復号時には、振幅が制圧目標ビット以下に制圧された信号を元に戻す必要があるため、shift_bitを表す信号を、符号化信号の一部として出力する必要がある。
【0019】
周波数変換部13は、入力された音声信号に対し周波数変換を施し、帯域分割部14に出力する。本実施形態では、音声信号の周波数変換としてMDCT(Modified Discrete Cosine Transform:変形離散コサイン変換)を用いることとする。入力された音声信号を{xn|n=0,…,M-1}とすると、MDCT係数(周波数変換係数){Xk|k=0,…,M/2-1}は式(2)のように定義される。
【数2】


ここで、hnは窓関数であり、式(3)のように定義される。
【数3】


【0020】
帯域分割部14は、周波数変換部13から入力される周波数変換係数の周波数帯域を、人間の聴覚の特性に合わせて分割する。具体的に、帯域分割部14は、図3に示すように、周波数変換係数を、低域(低周波数帯域)ほど狭く、高域(高周波数帯域)ほど広く分割する。例えば、音声信号のサンプリング周波数が16kHzであった場合、分割のスレッシュが、187.5Hz、437.5Hz、687.5Hz、937.5Hz、1312.5Hz、1687.5Hz、2312.5Hz、3250Hz、4625Hz、6500Hzとなる11帯域に分割することが考えられる。
【0021】
最大値検索部15は、帯域分割部14で分割された各帯域毎に、帯域中に含まれる周波数変換係数の絶対値の中から最大値を検索する。
【0022】
シフト数算出部16は、最大値検索部15で得られた各分割帯域での最大値が、各分割帯域で予め設定された量子化ビット数以下になるように、シフトするビット数(以下、シフトビット数と呼ぶ。)を算出する。例えば、ある帯域での周波数変換係数の絶対値の最大値が1101010(2進数)であるときには、符号ビットを含めると8ビットとなり、その帯域で予め設定された量子化ビット数が6ビットである場合、シフトビット数は2ビットとなる。各帯域で予め設定される量子化ビット数は、人間の聴覚の特性に基づいて、低域ほど多く、高域ほど少なくなるのが好ましく、例えば、低域から高域にかけて、8〜5ビット程度が割り当てられる。
【0023】
シフト処理部17は、各分割帯域毎に、分割帯域中の全ての周波数変換係数のデータを、シフト数算出部16で算出されたシフトビット数だけシフトし、量子化部18に出力する。なお、復号時には、周波数変換係数を元のビット数に戻す必要があるため、各帯域毎のシフトビット数を表す信号を、符号化信号の一部として出力する必要がある。
【0024】
量子化部18は、シフト処理部17から入力されたシフト処理後の信号に対し、所定の量子化(例えば、スカラー量子化)を施し、帯域重要度算出部19に出力する。
【0025】
帯域重要度算出部19は、後にエントロピー符号化部20で実行されるレンジコーダ(Range Coder)符号化によって、予め設定された目標符号量に合わせた符号を生成するため、量子化部18で算出された量子化値から周波数帯域毎に重要度を算出する。重要度として、各周波数帯域毎の合計エネルギーを用いることができる。1フレームにm個のブロックが含まれる場合、フレーム中のi番目の周波数帯域に含まれるm個の周波数変換係数を{fij|j=0,…,m-1}とすると、i番目の周波数帯域のエネルギーgiは式(4)のように表される。
【数4】


エネルギーgiの値が大きくなるにつれて重要度が高いものとする。図6は、帯域重要度算出部19による算出処理が終了した段階で得られているデータの関係を示すものであり、各周波数帯域毎にm個の周波数変換係数とエネルギーgiが算出されていることを表している。なお、エネルギーgiの値に、周波数に依存した重み係数を乗算するようにしてもよい。例えば、500Hz未満の周波数帯域には1.3、500Hz以上3500Hz未満の周波数帯域には1.1、3500Hz以上の周波数帯域には1.0を乗算することが考えられる。
【0026】
エントロピー符号化部20は、量子化部18で量子化が施された各周波数帯域のデータに対して、帯域重要度算出部19で算出された重要度の高い順番で各周波数帯域毎に周波数帯域番号iとその周波数帯域に含まれるm個の周波数変換係数のエントロピー符号化を施し、予め設定された目標符号量になった時点までの生成符号を符号化データ(圧縮信号)として出力する。エントロピー符号化とは、データの統計的性質を利用して、出現頻度が多い符号には短い符号、出現頻度が少ない符号には長い符号を割り当てることで、全体の符号長を短く変換する符号化方式であり、ハフマン(Huffman)符号化、算術符号化、レンジコーダ(Range Coder)による符号化等がある。本実施形態では、エントロピー符号化としてレンジコーダによる符号化を用いるものとする。
【0027】
図2に、本実施形態に係る音声復号装置200の構成を示す。音声復号装置200は、音声符号化装置100で符号化された信号を復号する装置であり、図2に示すように、エントロピー復号部21、逆量子化部22、帯域分割部23、シフト処理部24、周波数逆変換部25、レベル再現部26、フレーム合成部27により構成される。
【0028】
エントロピー復号部21は、エントロピー符号化された入力信号を復号し、逆量子化部22に出力する。
【0029】
逆量子化部22は、エントロピー復号部21で復号された周波数変換係数に対し逆量子化(例えば、スカラー逆量子化)を施す。このとき、逆量子化部22は、現在処理の対象であるフレームに含まれる周波数変換係数の帯域数が、元の(周波数変換時の)周波数変換係数の帯域数よりも少ない場合、不足分の周波数帯域については所定の値を挿入し、全ての周波数帯域が揃った周波数変換係数を帯域分割部23に出力する。不足分の周波数帯域に挿入する値は、入力された信号の周波数帯域のエネルギーの値よりも小さくなるような値(例えば、0)を挿入する。
【0030】
帯域分割部23は、逆量子化により得られたデータを、符号化時の帯域分割と同様に、人間の聴覚の特性に合わせて、低域ほど狭く、高域ほど広く帯域分割する。
【0031】
シフト処理部24は、逆量子化部22の逆量子化により得られた周波数変換係数のデータを、各分割帯域毎に符号化時にシフトしたビット数分だけ符号化時とは逆方向にシフトし、周波数逆変換部25に出力する。
【0032】
周波数逆変換部25は、シフト処理部24でシフト処理が施された周波数変換係数データに対し、周波数逆変換(例えば、逆MDCT)を施して時間軸を有する音声信号に変換し、レベル再現部26に出力する。
【0033】
レベル再現部26は、周波数逆変換部25から入力された音声信号のレベル調整(振幅調整)を行って元のレベルに戻し、フレーム合成部27に出力する。
【0034】
フレーム合成部27は、符号化及び復号の処理単位であったフレームを合成し、合成後の信号を再生信号として出力する。
【0035】
次に、本実施形態における動作について説明する。
まず、図4のフローチャートを参照して、音声符号化装置100において実行される音声符号化処理について説明する。
【0036】
まず、入力された音声信号が一定長のフレームに分割される(ステップS11)。次いで、フレーム毎に、入力された音声信号のレベル(振幅)が調整され(ステップS12)、レベル調整後の音声信号に対し、MDCTが施される(ステップS13)。
【0037】
次いで、MDCTにより得られたMDCT係数(周波数変換係数)が、人間の聴覚の特性に合わせて帯域分割される(ステップS14)。次いで、各分割帯域毎に、MDCT係数の絶対値の最大値が検索され(ステップS15)、各分割帯域での最大値が、各分割帯域で予め設定された量子化ビット数以下になるように、シフトビット数が算出される(ステップS16)。
【0038】
次いで、各分割帯域毎に、分割帯域中の全てのMDCT係数に対し、ステップS16で算出されたシフトビット数だけシフト処理が施され(ステップS17)、シフト処理後の信号に対し、所定の量子化(例えば、スカラー量子化)が施される(ステップS18)。
【0039】
次いで、ステップS18で算出された量子化値から周波数帯域毎に重要度が算出され(ステップS19)、重要度が高い帯域の順番でエントロピー符号化が行われ(ステップS20)、本音声符号化処理が終了する。ステップS20のエントロピー符号化については、後に図5を参照して詳細に説明する。
【0040】
次に、図5のフローチャートを参照して、エントロピー符号化部20において実行されるエントロピー符号化(図4のステップS20)について詳細に説明する。
【0041】
まず、ステップS19までの処理により得られた現在処理対象としているフレームの各周波数帯域についてのエネルギーに関するデータを参照して、最も重要度の高い周波数帯域のデータ(信号)が選択される(ステップS30)。次いで、周波数帯域番号iと、その周波数帯域におけるm個の周波数変換係数に対してレンジコーダ符号化が施される(ステップS31)。
【0042】
次いで、ステップS31の符号化によって、生成符号量が目標符号量になったか否かが判定される(ステップS32)。ステップS32において、目標符号量になったと判定された場合(ステップS32;YES)、本エントロピー符号化が終了する。
【0043】
ステップS32において、生成符号量が目標符号量に達していないと判定された場合(ステップS32;NO)、符号化が施されていない帯域のデータ(残データ)があるか否かが判定される(ステップS33)。
【0044】
ステップS33において、残データがあると判定された場合(ステップS33;YES)、次に重要度の高い周波数帯域のデータが選択され(ステップS34)、その選択された周波数帯域について、ステップS31及びS32の処理が繰り返される。ステップS33において、残データがないと判定された場合(ステップS33;NO)、本エントロピー符号化が終了する。
【0045】
次に、図7のフローチャートを参照して、音声復号装置200において実行される音声復号処理について説明する。
【0046】
まず、エントロピー符号化が施された符号化信号が復号処理される(ステップT10)。この復号処理により、レベル調整のためのシフトビット数、分割帯域における最大値調整のためのシフトビット数、各周波数帯域における周波数帯域番号及び周波数変換係数に関するデータが得られる。そして周波数変換係数データに対し、逆量子化が施される(ステップT11)。ここで、現在処理対象とするフレームのMDCT係数の帯域数が、元のMDCT係数の帯域数よりも少ない場合、不足分の帯域に所定の値(例えば、0)が挿入される。
【0047】
次いで、逆量子化により得られたMDCT係数が、符号化時に分割されたように、人間の聴覚の特性に合わせて帯域分割され(ステップT12)、当該MDCT係数に対し、各周波数帯域毎に、符号化時にシフトしたビット数分だけ符号化時とは逆方向にシフト処理が行われ(ステップT13)、シフト処理が施されたデータに対し、逆MDCTが施される(ステップT14)。次いで、逆MDCT後の音声信号がレベル調整により元のレベルに戻され(ステップT15)、符号化及び復号の処理単位であったフレームが合成され、本音声復号処理が終了する。
【0048】
以上のように、本実施形態の音声符号化装置100及び音声復号装置200によれば、エントロピー符号化を行う前に、予め周波数帯域毎に重要度を算出し、算出された重要度の高い順番で生成符号量が目標符号量になるまで符号化を行うことにより、従来のように何度も符号化をやり直すことがなく、演算量を削減させることが可能となる。
【0049】
次に、本実施形態の変形例について説明する。
<変形例1>
上述の実施形態では、重要度の高い周波数帯域の順番でエントロピー符号化を行ったため、符号化データに符号化順を表す周波数帯域を示す周波数帯域番号データを含ませて復号側に送信する必要があった。そこで、変形例1では、重要度の高い順番でエントロピー符号化を行った後、目標符号量で符号化された帯域に対して再度周波数帯域順にエントロピー符号化を施すことによって、符号化順を表すデータを送信する必要がなくなるような場合を示す。変形例1のエントロピー符号化部20において実行される符号化処理について、図8のフローチャートを参照して詳細に説明する。
【0050】
まず、1回目の符号化として、図5に示すエントロピー符号化が行われる(ステップS40)。次いで、この符号化によって目標符号量とするために符号化対象となった周波数帯域(選択帯域)が特定される(ステップS41)。図9は、この選択帯域を特定する処理が終了した段階で得られているデータの関係を示すものであり、周波数帯域番号別に、周波数変換係数、エネルギーgi(式(4)参照)、その周波数帯域が符号化対象となったことを示すフラグが付けられることを示す。ステップS41において選択帯域として特定された周波数帯域は、フラグの値が1となり、選択帯域として特定されていない周波数帯域は、フラグの値が0となる。
【0051】
次いで、ステップS41で特定された選択帯域(フラグの値が1の周波数帯域)に対し、今度は周波数順(例えば、周波数帯域番号の低い順)にエントロピー符号化(各周波数帯域における周波数変換係数に対するレンジコーダ符号化)が施され、また何番目の帯域の周波数変換係数が符号化されたかを示すデータ(例えば、図9のフラグを連続させたデータ)も符号化されて周波数変換係数の符号化データに付加され(ステップS42)、変形例1の符号化処理が終了する。
【0052】
<変形例2>
特許文献1に記載のように、音声信号の入力に応じて、音声信号を示す各記号の出現確率を格納した生起確率表を逐次更新するようなレンジコーダ符号化を用いる場合、変形例1のように、1回目の符号化で所定の符号量に合うように符号化対象の周波数帯域を決定し、その後、符号化順を変えて符号化をやり直すと、生起確率表の違いから生成符号量に若干差が出てしまう場合がある。そこで、変形例2では、変形例1の符号化処理を行った後に、生成符号量が目標符号量を超えてしまった場合には、予め指定された帯域を削除することで、生成符号量を目標符号量に抑える場合を示す。変形例2のエントロピー符号化部20において実行される符号化処理について、図10のフローチャートを参照して詳細に説明する。
【0053】
まず、変形例1と同様に、1回目の符号化として、図5に示すエントロピー符号化が行われ(ステップS50)、次いで、目標符号量で符号化するための周波数帯域(選択帯域)が特定される(ステップS51)。次いで、ステップS51で特定された選択帯域に対し、周波数順(周波数帯域番号の低い順)にエントロピー符号化が施される(ステップS52)。
【0054】
次いで、現在の生成符号量が目標符号量を超えているか否かが判定される(ステップS53)。ステップS53において、現在の生成符号量が目標符号量を超えていないと判定された場合(ステップS53;NO)、変形例2の符号化処理が終了する。
【0055】
ステップS53において、現在の生成符号量が目標符号量を超えていると判定された場合(ステップS53;YES)、符号化対象となったデータの中から、予め指定された帯域のデータ(例えば、最も高域側の帯域)が削除される(ステップS54)。次いで、ステップS54における帯域削除後に残った帯域のデータに対し、エントロピー符号化が施され(ステップS55)、変形例2の符号化処理が終了する。
【図面の簡単な説明】
【0056】
【図1】本発明の実施形態に係る音声符号化装置の構成を示すブロック図。
【図2】本発明の実施形態に係る音声復号装置の構成を示すブロック図。
【図3】周波数変換係数の帯域分割を説明するための図。
【図4】本実施形態の音声符号化装置において実行される音声符号化処理を示すフローチャート。
【図5】本実施形態におけるエントロピー符号化の詳細を示すフローチャート。
【図6】周波数帯域番号別に周波数変換係数とエネルギーとの関係を示す図。
【図7】本実施形態の音声復号装置において実行される音声復号処理を示すフローチャート。
【図8】本実施形態の変形例1における符号化処理を示すフローチャート。
【図9】周波数帯域番号別に周波数変換係数、エネルギー、フラグの関係を示す図。
【図10】本実施形態の変形例2における符号化処理を示すフローチャート。
【符号の説明】
【0057】
11 フレーム化部(フレーム化手段)
12 レベル調整部(振幅調整手段)
13 周波数変換部(周波数変換手段)
14 帯域分割部(帯域分割手段)
15 最大値検索部(検索手段)
16 シフト数算出部(シフト数算出手段)
17 シフト処理部(シフト処理手段)
18 量子化部
19 帯域重要度算出部(重要度算出手段)
20 エントロピー符号化部(符号化手段、比較手段)
21 エントロピー復号部(復号手段)
22 逆量子化部
23 帯域分割部
24 シフト処理部
25 周波数逆変換部(周波数逆変換手段)
26 レベル再現部
27 フレーム合成部
100 音声符号化装置
200 音声復号装置




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013