米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> 株式会社日立製作所

発明の名称 デジタル電話装置
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開平6−6426
公開日 平成6年(1994)1月14日
出願番号 特願平4−164542
出願日 平成4年(1992)6月23日
代理人 【弁理士】
【氏名又は名称】小川 勝男
発明者 波多野 雄治 / 大塚 正則 / 菊池 隆文 / 村上 康之 / 堀田 正生
要約 目的


構成
マイクロからの原音声入力301はA/D変換器302によりサンプリング/量子化され、音声符号化器303への入力となる。符号化のパラメータの選定は合成音声p′(n)と聴覚重み付け入力音声p(n)の間の総重み付け誤差が最小になるように行われる。同時に合成音声p′(n)は、ポストフィルタ304を経て必要な帯域制限を施された後、側音305として受信パラメータを複号した音声出力311に重畳され、D/A変換器312によりスピーカへの入力313となる。
特許請求の範囲
【請求項1】話者音声を符号化したパラメータを復号した合成音声を側音として話者の聴覚に帰還することを特徴とするデジタル電話装置。
【請求項2】請求項1において、音声符号化に用いるコードブックが、あらかじめ特定話者の明朗で緩慢な音声を符号化することに必要な最小限の大きさに限定されているデジタル電話装置。
【請求項3】請求項1において、話者の原音声と符号化したパラメータを復号した合成音声との残渣の大きさに対応した雑音を側音に付加するデジタル電話装置。
発明の詳細な説明
【0001】
【産業上の利用分野】本発明は、話者の音声を符号化したパラメータが送信され、聞き手側では受信されたパラメータを復号した合成音声を聴取するデジタル電話装置に係り、特に、音声符号化を低消費電力で行わなくてはならない携帯デジタル移動無線電話装置に関する。
【0002】
【従来の技術】一般にデジタル電話装置では音声信号は符号化したパラメータとして送信される。特に限られた周波数帯域を多数の加入者で共用する移動無線システムでは符号化結果のビットレートが低いことが要求される。これは音声を表現するパラメータが少数のものに限定されることを意味する。このような低ビットレートの音声符号化方式の代表的なものにCELP(Code Excitaion Linear Prediction)方式がある。
【0003】CELP方式における音声符号化処理の流れを図1に示す。入力音声は8kHzでサンプリングされ、13bに量子化されている。この入力音声は20ms(160サンプル)毎のフレームに区分される。フレーム毎の入力音声データは、スペクトルプリフィルタ101を経た後、コードブック102と呼ばれる基底ベクトル群と重み付け合成フィルタ103を用いて近似される。
【0004】まず、入力音声の高周波成分を近似する合成フィルタA(z)の係数として短期予測係数αi(i=1〜10)を決定する。次にコードブック102の要素ベクトルから符号語Iで指定される線形結合を形成してコードブック出力とする。コードブックは2個あり、各コードブック出力に利得γ1,γ2を乗じて加算して励起信号ex(n)を形成する。
【0005】短期予測係数をαiとする重み付け合成フィルタH(z)103に、この励起信号ex(n)を通すことにより、合成音声p′(n)が生成される。一方、入力音声s(n)を聴覚重み付けフィルタW(z)104に通した聴覚重み付け入力音声p(n)が形成される。フレーム内での合成音声p′(n)と聴覚重み付け入力音声p(n)の二乗和が総重み付け誤差105であり、これを最小にするように符号語I,利得γを探索する。コードブックが2個ある場合には符号語はI1とI2、利得はγ1とγ2の各2個になる。こうして選定されたI1,I2,γ1,γ2,α1 〜α10(106)が有限ビット数で表現するために量子化されたものがパラメータとして送信される。
【0006】次に音声復号化処理の流れを図2に示す。I1,I2,γ1,γ2,α1〜α10 がパラメータとして受信される。コードブック1(201)の要素ベクトルから符号語I1 で指定される線形結合を形成してコードブック1の出力とする。同様にコードブック2(202)の要素ベクトルから符号語I2 で指定される線形結合を形成してコードブック2の出力とする。2個のコードブック出力に利得γ1,γ2を乗じて加算して励起信号ex(n)を形成する。この励起信号ex(n)をピッチプリフィルタ203を通した後、短期予測係数をαiとする合成フィルタA(z)204に通し、さらにスペクトルポストフィルタ205を通すことにより、合成音声p′(n)が生成される。
【0007】図2を図1と比較すると音声符号化過程が復号化過程を含むことがわかる。すなわち、CELP方式は合成による分析(Analysis by Synthesis)を行っているのである。
【0008】CELP方式で符号化された音声の品質はコードブックのサイズと、パラメータの量子化ステップサイズに依存する。コードブックに用意されている基底ベクトルの数が豊富で、かつ各パラメータを誤差を抑えて量子化できれば、原音声は高い忠実度で合成音声で近似される。このため高い音質を保証するためにはコードブックのサイズと、展開係数の量子化ビット数を十分に確保することが必要である。
【0009】しかし、コードブックのサイズを拡げることと、展開係数の量子化ビット数を拡げることはともに符号化結果のビットレートを拡げることにつながる。このため抑えられたビットレートのもとで通話を実現するには、低音質のもとでも意味を了解できるように明朗にゆっくり発音したり、あるいは符号化誤差が少ないような特定の語彙で話す必要がある。
【0010】
【発明が解決しようとする課題】本発明の第1の目的は音声符号化の音質が悪い場合でも、通話を維持できるような装置を提供することにある。
【0011】本発明の第2の目的はコードブックのサイズ及び展開係数の量子化ビット数を抑えた場合でも、符号化誤差を小さく保てるように入力音声の内容に制約を与える装置を提供することにある。
【0012】本発明の第3の目的はサイズが小さくても符号化誤差を小さく保てるようなコードブックを使用する装置を提供することにある。
【0013】
【課題を解決するための手段】本発明の第1及び第2の目的は話者音声を符号化したパラメータを復号した合成音声を側音として話者の聴覚に帰還することによって達成される。また、話者の原音声と音声符号化した音声データを復号した合成音声との残渣の大きさに対応した雑音を側音に付加することによっても達成される。
【0014】本発明の第3の目的は音声符号化に用いるコードブックを、あらかじめ特定話者が、必要な最低限の語彙に対して、一定の抑揚,一定の調子で、かつ明朗で、緩慢な音声を、残渣最小に符号化するように最適化することによって達成される。
【0015】
【作用】話者音声を符号化したパラメータを復号した合成音声を側音として話者の聴覚に帰還することによって、話者は符号化音声の音質を常に把握可能である。このため、話者は自然に低音質のもとでも必要な意味を伝達できるように明朗にゆっくり発音したり、あるいは言葉を言い替えるなどの必要な努力を払うようになる。
【0016】また、コードブックのサイズ及び展開係数の量子化ビット数を抑えた場合でも、語彙,抑揚,声調によっては符号化残渣が小さくなる。一般に明朗で緩慢な発声を行えば符号化残渣が小さくなる。話者自身が符号化音声の音質を把握していることにより、話者は常にどのように語彙を選んだり、抑揚,声調を整えればよいかを意識するようになる。そして、どのように入力音声の内容に制約を加えたり、発声を行えば明朗な音声が合成されるのかが、自然に訓練されるようになる。
【0017】訓練の成果は話者の原音声と音声符号化した音声データを復号した合成音声との残渣の大きさに対応した不快な雑音を側音に付加することによって強調される。すなわち、話者は不快な雑音を聞きたくないために、合成音声との残渣が少なくなるような発声方法を工夫することになる。
【0018】以上の作用で符号化入力のパターンが限定可能なため、小規模なコードブックでも残渣の少ない符号化を行うことが可能となる。
【0019】
【実施例】本発明による、話者音声を符号化したパラメータを復号した合成音声を側音として話者の聴覚に帰還するデジタル電話装置の構成を図3に示す。マイクからの原音声入力301はA/D変換器302によりサンプリング/量子化され、音声符号化器303への入力となる。符号化のパラメータの選定は合成音声p′(n)と聴覚重み付け入力音声p(n)の間の総重み付け誤差が最小になるように行われる。
【0020】同時に合成音声p′(n)は、ポストフィルタ304を経て必要な帯域制限を施された後、側音305として受信パラメータを復号した音声出力311に重畳され、D/A変換器312によりスピーカの入力313となる。
【0021】本発明による、話者の原音声と符号化したパラメータを復号した合成音声との残渣の大きさに対応した雑音を側音に付加するデジタル電話装置の構成を図4に示す。雑音発声装置401は合成音声p′(n)と聴覚重み付け入力音声p(n)の間の総重み付け誤差に比例した大きさの雑音を側音306に重畳する。雑音は話者が不快と感じるものを発生する。雑音の代わりに話者が不快と感じる刺激、例えば感電するような高電圧を受話器表面に誘起すること,話者がまぶしがる光線を発すること,話者の皮膚に痛覚を誘起するような針状突起を突き出すこと等も同様に有効である。
【0022】コードブックは話者の音声を最小限のビットレートで伝送可能なように最適化される。すなわち、あらかじめ話者は自分の音声を最小限のサイズのコードブックから合成可能なようにトレーニングを行う。この時は非通話状態にしておく。受信系はスピーカから切り離され、話者の合成音声である側音のみを話者は聴取する。トレーニングにより、話者は符号化残渣を抑えるような語彙,抑揚,声調を習得する。CELP系の音声符号化に際しては、子音よりも母音が容易に符号化可能である。即ち、少数の基底ベクトルでも残渣を少なく抑えることができる。すなわち、母音が優勢的になるように緩慢に発声することにより残渣を少なく抑えることができる。トレーニングにより話者は緩慢な発声で会話を行うことを習慣付けられる。
【0023】同時に符号化残渣が最小化されるようにコードブックも最適化される。最適化されたコードブックは話者に固有の構造を有する。従って本移動無線電話装置に内蔵されるコードブックは特定の個人に専属させることが望ましい。移動無線電話装置では特定の所持者のみの使用に専ら供することは十分妥当なことである。移動無線電話装置に内蔵されるコードブックが本来の所持者にのみ最適化されることは、盗難の予防に役立つ等の副次的な効果もある。
【0024】話者毎にコードブックが異なることは不特定の二人の間の通話に際して事前に話者のコードブックを聞き手側に送付する必要があることを示す。通常、CELP系のコードブックのサイズは512W(ワード)×16b程度であるから、8kbpsの通話チャネルが確保されている場合には1秒程度で送信可能である。
【0025】
【発明の効果】本発明によれば話者が符号化音声の音質を常に把握できるので、話者は自然に低音質のもとでも必要な意味を伝達できるように明朗にゆっくり発音したり、あるいは言葉を言い替えるなどの必要な努力を払うようになる。また、トレーニングを重ねることにより、語彙,抑揚,声調をどのように選べば明朗な音声が合成されるのか、自然に訓練されるようになる。
【0026】また、本発明によれば話者の原音声と音声符号化した音声データを復号した合成音声との残渣の大きさに対応した不快な雑音が側音に付加されるので、話者は不快な雑音を聞きたくないために、合成音声との残渣が少なくなるような発声方法を熱心に工夫することになり、訓練の成果が上がる。
【0027】さらに、本発明によれば音声符号化に用いるコードブックを、あらかじめ特定話者が、必要な最低限の語彙に対して、一定の抑揚,一定の調子で、かつ明朗で、緩慢な音声を、残渣最小に符号化するように最適化することができるので、コードブックのサイズが小さくても良好な音質を維持することが可能になる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013