米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 楽器;音響 -> 沖電気工業株式会社

発明の名称 音声合成方法,音声合成装置,およびコンピュータプログラム
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2007−25338(P2007−25338A)
公開日 平成19年2月1日(2007.2.1)
出願番号 特願2005−208532(P2005−208532)
出願日 平成17年7月19日(2005.7.19)
代理人 【識別番号】100095957
【弁理士】
【氏名又は名称】亀谷 美明
発明者 兼安 勉
要約 課題
音声の話者,音量,音程,または話速を変更し,キーワード部分に対する出力音声と,その他の部分に対する出力音声とを識別できるような音声合成をしても音質の劣化を抑えることが可能な音声合成装置,音声合成方法,およびコンピュータプログラムを提供する。

解決手段
上記音声合成装置(100,900)は,テキスト本文に含まれる全てのキーワードの音韻の候補を,当該キーワード以外の音韻の候補よりも優先的に,当該キーワードの出現順で,コーパスから選択するキーワード優先音韻選択部(107,907)を備えることを特徴としている。
特許請求の範囲
【請求項1】
キーワード部分を強調し音声合成を行う音声合成方法であって:
テキスト本文に含まれる全てのキーワードの音韻の候補を,該キーワード以外の音韻の候補よりも優先的に,該キーワードの出現順で,コーパスから選択する選択処理が実行されることを特徴とする,音声合成方法。
【請求項2】
前記選択処理は,前記キーワード部分のコスト値が最小となる単位候補の組合せを用いて,前記テキスト本文の開始位置から最初に出現したキーワード開始位置に向けて,コスト値が最小となる単位候補の組合せを選択し;
前記キーワードが2つ以上存在する場合,該キーワードの終了位置から後続のキーワードの開始位置に向けて,前記コスト値が最小となる単位候補の組合せを選択することを特徴とする,請求項1に記載の音声合成方法。
【請求項3】
前記音声合成方法では,前記選択処理の前に,キーワードの音韻記号が,テキスト本文の音韻記号の内で,部分一致しているかを音韻記号の先頭からサーチするキーワード抽出処理が行われることを特徴とする,請求項1又は2に記載の音声合成方法。
【請求項4】
前記キーワード抽出処理は,前記キーワードの音韻記号と前記テキスト本文の音韻記号とが部分一致している個所を基に,韻律予測情報に記載された各音韻ごとのキーワード位置情報の値を変更し;
その変更後のキーワード位置情報を含んだ前記韻律予測情報を基にして,前記選択処理は,前記テキスト文に含まれる全てのキーワードの音韻の候補を,前記コーパスから選択することを特徴とする,請求項1〜3のいずれかに記載の音声合成方法。
【請求項5】
声の高さ,声の長さ,またはメルケプストラムのうち少なくとも一つを予測する情報である韻律予測情報に記載された各音韻のキーワード位置情報の値を変更することにより,前記キーワードの音韻記号と前記テキスト本文の音韻記号とが部分一致していることを示すことを特徴とする,請求項1〜4のいずれかに記載の音声合成方法。
【請求項6】
前記音声合成方法では,前記テキスト本文内の1又は2以上のキーワードに対して,該キーワード部分を強調する度合いを示すキーワード重み付け係数を付与する重み付け付与処理がさらに行われることを特徴とする,請求項1〜5のいずれかに記載の音声合成方法。
【請求項7】
前記キーワード抽出処理では,前記テキスト本文内の1又は2以上のキーワードに対して,前記重み付け付与処理で付与されたキーワード重み付け係数をキーワード重み付け情報として取得し,そのキーワード重み付け情報と前記単位候補の組合せを絞り込む幅とを対応付けたテーブルが用いられることを特徴とする,請求項4に記載の音声合成方法。
【請求項8】
前記選択処理では,ターゲットコスト幅と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを足し合わせたコスト値が最小となる値を基にして,前記単位候補の組合せを絞り込む幅の範囲内に収まるコスト値をもつ単位候補の組合せを選択することを特徴とする,請求項7に記載の音声合成方法。
【請求項9】
キーワード部分を強調し音声合成を行う音声合成装置であって:
テキスト本文に含まれる全てのキーワードの音韻の候補を,該キーワード以外の音韻の候補よりも優先的に,該キーワードの出現順で,コーパスから選択するキーワード優先音韻選択部を備えることを特徴とする,音声合成装置。
【請求項10】
前記キーワード優先音韻選択部は,前記キーワード部分のコスト値が最小となる単位候補の組合せを用いて,前記テキスト本文の開始位置から最初に出現したキーワード開始位置に向けて,コスト値が最小となる単位候補の組合せを選択し;
前記キーワードが2つ以上存在する場合,該キーワードの終了位置から後続のキーワードの開始位置に向けて,前記コスト値が最小となる単位候補の組合せを選択することを特徴とする,請求項9に記載の音声合成装置。
【請求項11】
前記音声合成装置は,前記キーワードの音韻記号が,前記テキスト本文の音韻記号の内で,部分一致しているかを音韻記号の先頭からサーチするキーワード抽出部をさらに備えることを特徴とする,請求項9又は10に記載の音声合成装置。
【請求項12】
前記キーワード抽出部は,前記キーワードの音韻記号と前記テキスト本文の音韻記号とが部分一致している個所を基に,韻律予測情報に記載された各音韻ごとのキーワード位置情報の値を変更し;
前記キーワード優先音韻選択部は,前記変更後のキーワード位置情報を含んだ前記韻律予測情報を基にして,前記テキスト文に含まれる全てのキーワードの音韻の候補を,前記コーパスから選択することを特徴とする,請求項9〜11項のいずれかに記載の音声合成装置。
【請求項13】
前記キーワード抽出部が,声の高さ,声の長さ,またはメルケプストラムのうち少なくとも一つを予測する情報である韻律予測情報に記載された各音韻のキーワード位置情報の値を変更することにより,該変更されたキーワード位置情報の値は,キーワードの音韻記号とテキスト本文の音韻記号とが部分一致していることを示すことを特徴とする,請求項9〜12のいずれかに記載の音声合成装置。
【請求項14】
前記音声合成装置は,前記テキスト本文内の1又は2以上のキーワードに対して,該キーワード部分を強調する度合いを示すキーワード重み付け係数を付与する重み付け部をさらに備えることを特徴とする,請求項9〜13のいずれかに記載の音声合成装置。
【請求項15】
前記キーワード抽出部は,前記テキスト本文内の1又は2以上のキーワードに対して,前記重み付け部で付与されたキーワード重み付け係数をキーワード重み付け情報として取得し,そのキーワード重み付け情報と前記単位候補の組合せを絞り込む幅とを対応付けたテーブルを用いることを特徴とする,請求項12に記載の音声合成装置。
【請求項16】
前記キーワード優先音韻選択部は,ターゲットコスト幅と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを足し合わせたコスト値が最小となる値を基にして,前記単位候補の組合せを絞り込む幅の範囲内に収まるコスト値をもつ単位候補の組合せを選択することを特徴とする,請求項15に記載の音声合成装置。
【請求項17】
コンピュータをして,キーワード部分を強調し音声合成を行う音声合成装置として機能させることを特徴とする,請求項9〜16項のいずれかに記載のコンピュータプログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は文書を読み上げるための音声合成にかかり,特にキーワードを強調する音声合成方法,音声合成装置,およびコンピュータプログラムに関する。
【背景技術】
【0002】
予め録音された人の自然音声等を基にして,PC(パーソナルコンピュータ)に記憶された文書を,音声に変換して読み上げる音声合成装置が一般的に知られている。上記音声合成装置は,品詞単位に分割可能な自然音声が記録されているコーパスに基づいて合成音声を作成する。
【0003】
上記音声合成装置による音声合成処理では,例えば,入力されたテキストに対して形態素解析,係り受け解析を実行し,音素記号,アクセント記号などに変換される。
【0004】
次に,音素記号,アクセント記号列,および形態素解析結果から得られる入力テキストの品詞情報を用いて,音素持続時間(声の長さ),基本周波数(声の高さ),母音中心のパワー(声の大きさ)等の推定が行われる。
【0005】
次に,上記推定された音素持続時間,基本周波数,母音中心のパワーなどに最も近く,かつ波形辞書に蓄積されている合成単位(音素片)を接続したときの歪みが最も小さくなる合成単位の組合せが動的計画法等を用いて選択される。なお,この際に行われる単位選択では,知覚的特徴に一致した尺度(コスト値)を用いる。
【0006】
上記合成単位の組合せが選択されると,当該選択された音素片の組合せに従って,ピッチを変換しつつ音素片の接続を行うことにより音声が合成される。以上が,音声合成処理の概略である。
【0007】
また,上記音声合成装置のなかには,文書中の重要な個所,文書作成者が読み手に特に伝えたい個所を強調して読み上げることが可能な装置が開発されている(例えば,特許文献1,参照)。
【0008】
【特許文献1】特開平10−274999号公報
【発明の開示】
【発明が解決しようとする課題】
【0009】
しかしながら,音声合成装置において文書中の重要な個所を強調する際に,上記音声の話者,音量,音程,または話速を変更することによって,キーワード部分に対する出力音声と,その他の部分に対する出力音声とが識別できるように音声合成をすると,かかる強調部分の音質が劣化するという問題があった。
【0010】
本発明は,上記問題点に鑑みてなされたものであり,本発明の目的は,音声の話者,音量,音程,または話速を変更し,キーワード部分に対する出力音声と,その他の部分に対する出力音声とを識別できるような音声合成をしても音質の劣化を抑えることが可能な,新規かつ改良された音声合成装置,音声合成方法,およびコンピュータプログラムを提供することである。
【課題を解決するための手段】
【0011】
上記課題を解決するため,本発明の第1の観点によれば,キーワード部分を強調し音声合成を行う音声合成方法が提供される。上記音声合成方法は,テキスト本文に含まれる全てのキーワードの音韻の候補を,該キーワード以外の音韻の候補よりも優先的に,該キーワードの出現順で,コーパスから選択する選択処理が実行されることを特徴としている。なお,上記コーパスには,例えば,少なくとも品詞単位に分割可能な自然音声が記録されているが,かかる例に限定されない。
【0012】
上記選択処理は,上記キーワード部分のコスト値が最小となる単位候補の組合せを用いて,上記テキスト本文の開始位置から最初に出現したキーワード開始位置に向けて,コスト値が最小となる単位候補の組合せを選択し;上記キーワードが2つ以上存在する場合,該キーワードの終了位置から後続のキーワードの開始位置に向けて,上記コスト値が最小となる単位候補の組合せを選択するように構成しても良い。
【0013】
上記音声合成方法では,上記選択処理の前に,キーワードの音韻記号が,テキスト本文の音韻記号の内で,部分一致しているかを音韻記号の先頭からサーチするキーワード抽出処理が行われるようにしてもよい。
【0014】
上記キーワード抽出処理は,上記キーワードの音韻記号と上記テキスト本文の音韻記号とが部分一致している個所を基に,韻律予測情報に記載された各音韻ごとのキーワード位置情報の値を変更し;その変更後のキーワード位置情報を含んだ上記韻律予測情報を基にして,上記選択処理は,上記テキスト文に含まれる全てのキーワードの音韻の候補を,上記コーパスから選択するようにしてもよい。
【0015】
声の高さ,声の長さ,またはメルケプストラムのうち少なくとも一つを予測する情報である韻律予測情報に記載された各音韻のキーワード位置情報の値を変更することにより,キーワードの音韻記号とテキスト本文の音韻記号とが部分一致していることを示すようにしてもよい。
【0016】
上記音声合成方法では,上記テキスト本文内の1又は2以上のキーワードに対して,該キーワード部分を強調する度合いを示すキーワード重み付け係数を付与する重み付け付与処理がさらに行われるように構成しても良い。
【0017】
上記キーワード抽出処理では,上記テキスト本文内の1又は2以上のキーワードに対して,上記重み付け付与処理で付与されたキーワード重み付け係数をキーワード重み付け情報として取得し,そのキーワード重み付け情報と上記単位候補の組合せを絞り込む幅とを対応付けたテーブルが用いられるように構成してもよい。
【0018】
上記選択処理では,ターゲットコスト幅と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを足し合わせたコスト値が最小となる値を基にして,上記単位候補の組合せを絞り込む幅の範囲内に収まるコスト値をもつ単位候補の組合せを選択するように構成してもよい。
【0019】
上記課題を解決するために,本発明の別の観点によれば,キーワード部分を強調し音声合成を行う音声合成装置が提供される。上記音声合成装置は,テキスト本文に含まれる全てのキーワードの音韻の候補を,当該キーワード以外の音韻の候補よりも優先的に,当該キーワードの出現順で,コーパスから選択するキーワード優先音韻選択部を備えることを特徴としている。なお,上記コーパスには,例えば,少なくとも品詞単位に分割可能な自然音声が記録されている。
【0020】
上記キーワード優先音韻選択部は,キーワード部分のコスト値が最小となる単位候補の組合せを用いて,上記テキスト本文の開始位置から最初に出現したキーワード開始位置に向けて,コスト値が最小となる単位候補の組合せを選択し;上記キーワードが2つ以上存在する場合,該キーワードの終了位置から後続のキーワードの開始位置に向けて,上記コスト値が最小となる単位候補の組合せを選択するように構成しても良い。
【0021】
上記音声合成装置は,上記キーワードの音韻記号が,上記テキスト本文の音韻記号の内で,部分一致しているかを音韻記号の先頭からサーチするキーワード抽出部をさらに備えてもよい。
【0022】
上記キーワード抽出部は,上記キーワードの音韻記号と上記テキスト本文の音韻記号とが部分一致している個所を基に,韻律予測情報に記載された各音韻ごとのキーワード位置情報の値を変更し;上記キーワード優先音韻選択部は,上記変更後のキーワード位置情報を含んだ上記韻律予測情報を基にして,上記テキスト文に含まれる全てのキーワードの音韻の候補を,上記コーパスから選択するようにしてもよい。
【0023】
上記キーワード抽出部が,声の高さ,声の長さ,またはメルケプストラムのうち少なくとも一つを予測する情報である韻律予測情報に記載された各音韻のキーワード位置情報の値を変更することにより,該変更されたキーワード位置情報の値は,キーワードの音韻記号とテキスト本文の音韻記号とが部分一致していることを示すようにしてもよい。
【0024】
上記音声合成装置は,上記テキスト本文内の1又は2以上のキーワードに対して,該キーワード部分を強調する度合いを示すキーワード重み付け係数を付与する重み付け部をさらに備えてもよい。
【0025】
上記キーワード抽出部は,上記テキスト本文内の1又は2以上のキーワードに対して,上記重み付け部で付与されたキーワード重み付け係数をキーワード重み付け情報として取得し,そのキーワード重み付け情報と上記単位候補の組合せを絞り込む幅とを対応付けたテーブルを用いるように構成しても良い。
【0026】
上記キーワード優先音韻選択部は,ターゲットコスト幅と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを足し合わせたコスト値が最小となる値を基にして,上記単位候補の組合せを絞り込む幅の範囲内に収まるコスト値をもつ単位候補の組合せを選択するように構成しても良い。
【0027】
上記課題を解決するために,本発明の別の観点によれば,コンピュータをして,キーワード部分を強調し音声合成を行う音声合成装置として機能させるコンピュータプログラムが提供される。
【発明の効果】
【0028】
以上説明したように,本発明によれば,音声の話者,音量,音程,または話速を変更しても,キーワード部分に対する出力音声とその他の部分に対する出力音声とを識別可能なように音声合成しても,強調させたいキーワード部分の音質の劣化を最小限に抑えることができる。
【発明を実施するための最良の形態】
【0029】
以下,本発明の好適な実施の形態について,添付図面を参照しながら詳細に説明する。なお,以下の説明及び添付図面において,略同一の機能及び構成を有する構成要素については,同一符号を付することにより,重複説明を省略する。
【0030】
(音声合成装置について)
まず,図1を参照しながら,第1の実施の形態にかかる音声合成装置100について説明する。なお,図1は,第1の実施の形態にかかる音声合成装置の概略的な構成を示すブロック図である。
【0031】
図1に示すように,音声合成装置100は,テキスト解析部101と,韻律予測部103と,キーワード抽出部105と,キーワード優先音韻選択部107と,コーパス109と,音韻接続部111とを備えている。
【0032】
上記テキスト解析部101は,図1に示すように,漢字仮名文字で表現されたテキスト本文と,テキスト本文の中で強調させたい漢字仮名文字で表現されたキーワードとを入力し,そのテキスト本文とキーワードを音韻記号に変換する。なお,音韻とは,例えば音素記号で表されるような分節可能な単位を示すが,かかる例に限定されない。
【0033】
また,テキスト解析部101は,上記音韻記号に変換後,漢字仮名文字で表現されたテキスト本文に,形態素解析,係り受け解析を行い,アクセント記号列と,テキスト本文の品詞情報を表す形態素解析結果とを出力する。
【0034】
上記韻律予測部103は,テキスト解析部101により変換されたテキスト本文の音韻記号と,テキスト解析部101から出力されるアクセント記号列と,形態素解析結果とから得られるテキスト本文の品詞情報を基にして,ピッチ(声の高さ:基本周波数F)と,音韻継続時間長(声の長さ)と,波形の成分を表現するメルケプストラムとを予測する。なお,その予測した結果が韻律予測情報となる。また,メルケプストラム等の詳細については,特開2003−208188に記載されている。
【0035】
図1に示すように,キーワード抽出部105は,キーワードの音韻記号が,テキスト本文の音韻記号のなかで部分的に一致しているか否かをテキスト本文の音韻記号の先頭から順にサーチする。
【0036】
また,キーワード抽出部105は,キーワードの音韻記号とテキスト本文における音韻記号とが部分的に一致している個所を基に,韻律予測部103から受ける韻律予測情報に記載された各音韻ごとのキーワード位置情報の値を,テキスト本文における音韻記号のなかで部分的に一致している全ての音韻について変更する。
【0037】
上記キーワード優先音韻選択部107は,韻律予測部103で予測したピッチと,音韻継続時間長と,メルケプストラムとを,音韻選択処理のパラメータとして,コーパス109から音韻を選択する。なお,コーパス109は,例えば,ハードディスクドライブ等の記憶手段に記憶されている。
【0038】
上記音韻を選択する処理では,キーワード優先音韻選択部107は知覚的特性に一致した尺度(コスト)を使用する。また,観測可能な特徴量から,心理量にマッピングを行ったコスト関数は,韻律に関するサブコストと,ピッチの不連続に関するサブコストと,音韻環境代替に関するサブコストと,スペクトルの不連続に関するサブコストと,音韻の適合性に関するサブコストとの重み付けされた5つのサブコスト関数を足し合わせた関数として構成される(例えば,特開2003−208188,参照)。
【0039】
なお,音声合成装置100は,テキスト本文とキーワードを基にして合成音声を出力することが可能な装置であって,その合成音声を出力することで,テキスト本文を音声にして読み上げることが可能な装置である。より具体的には,音声合成装置100は,例えば,CPU,メモリ,HDD(ハードディスクドライブ),マウス等に相当する入力部,液晶ディスプレイ等に相当する表示部などを備えたPC等を例示することができるが,かかる例に限定されない。
【0040】
なお,本実施の形態にかかる音声合成装置100に備わる表示部は,CPUにより表示可能なように処理された表示画面データと音声データを出力する。また,表示部は,例えば,TV又は液晶ディスプレイ装置などが例示され,上記双方ともにスピーカーを備えて,静止画像のほか,音声,又は動画像などを出力することが可能である。
【0041】
入力部は,例えば,使用者から操作指示を受けることが可能なマウス,トラックボール,トラックパッド,スタイラスペン,またはジョイスティックなどのポインティングデバイスや,キーボード,ボタン,スイッチ,レバー等の操作手段と,入力信号を生成してCPUに出力する入力制御回路などから構成されている。音声合成装置100のユーザは,この入力部を操作することにより,音声合成装置100に対して各種のデータを入力したり処理動作を指示したりすることができる。
【0042】
(音声合成方法について)
次に,図2を参照しながら,第1の実施の形態にかかる音声合成方法について説明する。なお,図2は,第1の実施の形態にかかる音声合成方法の概略を示すフローチャートである。
【0043】
図2に示すように,まず,1又は2以上のキーワードを含むテキスト本文と,強調させたい1又は2以上のキーワードとは,テキスト解析部101に入力する(S201)。なお,上記テキスト本文およびキーワードは漢字仮名文字で表現された場合を例に挙げて説明するが,かかる例に限定されない。
【0044】
次に,テキスト解析部101は,上記入力したテキスト本文とキーワードとを音韻記号に変換する(S203)。
【0045】
テキスト解析部101は,漢字仮名文字で表現されたテキスト本文に,形態素解析,係り受け解析を行い,アクセント記号列と,テキスト本文の品詞情報を表す形態素解析結果とを出力する(S203)。
【0046】
なお,図2に示すように,テキスト本文に対して変換された音韻記号と,形態素解析結果との情報を持つ出力結果は,例えば,テキスト本文中間言語であると定義するが,かかる例に限定されない。
【0047】
ここで,テキスト本文が変換された音韻記号501(図5Aに示す「テキスト本文音韻記号」)は,例えば,図5Aに示すように,「hajime…aoki」である。
【0048】
また,キーワードに対して変換された音韻記号を持つ出力結果を,キーワード中間言語とするが,かかる例に限定されない。
【0049】
また,図5Aに示すように,キーワードの音韻記号502(図5Aに示す「キーワード音韻記号」)は,例えば,「aoki」である。
【0050】
次に,図2に示すように,テキスト解析部101は,テキスト本文を韻律予測部103に入力するために,テキスト本文であるかどうかを判定する(S205)。
【0051】
判定の結果(S205),テキスト本文である場合,テキスト解析部101は,テキスト本文中間言語を出力して韻律予測部103に送信する。
【0052】
さらに,判定の結果(S205),テキスト本文である場合,テキスト解析部101は,テキスト本文中間言語をキーワード抽出部105に出力する。
【0053】
一方,テキスト本文でない場合,つまりキーワードである場合,テキスト解析部101は,キーワード中間言語をキーワード抽出部105に送信する。
【0054】
次に,韻律予測部103は,ピッチ(声の高さ:基本周波数F),音韻継続時間長(声の長さ),もしくは波形の成分を表現するメルケプストラムのうち少なくとも一つまたは全部を予測する(S207)。
【0055】
韻律予測部103は,予測した情報として韻律予測情報をキーワード抽出部105に出力する。
【0056】
ここで,上記韻律予測情報について説明すると,図5Aに示すように,韻律予測情報503は,音韻記号501(図5Aに示す例では,「hajime…aoki…」。)の音韻(韻律予測情報503内の縦方向に記載された「hajime…aoki…」)ごとに,音韻の開始時間を表す「start」と,音韻の継続時間長を表す「duration」と,音韻の1又は2以上のピッチを表す「pitch」と,音韻の1又は2以上のメルケプストラムを表す「Mel cep」とから少なくとも構成される。
【0057】
次に,図2に示すように,キーワード抽出部105は,キーワードの音韻記号と,テキスト本文における音韻記号とが部分的に一致している個所を基に,韻律予測情報に記載された各音韻ごとのキーワード位置情報の値を,テキスト本文内の音韻記号について部分一致している音韻記号全てに対して変更し,その変更したキーワード位置情報付き韻律予測情報を,キーワード優先音韻選択部107に出力する。
【0058】
(キーワード抽出部による処理について)
次に,キーワード抽出部105は,図2に示すように,テキスト本文内でキーワードがどの位置に存在しているかを示すための情報(キーワード位置情報)を記載するため,韻律予測情報における各音韻に対して領域を確保し,初期化する(S209)。なお,上記初期化の際には,キーワード位置情報のフラグ値をfalseに設定するが,かかる例に限定されない。
【0059】
次に,キーワード抽出部105は,テキスト本文と,キーワードとの音韻記号内で,現在どの音韻を指し示しているかを表現した音韻位置指示子を,テキスト本文と1又は2以上のキーワードにおける先頭音韻に設定する(S211)。
【0060】
次に,キーワード抽出部105は,テキスト本文と,複数のキーワードに対して,音韻の数を求め,各キーワード音韻数にキーワードの音韻数,テキスト音韻数にテキスト本文の音韻数を設定する(S213)。
【0061】
次に,キーワード抽出部105は,テキスト本文の文末であるか否かを判定する(S215)。
【0062】
上記テキスト本文の文末であるか否かの判定した結果(S215),テキスト本文の文末でない場合,キーワード抽出部105は,テキスト本文内にあるキーワードの個所を抽出する(S217)。なお,上記キーワードの抽出処理(S217)については,後程説明する。
【0063】
上記テキスト本文の文末である場合,キーワード抽出部105は,韻律予測情報と,韻律予測情報内の各音韻ごとに(付随する)キーワード位置情報とを有する,キーワード位置情報付き韻律予測情報をキーワード優先音韻選択部107に出力する。
【0064】
なお,図4Bに示すように,テキスト本文の文末であるか否かの基準は,テキスト本文の音韻位置指示子が,テキスト音韻数より小さいか否かを,基にして判断される。上記テキスト本文の音韻位置指示子が,テキスト音韻数より小さい場合,テキスト本文の文末であると判断される。
【0065】
図2に示すステップS219では,詳細は後述するが,キーワード優先音韻選択部107によって,テキスト本文内のキーワード部分から,図1に示すコーパス109を用いて,最適な音韻を選択している。
【0066】
キーワード部分の音韻選択が完了すると,次に,キーワード部分以外の個所の最適な音韻を選択する。
【0067】
全ての音韻選択処理がキーワード優先音韻選択部107によって行われることで,波形セグメントを出力することができる(S219)。
【0068】
次に,音韻接続部111は,現在取り扱っている波形セグメントの音韻が,テキスト本文の文末であるか否かを判定する(S221)。
【0069】
上記判定した結果(S221),テキスト本文の文末でない場合,音韻接続部111は,現在取り扱っている波形セグメントと,次の波形セグメントを接続する(S223)。
【0070】
また一方で,テキスト本文の文末である場合(S221),音韻接続部111は,波形セグメントを接続することにより生成する合成音声を出力する(S225)。かかる合成音声の出力により(S225),音声合成装置100は,キーワードを強調しながら,テキスト本文を読み上げることができる。
【0071】
(キーワード個所の抽出処理について)
次に,図2に示すキーワード個所の抽出処理(S217)について,図3,図4A,図4Bを参照しながら,さらに詳細に説明する。なお,図3,図4Aは,第1の実施の形態にかかるキーワード個所の抽出処理の概略を示すフローチャートであり,図4Bは,第1の実施の形態にかかるキーワードの語尾であるか否かの判断基準の概略を示す説明図である。
【0072】
図3に示すように,テキスト本文の文末でなければ(S215),キーワード抽出部105は,1又は2以上のキーワードのうち,順々にキーワードを取り扱うため,現時点で取り扱うキーワードの順番が,全体のキーワード数の範囲内でおさまっているか否かを判定する(S240)。
【0073】
現在取り扱っているキーワードの順番は,キーワードの入力順とするが,かかる例に限定されない。
【0074】
次に,キーワード抽出部105は,現在取り扱っているキーワード(当キーワード)の音韻位置指示子が,当キーワードの語尾を示しているかどうかを判定する(S241)。
【0075】
当キーワードの語尾である場合(S241),テキスト本文の音韻位置指示子が示す位置より前の,当キーワード音韻数の数値分の音韻の,韻律予測情報内の各音韻ごとのキーワード位置情報をtrueに設定する(図4Aに示すステップS253)。
【0076】
図4Bに示すように,当キーワードの語尾であるか否かの判断基準は,現在取り扱っているキーワード(当キーワード)の音韻位置指示子が,当キーワードの音韻数より小さいかどうかによって,判断する。
【0077】
図3に示すように,キーワード抽出部105は,テキスト本文と,当キーワードの音韻位置指示子が示している,テキスト本文の音韻と,当キーワードの音韻とが,同じ音韻であるか否かを判定する(S243)。
【0078】
音韻が一致している場合(S243),当キーワードの音韻位置指示子を次の音韻に設定し(S247),音韻が一致していない場合(S243),当キーワードの音韻位置指示子を先頭音韻に設定する(S245)。
【0079】
次に,キーワード抽出部105は,現在取り扱っているキーワード(当キーワード)の音韻位置指示子の指し示す位置を,当キーワードの先頭音韻に設定する(S245)。
【0080】
キーワード抽出部105は,次に,現在取り扱っているキーワード(当キーワード)の音韻位置指示子の指し示す位置を,当キーワードの音韻位置指示子が現在指し示している音韻の次の音韻に設定する(S247)。
【0081】
次に,キーワード抽出部105は,現在取り扱っているキーワードを,キーワードの入力順に次のキーワードに変更する(S249)。
【0082】
なお,テキスト本文の文末である場合(S215),キーワード抽出部105は,キーワード位置情報付き韻律予測情報を出力する(S251)。
【0083】
さらに,図4Aに示すように,キーワード抽出部105は,テキスト本文の音韻位置指示子が指し示す音韻より,1つ先行している音韻から先頭音韻の方向に向かって,当キーワード音韻数の数値分の音韻全てに対応する,韻律予測情報内の各音韻ごとのキーワード位置情報を変更する(S253)。なお,falseからtrueにキーワード位置情報は変更されるが,かかる例に限定されない。
【0084】
次に,図4Aに示すように,キーワード抽出部105は,図3に示すステップS245と同じ処理を実行する(S255)。
【0085】
また,図3に示す判定の結果(S240),キーワード数内でない場合,図4Aに示すように,キーワード抽出部105は,当キーワードを最初のキーワードに変更する(S257)。
【0086】
次に,図4Aに示すように,キーワード抽出部105は,テキスト本文の音韻位置指示子の指し示す位置を,テキスト本文の音韻位置指示子が現在指し示している音韻の次の音韻に設定する(S259)。
【0087】
また,図5Bには,図1に示した第1の実施の形態にかかる音声合成装置100におけるテキスト解析部101〜音韻接続部111の各部で処理するデータの流れについて示している。
【0088】
以上で,図3及び図4に示すキーワード抽出部105によるキーワード個所の抽出処理(S217)の一連の処理が終了する。
【0089】
(キーワード優先音韻選択部107によるキーワード優先音韻選択処理について)
次に,図2に示すように,キーワード個所を抽出すると(S217),キーワード優先音韻選択部107によるキーワード優先音韻選択処理が実行される(S219)。
【0090】
上記キーワード優先音韻選択処理(S219)では,テキスト本文の音韻に対して,音韻の適合性に関するサブコスト値と,音韻環境代替に関するサブコスト値と,韻律に関するサブコスト値とをコーパス109を利用することで取得し,さらに3つのサブコスト値を足し合わせた,最小のサブコスト値(ターゲットコスト値)から,ある程度の幅を持たせた値の範囲内に含まれる,音韻を候補として選択(ターゲット選択)する。
【0091】
ここで,図6〜図10を参照しながら,第1の実施の形態にかかるキーワード優先音韻選択処理(S219)について詳細に説明する。なお,図6は,第1の実施の形態にかかるキーワード優先音韻選択処理の概略を示す説明図であり,図7〜図10は,第1の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【0092】
図6に示すように,キーワード優先音韻選択部107は,ターゲット選択で求めた音韻候補をもとに,テキスト本文の各音韻に付与されているキーワード位置情報のフラグ値がtrueとなるキーワード開始位置から,キーワード終了位置まで,ターゲットコスト値と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを,足し合わせたコスト値が最小となる単位候補の組合せを,動的計画法を用いて選択する。
【0093】
キーワード優先音韻選択部107は,キーワード部分のコスト値が最小となる単位候補の組合せを用いて,テキスト本文の開始位置から,キーワード開始位置に向けて,コスト値が最小となる単位候補の組合せを,動的計画法を用いて選択する。
【0094】
キーワード優先音韻選択部107は,キーワード部分のコスト値が最小となる単位候補の組合せを用いて,キーワード終了位置から,テキスト本文の終了位置に向けて,コスト値が最小となる単位候補の組合せを,動的計画法を用いて選択する。
【0095】
図6に示すように,キーワードが2つ以上存在する場合,キーワード部分に関するコスト値の計算は,テキスト本文の開始から終了に向けてキーワードの出現順に行う。
【0096】
また,図6に示すように,キーワードが2つ以上存在する場合,キーワード部分以外のコスト値の計算方法は,テキスト本文の開始位置から,最初に出現したキーワード開始位置に向けて,コスト値が最小となる単位候補の組合せを,動的計画法を用いて選択する。
【0097】
図6に示すように,キーワードが2つ以上存在する場合,キーワード部分以外のコスト値の計算方法は,キーワード部分のコスト値が最小となる単位候補の組合せを用いて,出現したキーワード(当該キーワード)の終了位置から,次に出現するキーワード(後続キーワード)の開始位置に向けて,コスト値が最小となる単位候補の組合せを,動的計画法を用いて選択する。
【0098】
図6に示すように,キーワードが2つ以上存在する場合,キーワード部分以外のコスト値の計算方法は,最後に出現したキーワードの終了位置から,テキスト本文の終了位置に向けて,コスト値が最小となる単位候補の組合せを,動的計画法を用いて選択する。
【0099】
また,図7に示すように,キーワード優先音韻選択部107は,まず,テキスト本文の音韻に対して,ターゲット選択する(S271)。
【0100】
上記ターゲット選択すると(S271),キーワード優先音韻選択部107は,サーチ変数をテキスト本文の先頭音韻にキーワード数を0に設定する(S273)ことで,テキスト本文内で現在どの音韻を指し示しているかを表現したサーチ変数をテキスト本文の先頭の音韻を指し示すようにする。
【0101】
次に,キーワード優先音韻選択部107は,サーチ変数が指し示している音韻の位置がテキスト本文の全体の音韻数の範囲内にあるかどうかを判定する(S275)。つまり,図7に示すように,サーチ変数<テキストの音韻数の関係にあるかどうかを判定する。
【0102】
上記ステップS275の判定結果,サーチ変数がテキストの音韻数より小さい場合,キーワード優先音韻選択部107は,サーチ変数が指し示している音韻が,キーワード内の音韻であるかどうかを判定する(S277)。
【0103】
通常,サーチ変数が指し示している音韻が,キーワード内の音韻である場合,キーワード位置情報はtrueである。キーワード内の音韻でない場合,キーワード位置情報はfalseである。
【0104】
一方,サーチ変数がテキストの音韻数より大きい場合(S275),図8に示す後続の処理(サーチ変数をテキスト本文の先頭音韻に設定する)が実行される。
【0105】
なお,サーチ変数が指すキーワード位置情報がfalseである場合(S277),サーチ変数を次の音韻に設定する(S287)。
【0106】
サーチ変数が指すキーワード位置情報がtrueである場合,サーチ変数の次の音韻のキーワード位置情報がtrue,又は,次の音韻があるか否かを確認する処理を実行する(S279)。
【0107】
図7に示すように,ステップS279では,サーチ変数が指し示している音韻の次の音韻がキーワード内の音韻であるかどうかを判定している。
【0108】
サーチ変数の次の音韻のキーワード位置情報がtrueである場合,サーチ変数が指す音韻と次の音韻とのコスト値を求める(S281)。
【0109】
サーチ変数の次の音韻のキーワード位置情報がfalseである場合,キーワード数を1インクリメントする(S283)。
【0110】
図7に示すように,上記ステップS281では,サーチ変数が指し示している音韻のターゲット選択で求めた候補と,サーチ変数が指し示している音韻の次の音韻のターゲット選択で求めた候補との間で,ターゲットコスト値と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを足し合わせたコスト値を求めている。
【0111】
上記コスト値を求めると(S281),次に,サーチ変数を次の音韻に設定する(S287)。
【0112】
また,テキスト本文内でキーワードが幾つ存在するかを表現したキーワード数を1インクリメントすると(S283),キーワード優先音韻選択部107は,コスト値が最小となるパスを設定する(S285)。
【0113】
上記パスを設定するステップS285では,サーチ変数が指し示している音韻の,ターゲット選択で求めた候補と,サーチ変数が指し示している音韻の次の音韻の,ターゲット選択で求めた候補との間で,ターゲットコスト値と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを,足し合わせたコスト値が最小となる単位候補の組合せ(パス)を求めている。
【0114】
上記コスト値が最小となるパスを設定すると(S285),サーチ変数を次の音韻に設定する(S287)。
【0115】
図8に示すように,キーワード優先音韻選択部107は,サーチ変数をテキスト本文の先頭音韻に設定する(S290)。なお,上記ステップS290は,上記図7のステップS273と実質的に同様である。
【0116】
上記サーチ変数がテキスト本文の先頭音韻に設定されると(S290),サーチ変数が指すキーワード位置情報がfalseであるか否かを確認する(S291)。なお,上記ステップS291は,上記図7のステップS277と実質的に同様である。
【0117】
サーチ変数が指し示すキーワード位置情報がfalseである場合(S291),サーチ変数の次の音韻のキーワード位置情報がfalseであるか否かを確認する(S293)。
【0118】
一方,サーチ変数が指し示すキーワード位置情報がtrueである場合(S291),サーチ変数が指すキーワード位置情報がtrueであるか否かを確認する(S298)。
【0119】
図8に示すように,上記ステップS293では,サーチ変数が指し示している音韻の,次の音韻が,キーワード内の音韻であるかどうかを判定している。
【0120】
次に,サーチ変数の次の音韻のキーワード位置情報がfalseである場合(S293),サーチ変数が指す音韻と,次の音韻とのコスト値を求める(S295)。なお,当該ステップS295と,図7のコスト値を求める処理(S281)とは実質的に同様である。
【0121】
上記サーチ変数の次の音韻のキーワード位置情報がtrueである場合(S293),コスト値が最小となるパスを設定する(S296)。なお,当該ステップS296と,図7の最小となるパスを設定する処理(S285)とは実質的に同様である。
【0122】
上記サーチ変数が指し示す音韻と,次の音韻とのコスト値を求めた後,サーチ変数を次の音韻に設定する(S297)。なお,当該ステップS297と,図7の次の音韻に設定する処理(S287)とは実質的に同様である。
【0123】
次に,図8に示すように,キーワード優先音韻選択部107は,サーチ変数が指し示すキーワード位置情報がfalseであるか否かを確認する(S298)。なお,上記ステップS298は,図7のサーチ変数が指すキーワード位置情報がfalseであるか否かを確認する処理(S277)と実質的に同様である。
【0124】
上記確認の結果(S298),サーチ変数が指し示すキーワード位置情報がtrueの場合,キーワード数を1デクリメント(減算)した結果が1以上であるか否かを確認する(S299)。
【0125】
一方,上記確認の結果(S298),サーチ変数が指し示すキーワード位置情報がfalseの場合,図9に示す後続の処理(S301)が実行される。
【0126】
図8に示すように,上記ステップS299では,テキスト本文内に複数のキーワードがある場合,キーワードとキーワードの間に1つ以上の音韻がある場合,サーチ変数を次の音韻に設定する(S300)。上記ステップS300は,図7のステップS287と実質的に同様である。
【0127】
次に,図9に示すように,キーワード優先音韻選択部107は,まずサーチ変数が指すキーワード位置情報がfalseであるか否かを確認し(S301),次にサーチ変数が指すキーワード位置情報がfalseである場合,サーチ変数の次の音韻のキーワード位置情報がfalseであるか否かを確認する(S303)。なお,ステップS303は,図8のステップS293と実質的に同様である。
【0128】
サーチ変数の次の音韻のキーワード位置情報がfalseである場合(S303),サーチ変数が指す音韻と,次の音韻とのコスト値を求める(S305)。
【0129】
一方,サーチ変数の次の音韻のキーワード位置情報がtrueである場合,コスト値が最小となるパスを設定する(S307)。
【0130】
次に,図9に示すように,キーワード優先音韻選択部107による上記ステップS307では,図7のコスト値が最小となるパスを設定するステップS285と実質的に同様である。
【0131】
キーワード優先音韻選択部107は,コスト値が最小となるパスを設定すると(S307),キーワード数を1デクリメントする(S309)。
【0132】
図9に示すように,キーワード優先音韻選択部107による,ステップS309では,テキスト本文内に複数のキーワードがある場合,キーワード数を参照することで,キーワードとキーワードとの間の音韻選択処理が完了したことを表現するのに用いられる。例えば,キーワード数が1になるとキーワードとキーワードとの間の音韻選択処理が完了したことを示しているが,かかる例に限定されない。
【0133】
上記ステップS309でキーワード数を1デクリメントすると,キーワード優先音韻選択部107は,サーチ変数を次の音韻に設定する(S311)。なお,上記ステップS311は,図7のステップS287と実質的に同様である。
【0134】
また,図9に示すように,図8のステップS299の実行後,キーワード優先音韻選択部107は,サーチ変数が指し示すキーワード位置情報がtrueであるか否かを確認する(S313)。
【0135】
上記サーチ変数が指し示すキーワード位置情報がtrueである場合(S313),サーチ変数の次の音韻のキーワード位置情報が文末であるか否かを確認する(S315)。
【0136】
一方,上記サーチ変数が指し示すキーワード位置情報がfalseである場合(S313),図10に示すサーチ変数の次の音韻のキーワード位置情報が文末であるか否かを確認する処理が行われる(S320)。
【0137】
上記説明したように,図9に示す上記ステップS315では,サーチ変数が指し示している音韻の,次の音韻が,テキスト本文の文末であるか否かの判定がされる。
【0138】
上記サーチ変数の次の音韻のキーワード位置情報が文末である場合(S315),図10に示すように,波形セグメントを出力する(S329)。
【0139】
一方,上記サーチ変数の次の音韻のキーワード位置情報が文末でない場合(S315),サーチ変数を次の音韻に設定する(S317)。なお,上記ステップS317は,図7のステップS287と実質的に同様である。
【0140】
上記サーチ変数を次の音韻に設定すると(S317),再びサーチ変数が指し示すキーワード位置情報がtrueであるか否かを確認する(S313)。以降の処理については上記説明した通りである。
【0141】
図10に示すキーワード優先音韻選択部107が行うサーチ変数の次の音韻のキーワード位置情報が文末であるか否かを確認する処理(S320)は,図9のステップS315と実質的に同様である。
【0142】
上記確認の結果(S320),サーチ変数の次の音韻のキーワード位置情報が文末である場合,次に,コスト値が最小となるパスを設定する(S327)。なお,上記パスを設定する処理(S327)は,図7に示すステップS285と実質的に同様である。
【0143】
上記コスト値が最小となるパスを設定すると(S327),波形セグメントを出力する(S329)。
【0144】
また一方で,サーチ変数の次の音韻のキーワード位置情報が文末でない場合(S320),キーワード優先音韻選択部107は,サーチ変数が指す音韻と,次の音韻とのコスト値を求める(S323)。なお,上記ステップS323は,図7のステップS281と実質的に同様である。
【0145】
サーチ変数を次の音韻に設定すると(S325),再びサーチ変数の次の音韻のキーワード位置情報が文末であるか否かを確認する処理が行われる(S320)。以降の処理については,上記説明した通りである。
【0146】
図10に示す波形セグメントを出力する処理(S329)は,テキスト本文に対して,音韻選択することで得ることができた波形セグメントを出力する。
【0147】
上記キーワード優先音韻選択部107により波形セグメントが出力されると(S329),音韻接続部111は,上記音韻選択された波形セグメントをつなぎ合わせて合成音声として出力する。上記合成音声がスピーカー等の出力部から出力されることで,音声合成装置100は,テキスト本文のうちキーワードを強調しながら読み上げることができる。
【0148】
なお,以上で,第1の実施の形態にかかる音声合成装置100についての説明が終了するが,かかる音声合成装置100によって,以下に示すような優れた効果が存在する。
(1)テキスト本文に含まれるキーワードを,キーワード以外の個所よりも滑らかな読み上げが可能となり,キーワード以外の個所よりも音質がよく,キーワード部分の読み上げをより強調し,より際立たせることができ,視聴者にキーワード部分をより明確に伝えることができる。
【0149】
(音声合成装置について)
次に,図11を参照しながら,第2の実施の形態にかかる音声合成装置900について説明する。なお,図11は,第2の実施の形態にかかる音声合成装置の概略的な構成を示すブロック図である。以下,第1の実施の形態との相違点について詳細に説明するが,その他の点については,ほぼ同様であるため詳細な説明は省略する。
【0150】
図11に示すように,音声合成装置900は,テキスト解析部101と,韻律予測部103と,キーワード重み付け部901と,キーワード抽出部905と,キーワード優先音韻選択部907と,コーパス109と,音韻接続部111とを備えている。
【0151】
なお,第2の実施の形態に係る音声合成装置900は,第1の実施の形態に係る音声合成装置100と同様に,テキスト本文とキーワードを基にして合成音声を出力することが可能な装置であって,その合成音声を出力することで,テキスト本文を音声にして読み上げることが可能な装置である。
【0152】
より具体的には,音声合成装置900は,例えば,CPU,メモリ,HDD(ハードディスクドライブ),マウス等に相当する入力部,液晶ディスプレイ等に相当する表示部などを備えたPC等を例示することができるが,かかる例に限定されない。
【0153】
なお,本実施の形態にかかる音声合成装置900に備わる表示部は,CPUにより表示可能なように処理された表示画面データと音声データを出力する。また,表示部は,例えば,TV又は液晶ディスプレイ装置などが例示され,上記双方ともにスピーカーを備えて,静止画像のほか,音声,又は動画像などを出力することが可能である。
【0154】
入力部は,例えば,使用者から操作指示を受けることが可能なマウス,トラックボール,トラックパッド,スタイラスペン,またはジョイスティックなどのポインティングデバイスや,キーボード,ボタン,スイッチ,レバー等の操作手段と,入力信号を生成してCPUに出力する入力制御回路などから構成されている。音声合成装置900のユーザは,この入力部を操作することにより,音声合成装置900に対して各種のデータを入力したり処理動作を指示したりすることができる。
【0155】
図11に示すキーワード重み付け部901は,テキスト本文内にある,複数のキーワード部分を読み上げさせる強調の度合い,つまりキーワード優先音韻選択部907で単位候補の組合せを絞り込むための,重み係数を決定し,キーワード重み付け情報として保持する。
【0156】
上記キーワード抽出部905は,キーワードの音韻記号と,テキスト本文内の音韻記号との部分一致している個所を基にして,キーワード強弱情報の値を,上記キーワード重み付け部901で求まったキーワード重み付け情報に対応する単位候補の組合せを絞り込む幅の値に変更する。なお,変更されたキーワード強弱情報は,韻律予測情報内のキーワードの先頭音韻に含んでいる。
【0157】
また,上記キーワード抽出部905は,キーワード部分を読み上げさせる強調の度合いを示しているキーワード重み付け情報と,単位候補の組合せを絞り込む幅とを,対応付けたテーブルを用いる。なお,当該テーブルは,例えば,音声合成装置900に備わるHDD等の記憶手段に格納されている。
【0158】
上記キーワード優先音韻選択部907は,ターゲット選択で求めた音韻候補を基にして,テキスト本文の各音韻に付与されているキーワード位置情報のフラグ値がtrueとなるキーワード開始位置からキーワード終了位置まで,ターゲットコスト値と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを足し合わせたコスト値が最小となる値から,単位候補の組合せを絞り込む幅の範囲内に収まるコスト値を持つ,単位候補の組合せを,動的計画法を用いて選択する。
【0159】
(音声合成方法について)
次に,図12,図13を参照しながら,第2の実施の形態にかかる音声合成方法について説明する。なお,図12,図13は,第2の実施の形態にかかる音声合成方法の概略を示すフローチャートである。
【0160】
図12及び図13に示すように,第2の実施の形態にかかる音声合成方法は,第1の実施の形態にかかる音声合成方法と比べて,キーワード重み付け処理(S1201)と,キーワード強弱情報を初期化する処理(S1203)とを含んでいる点で相違し,またキーワード個所を抽出する処理(S1205)と,キーワード優先音韻選択処理(S1207)は,第1の実施の形態にかかる処理と処理内容を異にするが,詳細は後述する。
【0161】
まず,図12に示すように,1又は2以上のキーワードを含むテキスト本文と,強調させたい1又は2以上のキーワードとは,テキスト解析部101に入力する(S201)。なお,上記テキスト本文およびキーワードは漢字仮名文字で表現された場合を例に挙げて説明するが,かかる例に限定されない。
【0162】
次に,テキスト解析部101は,上記入力したテキスト本文とキーワードとを音韻記号に変換する(S203)。
【0163】
テキスト解析部101は,漢字仮名文字で表現されたテキスト本文に,形態素解析,係り受け解析を行い,アクセント記号列と,テキスト本文の品詞情報を表す形態素解析結果とを出力する(S203)。
【0164】
なお,図12に示すように,テキスト本文に対して変換された音韻記号と,形態素解析結果との情報を持つ出力結果は,例えば,テキスト本文中間言語であると定義するが,かかる例に限定されない。
【0165】
次に,図12に示すように,テキスト解析部101は,テキスト本文を韻律予測部103に入力するために,テキスト本文であるかどうかを判定する(S205)。
【0166】
判定の結果(S205),テキスト本文である場合,テキスト解析部101は,テキスト本文中間言語を出力して韻律予測部103とともにキーワード抽出部905に送信する。
【0167】
一方,テキスト本文でない場合,つまりキーワードである場合,テキスト解析部101は,キーワード中間言語をキーワード重み付け部901に送信する。
【0168】
次に,韻律予測部103は,ピッチ(声の高さ:基本周波数F),音韻継続時間長(声の長さ),もしくは波形の成分を表現するメルケプストラムのうち少なくとも一つまたは全部を予測する(S207)。
【0169】
韻律予測部103は,予測した情報として韻律予測情報をキーワード抽出部901に出力する。
【0170】
また,図12に示すように,キーワード重み付け部901は,テキスト解析部101からキーワード中間言語を受け取ると(S205),テキスト本文内にある,複数のキーワード部分を読み上げさせる際の強調する度合い,つまりキーワード優先音韻選択部907で単位候補の組合せを絞り込むための重み係数を決定し,キーワード重み付け情報として保持する(S1201)。
【0171】
次に,キーワード重み付け部901は,重み係数を決定し,キーワード重み付け情報を生成すると(S1201),キーワード中間言語とキーワード重み付け情報とをキーワード抽出部905に出力する。
【0172】
(キーワード抽出部による処理について)
次に,キーワード抽出部905は,図12に示すように,テキスト本文内でキーワードがどの位置に存在しているかを示すための情報(キーワード位置情報)を記載するため,韻律予測情報における各音韻に対して領域を確保し,初期化する(S209)。なお,上記初期化の際には,キーワード位置情報のフラグ値をfalseに設定するが,かかる例に限定されない。
【0173】
次に,キーワード抽出部905は,単位候補の組合せを絞り込む幅を表現するキーワード強弱情報を初期化する(S1203)。
【0174】
上記ステップS1203では,単位候補の組合せを絞り込む幅を表現する,韻律予測情報内の各音韻ごとのキーワード強弱情報を初期化する。なお,当該初期化は,例えばキーワード強弱情報の値を0に設定する場合を例に挙げて説明するが,かかる例に限定されない。
【0175】
次に,キーワード抽出部905は,テキスト本文と,キーワードとの音韻記号内で,現在どの音韻を指し示しているかを表現した音韻位置指示子を,テキスト本文と1又は2以上のキーワードにおける先頭音韻に設定する(S211)。
【0176】
次に,キーワード抽出部905は,テキスト本文と,複数のキーワードに対して,音韻の数を求め,各キーワード音韻数にキーワードの音韻数,テキスト音韻数にテキスト本文の音韻数を設定する(S213)。
【0177】
次に,キーワード抽出部905は,テキスト本文の文末であるか否かを判定する(S215)。
【0178】
上記テキスト本文の文末であるか否かの判定した結果(S215),テキスト本文の文末でない場合,キーワード抽出部905は,テキスト本文内にあるキーワードの個所を抽出する(S217)。
【0179】
上記キーワード個所の抽出処理(S217)が実行された後,キーワードの音韻記号と,テキスト本文内の音韻記号との,部分一致している個所を基にして,韻律予測情報内のキーワードの先頭音韻に備えられたキーワード強弱情報を求めるために,キーワード部分を読み上げさせる強弱の度合いを示しているキーワード重み付け情報と,単位候補の組合せを絞り込む幅とを,対応付けたテーブルを用いて,キーワード強弱情報の値を,キーワード重み付け部901で求まったキーワード重み付け情報に対応する,単位候補の組合せを絞り込む幅の値に変更する(S2105)。
【0180】
上記キーワード抽出部905は,キーワード位置情報付き韻律予測情報と,キーワード強弱情報とから構成される「キーワード位置情報,強弱情報(キーワード強弱情報)付き韻律予測情報」をキーワード優先音韻選択部907に出力する。
【0181】
次に,テキスト本文の文末であることを確認すると(S215),図13に示すように,キーワード優先音韻選択処理を実行する(S1219)。
【0182】
上記キーワード優先音韻選択処理(S1219)では,ターゲット選択で求めた音韻候補を基にして,テキスト本文の各音韻に付与されているキーワード位置情報のフラグ値がtrueとなるキーワード開始位置からキーワード終了位置まで,ターゲットコスト値と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを,足し合わせたコスト値が最小となる値から,単位候補の組合せを絞り込む幅の間の,単位候補の組合せを,動的計画法を用いて選択している。
【0183】
なお,上記ステップS1219において,キーワードが2つ以上存在する場合,キーワード部分に関するコスト値の計算は,テキスト本文の開始から終了に向けて,キーワードの出現順に行ってもよい。
【0184】
また,上記ステップS1219において,キーワードが2つ以上存在する場合,キーワード部分以外のコスト値の計算方法は,テキスト本文の開始位置から,最初に出現したキーワード開始位置に向けて,コスト値が最小となる単位候補の組合せを,動的計画法を用いて選択してもよい。
【0185】
また,上記ステップS1219において,キーワードが2つ以上存在する場合,キーワード部分以外のコスト値の計算方法は,キーワード部分のコスト値が最小となる単位候補の組合せを用いて,出現したキーワード(当該キーワード)の終了位置から,次に出現するキーワード(後続キーワード)の開始位置に向けて,コスト値が最小となる単位候補の組合せを,動的計画法を用いて選択してもよい。
【0186】
また,上記ステップS1219において,キーワードが2つ以上存在する場合,キーワード部分以外のコスト値の計算方法は,最後に出現したキーワードの終了位置から,テキスト本文の終了位置に向けて,コスト値が最小となる単位候補の組合せを,動的計画法を用いて選択しても良い。
【0187】
以上,図13に示すように,全ての音韻選択処理がキーワード優先音韻選択部107によって行われることで,波形セグメントを出力することができる(S1219)。
【0188】
次に,音韻接続部111は,現在取り扱っている波形セグメントの音韻が,テキスト本文の文末であるか否かを判定する(S221)。
【0189】
上記判定した結果(S221),テキスト本文の文末でない場合,音韻接続部111は,現在取り扱っている波形セグメントと,次の波形セグメントを接続する(S223)。
【0190】
また一方で,テキスト本文の文末である場合(S221),音韻接続部111は,波形セグメントを接続することにより生成する合成音声を出力する(S225)。かかる合成音声の出力により(S225),音声合成装置900は,キーワードを強調しながら,テキスト本文を読み上げることができる。
【0191】
(キーワード個所の抽出処理について)
次に,図12に示す第2の実施の形態に係るキーワード個所の抽出処理(S215,S217,S2105)について,図14,図15を参照しながら,さらに詳細に説明する。なお,図14,図15は,第2の実施の形態にかかるキーワード個所の抽出処理の概略を示すフローチャートである。
【0192】
キーワード個所の抽出処理(S217)では,上記説明したように,キーワード抽出部905は,予めテキスト本文と,キーワードとの音韻記号内で,現在どの音韻を指し示しているかを表現した,音韻位置指示子を,テキスト本文,複数のキーワードに対して,先頭音韻に設定しておく。
【0193】
まず,図14に示すように,テキスト本文の文末でなければ(S215),キーワード抽出部905は,1又は2以上のキーワードのうち,順々にキーワードを取り扱うため,現時点で取り扱うキーワードの順番が,全体のキーワード数の範囲内でおさまっているか否かを判定する(S240)。
【0194】
現在取り扱っているキーワードの順番は,キーワードの入力順とするが,かかる例に限定されない。
【0195】
次に,キーワード抽出部905は,現在取り扱っているキーワード(当キーワード)の音韻位置指示子が,当キーワードの語尾を示しているかどうかを判定する(S241)。
【0196】
当キーワードの語尾である場合(S241),当キーワードの重みに対応する,単位候補の組合せを絞り込む値を取得する処理が行われる(図15に示すS1229)。
【0197】
当キーワードの語尾でない場合(S241),音韻位置指示子が示しているテキスト本文,当キーワードの音韻が一致しているか否かを判定する(S243)。
【0198】
なお,第2の実施の形態にかかる当キーワードの語尾であるか否かの判断基準は,第1の実施の形態にかかる判断基準と同様であり,現在取り扱っているキーワード(当キーワード)の音韻位置指示子が,当キーワードの音韻数より小さいかどうかによって,判断する。
【0199】
音韻が一致している場合(S243),当キーワードの音韻位置指示子を次の音韻に設定し(S247),音韻が一致していない場合(S243),当キーワードの音韻位置指示子を先頭音韻に設定する(S245)。
【0200】
次に,キーワード抽出部905は,現在取り扱っているキーワード(当キーワード)の音韻位置指示子の指し示す位置を,当キーワードの先頭音韻に設定する(S245)。
【0201】
キーワード抽出部905は,次に,現在取り扱っているキーワード(当キーワード)の音韻位置指示子の指し示す位置を,当キーワードの音韻位置指示子が現在指し示している音韻の次の音韻に設定する(S247)。
【0202】
次に,キーワード抽出部905は,現在取り扱っているキーワードを,キーワードの入力順に次のキーワードに変更する(S249)。
【0203】
なお,テキスト本文の文末である場合(S215),キーワード抽出部905は,キーワード位置情報,強弱付き韻律予測情報を出力する(S251)。
【0204】
次に,図15に示すように,キーワード抽出部905によるステップS1229では,現在取り扱っているキーワード(当キーワード)が保持する,キーワード部分を読み上げさせる強調の度合いを示しているキーワード重み付け情報に対応する,単位候補の組合せを絞り込む値を,キーワード部分を読み上げさせる強調の度合いを示しているキーワード重み付け情報と単位候補の組合せを絞り込む幅とを対応付けたテーブルから,取得する処理が行われる。
【0205】
次に,キーワード抽出部905は,テキスト本文の音韻位置指示子が指し示す音韻より,1つ先行している音韻から先頭音韻の方向に向かって,当キーワード音韻数の数値分の音韻全てに対応する,韻律予測情報内の各音韻ごとのキーワード位置情報を変更する(S253)。なお,falseからtrueにキーワード位置情報は変更されるが,かかる例に限定されない。
【0206】
キーワード抽出部905は,ステップS253の処理を実行すると,次に,テキスト本文内の当キーワードの先頭音韻に含まれるキーワード強弱情報の値を,単位候補の組合せを絞り込む値に変更する(S1300)。
【0207】
上記ステップS1300では,テキスト本文内の当キーワードの先頭音韻に含むキーワード強弱情報の値を,上記ステップS1229で取得した単位候補の組合せを絞り込む幅の値に変更する処理が行われる。
【0208】
次に,図15に示すように,キーワード抽出部905は,図14に示すステップS245と同じ処理を実行する(S255)。
【0209】
また,図14に示す判定の結果(S240),キーワード数内でない場合,図15に示すように,キーワード抽出部905は,当キーワードを最初のキーワードに変更する(S257)。
【0210】
次に,キーワード抽出部905は,テキスト本文の音韻位置指示子の指し示す位置を,テキスト本文の音韻位置指示子が現在指し示している音韻の次の音韻に設定する(S259)。
【0211】
以上で,図14及び図15に示す第2の実施の形態に係るキーワード抽出部905によるキーワード個所の抽出処理(S215,S217,S2105)の一連の処理が終了する。
【0212】
(キーワード優先音韻選択部907によるキーワード優先音韻選択処理について)
次に,図16〜図20を参照しながら,第2の実施の形態にかかるキーワード優先音韻選択処理(S1219)について詳細に説明する。なお,図16〜図20は,第2の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【0213】
まず,図16に示すように,キーワード優先音韻選択部907は,テキスト本文の音韻に対して,ターゲット選択する(S271)。
【0214】
上記ターゲット選択すると(S271),キーワード優先音韻選択部907は,サーチ変数をテキスト本文の先頭音韻にキーワード数を0に設定する(S273)ことで,テキスト本文内で現在どの音韻を指し示しているかを表現したサーチ変数をテキスト本文の先頭の音韻を指し示すようにする。
【0215】
次に,キーワード優先音韻選択部907は,サーチ変数が指し示している音韻の位置がテキスト本文の全体の音韻数の範囲内にあるかどうかを判定する(S275)。つまり,図16のステップS275に示すように,サーチ変数<テキストの音韻数の関係にあるかどうかを判定する。
【0216】
上記ステップS275の判定結果,サーチ変数がテキストの音韻数より小さい場合,キーワード優先音韻選択部907は,サーチ変数が指し示している音韻が,キーワード内の音韻であるかどうかを判定する(S277)。
【0217】
通常,サーチ変数が指し示している音韻が,キーワード内の音韻である場合,キーワード位置情報はtrueである。キーワード内の音韻でない場合,キーワード位置情報はfalseである。
【0218】
また,サーチ変数がテキストの音韻数より大きい場合(S275),図18に示す後続の処理(サーチ変数をテキスト本文の先頭音韻に設定する(S290))が実行される。
【0219】
なお,サーチ変数が指すキーワード位置情報がfalseである場合(S277),図17に示すように,サーチ変数を次の音韻に設定する(S287)。
【0220】
サーチ変数が指すキーワード位置情報がtrueである場合,図17に示すように,サーチ変数が指し示すキーワード位置情報がtrue,かつ,サーチ変数の前の音韻のキーワード位置情報がfalseであるか否かを確認する処理を実行する(S1333)。
【0221】
図17に示すステップS1333では,テキスト本文内の当キーワードの先頭音韻であるかどうかを判定している。サーチ変数が指し示すキーワード位置情報がtrue,かつ,サーチ変数の前の音韻のキーワード位置情報がfalseである場合,サーチ変数がキーワードの先頭音韻を指し示している。
【0222】
次に,サーチ変数が指すキーワード位置情報がtrueで,かつ,サーチ変数の前の音韻のキーワード位置情報がfalseである場合(S1333),サーチ変数が指し示すキーワードの先頭音韻に含まれるキーワード強弱情報を取得する(S1334)。
【0223】
一方,サーチ変数が指すキーワード位置情報がtrueで,かつ,サーチ変数の前の音韻のキーワード位置情報がfalseでない場合(S1333),サーチ変数の次の音韻のキーワード位置情報がtrue,または,次の音韻があるか否かを確認する(S279)。
【0224】
上記ステップS1334では,サーチ変数が指し示すキーワードの先頭音韻に含まれる,単位候補の組合せを絞り込む幅を表現した,キーワード強弱情報の値を取得する。なお,当該キーワード強弱情報の値を取得すると(S1334),次に,ステップS279が実行される。
【0225】
図17に示すように,ステップS279では,サーチ変数が指し示している音韻の次の音韻がキーワード内の音韻であるかどうかを判定している。
【0226】
サーチ変数の次の音韻のキーワード位置情報がtrueである場合,サーチ変数が指す音韻と次の音韻とのコスト値を求める(S281)。
【0227】
サーチ変数の次の音韻のキーワード位置情報がfalseである場合,キーワード数を1インクリメントする(S283)。
【0228】
図17に示すように,上記ステップS281では,サーチ変数が指し示している音韻のターゲット選択で求めた候補と,サーチ変数が指し示している音韻の次の音韻のターゲット選択で求めた候補との間で,ターゲットコスト値と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを足し合わせたコスト値を求めている。
【0229】
上記コスト値を求めると(S281),次に,サーチ変数を次の音韻に設定する(S287)。
【0230】
また,テキスト本文内でキーワードが幾つ存在するかを表現したキーワード数を1インクリメントすると(S283),キーワード優先音韻選択部907は,(コスト値+キーワード強弱情報)の値の範囲内に収まる,コスト値を持つパスを設定する(S1335)。
【0231】
上記ステップS1335では,サーチ変数が指し示している音韻の,ターゲット選択で求めた候補と,サーチ変数が指し示している音韻の次の音韻の,ターゲット選択で求めた候補との間で,ターゲットコスト値と,ピッチの不連続に関するサブコスト値と,スペクトルの不連続に関するサブコスト値とを,足し合わせた最小となるコスト値に,上記ステップS1334で取得したキーワード強弱情報を足し合わせた値の範囲内に収まるコスト値を持つ,単位候補の組合せ(パス)を求める。
【0232】
上記パスを設定すると(S1335),サーチ変数を次の音韻に設定する(S287)。
【0233】
図18に示すように,キーワード優先音韻選択部907は,サーチ変数をテキスト本文の先頭音韻に設定する(S290)。なお,上記ステップS290は,上記図16のステップS273と実質的に同様である。
【0234】
上記サーチ変数がテキスト本文の先頭音韻に設定されると(S290),サーチ変数が指すキーワード位置情報がfalseであるか否かを確認する(S291)。なお,上記ステップS291は,上記図16のステップS277と実質的に同様である。
【0235】
サーチ変数が指し示すキーワード位置情報がfalseである場合(S291),サーチ変数の次の音韻のキーワード位置情報がfalseであるか否かを確認する(S293)。
【0236】
一方,サーチ変数が指し示すキーワード位置情報がtrueである場合(S291),サーチ変数が指すキーワード位置情報がtrueであるか否かを確認する(S298)。
【0237】
図18に示すように,上記ステップS293では,サーチ変数が指し示している音韻の,次の音韻が,キーワード内の音韻であるかどうかを判定している。
【0238】
次に,サーチ変数の次の音韻のキーワード位置情報がfalseである場合(S293),サーチ変数が指す音韻と,次の音韻とのコスト値を求める(S295)。なお,当該ステップS295と,図17のコスト値を求める処理(S281)とは実質的に同様である。
【0239】
上記サーチ変数の次の音韻のキーワード位置情報がtrueである場合(S293),コスト値が最小となるパスを設定する(S296)。なお,当該ステップS296と,図7の最小となるパスを設定する処理(S285)とは実質的に同様である。
【0240】
上記サーチ変数が指し示す音韻と,次の音韻とのコスト値を求めた後,サーチ変数を次の音韻に設定する(S297)。なお,当該ステップS297と,図7の次の音韻に設定する処理(S287)とは実質的に同様である。
【0241】
次に,図18に示すように,キーワード優先音韻選択部907は,サーチ変数が指し示すキーワード位置情報がfalseであるか否かを確認する(S298)。なお,上記ステップS298は,図16のサーチ変数が指すキーワード位置情報がfalseであるか否かを確認する処理(S277)と実質的に同様である。
【0242】
上記確認の結果(S298),サーチ変数が指し示すキーワード位置情報がtrueの場合,キーワード数を1デクリメント(減算)した結果が1以上であるか否かを確認する(S299)。
【0243】
一方,上記確認の結果(S298),サーチ変数が指し示すキーワード位置情報がfalseの場合,図19に示す後続の処理(S301)が実行される。
【0244】
図18に示すように,上記ステップS299では,テキスト本文内に複数のキーワードがある場合,キーワードとキーワードとの間に1つ以上の音韻がある場合,サーチ変数を次の音韻に設定する(S300)。上記ステップS300は,図17のステップS287と実質的に同様である。
【0245】
次に,図19に示すように,キーワード優先音韻選択部907は,まずサーチ変数が指すキーワード位置情報がfalseであるか否かを確認し(S301),次にサーチ変数が指すキーワード位置情報がfalseである場合,サーチ変数の次の音韻のキーワード位置情報がfalseであるか否かを確認する(S303)。なお,ステップS303は,図18のステップS293と実質的に同様である。
【0246】
サーチ変数の次の音韻のキーワード位置情報がfalseである場合(S303),サーチ変数が指す音韻と,次の音韻とのコスト値を求める(S305)。
【0247】
一方,サーチ変数の次の音韻のキーワード位置情報がtrueである場合,コスト値が最小となるパスを設定する(S307)。
【0248】
次に,図19に示すように,キーワード優先音韻選択部907による上記ステップS307では,図7のコスト値が最小となるパスを設定するステップS285と実質的に同様である。
【0249】
キーワード優先音韻選択部907は,コスト値が最小となるパスを設定すると(S307),キーワード数を1デクリメントする(S309)。
【0250】
図19に示すように,キーワード優先音韻選択部907による,ステップS309では,テキスト本文内に複数のキーワードがある場合,キーワード数を参照することで,キーワードとキーワードとの間の音韻選択処理が完了したことを表現するのに用いられる。例えば,キーワード数が1になるとキーワードとキーワードとの間の音韻選択処理が完了したことを示しているが,かかる例に限定されない。
【0251】
上記ステップS309でキーワード数を1デクリメントすると,キーワード優先音韻選択部907は,サーチ変数を次の音韻に設定する(S311)。なお,上記ステップS311は,図17のステップS287と実質的に同様である。
【0252】
また,図19に示すように,図18のステップS299の実行後,キーワード優先音韻選択部907は,サーチ変数が指し示すキーワード位置情報がtrueであるか否かを確認する(S313)。
【0253】
上記サーチ変数が指し示すキーワード位置情報がtrueである場合(S313),サーチ変数の次の音韻のキーワード位置情報が文末であるか否かを確認する(S315)。
【0254】
一方,上記サーチ変数が指し示すキーワード位置情報がfalseである場合(S313),図20に示すサーチ変数の次の音韻のキーワード位置情報が文末であるか否かを確認する処理が行われる(S320)。
【0255】
上記説明したように,図19に示す上記ステップS315では,サーチ変数が指し示している音韻の,次の音韻が,テキスト本文の文末であるか否かの判定がされる。
【0256】
上記サーチ変数の次の音韻のキーワード位置情報が文末である場合(S315),図20に示すように,波形セグメントを出力する(S329)。
【0257】
一方,上記サーチ変数の次の音韻のキーワード位置情報が文末でない場合(S315),サーチ変数を次の音韻に設定する(S317)。なお,上記ステップS317は,図17のステップS287と実質的に同様である。
【0258】
上記サーチ変数を次の音韻に設定すると(S317),再びサーチ変数が指し示すキーワード位置情報がtrueであるか否かを確認する(S313)。以降の処理については上記説明した通りである。
【0259】
図20に示すキーワード優先音韻選択部907が行うサーチ変数の次の音韻のキーワード位置情報が文末であるか否かを確認する処理(S320)は,図9のステップS315と実質的に同様である。
【0260】
上記確認の結果(S320),サーチ変数の次の音韻のキーワード位置情報が文末である場合,次に,コスト値が最小となるパスを設定する(S327)。なお,上記パスを設定する処理(S327)は,図7に示すステップS285と実質的に同様である。
【0261】
上記コスト値が最小となるパスを設定すると(S327),波形セグメントを出力する(S329)。
【0262】
また一方で,サーチ変数の次の音韻のキーワード位置情報が文末でない場合(S320),キーワード優先音韻選択部907は,サーチ変数が指す音韻と,次の音韻とのコスト値を求める(S323)。なお,上記ステップS323は,図17のステップS281と実質的に同様である。
【0263】
サーチ変数を次の音韻に設定すると(S325),再びサーチ変数の次の音韻のキーワード位置情報が文末であるか否かを確認する処理が行われる(S320)。以降の処理については,上記説明した通りである。
【0264】
図20に示す波形セグメントを出力する処理(S329)は,テキスト本文に対して,音韻選択することで得ることができた波形セグメントを出力する。
【0265】
上記キーワード優先音韻選択部907により波形セグメントが出力されると(S329),音韻接続部111は,上記音韻選択された波形セグメントをつなぎ合わせて合成音声として出力する。上記合成音声がスピーカー等の出力部から出力されることで,音声合成装置100は,テキスト本文のうちキーワードを強調しながら読み上げることができる。
【0266】
なお,以上で,第2の実施の形態にかかる音声合成装置900についての説明が終了するが,かかる音声合成装置900によって,以下に示すような優れた効果が存在する。
(1)キーワードの読み上げを強調させる度合い,つまりキーワード部分の強調の際に前後とのつながりを滑らかにし,また,そのキーワード部分の強調の度合いを調節することで,キーワード部分を強調しても自然な読み上げをすることができる。
【0267】
なお,上述した一連の処理は,専用のハードウェアにより行うこともできるし,ソフトウェアにより行うこともできる。一連の処理をソフトウェアによって行う場合には,そのソフトウェアを構成するプログラムが,汎用のコンピュータやマイクロコンピュータ等の情報処理装置にインストールされ,上記音声合成装置100,音声合成装置900として機能させる。
【0268】
上記プログラムは,コンピュータに内蔵されている記録媒体としてのハードディスクやROM等に予め実行可能なように記録しておくことができる。
【0269】
あるいはまた,プログラムは,ハードディスクドライブに限らず,フレキシブルディスク,CD−ROM(Compact Disc Read Only Memory),MO(Magneto Optical)ディスク,DVD(Digital Versatile Disc),磁気ディスク,半導体メモリなどのリムーバブル記録媒体に,一時的あるいは永続的に格納(記録)しておくことができる。このようなリムーバブル記録媒体は,いわゆるパッケージソフトウエアとして提供することができる。
【0270】
なお,プログラムは,上述したようなリムーバブル記録媒体からコンピュータにインストールする他,ダウンロードサイトから,ディジタル衛星放送用の人工衛星を介して,コンピュータに無線で転送したり,LAN(Local Area Network),インターネットといったネットワークを介して,コンピュータに有線で転送し,コンピュータでは,そのようにして転送されてくるプログラムを,内蔵するハードディスク等の記憶手段にインストールすることができる。
【0271】
ここで,本明細書において,コンピュータに各種の処理を行わせるためのプログラムを記述する処理ステップは,必ずしもフローチャートとして記載された順序に沿って時系列に処理する必要はなく,並列的あるいは個別に実行される処理(例えば,並列処理あるいはオブジェクトによる処理)も含むものである。
【0272】
また,プログラムは,1のコンピュータにより処理されるものであっても良いし,複数のコンピュータによって分散処理されるものであっても良い。
【0273】
以上,添付図面を参照しながら本発明の好適な実施形態について説明したが,本発明はかかる例に限定されない。当業者であれば,特許請求の範囲に記載された技術的思想の範疇内において各種の変更例または修正例を想定し得ることは明らかであり,それらについても当然に本発明の技術的範囲に属するものと了解される。
【0274】
上記実施形態においては,音声合成装置100および音声合成装置900に備わる各部(テキスト解析部101〜キーワード優先音韻選択部907)はハードウェアからなる場合を例にあげて説明したが,本発明はかかる例に限定されない。例えば,上記各部のうち少なくとも一つは,1又は2以上のモジュールまたはコンポーネントから構成されるプログラムの場合であってもよい。
【図面の簡単な説明】
【0275】
【図1】第1の実施の形態にかかる音声合成装置の概略的な構成を示すブロック図である。
【図2】第1の実施の形態にかかる音声合成方法の概略を示すフローチャートである。
【図3】第1の実施の形態にかかるキーワード個所の抽出処理の概略を示すフローチャートである。
【図4A】第1の実施の形態にかかるキーワード個所の抽出処理の概略を示すフローチャートである。
【図4B】第1の実施の形態にかかるキーワードの語尾であるか否かの判断基準の概略を示す説明図である。
【図5A】本実施の形態にかかる各種情報の概略的な構成を示す説明図である。
【図5B】第1の実施の形態にかかる音声合成装置におけるデータの流れを概略的に示す説明図である。
【図6】第1の実施の形態にかかるキーワード優先音韻選択処理の概略を示す説明図である。
【図7】第1の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【図8】第1の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【図9】第1の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【図10】第1の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【図11】第2の実施の形態にかかる音声合成装置の概略的な構成を示すブロック図である。
【図12】第2の実施の形態にかかる音声合成方法の概略を示すフローチャートである。
【図13】第2の実施の形態にかかる音声合成方法の概略を示すフローチャートである。
【図14】第2の実施の形態にかかるキーワード個所の抽出処理の概略を示すフローチャートである。
【図15】第2の実施の形態にかかるキーワード個所の抽出処理の概略を示すフローチャートである。
【図16】第2の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【図17】第2の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【図18】第2の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【図19】第2の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【図20】第2の実施の形態にかかるキーワード優先音韻選択処理の概略を示すフローチャートである。
【符号の説明】
【0276】
100 音声合成装置
101 テキスト解析部
103 韻律予測部
105,905 キーワード抽出部
107,907 キーワード優先音韻選択部
109 コーパス
111 音韻接続部
901 キーワード重み付け部




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013