米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 楽器;音響 -> 沖電気工業株式会社

発明の名称 電子テキスト読み上げ装置
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2002−132282(P2002−132282A)
公開日 平成14年5月9日(2002.5.9)
出願番号 特願2000−320134(P2000−320134)
出願日 平成12年10月20日(2000.10.20)
代理人 【識別番号】100082050
【弁理士】
【氏名又は名称】佐藤 幸男
【テーマコード(参考)】
5D045
【Fターム(参考)】
5D045 AA07 
発明者 奥村 晃弘
要約 目的


構成
特許請求の範囲
【請求項1】 テキスト中から空行または記号行のうち少なくとも一方を抽出する空行/記号行抽出部と、前記空行/記号行抽出部で抽出した空行または記号行に対して予め設定された制御コードを付与する制御コード挿入部と、前記制御コード挿入部で付与された制御コードに基づき、その位置での読み上げ方の変更または特殊音の発声の少なくとも一方を行う音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【請求項2】 請求項1に記載の電子テキスト読み上げ装置において、記号行の抽出する基準として、行全体の文字数と行中の記号が占める割合を利用する空行/記号行抽出部を備えたことを特徴とする電子テキスト読み上げ装置。
【請求項3】 請求項1または2に記載の電子テキスト読み上げ装置において、音声合成部は、記号行中に存在する記号以外の文字を読み上げるよう構成されたことを特徴とする電子テキスト読み上げ装置。
【請求項4】 請求項1〜3のいずれかに記載の電子テキスト読み上げ装置において、テキスト中から計算機が直接理解する特殊文字列を抽出する特殊文字列抽出部と、前記特殊文字列抽出部で抽出した特殊文字列に対して予め設定された制御コードを付与する制御コード挿入部と、前記制御コード挿入部で付与された制御コードに基づき、特殊文字列の種類に応じた特殊音を発声する音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【請求項5】 請求項1〜4のいずれかに記載の電子テキスト読み上げ装置において、テキスト中から重要部分を抽出する要約処理部と、前記要約処理部で抽出した重要部分に対して予め設定された制御コードを付与する制御コード挿入部と、前記制御コード挿入部で付与された制御コードに基づき、重要部分に応じた特殊音の発声または読み上げ方の変更のうち少なくとも一方を行う音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【請求項6】 請求項5に記載の電子テキスト読み上げ装置において、音声合成部は、重要部分を繰り返し読み上げるよう構成されたことを特徴とする電子テキスト読み上げ装置。
【請求項7】 請求項1〜6のいずれかに記載の電子テキスト読み上げ装置において、テキスト中から固有名詞を抽出する固有名詞抽出部と、前記固有名詞抽出部で抽出した固有名詞の位置に対して予め設定された制御コードを付与する制御コード挿入部と、前記制御コード挿入部で付与された制御コードに基づき、固有名詞に応じた特殊音の発声または読み上げ方の変更のうち少なくとも一方を行う音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【請求項8】 請求項7に記載の電子テキスト読み上げ装置において、漢字の説明フレーズを作成する説明フレーズ作成部と、固有名詞に漢字が含まれる場合は、前記説明フレーズ作成部で作成した当該漢字の説明フレーズを用いて前記固有名詞に対応した表記説明文を作成する制御コード挿入部と、前記制御コード挿入部で作成された表記説明文に基づき、固有名詞抽出部で抽出した固有名詞の読み上げの後に前記表記説明文を読み上げる音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【請求項9】 請求項1〜8のいずれかに記載の電子テキスト読み上げ装置において、内部状態と、読み上げ方の変更または特殊音の発声を表す制御コードとの対応を示す対応表を備え、制御コード挿入部は、前記対応表に基づいて制御コードを付与するよう構成されたことを特徴とする電子テキスト読み上げ装置。
【請求項10】 請求項1〜9のいずれかに記載の電子テキスト読み上げ装置において、読み上げ方の変更は、音量の変更、読み上げ速度の変更、男性音声と女性音声の変更、音質変更のうち少なくとも一つを含むことを特徴とする電子テキスト読み上げ装置。
発明の詳細な説明
【0001】
【発明の属する技術分野】本発明は、テキストを音声合成により読み上げる電子テキスト読み上げ装置に関する。
【0002】
【従来の技術】従来より、表示用のテキストを音声合成で読み上げ、音声情報として出力するシステムが存在する。例えば、このようなシステムとして、特開平5−260082号公報に開示されているように、電子メールのテキストを読み上げる場合、電子メールの送信元に応じて声質を変化させるといったものがあった。また、特開平7−203392号公報に記載されているように、文字放送の文字データを音声合成によって読み上げる技術があった。
【0003】また、特開平10−133853号公報に開示されているように、電子メールから読み上げ不要な部分を削除し、分かり易い表現に書き換えてから読み上げを行うものがあった。更に、特開平7−200554号公報に開示されているように、記号などの特殊文字が存在した場合は、その記号の種類に応じて効果音で表現する技術があった。また、特開平11−305987号公報に開示されているように、URLなどの英語文字列を英語仮名変換により仮名に変換して読み上げを行う技術があった。
【0004】
【発明が解決しようとする課題】しかしながら、上記のような従来の技術は以下のような問題があった。
[問題点1]特開平10−133853号公報に開示されて技術では、空行があった場合その空行を削除することによって聞き易い音声合成を可能にしている。しかしながら、書き手は段落の終わりや話題の変化を意図して空行を挿入していることが多いにもかかわらず、この情報が欠落してしまうという問題があった。音声情報を聞く側にとっても話題が突然変わるようなことがあると内容理解の妨げになるので、この問題は重要である。また、特開平7−200554号公報に開示されている技術では、記号を効果音で表すが、後述する図7に示すように“−”などの記号を多く並べることによって話題の変化を表す場合がある。この場合、効果音を連続して何度もならすことになり、読み上げを聞く利用者にとって負担であった。
【0005】[問題点2]特開平11−305987号公報に開示されている技術では、英語仮名変換によりURLなどの英語文字列を読み上げるようにしている。しかしながら、読み上げ内容を聞き取って再度計算機に入力する場合には、これらの文字列は正確でなければならないにもかかわらず、英語仮名変換は“ji”と“zi”を共に「じ」と読み上げるなど、正確な文字列として表現することは不可能な場合があり、却って利用者が混乱する原因にもなっていた。また、読み上げ内容を聞き取って再度計算機に入力しない場合には、URLなどの文字列は特に重要ではないので、利用者にとって興味のない文字列の読み上げを聞くことは時間の無駄であり、また、負担でもあった。
【0006】[問題点3]音声情報は重要な部分を聞き漏らすともう一度その部分を聞き直す必要がある。しかしながら、聞き直すにはそのための手順が必要であり、これが利用者に負担となっていた。
【0007】[問題点4]音声情報では、読みだけではどのような漢字で書かれているのか分からない場合がある。特に、機械が漢字の読み方を間違えた場合には本来の意味が聞き手になかなか伝わらないという問題があった。
【0008】
【課題を解決するための手段】本発明は、前述の課題を解決するため次の構成を採用する。
〈構成1〉テキスト中から空行または記号行のうち少なくとも一方を抽出する空行/記号行抽出部と、空行/記号行抽出部で抽出した空行または記号行に対して予め設定された制御コードを付与する制御コード挿入部と、制御コード挿入部で付与された制御コードに基づき、その位置での読み上げ方の変更または特殊音の発声の少なくとも一方を行う音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【0009】〈構成2〉構成1に記載の電子テキスト読み上げ装置において、記号行の抽出する基準として、行全体の文字数と行中の記号が占める割合を利用する空行/記号行抽出部を備えたことを特徴とする電子テキスト読み上げ装置。
【0010】〈構成3〉構成1または2に記載の電子テキスト読み上げ装置において、音声合成部は、記号行中に存在する記号以外の文字を読み上げるよう構成されたことを特徴とする電子テキスト読み上げ装置。
【0011】〈構成4〉構成1〜3のいずれかに記載の電子テキスト読み上げ装置において、テキスト中から計算機が直接理解する特殊文字列を抽出する特殊文字列抽出部と、特殊文字列抽出部で抽出した特殊文字列に対して予め設定された制御コードを付与する制御コード挿入部と、制御コード挿入部で付与された制御コードに基づき、特殊文字列の種類に応じた特殊音を発声する音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【0012】〈構成5〉構成1〜4のいずれかに記載の電子テキスト読み上げ装置において、テキスト中から重要部分を抽出する要約処理部と、要約処理部で抽出した重要部分に対して予め設定された制御コードを付与する制御コード挿入部と、制御コード挿入部で付与された制御コードに基づき、重要部分に応じた特殊音の発声または読み上げ方の変更のうち少なくとも一方を行う音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【0013】〈構成6〉構成5に記載の電子テキスト読み上げ装置において、音声合成部は、重要部分を繰り返し読み上げるよう構成されたことを特徴とする電子テキスト読み上げ装置。
【0014】〈構成7〉構成1〜6のいずれかに記載の電子テキスト読み上げ装置において、テキスト中から固有名詞を抽出する固有名詞抽出部と、固有名詞抽出部で抽出した固有名詞の位置に対して予め設定された制御コードを付与する制御コード挿入部と、制御コード挿入部で付与された制御コードに基づき、固有名詞に応じた特殊音の発声または読み上げ方の変更のうち少なくとも一方を行う音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【0015】〈構成8〉構成7に記載の電子テキスト読み上げ装置において、漢字の説明フレーズを作成する説明フレーズ作成部と、固有名詞に漢字が含まれる場合は、説明フレーズ作成部で作成した漢字の説明フレーズを用いて固有名詞に対応した表記説明文を作成する制御コード挿入部と、制御コード挿入部で作成された表記説明文に基づき、固有名詞抽出部で抽出した固有名詞の読み上げの後に表記説明文を読み上げる音声合成部とを備えたことを特徴とする電子テキスト読み上げ装置。
【0016】〈構成9〉構成1〜8のいずれかに記載の電子テキスト読み上げ装置において、内部状態と、読み上げ方の変更または特殊音の発声を表す制御コードとの対応を示す対応表を備え、制御コード挿入部は、対応表に基づいて制御コードを付与するよう構成されたことを特徴とする電子テキスト読み上げ装置。
【0017】〈構成10〉構成1〜9のいずれかに記載の電子テキスト読み上げ装置において、読み上げ方の変更は、音量の変更、読み上げ速度の変更、男性音声と女性音声の変更、音質変更のうち少なくとも一つを含むことを特徴とする電子テキスト読み上げ装置。
【0018】
【発明の実施の形態】以下、本発明の実施の形態を具体例を用いて詳細に説明する。
《具体例1》図1は、本発明の電子テキスト読み上げ装置の具体例1を示す構成図である。図示の装置は、空行/記号行抽出部101、制御コード挿入部102、音声合成部103、対応表104からなる。
【0019】空行/記号行抽出部101は、入力テキストから空行と記号行とを抽出する機能部である。制御コード挿入部102は、対応表104に従ってテキストに制御コードを挿入する機能部である。音声合成部103は、テキストを読み込んで音声を合成する機能部であり、制御コードの指定により、音量の変更、読み上げ速度の変更、男性音声と女性音声の変更、音質の変更、効果音(特殊音)の発声、指定サンプリング音声の再生などを行う。対応表104は、空行/記号行の種別を示すタグと音声合成部103への制御コード、即ち、内部状態と読み上げ方の変更や効果音の発声といったことを示す制御コードとの対応を示すテーブルデータである。尚、本発明の電子テキスト読み上げ装置は、例えばパーソナルコンピュータからなり、具体例1の空行/記号行抽出部101〜音声合成部103は、それぞれの処理に対応した機能のソフトウェアと、このソフトウェアを実行するためのプロセッサやメモリ等のハードウェアとから実現されている。
【0020】〈動作〉以下、具体例1の動作について説明する。先ず、空行/記号行抽出部101は、入力テキストから空行および記号行を抽出する。抽出した空行または記号行に空白文字または記号がある場合はそれらを削除し、抽出した空行または記号行の種類に応じたタグを挿入する。
【0021】図2は、空行または記号行の判断基準と挿入タグの一例を示す説明図である。例えば、空行/記号行抽出部101の判断基準として、空白文字+改行のみの行は「空行A」と判断して、タグ<空行A>を挿入する。また、空行Aが二つ以上連続した場合は「空行B」と判断してタグ<空行B>を挿入するといった処理を行う。このような処理を行うとテキストは次のようになる。
【0022】図3および図4は、それぞれテキストの一例およびそのテキストを処理した場合の説明図である。図7および図8は、それぞれテキストの他の例およびそのテキストを処理した場合の説明図である。
【0023】例えば、図3に示すテキストを処理した場合、図4に示すように<空行A>や<空行B>のタグが本来の空行の部分に挿入されている。また、図7に示すような記号行も含むテキストを処理した場合は、図8に示すように、<空行A>や<記号行A>といったタグが本来の空行の部分や記号行の部分に挿入されている。尚、図8に示すように、“新製品情報”や“イベント”といった記号行中に位置する記号以外の文字はそのまま残されている。
【0024】次に、制御コード挿入部102は、対応表104を参照して空行/記号行抽出部101で挿入したタグを音声合成部103への制御コードに置き換える。図5は、タグと制御コードと効果との対応を示す説明図である。例えば、制御コード挿入部102は、<空行A>のタグが挿入されていると、制御コード<ポーズ>を、また、<空行B>のタグの場合は<チャイム1>を付与する。次に、音声合成部103は、制御コード挿入部102によってタグが挿入されたテキストの音声合成処理を行う。音声合成部103における制御コードと処理内容とが図5のように設定されている場合、その処理内容は次の通りとなる。
【0025】図6および図9は、それぞれ図4のテキストおよび図8のテキストを処理した結果の説明図である。図示のように、それぞれのテキストで付与されている制御コードに応じた処理を行う。例えば制御コードが<ポーズ>であった場合は、ポーズ(短い無音状態)を挿入し、<チャイム1>であった場合は、チャイム1に対応したチャイム音を挿入する。また、<記号行A>であった場合、声質の男女を変更する。例えば、記号行Aより以前が声質:男性であった場合は、声質:女性とする。このように音声合成部103は、制御コード挿入部102で挿入された制御コードに従って、ポーズを入れたり効果音を入れながらテキストの読み上げを行う。尚、図5の効果の例は制御コードによって得られる効果を分かり易くするために付けたものであり、実際の対応表104には必ずしもなくても構わない。
【0026】〈効果〉以上のように、具体例1によれば、テキスト中の空行や記号行をポーズや効果音で表現するようにしたので次のような効果がある。
●テキストに記述された文字の情報だけでなく、文章が空行によって大きく隔てられているといった状態や、文章が連続した記号で分離されているといった、テキスト全体の構造情報を読み上げ内容に反映させることができる。
●空行や記号だけからなる行などがあった場合は、適切に効果音を入れたり読み上げの声質を変化させたりできる。これにより、読み上げ音声を聞いている利用者は話題の変化を察知することができ、内容理解が容易になる。
●対応表104の内容を変えることによって簡単に様々な設定が可能である。
【0027】《具体例2》具体例2は、URL等の計算機が直接理解できる文字列に関しては予め登録しておき、このような文字列がテキスト中に存在した場合は、その代わりに効果音を発声するようにしたものである。
【0028】〈構成〉図10は、具体例2の構成図である。図の装置は、制御コード挿入部102、音声合成部103、対応表104、特殊文字列抽出部201からなる。ここで、特殊文字列抽出部201以外は具体例1と同様であるため、対応する部分に同一符号を付してその説明を省略する。
【0029】特殊文字列抽出部201は、テキストから電子メールアドレス、URL(Uniform Resource Locator)、ファイルパスといった計算機用の特殊な文字列(以下、特殊文字列と呼ぶ)を抽出する機能部である。尚、特殊文字列抽出部201は、その処理に対応した機能のソフトウェアと、このソフトウェアを実行するためのプロセッサやメモリ等のハードウェアとから実現されている。
【0030】〈動作〉以下、具体例2の動作を説明する。先ず、特殊文字列抽出部201は、入力テキストから電子メールアドレス、URL、ファイルパス等の特殊文字列を抽出する。そして、抽出した特殊文字列に代えて特殊文字列の種類を表すタグを挿入する。
【0031】特殊文字列は計算機が直接理解する文字列であり、これらの特殊文字列は用途によってそのシンタックスが決められている。例えば、電子メールアドレスのシンタックスは、RFC822(STANDARD FOR THE FORMAT OF ARPA INTERNET TEXT MESSAGES)、URLのシンタックスはRFC1738(Uniform Resource Locators)というインターネット規約集に詳細に規定されている。このため、このシンタックスの特徴を使って該当する文字列を抽出する機構を作成することは容易である。
【0032】図11は、特殊文字列とタグの例を示す説明図である。例えば、特殊文字列が電子メールアドレスの場合はタグとして<アドレス>を、特殊文字列がURLの場合は<URL>を、特殊文字列がファイルパスの場合は<ファイル>を付与する。このような処理を行うと入力テキストは次のようになる。
【0033】図12は、入力テキストの一例を示す説明図である。図13は、処理後の説明図である。図示のように、入力テキスト中の特殊文字列“http://www.tohto-u.ac.jp/shima/”は、タグ<URL>に変更されている。
【0034】次に、制御コード挿入部102は、対応表104を参照して特殊文字列抽出部201で挿入したタグを音声合成部103の制御コードに置き換える。図14は、対応表104の内容を示す説明図である。図示のように、タグが<URL>であった場合、制御コードとして<チャイム2>を付与する。図15は、制御コード付与後のテキストの説明図である。音声合成部103は、この制御コードに従って、効果音を入れながらテキストの読み上げを行う。
【0035】〈効果〉以上のように具体例2によれば、URL等の特殊文字列は、その種類を識別可能な効果音としてテキスト読み上げを行うようにしたので、次のような効果がある。
【0036】●特殊文字列の読み上げを回避できるため、利用者は無意味な読み上げ音声を聞かずに済む。
●特殊文字列の読み上げに代えて効果音を入れるようにしたため、読み上げを聞く利用者はこの部分に何らかの特殊文字列が存在していることを知ることができる。
●特殊文字列の種類によって効果音の種類を変えることができるため、読み上げを聞く利用者は特殊文字列の種類を知ることができる。
●対応表104の内容を変えることによって簡単に様々な設定を行うことができる。
【0037】《具体例3》具体例3は、テキスト中の要約部分をゆっくり読み上げたり、繰り返したりすることで、重要部分を利用者に知らせるようにしたものである。
【0038】〈構成〉図16は、具体例3の構成図である。図の装置は、制御コード挿入部102、音声合成部103、対応表104、要約処理部301からなる。ここで、要約処理部301以外の構成は具体例1、2と同様であるため、対応する部分に同一符号を付してその説明を省略する。
【0039】要約処理部301は、入力テキストを要約し重要部分の抽出を行う機能部である。尚、この要約処理は、入力テキストをパラグラフに分割し、引用行を含まないパラグラフのうち、本文の最初に近いものを重要部分として抽出するものであるが、その処理方法の詳細については動作の項で説明する。また、要約処理部301は、その処理に対応した機能のソフトウェアと、このソフトウェアを実行するためのプロセッサやメモリ等のハードウェアとから実現されている。
【0040】〈動作〉次に具体例3の動作について説明する。先ず、要約処理部301は、入力テキストを要約し、重要部分を抽出する。要約の方法には様々な方法が考えられるが、ここでは以下の手順に従って処理するものとする。尚、これ以外の方法で要約を行っても構わない。
【0041】1.処理対象となるテキストをパラグラフに分割する。テキストの空行を区切り記号とすることで分割することができる。
2.文字を含む行が2行以上あり、かつ、引用行を含まないパラグラフのうち本文の最初に最も近いものを探索する。引用行とは行頭が「>」で始まる行と定義する。
3.上記2項の処理で探索されたパラグラフを要約とし、要約部分となるパラグラフの前後に要約を示すタグを挿入する。ここでは、要約の始まりに「<abstract>」、終わりに「</abstract>」を挿入する。
【0042】このような要約処理の一例を具体例2の図12で示した例を用いて説明する。図17は、図12のテキストに対して要約処理を行った場合の説明図である。上記3項の手順によって、“明日、東都大学の嶋翔一教授が…準備しておいて下さい”が要約として抽出され、その前後に<abstract>と、</abstract>が挿入されている。次に、制御コード挿入部102は、対応表104を参照して要約処理部301で挿入したタグを音声合成部103への制御コードに置き換える。
【0043】図18は、対応表104の内容説明図である。図19は、対応表104が図18の場合に図17のテキストを処理した場合の説明図である。この場合、<abstract>には、<チャイム3><発話速度:低速>の制御コードが付与され、また、</abstract>には<発話速度:標準>の制御コードが付与される。従って、制御コード挿入部102での処理結果は図19に示す通りとなる。
【0044】次に、音声合成部103は付与された制御コードに従ってテキストの読み上げを行う。例えば、制御コードが<チャイム3><発話速度:低速>であった部分は、チャイム3を鳴らし、ゆっくりと読み上げる動作を行う。また、制御コードが<発話速度:標準>であった部分以降は読み上げ速度を普通の速度に戻す。
【0045】次に、読み上げ方法の他の例を説明する。図20は、対応表104の他の例の内容説明図である。図21は、対応表104が図20の場合に図17のテキストを処理した場合の説明図である。この例は、対応表104で、<abstract>には、特に制御コードは付与されず、</abstract>で<再生:繰り返しの案内>と<要約>の制御コードが付与されるよう設定されている。尚、<要約>が指定される場合は、要約処理部301が抽出した「要約部分」を挿入する。また、<再生:繰り返しの案内>は、音声合成部103への制御コードの一つで、例えば「重要部分なので繰り返します。」というサンプリング音声の再生命令などを意味する。従って、制御コード挿入部102での処理結果は図21に示す通りとなる。
【0046】次に、音声合成部103は付与された制御コードに従ってテキストの読み上げを行う。例えば、制御コードが<再生:繰り返しの案内>と<要約>であった部分では、繰り返しの案内を行った後、要約の読み上げを行う。
【0047】〈効果〉以上のように具体例3によれば、入力テキストの要約部分を識別できるよう音声による読み上げを行うようにしたので次のような効果がある。
●重要部分の読み上げの前に効果音を鳴らして利用者に合図するように指定することにより、読み上げを聞く利用者の注意を喚起し、重要部分の聞き漏らしを防止できる。
●重要部分を繰り返して読み上げるように指定することにより、重要部分の聞き漏らしを防止できる。
●重要部分をゆっくり読み上げるように指定することにより、重要部分の聞き漏らしを防止できる。
●対応表104の内容を変えることによって上記三つの効果を組み合わせて利用することができる。
●対応表104の内容を変えることによって簡単に様々な設定を行うことができる。
【0048】《具体例4》具体例4は、テキスト中の固有名詞の部分は読み上げのパラメータを変化させて他の部分とは識別できるようにしたものである。
【0049】〈構成〉図22は、具体例4の構成図である。図の装置は、制御コード挿入部102、音声合成部103、対応表104、固有名詞抽出部401からなる。ここで、固有名詞抽出部401以外の構成は具体例1〜3と同様であるため、対応する部分に同一符号を付してその説明を省略する。
【0050】固有名詞抽出部401は、入力テキストから、人名、組織名、地名といった固有名詞を抽出する機能部である。この抽出方法としては、例えば、人名接辞等に基づいて行うが、その抽出方法の詳細については動作の項で説明する。尚、固有名詞抽出部401は、その処理に対応した機能のソフトウェアと、このソフトウェアを実行するためのプロセッサやメモリ等のハードウェアとから実現されている。
【0051】〈動作〉次に具体例4の動作について説明する。先ず、固有名詞抽出部401は、入力テキストから固有名詞を抽出する。この方法としては、例えば、電子情報通信学会、信学技報 NLC98-21,“固有名詞抽出における日本語と英語の比較”に記載された方法などを用いることができる。即ち、人名や地名のリストを用意すると共に、人名接辞リストや組織名接辞リスト、地名接辞リストといったリストを用意し、これらのリストと入力テキストを照合し、また、人名リストと人名接辞リストに一致した場合は、人名+人名接辞と認識するといった分割・統合規則により、人名や地名等の固有名詞を抽出する。
【0052】抽出した固有名詞は、人名、組織名、地名などの種類に応じたタグを挿入して分離する。図23は、固有名詞の種類とタグの例を示す説明図である。図中の、<ps>は人名接辞であり、人名の後に続く「さん」、「被告」、「社長」などを指す。図示のように、「今朝、越田社長が来られた」という文から固有名詞を抽出すると、「越田」が人名として得られる。しかし、「越田社長」をひとまとめにして扱いたい場合もある。このような場合に人名接辞を利用することができる。
【0053】図24は、図12のテキストに対して固有名詞抽出処理を行った場合の説明図である。上記の固有名詞抽出処理によって、“東都大学”が組織名として認識されて<o東都大学>として分離され、また、“嶋翔一”は人名と認識されて<p嶋翔一>に、“教授”は人名接辞として<ps教授>に分離されている。
【0054】次に、制御コード挿入部102は、対応表104を参照して固有名詞抽出部401で挿入したタグを音声合成部103への制御コードに置き換える。図25は、対応表104の一例を示す説明図である。図26は、対応表104が図25の場合に図24のテキストに対して制御コードを付与した場合の説明図である。この例では、対応表104において、人名である<p>や組織名である<o>のタグに対して、制御コードとして<発話速度:低速>が設定されているため、“東都大学”と“嶋翔一”とに<発話速度:低速>が設定されている。
【0055】次に、音声合成部103は付与された制御コードに従って、効果音を入れたり読み上げ方のパラメータ(声質、発話速度、音量、音の高さなど)を変化させながらテキストの読み上げを行う。この例では、制御コードが<発話速度:低速>であった部分は、ゆっくりと読み上げる動作を行う。また、制御コードが<発話速度:標準>であった部分以降は読み上げ速度を普通の速度に戻す。
【0056】〈効果〉以上のように、具体例4によれば、固有名詞の部分を読み上げのパラメータを変化させながらテキストの読み上げを行うようにしたので、次のような効果がある。
●人名や地名などの重要情報をゆっくりと読み上げるように指定することにより、これらの重要情報の聞き漏らしを防止できる。
●対応表104の内容を変えることによって、固有名詞の種類(人名、組織名、地名など)毎に違う設定ができる。
●対応表104の内容を変えることによって、簡単に様々な設定ができる。
【0057】《具体例5》具体例5は、テキスト中の固有名詞の漢字に対してその表記説明を行うようにしたものである。
【0058】〈構成〉図27は、具体例5の構成図である。図の装置は、制御コード挿入部102、音声合成部103、対応表104、固有名詞抽出部401、説明フレーズ作成部501からなる。ここで、説明フレーズ作成部501以外の構成は具体例1〜4と同様であるため、対応する部分に同一符号を付してその説明を省略する。
【0059】説明フレーズ作成部501は、一つの漢字が入力されるとその漢字の説明フレーズを作成する機能部である。尚、説明フレーズ作成部501は、その処理に対応した機能のソフトウェアと、このソフトウェアを実行するためのプロセッサやメモリ等のハードウェアとから実現されている。
【0060】〈動作〉以下、動作について説明する。先ず、固有名詞抽出部401は、入力テキストから固有名詞を抽出する。この動作については具体例4と同様であるため、ここでの説明は省略する。制御コード挿入部102は、対応表104を参照して固有名詞抽出部401で挿入したタグを音声合成部103への制御コードに置き換える。
【0061】図28は、対応表104の一例を示す説明図である。この例では、<p><ps>には制御コードとして、<再生:表記説明の案内>や<声質:女性><表記説明><声質:標準>が付与される。そして、対応表104で<表記説明>が指定された場合、説明フレーズ作成部501は、該当する固有名詞の文字列を次のようなテンプレートに当てはめて表記説明文を作成し挿入する。
【0062】図29は、表記説明文とフレーズとの関係を示す説明図である。図示のような漢字説明フレーズは、該当漢字1文字を使って説明フレーズ作成部501が作成する。このフレーズの作成方法としては、例えば特開平9−237096号公報に記載された方法等を用いて作成することができる。即ち、漢字1文字をキーとして、熟語辞書を参照し、得られた熟語に基づいて説明フレーズを作成したり、漢字のへんや旁といったパーツ情報に基づいてフレーズを生成する方法である。
【0063】例えば「クコの実」という固有名詞の表記説明文は、「実」の漢字の説明フレーズとして説明フレーズ作成部501が「果実の実」を出力したとすると、表記説明としては次の通りとなる。図30は、表記説明の一例を示す説明図である。
【0064】また、図28に示した<再生:表記説明の案内>は、音声合成部103への制御コードの一つで、例えば、「表記の説明をします」というサンプリング音声の再生命令などを意味する。
【0065】図31は、説明フレーズ作成部501の入力と出力との関係を示す説明図である。図32は、対応表104が図28の場合で、かつ、説明フレーズ作成部501が図31に示すように構成されている場合に、図12のテキストを処理した結果の説明図である。
【0066】図31に示すように、説明フレーズ作成部501において、例えば、漢字「嶋」は「山へんに鳥」といったようにへんと旁の説明を行う。従って、処理結果としては、図32のように、固有名詞「嶋翔一」では、「嶋翔一の表記は、山へんに鳥、羊に羽、一十百千の一です」といった説明となる。
【0067】次に、音声合成部103は付与された制御コードに従って、効果音を入れたり読み上げのパラメータ(声質、発話速度、音量、音の高さなど)を変化させながらテキストの読み上げを行う。この例では、制御コードが<再生:表記説明の案内>であった部分は、「表記の説明をします」といったサンプリング音声の再生を行う。また、制御コードが<声質:女性>であった部分以降は読み上げの声質を女性の声とし、<声質:標準>以降は通常の声質に戻す。
【0068】〈効果〉以上のように、具体例5によれば、テキスト中の漢字に対してどのような漢字かを説明するようにしたので、次のような効果がある。
●使われている漢字やひらがなとカタカナの違いなどの、音で聞いただけでは分からない内容も知ることができるので、人名なども正しく知ることができる。
●機械が読み方を間違えた場合でも内容を正しく理解することができる。
●対応表104の内容を変えることによって、簡単に様々な設定ができる。
【0069】《利用形態》
●具体例1において、空行を単独の空行と2回以上連続した空行で分類したが、これに限定されるものではない。例えば、2回までと3回以上で分けてもよいし、3種類以上に分類してもよい。
●具体例3において、繰り返しのための重要部分挿入位置は重要部分の終了位置としたが、これに限定されるものではない。例えば、テキストの最後でもよいし、重要部分内で一文毎に繰り返すようにしてもよい。
●具体例5において、表記の説明文は該当する固有名詞の読み上げの直後で行うとしたが、これに限定されるものではない。例えば、該当する固有名詞の属する段落の最後でもよいし、テキストの最後であってもよい。
●上記具体例1〜5において、電子メールなどのテキストだけでなく、例えば文字放送の文字データを対象としてもよい。
●上記具体例1〜5を任意に組み合わせてもよい。即ち、いずれか二つの具体例を組み合わせるだけでなく、三つ以上の具体例を組み合わせてもよい。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013