米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 楽器;音響 -> ソニー株式会社

発明の名称 携帯電話端末、楽曲同定方法及び装置、楽曲同定配信方法及びシステム
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2002−116768(P2002−116768A)
公開日 平成14年4月19日(2002.4.19)
出願番号 特願2000−306871(P2000−306871)
出願日 平成12年10月5日(2000.10.5)
代理人 【識別番号】100067736
【弁理士】
【氏名又は名称】小池 晃 (外2名)
【テーマコード(参考)】
5B049
5B075
5D015
5K067
【Fターム(参考)】
5B049 AA06 CC05 EE05 FF01 GG06 
5B075 ND14 NK06 NK46 NR16 PP07 PP13 PQ02 PQ04 PQ46
5D015 AA06 FF03 HH04 KK02 LL05
5K067 AA29 AA44 BB21 DD51 EE02 FF02 FF23 FF25 FF40 HH21 HH23 KK15
発明者 安部 素嗣 / 西口 正之
要約 目的


構成
特許請求の範囲
【請求項1】 音響電気変換手段を介して取り込まれた音楽データを録音する録音手段と、上記録音された音楽データを圧縮符号化する符号化手段と、上記圧縮符号化された音楽データを送信する送信手段とを有することを特徴とする携帯電話端末。
【請求項2】 音響電気変換手段を介して取り込まれた音楽データを録音する録音手段と、上記録音された音楽データより、その音楽の楽曲名を同定するための特徴量を抽出する特徴抽出手段と、上記抽出された特徴量を送信する送信手段とを有することを特徴とする携帯電話端末。
【請求項3】 通話時と上記録音時とで、上記音響電気変換手段の音の指向性を変更することを特徴とする請求項1記載の携帯電話端末。
【請求項4】 通話時と上記録音時とで、上記音響電気変換手段の音の指向性を変更することを特徴とする請求項2記載の携帯電話端末。
【請求項5】 上記音響電気変換手段として、通話用の音響電気変換手段と上記録音用の音響電気変換手段とを備え、通話時には上記通話用の音響電気変換手段に切り替え、上記録音時には上記録音用の音響電気変換手段に切り替えることを特徴とする請求項1記載の携帯電話端末。
【請求項6】 上記音響電気変換手段として、通話用の音響電気変換手段と上記録音用の音響電気変換手段とを備え、通話時には上記通話用の音響電気変換手段に切り替え、上記録音時には上記録音用の音響電気変換手段に切り替えることを特徴とする請求項2記載の携帯電話端末。
【請求項7】 上記特徴量は、離散化された短時間スペクトル係数であることを特徴とする請求項2記載の携帯電話端末。
【請求項8】 音楽データを記憶する記憶手段と、音楽データから音楽を再生する再生手段とを有し、携帯電話システムを通じて受信した音楽データを上記記憶手段に蓄積し、上記記憶手段に蓄積した音楽データから上記再生手段により音楽を再生することを特徴とする携帯電話端末。
【請求項9】 上記携帯電話システムを通じて受信した音楽データは、実音楽データを圧縮符号化したデータであり、上記再生手段は、上記圧縮符号化されたデータを復号して上記実音楽データを復元する復号手段を備えることを特徴とする請求項8記載の携帯電話端末。
【請求項10】 上記記憶手段は、半導体記憶素子を備えることを特徴とする請求項8記載の携帯電話端末。
【請求項11】 操作者による操作される操作子を備えた操作入力手段と、少なくとも複数の楽曲のそれぞれを上記操作者が認識可能とする表示を行う表示手段とを有し、上記表示手段上に表示された複数の楽曲のうち1つを、上記操作入力手段の操作子の操作に応じて選択し、当該選択された楽曲を試聴し、若しくは当該選択された楽曲を購入することを特徴とする請求項8記載の携帯電話端末。
【請求項12】 音響電気変換手段を介して取り込まれた音楽データを録音する録音手段と、上記録音された音楽データを圧縮符号化、若しくは、上記録音された音楽データから当該音楽の楽曲名を同定するための特徴量を抽出する音楽データ処理手段と、上記圧縮符号化されたデータ、若しくは、上記抽出された特徴量を携帯電話システムを通じて送信する送信手段と、上記携帯電話システムを通じて音楽データを受信する受信手段と、上記受信手段が受信した音楽データを記憶する記憶手段と、上記記憶手段に記憶した音楽データから音楽を再生する再生手段と、操作者による操作される操作子を備えた操作入力手段と、少なくとも複数の楽曲のそれぞれを上記操作者が認識可能とする表示を行う表示手段とを有し、上記表示手段上に表示された複数の楽曲のうち1つを、上記操作入力手段の操作子の操作に応じて選択し、当該選択された楽曲を試聴し、若しくは当該選択された楽曲を購入することを特徴とする携帯電話端末。
【請求項13】 音響信号の時間周波数分布を求め、上記時間周波数分布を再離散化し特徴行列を生成し、上記時間周波数分布の再離散化により生成された楽曲の特徴行列と当該楽曲の属性を保存および管理し、上記保存および管理されている複数の特徴行列と楽曲の一部分の信号から生成された特徴行列とのマッチングを行うことにより、上記一部分の信号を含む楽曲の楽曲名を同定することを特徴とする楽曲同定方法。
【請求項14】 上記マッチングの際には、上記楽曲の一部の信号から定常ノイズを減算する処理、及び/又は、上記時間周波数成分の一部分をマッチングから除外する処理、及び/又は、上記保存および管理されている複数の特徴行列と楽曲の一部分の信号から生成された特徴行列との相互相関の関数を演算する処理を行うことを特徴とする請求項13記載の楽曲同定方法。
【請求項15】 音響信号の時間周波数分布を求めるパワースペクトル分析手段と、上記時間周波数分布を再離散化し特徴行列を生成する特徴行列生成手段と、上記特徴行列生成手段より生成された楽曲の特徴行列と楽曲の属性を保存および管理する楽曲データベース手段と、上記楽曲データベース手段により保存および管理されている複数の特徴行列と楽曲の一部分の信号から生成された特徴行列とのマッチングを行うマッチング手段とを有し、上記マッチングの結果に基づいて、上記一部分の信号を含む楽曲の楽曲名を同定することを特徴とする楽曲同定装置。
【請求項16】 上記マッチング手段は、上記マッチングの際に、上記楽曲の一部の信号から定常ノイズを減算する処理、及び/又は、上記時間周波数成分の一部分をマッチングから除外する処理、及び/又は、上記楽曲データベース手段により保存および管理されている複数の特徴行列と楽曲の一部分の信号から生成された特徴行列との相互相関の関数を演算する処理を行うことを特徴とする請求項15記載の楽曲同定装置。
【請求項17】 携帯電話網を用いた楽曲同定配信方法であって、音響電気変換手段により取り込まれてディジタル化された音楽データを録音し、上記録音された音楽データを圧縮符号化若しくは上記録音された音楽データから当該音楽の楽曲名を同定するための特徴量を抽出し、上記圧縮符号化されたデータ若しくは上記抽出された特徴量を携帯電話網へ送信し、上記携帯電話網を通じて送信されてきた上記圧縮符号化されたデータ若しくは上記抽出された特徴量から楽曲の候補を検索し、上記検索された楽曲の試聴用データを上記携帯電話網を通じて送信し、上記携帯電話網を通じて送信されてきた上記楽曲の試聴用データを試聴し、上記試聴した楽曲の候補から購入する楽曲を決定し、上記決定された楽曲の配信を上記携帯電話網を通じて要求し、上記要求された楽曲を上記携帯電話網を通じて配信し、上記試聴用データの送信と上記楽曲の配信に応じた課金を行うことを特徴とする楽曲同定配信方法。
【請求項18】 上記楽曲の候補検索及びその候補検索による試聴用データの送信と上記楽曲配信に対応する課金を、上記携帯電話網の使用に応じた携帯電話通信料に加算して行うことを特徴とする請求項17記載の楽曲同定配信方法。
【請求項19】 音響電気変換手段を介して取り込まれた音楽データを録音する録音手段と、上記録音された音楽データを圧縮符号化若しくは上記録音された音楽データから当該音楽の楽曲名を同定するための特徴量を抽出する音楽データ処理手段と、上記圧縮符号化されたデータ若しくは上記抽出された特徴量を携帯電話網を通じて送信する送信手段と、上記携帯電話網を通じて音楽データを受信する受信手段と、上記受信手段が受信した音楽データを記憶する記憶手段と、上記記憶手段に記憶した音楽データを再生する再生手段と、操作者による操作される操作子を備えた操作入力手段と、少なくとも複数の楽曲のそれぞれを上記操作者が認識可能とする表示を行う表示手段とを有し、上記表示手段上に表示された複数の楽曲のうち1つを、上記操作入力手段の操作子の操作に応じて選択し、当該選択された楽曲を試聴し、若しくは当該選択された楽曲を購入する携帯電話端末と、上記携帯電話網を通じて上記携帯電話端末から送信されてきた上記圧縮符号化されたデータ若しくは上記抽出された特徴量から楽曲の候補を検索し、上記検索した楽曲の試聴用データを上記携帯電話網を通じて上記携帯電話端末へ送信する楽曲同定装置と、上記携帯電話網を通じて、上記携帯電話端末から上記試聴用データの試聴の元で選択された楽曲の配信が要求されたとき、当該要求に応じた音楽データを、上記携帯電話網を通じて上記携帯電話端末へ送信する楽曲配信装置と、上記携帯電話網上の通信を管理すると共に、上記試聴用データの送信と上記楽曲の配信に応じた課金を行う上記携帯電話管理装置とからなることを特徴とする楽曲同定配信システム。
【請求項20】 上記楽曲同定装置での上記楽曲の候補検索及びその候補検索による試聴用データの送信と上記楽曲配信装置による楽曲配信に対応する上記携帯電話端末の使用者への課金を、上記携帯電話管理装置側において携帯電話通信料に加算して行うことを特徴とする請求項19記載の楽曲同定配信システム。
発明の詳細な説明
【0001】
【発明の属する技術分野】本発明は、例えば電子音楽配信のためのシステム、方法および装置に関するものであり、特に携帯電話を利用した楽曲配信を行うための携帯電話端末、楽曲同定方法及び装置、楽曲同定配信方法及びシステムに関する。
【0002】
【従来の技術】近年は、膨大な数の新曲が発表されており、過去に作成された様々な楽曲も含めて、それらの全てを知ることは到底不可能な状況になっている。また、それら様々な楽曲は、テレビジョン放送やラジオ放送の番組中やコマーシャルメッセージ中に流されたり、街頭で流されることも多く、したがって、人々は自らの意思にかかわらず、様々な楽曲を耳にする機会が多い。
【0003】このように、周囲に溢れる楽曲の中から、ある気に入った楽曲を入手しようとした場合、購入者は、一般に以下の(1)〜(4)の順番のような手続きを踏むことになる。
(1)楽曲を耳にする。
(2)楽曲名を調査する。
(3)楽曲販売店に行く。
(4)楽曲名を指定し楽曲を購入する。
【0004】
【発明が解決しようとする課題】しかしながら、多くの場合、上記(2)の楽曲名の調査には多大な労力を要する。また、楽曲を知ると同時に楽曲名を知り得る場合もあるものの、例えば一部分のみを耳にした曲、放送番組中やコマーシャルメッセージで耳にした曲、外出時に耳にした曲などの場合、その楽曲名を同定できずに結局は入手に至らないことも多い。一方、調査の結果として楽曲名を知り得た場合でも、実際に楽曲を入手するためには、販売店に足を運ぶか、あるいは、電子音楽配信などを利用する必要がある。電子音楽配信を利用する場合は、販売店に足を運ぶ必要はないものの、パーソナルコンピュータを動作させ、インターネットヘの接続を行い、配信者への支払い方法の登録を行い、楽曲をダウンロードするなど、多段階の行動が必要となる。
【0005】そこで、本発明はこのような実情に鑑みてなされたものであり、例えば演奏、再生、放送などがされている楽曲或いはその一部断片であっても、その楽曲を容易に同定及び入手(例えば購入)可能とし、また、その楽曲の代金の支払い、楽曲の再生等をも可能にする携帯電話端末、楽曲同定方法及び装置、楽曲同定配信方法及びシステムを提供することを目的とする。
【0006】
【課題を解決するための手段】本発明の携帯電話端末は、音響電気変換手段を介して取り込まれた音楽データを録音する録音手段と、上記録音された音楽データを圧縮符号化する符号化手段と、上記圧縮符号化された音楽データを送信する送信手段とを有することにより、上述した課題を解決する。
【0007】また、本発明の携帯電話端末は、音響電気変換手段を介して取り込まれた音楽データを録音する録音手段と、上記録音された音楽データより、その音楽の楽曲名を同定するための特徴量を抽出する特徴抽出手段と、上記抽出された特徴量を送信する送信手段とを有することにより、上述した課題を解決する。
【0008】さらに、本発明の携帯電話端末は、音楽データを記憶する記憶手段と、音楽データから音楽を再生する再生手段とを有し、携帯電話システムを通じて受信した音楽データを上記記憶手段に蓄積し、上記記憶手段に蓄積した音楽データから上記再生手段により音楽を再生することにより、上述した課題を解決する。
【0009】また、本発明の携帯電話端末は、音響電気変換手段を介して取り込まれた音楽データを録音する録音手段と、上記録音された音楽データを圧縮符号化若しくは上記録音された音楽データから当該音楽の楽曲名を同定するための特徴量を抽出する音楽データ処理手段と、上記圧縮符号化されたデータ若しくは上記抽出された特徴量を携帯電話システムを通じて送信する送信手段と、上記携帯電話システムを通じて音楽データを受信する受信手段と、上記受信手段が受信した音楽データを記憶する記憶手段と、上記記憶手段に記憶した音楽データから音楽を再生する再生手段と、操作者による操作される操作子を備えた操作入力手段と、少なくとも複数の楽曲のそれぞれを上記操作者が認識可能とする表示を行う表示手段とを有し、上記表示手段上に表示された複数の楽曲のうち1つを、上記操作入力手段の操作子の操作に応じて選択し、当該選択された楽曲を試聴し、若しくは当該選択された楽曲を購入することにより、上述した課題を解決する。
【0010】次に、本発明の楽曲同定方法は、音響信号の時間周波数分布を求め、上記時間周波数分布を再離散化し特徴行列を生成し、上記時間周波数分布の再離散化により生成された楽曲の特徴行列と当該楽曲の属性を保存および管理し、上記保存および管理されている複数の特徴行列と楽曲の一部分の信号から生成された特徴行列とのマッチングを行うことにより、上記一部分の信号を含む楽曲の楽曲名を同定することにより、上述した課題を解決する。
【0011】また、本発明の楽曲同定装置は、音響信号の時間周波数分布を求めるパワースペクトル分析手段と、上記時間周波数分布を再離散化し特徴行列を生成する特徴行列生成手段と、上記特徴行列生成手段より生成された楽曲の特徴行列と楽曲の属性を保存および管理する楽曲データベース手段と、上記楽曲データベース手段により保存および管理されている複数の特徴行列と楽曲の一部分の信号から生成された特徴行列とのマッチングを行うマッチング手段とを有し、上記マッチングの結果に基づいて、上記一部分の信号を含む楽曲の楽曲名を同定することにより、上述した課題を解決する。
【0012】次に、本発明の楽曲同定配信方法は、携帯電話網を用いた楽曲同定配信方法であって、音響電気変換手段により取り込まれてディジタル化された音楽データを録音し、上記録音された音楽データを圧縮符号化若しくは上記録音された音楽データから当該音楽の楽曲名を同定するための特徴量を抽出し、上記圧縮符号化されたデータ若しくは上記抽出された特徴量を携帯電話網へ送信し、上記携帯電話網を通じて送信されてきた上記圧縮符号化されたデータ若しくは上記抽出された特徴量から楽曲の候補を検索し、上記検索された楽曲の試聴用データを上記携帯電話網を通じて送信し、上記携帯電話網を通じて送信されてきた上記楽曲の試聴用データを試聴し、上記試聴した楽曲の候補から購入する楽曲を決定し、上記決定された楽曲の配信を上記携帯電話網を通じて要求し、上記要求された楽曲を上記携帯電話網を通じて配信し、上記試聴用データの送信と上記楽曲の配信に応じた課金を行うことにより、上述した課題を解決する。
【0013】また、本発明の楽曲同定配信システムは、音響電気変換手段を介して取り込まれた音楽データを録音する録音手段と、上記録音された音楽データを圧縮符号化若しくは上記録音された音楽データから当該音楽の楽曲名を同定するための特徴量を抽出する音楽データ処理手段と、上記圧縮符号化されたデータ若しくは上記抽出された特徴量を携帯電話網を通じて送信する送信手段と、上記携帯電話網を通じて音楽データを受信する受信手段と、上記受信手段が受信した音楽データを記憶する記憶手段と、上記記憶手段に記憶した音楽データを再生する再生手段と、操作者による操作される操作子を備えた操作入力手段と、少なくとも複数の楽曲のそれぞれを上記操作者が認識可能とする表示を行う表示手段とを有し、上記表示手段上に表示された複数の楽曲のうち1つを、上記操作入力手段の操作子の操作に応じて選択し、当該選択された楽曲を試聴し、若しくは当該選択された楽曲を購入する携帯電話端末と、上記携帯電話網を通じて上記携帯電話端末から送信されてきた上記圧縮符号化されたデータ若しくは上記抽出された特徴量から楽曲の候補を検索し、上記検索した楽曲の試聴用データを上記携帯電話網を通じて上記携帯電話端末へ送信する楽曲同定装置と、上記携帯電話網を通じて、上記携帯電話端末から上記試聴用データの試聴の元で選択された楽曲の配信が要求されたとき、当該要求に応じた音楽データを、上記携帯電話網を通じて上記携帯電話端末へ送信する楽曲配信装置と、上記携帯電話網上の通信を管理すると共に、上記試聴用データの送信と上記楽曲の配信に応じた課金を行う上記携帯電話管理装置とからなることにより、上述した課題を解決する。
【0014】本発明によれば、耳にした音楽の調査を容易に行えるような仕組みと、その楽曲を容易に入手できるような仕組みを一体として提供すること、すなわち、耳にした楽曲(演奏、再生、放送などがされている楽曲)或いはその一部断片を録音し、楽曲名の調査、楽曲の購入、代金の支払い、そして楽曲の再生までを、一台の端末操作のみで実現可能にすることにより、購入者は楽曲を同定できずに購入をあきらめることが減り、また、購入のための時間や労力を著しく節約することを可能にしている。
【0015】
【発明の実施の形態】以下、本発明の好ましい実施の形態について、図面を参照しながら説明する。
【0016】先ず、第1の発明として携帯端末について述べ、続いて、第2の発明として音楽同定方法について述べ、さらに第3の発明として電子音楽同定配信サービスシステムについて述べる。
【0017】第1の発明の携帯端末が適用される一実施の形態としての携帯電話端末の送信部の概要を図1に示し、受信部の概要を図2に示す。
【0018】本実施の形態の携帯電話端末の送信部は、一般の携帯電話装置と略々同様の構成を有し、図1に示すように、音響電気変換手段としてのマイクロフォン1、「0」〜「9」までの10キー、通話開始キー、通話終了キー、電源オン/オフキー等の各種キーや各種メニュー、アイコン、アプリケーションなどの選択用の選択手段(例えばプッシュスイッチ機能を有するジョグダイヤルなどを含む)を備えたキー入力部2、マイクロフォン1により音響電気変換されたアナログ音響信号をディジタル音響信号に変換するA/D変換器4、ディジタル音響信号(例えば通話時の通話音声信号)を符号化する音声用符号化器6、キー入力部2や音声用符号化器6からの信号などを多重化するマルチプレクサ8、電送用の高周波信号への変調を行う変調器9等を備えている。これら各構成要素は、従来の携帯電話装置に搭載されているものと同様であるため、ここではこれらの詳細な動作の説明を省略する。
【0019】本実施の形態の携帯電話端末の送信部において、一般の携帯電話装置と異なる独自の部分は、録音ボタン3、スイッチ5、および音楽データ処理部7であり、以下、これらの詳細な動作を説明する。
【0020】録音ボタン3は例えばオン(ON)/オフ(OFF)ボタンであり、そのオン/オフ信号はマイクロフォン1の指向性切り換え制御信号とスイッチ5の切り換え制御信号となっている。
【0021】当該録音ボタン3がオフ(OFF)になされている場合、マイクロフォン1の指向性は電話用として近距離に設定され、また、スイッチ5は音声用符号化器6側に設定される。したがって、当該録音ボタン3がオフになされている場合、マイクロフォン1を通じて入力された音響信号(この場合は通話時の音声信号となる)は、A/D変換器4によりディジタル化され、音声用符号化器6により符号化されて、通話電送に用いられる音声データ(ディジタルビットストリームデータ)となされ、さらに、変調器9にて高周波信号に変調された後、携帯電話会社の運用システムヘと送信される。またこの通話時において、例えば、キー入力部2が操作者により操作されて当該キー入力部2から番号や動作指令などの入力がなされた場合、そのキー入力信号は、マルチプレクサ6にて上記音声データと組み合わされ、さらに上記変調器9にて高周波信号に変調された後、携帯電話会社の運用システムヘと送信される。以上は、従来の携帯電話の基本動作と全く同じである。
【0022】一方、録音ボタン3がオン(ON)になされた場合、マイクロフォン1の指向性は音楽録音用として遠距離に設定され、また、このときのスイッチ5は音楽データ処理部7側に設定される。これにより、マイクロフォン1を通じて入力された音響信号(この場合は音楽信号となる)は、A/D変換器4によりディジタル化され、音楽データ処理部7により後述のように圧縮符号化或いは特徴抽出された後にビットストリーム化され、一時記憶部10に送られて少なくとも所定の時間(例えば数秒間)分蓄積される。当該一時記憶部10に蓄積された所定の時間分の音楽データに係るビットストリームは、自動的若しくは操作者の操作によるキー入力部2からの読み出し指示信号に応じて読み出されてマルチプレクサ8に送られる。当該マルチプレクサ8には、操作者の操作に応じてキー入力部2から出力された後述する要求信号などが入力され、上記所定時間分の音楽データに係るビットストリームと上記キー入力部2からの信号とが多重化されて変調器9に送られる。変調器9からは、上記通話時と同様に、高周波信号への変調がなされ、携帯電話運用システムヘと送信される。
【0023】なお、マイクロフォン1の指向性の調節は、一つのマイクロフォンの指向性を変更する方法でもよいし、指向性の異なる複数のマイクロフォンを切り替えて使用する方法でもよい。上記一時記憶部10は、一般の携帯電話装置が備えるメモリとは別の大容量のメモリとして新たに設けても良いし、一般の携帯電話装置に設けられているメモリが大容量メモリである場合はそのメモリをそのまま用いても良い。また、上記一時記憶部10は、後述する受信部のメモリ18と共用することも可能であり、半導体メモリカードのように取り外し可能なものであっても良い。上記一時記憶部10として、半導体メモリカードのように取り外し可能なものを用いると、マイクロフォン1により取り込んだ楽曲だけでなく、別の携帯電話端末や携帯型情報処理装置など様々な装置にて取得した楽曲についても、後述するような楽曲名の同定や楽曲の購入等を行えることになる。
【0024】上記音楽データ処理部7は、上記一時記憶部10に蓄積(以下、適宜録音とする)された上記所定時間の短時間音楽データ(以下、音楽断片或いは音楽クリップと呼ぶ)から、その楽曲名の同定に必要となる符号化データを生成、あるいは楽曲名同定に必要となる後述する特微量を抽出するものである。
【0025】すなわち本実施の形態において、上記音楽データ処理部7は、以下の第1、第2の構成の何れかを取り得る。
【0026】第1の音楽データ処理部7の構成は、例えばいわゆるMPEGオーディオなどのオーディオ圧縮用符号化器をそのまま用いる構成である。この場合、一時記憶部10に録音された音楽断片は、上記オーディオ圧縮用符号化器によりそのまま圧縮符号化されて送信され、後述する楽曲同定システムに送られ、当該楽曲同定システムの側で、楽曲名同定に必要な後述する特微量への変換が行われることになる。この例によれば、本実施の形態の携帯電話端末に搭載しなければならない構成が一般的な符号化器のみで良いため、携帯電話端末のコストを低減することが可能となる。同時に、この例の場合、楽曲名同定のための後述する特徴抽出は楽曲同定システム側で行うことになるため、当該特徴抽出のための多量の演算を必要とする精度の高い同定法を導入できることになり、また、自動的に同定できない楽曲については、楽曲同定システム側の人が聞いて確認することもでき、さらに、新たな同定アルゴリズムが開発された場合に旧同定アルゴリズムを当該新たな同定アルゴリズムに置き換えるようなことが容易になる、などの利点がある。
【0027】第2の音楽データ処理部7の構成は、当該音楽データ処理部7において後述する特徴抽出法を用いた特徴抽出を行い、その特徴量情報(すなわち例えば特徴ベクトル)を符号化する構成である。この例の場合、当該音楽データ処理部7により得られる特徴量の情報は、第1の構成のような圧縮符号化された音楽データと比べて、そのデータ量は遥かに少なくなる。このため、前記一時記憶部10の記憶容量(メモリの容量)や、そのデータを電送する際の電送容量、電送時間などを節約できる利点がある。
【0028】次に、図2に示した本実施の形態の携帯電話端末の受信部も、従来の携帯電話装置と略々同様の構成を有し、アンテナを介して受信した高周波信号を復調する復調器11、多重化されたデータを分離するデマルチプレクサ12、デマルチプレクサ12により分離された通話用の音声データを復号化する音声用復号化器15、上記復号化により得られた通話用のディジタル音声データをアナログ音声信号に変換するD/A変換器16、D/A変換器16からの通話用アナログ音声信号を放音するスピーカ17、デマルチプレクサ12により分離された制御データに含まれる番号や文字等のデータから表示用信号を生成する表示処理部13、液晶表示デバイス等からなるディレイ14等を備えている。これら各構成要素は、従来の携帯電話装置に搭載されているものと同様であるため、ここではこれらの詳細な動作の説明を省略する。
【0029】一方、本実施の形態の携帯電話端末の受信部において、一般の携帯電話装置と異なる独自の部分は、音楽信号処理系の構成として、メモリ18、オーディオ用復号化器19、D/A変換器20、スピーカ21が設けられていることであり、以下、これらの詳細な動作を説明する。
【0030】この図2に示す受信部において、前記復調器11にて復調された受信データに、通話用の音声データとは別の本実施の形態に係る音楽データが含まれている場合、上記デマルチプレクサ12は、受信データから当該音楽データを分離し、メモリ18に送る。メモリ18は、当該音楽データを一時蓄積する。なお、当該メモリ18は、携帯電話端末に内蔵されているものでも、或いは、半導体メモリカードのように取り外し可能なものであっても良い。メモリ18として、半導体メモリカードのように取り外し可能なものを用いると、取得した音楽データを他の機器でも再生できて都合がよい。
【0031】上記音楽データは、楽曲の全て若しくは十分なデータが受信された後、メモリ18から読み出されてオーディオ用復号器19に送られ復号され、さらにD/A変換器20を経てスピーカ21若しくはヘッドフォンなどにより音として出力される。なお、D/A変換器20及びスピーカ21については、部品点数を減らすためには音声信号処理系のD/A変換器16及びスピーカ17と共用しても良いが、通話用の音声信号と楽曲用の音楽信号とでは、一般に必要とされる音質が異なる(例えば音楽用は高品質)ため、それぞれ必要とされる音質に応じて別個に設けることが望ましい。
【0032】次に、第2の発明としての楽曲名の同定方法について以下に説明する。
【0033】本発明に係る楽曲同定方法は、大別して、以下に述べるように、楽曲同定の前段階の処理となる楽曲のデータベースへの登録処理と、登録された楽曲データベースを用いた実際の楽曲同定処理の2つの流れにより行われる。
【0034】図3には、本発明に係る楽曲同定方法における上記楽曲のデータベースへの登録処理のためのシステム構成を示す。
【0035】図3において、例えばいわゆるコンパクトディスク(CD)やネットワークなどを介して配布された複数の各楽曲データ31は、パワースペクトル分析部33に送られる。パワースペクトル分析部33は、入力された複数のそれぞれの楽曲データ31を時間周波数分布に変換し、それぞれ得られた時間周波数分布データを特徴行列生成部34に送る。
【0036】特徴行列生成部34では、各楽曲に対応する時間周波数分布データを所定の周波数および時間間隔でリサンプリングすることにより、各楽曲にそれぞれ対応した楽曲特徴行列(特徴ベクトル)Aftを生成する。但し、図4の(a)に示すように、上記楽曲特徴行列Aftの「f」は行列の周波数方向のインデックス(行)、「t」は時間方向のインデックス(列)を表している。これら各楽曲に対応した楽曲特徴行列Aftのデータは、上記楽曲データ31と共に配布された各楽曲の楽曲名、演奏家名、楽曲のID番号などの各楽曲の属性データ32と対応付けられて、データベース35に登録される。
【0037】次に、図5には、上記登録された楽曲データベースを用いた楽曲同定のためのシステム構成を示す。
【0038】この図5において、上述した第1の発明にかかる携帯電話端末やその他の任意の方法で得られた、例えば数秒程度の楽曲の一部分(前記音楽断片)データ41は、上記図3と同様のパワースペクトル分析部43に送られ、時間周波数分布に変換される。また、上記図3と同様の特徴行列生成部44では、パワースペクトル分析部43からの時間周波数分布データを所定の周波数および時間間隔でリサンプリングし、音楽断片特徴行列(特徴ベクトル)Sfuを生成する。但し、図4の(b)に示すように、音楽断片特徴行列Sfuの「f」は上記と同様の行列の周波数方向のインデックス(行)、「u」は時間方向のインデックス(列)を表す。この音楽断片特徴行列Sfuのデータは、マッチング部45へ送られる。なお、前記携帯電話端末において特徴量の抽出まで行うようにした場合は、当該図5のパワースペクトル分析部43及び特徴行列生成部44と同様の構成が、特徴量抽出のための構成として前記携帯電話端末の音声データ処理部7内に設けられることになる。一方、携帯電話端末にて音楽データの圧縮符号化のみ行い特徴量の抽出を行わない場合は、この図5のパワースペクトル分析部43に供給される音楽断片のデータ41として、前記携帯電話端末にて圧縮符号化されて送信されてきたデータを伸長復号化したデータが用いられることになる。
【0039】マッチング部45には、上記データベース35に登録されている複数の楽曲についての楽曲特徴行列Aftとそれぞれ対応する楽曲名、演奏家名、楽曲のID番号などの各楽曲の属性データ32とからなるデータ42も入力される。当該マッチング部45は、データベース35から得られた複数の楽曲特徴行列Aftすなわち楽曲特徴ベクトルと、上記特徴行列生成部44から供給された音楽断片特徴行列Sfuすなわち音楽断片特徴ベクトルとを用いて、後述の方法によりマッチング(ベクトルマッチング)を行い、それらベクトルの類似度を算出し、上記音楽断片特徴ベクトルと楽曲特徴ベクトルとの間の類似度が所定の閾値を越えているとき、当該楽曲特徴ベクトルに対応する楽曲について、その類似度Q、類似度が最大となる時刻(類似度最大時刻)T、および属性データ32からなるデータ46を出力する。
【0040】ここで、上記マッチング部45でのマッチングは、相互相関を用いて以下のように行う。
【0041】図4に示すように、楽曲特徴行列Aftは、複数の楽曲全曲分の特徴行列であり、音楽断片特徴行列Sfuは、ある楽曲の一部分の(劣化した)特徴行列となる。原理的には、これらの行列の相互相関が最大となる時刻の相関値を類似度とすればよいが、通例、音楽断片特徴行列Sfuには雑音が加わっているため、次のような操作を行いノイズ耐性を改善する。
【0042】先ず、音楽断片特徴行列Sfuを、次式(1)により変換する。
【0043】
S'fu=Mfu(Sfu−Bfu) (1)但し、式中のBfuは、定常的なノイズ成分を減ずるための定数行列であり、例えば各周波数成分における最小値などによって作成される。また、式中のMfuは図4の(c)〜図4の(e)に示すように、音楽断片特徴行列Sfuの一部(各図中mで示す部分)をマスクする行列である。図4の(c)に示すマスク行列Mfuは低周波成分をマスクするための行列であり、これによれば、例えば交通騒音など低周波ノイズが強い場合に、それら低周波ノイズを音楽断片特徴行列Sfuから除去するのに有効となる。また、図4の(d)に示すマスク行列Mfuは時間マスクを行うための行列であり、この時間マスクにより、音楽断片特徴行列Sfuから例えば音楽成分が強い時刻のみを取り出すことで、安定なマッチング処理が実現可能となる。また、図4の(e)に示すマスク行列Mfuは音声成分をマスクするための行列であり、音楽断片特徴行列Sfuから音声成分が最も多く含まれる周波数範囲(例えば100Hz〜1kHz)を除去することで、例えば音声混入があるような場合にその音声成分を除去することが可能となる。この他にも様々なマスクパターンが考えられるが、これらのマスクを切り替えて用い、最も類似度の高いものを選択することで、ノイズ耐性の強い安定なマッチングが行われる。
【0044】次に、上記式(1)の変換を用い、各時刻での類似度を次式(2)により計算する。
【0045】
【数1】

【0046】さらに、各時刻の類似度のうち最大のもの及びその時刻によって、式(3)、式(4)のように、楽曲と音楽断片の類似度Q及び類似度最大時刻Tを求める。
【0047】Q=maxtR(t) (3)T=argmaxtR(t) (4)マッチング部45では、図6に示す流れで、以上説明したマッチング方法を実現する。
【0048】図6において、マッチング部45には、上述した低周波成分のマスクや時間マスク、音声成分のマスク等の、必要と思われる各種のマスクパターンが予め用意されており、マッチング処理に先立ち、テップS51として、そのうち一つのマスクパターンが選択される。
【0049】次に、マッチング部45では、ステップS52として、全てのマスクパターンについて処理したか否かの判定が行われ、未だ全てのマスクパターンの処理が終了していないと判定した場合はステップS53の処理に進み、用意した全てのマスクパターンの処理が終了したと判定した場合はステップS55の処理に進む。
【0050】ステップS52において未だ全てのマスクパターンの処理が終了していないと判定され、ステップS53の処理に進むと、マッチング部45では、ステップS51で選択されたマスクパターンを用いて相関関数R(t)を計算し、次のステップS54において、類似度Q、類似度最大時刻Tを計算し、得られた値を保存する。その後は、ステップS51に戻り、再びマスクパターンを選択する。
【0051】一方、ステップS52において、用意した全てのマスクパターンの処理が終了したと判定され、ステップS55の処理に進むと、マッチング部45では、上記類似度Qの中で最大のものをもって、その楽曲と入力された音楽断片との類似度とする。
【0052】次に、上記第1の発明に係る携帯電話端末と上記第2の発明に係る楽曲同定のシステムを用いた、第3の発明である電子音楽同定配信サービス方法及びそのシステムについて、以下に説明する。このシステムの利点は、一つの携帯端末(本実施の形態の携帯電話端末)から楽曲の調査、購入、再生、代金支払いなどが全て行われる点である。
【0053】図7には第3の発明である電子音楽同定配信サービスが適用される実施の形態のシステム構成を示し、図8〜図11を用いて当該システムの運用方法を説明する。なお、図7中の指示符号S71,S72,S75,S76,S78,S79,S82〜S85,S90〜S99は、図8〜図11中の対応する指示符号で表されるステップの処理が行われることを示している。図8には予め行われる楽曲登録段階での処理の流れを示し、図9には楽曲同定段階での処理の流れを、図10には楽曲試聴段階での処理の流れを、図11には楽曲購入段階での処理の流れを示す。
【0054】図8に示す楽曲登録段階において、先ずステップS71として、楽曲販売者側の楽曲配信システム64は、楽曲同定に必要なデータ(前記複数の楽曲データとその属性データ)を楽曲同定者側の楽曲同定システム63に送り、それらデータを受け取った楽曲同定システム63では、その楽曲同定用の楽曲データから前述したように特徴行列を求め、属性データと対応つけて前記データベースに登録する。また、ステップS72として、楽曲配信システム64は、楽曲の試聴時に必要なデータ(複数の試聴用の楽曲データと各試聴用の楽曲データのID等)を楽曲同定システム63に送り、当該楽曲同定システム63では、その楽曲試聴用データをデータベースに登録する。なお、ステップS71とS72の処理は同時に行ってもよく、また、ステップS71の処理後にステップS72の処理を行っても良い。
【0055】次に、図9に示す楽曲同定段階において、先ずステップS73として、楽曲購入者側の携帯電話端末61は、当該端末の操作者によって前記録音ボタン3がオン操作されると、そのオン操作時点で例えば放送番組中やコマーシャルメッセージ中に演奏されたり街頭で流されている楽曲の一部分(音楽断片)を録音する。また、ステップS74として、携帯電話端末61は、前記音楽データ処理部7により、その音楽断片のデータに対して前述のように圧縮符号化若しくは特徴抽出を行う。
【0056】次に、ステップS75として、携帯電話端末61は、携帯電話運用者側の携帯電話運用システム62に対して、キー入力部2からのキー入力に応じて生成された楽曲同定要求と共に、上記特徴抽出されたデータを送信し、さらに、ステップS76として、携帯電話運用システム62は、その楽曲同定要求と上記特徴抽出されたデータをそのまま楽曲同定者側の楽曲同定システム63に送信する。
【0057】上記楽曲同定要求と上記圧縮符号化データ若しくは特徴抽出されたデータを受け取った楽曲同定システム63は、ステップS77として、前記第2の発明で説明したようにして特徴ベクトルを用いた楽曲同定の処理(候補となる楽曲の検索)を行う。なお、携帯電話端末61側の音楽データ処理部7において、音楽断片の録音から特徴抽出までの処理を行っている場合、上記楽曲同定システム63では、携帯電話端末61から送られてきた特徴ベクトルを用いた前記マッチングにより楽曲同定を行うことになる。また、携帯電話端末61側の音楽データ処理部7において、音楽断片の録音から音楽データの圧縮符号化処理までしか行っていない場合、上記楽曲同定システム63では、上記携帯電話端末61から送られてくる圧縮符号化された音楽データを復号してから前述した特徴抽出を行い、さらにマッチングにより楽曲同定を行うことになる。上記楽曲同定処理が終了すると、当該楽曲同定システム63は、ステップS78として、その楽曲同定処理により得られた候補となる楽曲に関するデータ(楽曲名や演奏家名、楽曲のID番号など)を、携帯電話運用システム62に送信し、さらに、ステップS79として、携帯電話運用システム62は、その候補楽曲についてのデータをそのまま携帯電話端末61に送信する。
【0058】上記候補楽曲についてのデータを受け取った携帯電話端末61では、ステップS80として、当該端末の操作者(楽曲購入者)により前記キー入力部2に対して候補楽曲を試聴することの要否を指示するための所定の入力操作がなされたか否かの判断を行う。このステップS80において、操作者から候補楽曲を試聴することの指示入力がなされた場合(試聴する場合(Y))は、図10に示す楽曲試聴段階の処理へ進み、一方、操作者から楽曲を試聴しないことの指示入力がなされた場合(試聴しない場合(N))は、処理を終了する。
【0059】図10に示す楽曲試聴段階へ進むと、先ず、ステップS81として、携帯電話端末61では、端末操作者(楽曲購入者)により前記キー入力部2に対して試聴用の楽曲を選択するための所定の入力操作がなされると、その入力操作に応じた試聴用の楽曲の選択を行う。
【0060】次に、ステップS82として、携帯電話端末61は、携帯電話運用システム62に対して、前記キー入力部2からのキー入力に応じて生成された楽曲試聴要求を送信し、さらに、携帯電話運用システム62は、ステップS83として、その楽曲試聴要求をそのまま楽曲同定システム63に送信する。
【0061】上記楽曲試聴要求を受け取った楽曲同定システム63は、ステップS84として、上記楽曲試聴要求に応じた試聴用データを携帯電話運用システム62へ送信し、さらに、携帯電話運用システム62は、ステップS85として、その試聴用データをそのまま携帯電話端末61に送信する。このときの携帯電話端末61では、上記試聴用データを前記メモリ18に蓄積する。
【0062】次に、ステップS86として、上記試聴用データの提供を受けた携帯電話端末61では、当該端末の操作者(楽曲購入者)により前記キー入力部2に対して当該試聴用の楽曲を試聴する旨の所定の入力操作がなされると、その入力操作に応じて前記メモリ18に蓄積された試聴用の楽曲データをオーディオ用復号化器19に送り、当該試聴用の楽曲データを復号し、さらにD/A変換器20を介してスピーカ21に送る。これにより、当該携帯電話端末61の操作者(楽曲購入者)は、上記試聴用の楽曲を聴くことができる。
【0063】その後、携帯電話端末61では、ステップS87として、当該端末の操作者(楽曲購入者)により前記キー入力部2に対して他の楽曲を試聴することの要否を指示するための所定の入力操作がなされたか否かの判断を行う。このステップS87において、操作者から他の楽曲を試聴することの指示入力がなされた場合(試聴する場合(Y))は、ステップS81の試聴曲の選択の処理に戻り、一方、操作者から他の楽曲を試聴しないことの指示入力がなされた場合(試聴しない場合(N))は、ステップS88の処理に進む。
【0064】ステップS88の処理に進むと、携帯電話端末61では、操作者(楽曲購入者)によりキー入力部2に対してその試聴した楽曲を購入することの要否を指示するための所定の入力操作がなされたか否かの判断を行う。このステップS88において、操作者から当該試聴した楽曲を購入することの指示入力がなされた場合(Y)は、図11に示す楽曲購入段階へ進み、一方、操作者から当該試聴した楽曲を購入しないことの指示入力がなされた場合(N)は、処理を終了する。
【0065】図11に示す楽曲購入段階へ進むと、先ずステップS89として、携帯電話端末61では、端末操作者(楽曲購入者)によりキー入力部2に対して購入楽曲を選択するための所定の入力操作がなされると、その入力操作に応じた楽曲選択を行う。
【0066】次に、ステップS90として、携帯電話端末61は、上記選択された楽曲の購入意思を示す楽曲購入要求を携帯電話運用システム62に対して送信し、さらに、ステップS91として、携帯電話運用システム62は、その楽曲購入要求をそのまま楽曲販売者側の楽曲配信システム64に送信する。
【0067】上記楽曲購入要求を受け取った楽曲販売システム64は、ステップS92として、当該楽曲購入要求に応じた楽曲データを携帯電話運用システム62へ送信し、さらに、携帯電話運用システム62は、ステップS93として、その楽曲データをそのまま携帯電話端末61に送信する。なお、このときの携帯電話端末61では、上記楽曲データがメモリ18に蓄積される。その後、当該端末操作者(楽曲購入者)によりキー入力部2に対して当該楽曲を再生する旨の所定の入力操作がなされると、携帯電話端末61は、その入力操作に応じて前記メモリ18に蓄積された楽曲データをオーディオ用復号化器19に送り、当該楽曲データを復号し、さらにD/A変換器20を介してスピーカ21に送る。これにより、当該携帯電話端末61の操作者(楽曲購入者)は、上記購入した楽曲を聴くことができる。
【0068】ここで、上述のように楽曲の同定や配信が行われた場合、その楽曲の同定や購入の代金は、楽曲購入者が楽曲同定者や楽曲配信者に直接或いは銀行振込、インターネット経由のクレジットカード精算等により支払うことも可能であるが、本発明実施の形態の電子音楽同定配信システムでは、代金支払いの一括化のために、上記携帯電話運用者を通じて支払うようにしている。
【0069】先ず、ステップS94として、楽曲同定者側の楽曲同定システム63は、前述した楽曲の同定のための代金請求情報を、電話運用者側の携帯電話運用システム62に対して送る。このときの携帯電話運用システム62の電話運用者は、ステップS95として、その代金を楽曲購入者に代行して上記楽曲同定者に支払う。なお、この場合の代金支払い方法としては、例えば電話運用者の銀行口座から楽曲同定者の銀行口座に代金が振り込まれるような電子決済処理を行い、その決済が行われたことを示す情報を、携帯電話運用システム62或いは銀行より、楽曲同定者側の楽曲同定システム63に送るようにしても良い。
【0070】同様に、ステップS96として、楽曲販売者側の楽曲配信システム64は、前述のように配信した楽曲の代金請求情報を、電話運用者側の携帯電話運用システム62に対して送る。このときの携帯電話運用システム62の電話運用者は、ステップS97として、その代金を楽曲購入者に代行して上記楽曲配信者に支払う。なお、この場合の代金支払い方法としては、例えば電話運用者の銀行口座から楽曲配信者の銀行口座に代金が振り込まれるような電子決済処理を行い、その決済が行われたことを示す情報を、携帯電話運用システム62或いは銀行より、楽曲配信者側の楽曲配信システム64に送るようにしても良い。
【0071】次に、ステップS98として、携帯電話運用システム62は、上記楽曲同定者や楽曲配信者に対して上記代行して支払った金額を通話料などに加算して、上記携帯電話端末61の使用者(楽曲購入者)に対して請求する。その後、ステップS99として、当該携帯電話端末61の使用者(楽曲購入者)は、上記楽曲同定代金や楽曲配信代金が加算された通話料を、上記電話運用者に対して、直接或いは銀行振込、インターネット経由のクレジットカード精算等により一括或いは分割して支払う。なお、携帯電話端末61の使用者(楽曲購入者)と電話運用者との間の通話料の支払いについても、上述同様に、例えば携帯電話端末61の使用者(楽曲購入者)の銀行口座から電話運用者の銀行口座に代金が振り込まれるような電子決済処理を行い、その決済が行われたことを示す情報を、携帯電話端末61或いは銀行より、電話運用者側の携帯電話運用システム62に送るようなことも可能である。
【0072】以上により、代金精算の処理が完了する。
【0073】本実施の形態では、説明の便宜上、楽曲同定者と楽曲販売者を別物として説明したが、もちろん、楽曲販売者自身が同定サービスを行っても同様のことが実現される。また、説明の便宜上、試聴用の楽曲データは、同定者が提供するよう説明したが、この部分は販売者が行っても本質的な差異が生じないのは明らかである。
【0074】さらに、本実施の形態では、楽曲データの配信を受けた後に、同定代金と楽曲購入代金を支払うようにしているが、楽曲同定のみが行われ、楽曲購入が行われなかった場合には、上記楽曲同定の代金のみを請求することも可能であるし、また、楽曲同定については無料サービスとすることもできる。
【0075】また、本発明実施の形態では、携帯電話端末を例に挙げているが、本発明は、いわゆるパームトップ型コンピュータのような携帯型情報処理端末であっても適用可能である。但し、本発明では、上述したように音楽の録音、楽曲同定、楽曲配信、購入、再生などの全てを一台の携帯電話端末において実現することにより、携帯型情報処理端末を不要とし、さらに、いわゆる携帯型のオーディオ記録再生装置をも不要としている。
【0076】以上説明したように、本発明実施の形態によれば、テレビジョン放送やラジオ放送等、街頭放送等により流れている音楽の一部分から、楽曲候補の検索を行うことができ、さらに、該楽曲候補の試聴、楽曲名の同定、楽曲の購入、楽曲の再生を、一台の携帯電話端末により行うことが可能となっている。すなわち、本発明実施の形態によれば、テレビジョン放送やラジオ放送等、街頭放送等により流れている音楽の調査を容易に行え、その楽曲を容易に入手可能となり、したがって、購入者は楽曲を同定できずに購入をあきらめることが減り、また購入のための時間や労力を著しく節約することが可能となる。
【0077】
【発明の効果】以上の説明からも明らかなように、本発明によれば、携帯電話端末において、音響電気変換手段を介して取り込まれた音楽データを録音し、その録音された音楽データを圧縮符号化、若しくは、録音された音楽データから当該音楽の楽曲名を同定するための特徴量を抽出して楽曲同定・配信側に送り、楽曲同定・配信側において、その圧縮符号化若しくは抽出された特徴量から楽曲の候補を検索し、その候補の楽曲の試聴用データを携帯電話端末に送り、携帯電話端末での試聴の結果、購入の決定された楽曲を、楽曲同定・配信側から携帯電話端末に送り、携帯電話運用側において、試聴した楽曲と購入した楽曲に応じた課金を行うことにより、例えば演奏、再生、放送などがされている楽曲の一部断片であっても、その楽曲を容易に同定及び入手(例えば購入)可能であり、また、その楽曲の代金の支払い、楽曲の再生等をも同時に可能となる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013