米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> オムロン株式会社

発明の名称 かな漢字変換装置およびかな漢字変換方法
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2003−178059(P2003−178059A)
公開日 平成15年6月27日(2003.6.27)
出願番号 特願2002−295006(P2002−295006)
出願日 平成6年12月5日(1994.12.5)
代理人 【識別番号】100092956
【弁理士】
【氏名又は名称】古谷 栄男 (外2名)
【テーマコード(参考)】
5B009
【Fターム(参考)】
5B009 ME16 
発明者 篠原 淳一 / 長岡 宏 / 桑理 聖二 / 岸塲 秀行 / 三浦 健一 / 渡辺 泰久 / 桑内 繁樹 / 針間 正紀
要約 課題
変換効率の良いかな漢字変換装置および方法を提供することを目的とする。

解決手段
変換情報記憶部92には、読みに関連づけて、漢字が記憶されている。また、繰り返しのある文字に対応する繰り返し符号が記憶されている。繰り返し基準記憶部94には、文字を繰り返し符号に変換すべきか否かの基準が記憶されている。繰り返し判定手段98は、文節区切り手段96により区切られた文節を構成する文字について、繰り返し基準記憶部94を参照し、繰り返し符号に変換すべきか否かを判定する。変換手段100は、文節を構成する文字が、繰り返し符号に変換すべきと判定された場合は、文節に区切られたかな文字列に対して、変換情報記憶部92を参照し、繰り返し符号を含む漢字混じりの文字列に変換してかな漢字変換候補を得る。
特許請求の範囲
【請求項1】連続する文節の品詞に基づいて連濁を生じる可能性があるか否かを判断するため、品詞の組合わせと可能性との対応を、連濁情報として記憶する連濁情報記憶部、前記連濁情報に基づいて連濁の可能性があると判断した場合であって、連続する文節の後の文節における最初の変換対象かな文字が濁音であれば、該濁音を清音に変える濁音処理手段、を備え、かな漢字変換候補のそれぞれに、前記濁音処理手段において濁音変更がなされたかな文字列に対する変換候補であるか否かを示す連濁有無情報を付すことを特徴とするかな漢字変換装置。
【請求項2】請求項1のかな漢字変換装置において、選択確定されたかな漢字変換候補の連濁有無情報が濁音変更有りを示す場合には、当該かな漢字変換候補に関連づけて、当該かな漢字変換候補を構成する文節ごとの文節変換候補を登録する登録手段を備えたことを特徴とするかな漢字変換装置。
【請求項3】請求項2のかな漢字変換装置において、前記登録手段は、選択確定されたかな漢字変換候補の連濁有無情報が濁音変更有りを示す場合には、当該かな漢字変換候補を対応するかな文字列に関連づけて変換情報記憶部に登録することを特徴とするかな漢字変換装置。
【請求項4】請求項2のかな漢字変換装置において、選択確定されたかな漢字変換候補に関連づけて、当該かな漢字変換候補を構成する文節ごとの文節変換候補が登録されている場合には、各文節変換候補の使用頻度も更新するようにしたことを特徴とするかな漢字変換装置。
【請求項5】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換装置であって、読みに関連づけて、漢字およびその品詞を記憶する変換情報記憶部、与えられたかな文字列を文節に区切る文節区切手段、区切られたかな文字列の各文節の品詞を、変換情報記憶部に基づいて決定する品詞決定手段、連続する文節の品詞に基づいて連濁を生じる可能性があるか否かを判断するため、品詞の組合わせと可能性との対応を、連濁情報として記憶する連濁情報記憶部、品詞決定手段によって決定された各文節の品詞に基づき、前記連濁情報を参照し、与えられたかな文字列の連続する文節が、連濁を生じる可能性があるか否かを判断し、連濁を生じる可能性のある連続した文節のうち、後の文節における最初の変換対象かな文字が濁音である場合には、当該濁音を清音に変更して変更かな文字列を生成する濁音変更手段、文節に区切られたかな文字列および変更かな文字列に対して、変換情報記憶部を参照し、漢字混じりの文字列に変換してかな漢字変換候補を得る変換手段、を備えたかな漢字変換装置。
【請求項6】変換対象かな文字列の連続する文節の品詞の組合わせが、連濁を生じる可能性があるか否かを判断し、連濁の可能性があると判断した場合には、後の文節の最初の変換対象かな文字が濁音であるか否かを判断し、濁音であれば、該濁音を清音に変える濁音変更を行うとともに、かな漢字変換候補のそれぞれに、前記濁音変更がなされたかな文字列に対する変換候補であるか否かを示す連濁有無情報を付すことを特徴とするかな漢字変換方法。
【請求項7】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換装置であって、読みに関連づけて、単語およびその使用頻度を記憶するとともに、複数の単語を群として関連づけ、当該群ごとに使用頻度を記憶する変換情報記憶部、与えられたかな文字列に対して、変換情報記憶部を参照し、かな漢字変換候補を得るとともに、少なくとも単語の使用頻度および群の使用頻度に基づいて、各かな漢字変換候補に優先度を付す変換手段、選択確定されたかな漢字変換候補に用いられた単語の前記頻度を更新する単語頻度更新手段、選択確定されたかな漢字変換候補に用いられた単語の属する群の前記頻度を更新する群頻度更新手段、を備えたかな漢字変換装置。
【請求項8】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換方法であって、読みに関連づけて、単語およびその使用頻度を記憶するとともに、複数の単語を群として関連づけ、当該群ごとに使用頻度を記憶した変換情報記憶部を設け、与えられたかな文字列に対して、変換情報記憶部を参照し、かな漢字変換候補を得るとともに、少なくとも単語の使用頻度および群の使用頻度に基づいて、各かな漢字変換候補に優先度を付して、選択確定されたかな漢字変換候補に用いられた単語の前記頻度を更新するとともに、当該単語の属する群の前記頻度を更新するようにしたことを特徴とするかな漢字変換方法。
【請求項9】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換装置であって、読みに関連づけて漢字を記憶するとともに、漢字に対応する一の読みに異なる複数の文字列が対応する場合、異なる複数の文字列の対応する異なる文字を一の文字群として記憶することにより、異なる複数の文字列を一の読みとして記憶する変換情報記憶部、変換情報記憶部に記憶された読みが文字群を有する場合は、文字群を参照し、異なる複数の文字列に展開する展開手段、与えられたかな文字列に対して、展開手段により複数の文字列に展開された読みを含め、変換情報記憶部に記憶された読み、読みに関連付けられた漢字を参照し、漢字混じりの文字列に変換してかな漢字変換候補を得る変換手段、を備えたかな漢字変換装置。
【請求項10】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換方法であって、読みに関連づけて漢字を記憶するとともに、漢字に対応する一の読みに異なる複数の文字列が対応する場合、異なる複数の文字列の対応する異なる文字を一の文字群として記憶することにより、異なる複数の文字列を一の読みとして記憶する変換情報記憶部を設け、変換情報記憶部に記憶された読みが文字群を有する場合は、文字群を参照し、異なる複数の文字列に展開し、与えられたかな文字列に対して、複数の文字列に展開された読みを含め、変換情報記憶部に記憶された読み、読みに関連付けられた漢字を参照し、漢字混じりの文字列に変換してかな漢字変換候補を得ること、を特徴とするかな漢字変換方法。
【請求項11】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換装置であって、繰り返しのある文字に対応する繰り返し符号を用意し、文字列が繰り返しの文字を含む場合は、該繰り返しの文字を所定の繰り返し符号に変換する繰り返し文字変換手段を備えたこと、を特徴とするかな漢字変換装置。
【請求項12】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換装置であって、かな文字列を含む文節が連濁を生じている場合に、濁音を清音化する濁音処理手段、繰り返しのある文字に対応する繰り返し符号を用意し、濁音処理手段により清音化されたかな文字列が繰り返しの文字を含む場合は、該繰り返しの文字を所定の繰り返し符号に変換する繰り返し文字変換手段、を備えたことを特徴とするかな漢字変換装置。
【請求項13】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換装置であって、繰り返しのある文字に対応する繰り返し符号を用意し、与えられたかな文字列が清音と該清音に後続する濁音であって該清音を濁音化した濁音を含む場合は、該濁音を所定の繰り返し符号に変換する繰り返し文字変換手段を備えたこと、を特徴とするかな漢字変換装置。
【請求項14】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換装置であって、読みに関連づけて、漢字を記憶するとともに、繰り返しのある文字に対応する繰り返し符号を記憶する変換情報記憶部、文字を繰り返し符号に変換すべきか否かの基準を記憶する繰り返し基準記憶部、与えられたかな文字列を文節に区切る文節区切手段、文節区切り手段により区切られた文節を構成する文字について、繰り返し基準記憶部を参照し、繰り返し符号に変換すべきか否かを判定する繰り返し判定手段、文節を構成する文字が、繰り返し判定手段により繰り返し符号に変換すべきとされた場合は、文節に区切られたかな文字列に対して、変換情報記憶部を参照し、繰り返し符号を含む漢字混じりの文字列に変換してかな漢字変換候補を得る変換手段、を備えたかな漢字変換装置。
【請求項15】与えられたかな文字列を漢字混じりの文字列に変換するかな漢字変換方法であって、読みに関連づけて、漢字を記憶するとともに、繰り返しのある文字に対応する繰り返し符号を記憶する変換情報記憶部と、文字を繰り返し符号に変換すべきか否かの基準を記憶する繰り返し基準記憶部とを設け、与えられたかな文字列を文節に区切り、区切られた文節を構成する文字について、繰り返し基準記憶部を参照し、繰り返し符号に変換すべきか否かを判定し、文節を構成する文字が、繰り返し符号に変換すべきとされた場合は、文節に区切られたかな文字列に対して、変換情報記憶部を参照し、繰り返し符号を含む漢字混じりの文字列に変換してかな漢字変換候補を得ること、を特徴とするかな漢字変換方法。
発明の詳細な説明
【0001】
【産業上の利用分野】この発明は、かな漢字変換装置および方法に関し、特にその変換効率の向上に関するものである。
【0002】
【従来の技術】日本語ワードプロセッサーなどに、かな漢字変換装置が用いられる。従来のかな漢字変換装置2の構成を図27に示す。かな漢字変換装置2は、キーボード等の入力装置4、辞書6、かな漢字変換部8、CRT等の表示装置10を有している。辞書6には、読みに対応づけて、単語(漢字等)、品詞等が記憶されている。
【0003】かな漢字変換部8は、入力装置4から入力されたかな文字列データを、文節に区切るとともに、漢字混じりのデータに変換し、変換候補として出力する。この際、単語の使用頻度等に基づいて各変換候補の優先度を決定する。表示装置10は、この優先度にしたがって、変換候補を順に表示する。操作者は、所望の変換候補を選択する。これにより、選択された変換候補が出力される。
【0004】
【発明が解決しようとする課題】しかしながら、上記のような従来のかな漢字変換装置2には、次のような問題点があった。
【0005】第一に、いわゆる連濁に関連して効率の良い変換を行えないという問題があった。たとえば、「会社」が「かいしゃ」という読みだけで辞書に登録されている場合、「かぶしきがいしゃ」は、「株式会社」と正しく変換されない。
【0006】一方、上記の場合、「会社」を「かいしゃ」だけでなく「がいしゃ」という読みでも登録しておけば、「かぶしきがいしゃ」は、「株式会社」と正しく変換される。しかし、「かれは、がいしゃにのっている」を変換しようとする際に、「彼は、会社に乗っている」という誤った変換候補を出すおそれが生じてしまう。
【0007】何れの場合においても、変換効率が良くないという問題があった。
【0008】第二に、関連の深い一群の漢字の使用頻度が高いか否かが考慮されていないため、特定分野の文章を作成している場合に、変換効率が向上しないという問題があった。
【0009】第三に、たとえば、漢字「通り」に対し、「とおり」、「とうり」など複数の文字列が対応可能である場合、漢字に対し、いずれか一つの文字列のみを対応させたり、複数の文字列を別個に対応させたりしていたため、対応付けられていない文字列が入力された場合に正しく変換されなかったり、正しく変換されても、辞書容量が増大するなど、変換効率が向上しないという問題があった。
【0010】第四に、たとえば、「むらむら(村々)」など繰り返しのある語は、辞書に登録されていないため、正しく変換することができず、変換効率が向上しないという問題があった。この場合、繰り返しのある語をすべて登録するとすると、辞書容量は膨大なものとなってしまうため、不都合である。
【0011】この発明は上記のような問題点を考慮して変換効率の良いかな漢字変換装置および方法を提供することを目的とする。
【0012】
【課題を解決するための手段】請求項1のかな漢字変換装置は、連続する文節の品詞に基づいて連濁を生じる可能性があるか否かを判断するため、品詞の組合わせと可能性との対応を、連濁情報として記憶する連濁情報記憶部と、前記連濁情報に基づいて連濁の可能性があると判断した場合であって、連続する文節の後の文節における最初の変換対象かな文字が濁音であれば、該濁音を清音に変える濁音処理手段とを備え、かな漢字変換候補のそれぞれに、前記濁音処理手段において濁音変更がなされたかな文字列に対する変換候補であるか否かを示す連濁有無情報を付すことを特徴としている。
【0013】ここで、連濁情報とは、実施例においては、図4に示すものが該当するが、連続する文節の品詞に基づいて連濁の可能性を判断できる情報であれば、どのようなものであってもよい。濁音処理手段は、実施例においては、図3のステップST8、ST10、ST11が該当する。濁音有無情報は、実施例においては、図8の濁音フラグが該当する。
【0014】請求項2のかな漢字変換装置は、さらに、選択確定されたかな漢字変換候補の連濁有無情報が濁音変更有りを示す場合には、当該かな漢字変換候補に関連づけて、当該かな漢字変換候補を構成する文節ごとの文節変換候補を登録する登録手段を備えたことを特徴としている。登録手段は、実施例においては、図3のステップST15が該当する。
【0015】請求項3のかな漢字変換装置は、前記登録手段が、選択確定されたかな漢字変換候補の連濁有無情報が濁音変更有りを示す場合には、当該かな漢字変換候補を対応するかな文字列に関連づけて変換情報記憶部に登録することを特徴としている。
【0016】請求項4のかな漢字変換装置は、選択確定されたかな漢字変換候補に関連づけて、当該かな漢字変換候補を構成する文節ごとの文節変換候補が登録されている場合には、各文節変換候補の使用頻度も更新するようにしたことを特徴としている。
【0017】請求項5のかな漢字変換装置は、読みに関連づけて、漢字およびその品詞を記憶する変換情報記憶部、与えられたかな文字列を文節に区切る文節区切手段、区切られたかな文字列の各文節の品詞を、変換情報記憶部に基づいて決定する品詞決定手段、連続する文節の品詞に基づいて連濁を生じる可能性があるか否かを判断するため、品詞の組合わせと可能性との対応を、連濁情報として記憶する連濁情報記憶部、品詞決定手段によって決定された各文節の品詞に基づき、前記連濁情報を参照し、与えられたかな文字列の連続する文節が、連濁を生じる可能性があるか否かを判断し、連濁を生じる可能性のある連続した文節のうち、後の文節における最初の変換対象かな文字が濁音である場合には、当該濁音を清音に変更して変更かな文字列を生成する濁音変換手段、文節に区切られたかな文字列および変更かな文字列に対して、変換情報記憶部を参照し、漢字混じりの文字列に変換してかな漢字変換候補を得る変換手段、を備えている。
【0018】変換情報記憶部は、実施例では、図10に示すものが該当する。文節区切手段は、実施例では、図3のステップST3が該当する。品詞決定手段は、実施例では、図3のステップST8が該当する。濁音変換手段は、実施例では、図3のステップST8、ST10、ST11が該当する。変換手段は、実施例では、図3のステップST4、ST12が該当する。
【0019】請求項6のかな漢字変換方法は、変換対象かな文字列の連続する文節の品詞の組合わせが、連濁を生じる可能性があるか否かを判断し、連濁の可能性があると判断した場合には、後の文節の最初の変換対象かな文字が濁音であるか否かを判断し、濁音であれば、該濁音を清音に変える濁音変更を行うとともに、かな漢字変換候補のそれぞれに、前記濁音変更がなされたかな文字列に対する変換候補であるか否かを示す連濁有無情報を付すことを特徴としている。
【0020】請求項7のかな漢字変換装置は、読みに関連づけて、単語およびその使用頻度を記憶するとともに、複数の単語を群として関連づけ、当該群ごとに使用頻度を記憶する変換情報記憶部、与えられたかな文字列に対して、変換情報記憶部を参照し、かな漢字変換候補を得るとともに、少なくとも単語の使用頻度および群の使用頻度に基づいて、各かな漢字変換候補に優先度を付す変換手段、選択確定されたかな漢字変換候補に用いられた単語の前記頻度を更新する単語頻度更新手段、選択確定されたかな漢字変換候補に用いられた単語の属する群の前記頻度を更新する群頻度更新手段、を備えている。
【0021】ここで、変換情報記憶部は、実施例では、図13の辞書、図14、図15のテーブルが該当する。単語頻度更新手段は、実施例では、図16のステップST16が該当する。群頻度更新手段は、実施例では、図16のステップST56、ST57が該当する。
【0022】請求項8のかな漢字変換方法は、読みに関連づけて、単語およびその使用頻度を記憶するとともに、複数の単語を群として関連づけ、当該群ごとに使用頻度を記憶した変換情報記憶部を設け、与えられたかな文字列に対して、変換情報記憶部を参照し、かな漢字変換候補を得るとともに、少なくとも単語の使用頻度および群の使用頻度に基づいて、各かな漢字変換候補に優先度を付して、選択確定されたかな漢字変換候補に用いられた単語の前記頻度を更新するとともに、当該単語の属する群の前記頻度を更新するようにしたことを特徴としている。
【0023】請求項9のかな漢字変換装置は、読みに関連づけて漢字を記憶するとともに、漢字に対応する一の読みに異なる複数の文字列が対応する場合、異なる複数の文字列の対応する異なる文字を一の文字群として記憶することにより、異なる複数の文字列を一の読みとして記憶する変換情報記憶部、変換情報記憶部に記憶された読みが文字群を有する場合は、文字群を参照し、異なる複数の文字列に展開する展開手段、与えられたかな文字列に対して、展開手段により複数の文字列に展開された読みを含め、変換情報記憶部に記憶された読み、読みに関連付けられた漢字を参照し、漢字混じりの文字列に変換してかな漢字変換候補を得る変換手段を備えたことを特徴とする。
【0024】ここで、変換情報記憶部の構造は、実施例では、図21に示す構造が該当する。ただし、変換情報記憶部は、これに限定されるものではない。展開手段は、実施例では、図20のステップST73、ステップST74が該当する。
【0025】請求項10のかな漢字変換方法は、読みに関連づけて漢字を記憶するとともに、漢字に対応する一の読みに異なる複数の文字列が対応する場合、異なる複数の文字列の対応する異なる文字を一の文字群として記憶することにより、異なる複数の文字列を一の読みとして記憶する変換情報記憶部を設け、変換情報記憶部に記憶された読みが文字群を有する場合は、文字群を参照し、異なる複数の文字列に展開し、与えられたかな文字列に対して、複数の文字列に展開された読みを含め、変換情報記憶部に記憶された読み、読みに関連付けられた漢字を参照し、漢字混じりの文字列に変換してかな漢字変換候補を得ることを特徴とする。
【0026】請求項11のかな漢字変換装置は、繰り返しのある文字に対応する繰り返し符号を用意し、文字列が繰り返しの文字を含む場合は、該繰り返しの文字を所定の繰り返し符号に変換する繰り返し文字変換手段を備えたことを特徴とする。
【0027】請求項12のかな漢字変換装置は、かな文字列を含む文節が連濁を生じている場合に、濁音を清音化する濁音処理手段、繰り返しのある文字に対応する繰り返し符号を用意し、濁音処理手段により清音化されたかな文字列が繰り返しの文字を含む場合は、該繰り返しの文字を所定の繰り返し符号に変換する繰り返し文字変換手段を備えたことを特徴とする。ここで、濁音処理手段は、実施例では、図26のステップST93が該当する。
【0028】請求項13のかな漢字変換装置は、繰り返しのある文字に対応する繰り返し符号を用意し、与えられたかな文字列が清音と該清音に後続する濁音であって該清音を濁音化した濁音を含む場合は、該濁音を所定の繰り返し符号に変換する繰り返し文字変換手段を備えたことを特徴とする。
【0029】請求項14のかな漢字変換装置は、読みに関連づけて、漢字を記憶するとともに、繰り返しのある文字に対応する繰り返し符号を記憶する変換情報記憶部、文字を繰り返し符号に変換すべきか否かの基準を記憶する繰り返し基準記憶部、与えられたかな文字列を文節に区切る文節区切手段、文節区切り手段により区切られた文節を構成する文字について、繰り返し基準記憶部を参照し、繰り返し符号に変換すべきか否かを判定する繰り返し判定手段、文節を構成する文字が、繰り返し判定手段により繰り返し符号に変換すべきとされた場合は、文節に区切られたかな文字列に対して、変換情報記憶部を参照し、繰り返し符号を含む漢字混じりの文字列に変換してかな漢字変換候補を得る変換手段を備えたことを特徴とする。
【0030】ここで、文節区切り手段は、実施例では、図26のステップST92が該当する。繰り返し判定手段は、図26のステップST95、ST96、ST98、ST99が該当する。変換手段は、実施例では、図26のステップST97、ST100が該当する。
【0031】請求項15のかな漢字変換方法は、読みに関連づけて、漢字を記憶するとともに、繰り返しのある文字に対応する繰り返し符号を記憶する変換情報記憶部と、文字を繰り返し符号に変換すべきか否かの基準を記憶する繰り返し基準記憶部とを設け、与えられたかな文字列を文節に区切り、区切られた文節を構成する文字について、繰り返し基準記憶部を参照し、繰り返し符号に変換すべきか否かを判定し、文節を構成する文字が、繰り返し符号に変換すべきとされた場合は、文節に区切られたかな文字列に対して、変換情報記憶部を参照し、繰り返し符号を含む漢字混じりの文字列に変換してかな漢字変換候補を得ることを特徴とする。
【0032】
【作用】請求項1のかな漢字変換装置および請求項6のかな漢字変換方法は、連続する文節の品詞によって連濁の可能性を判断し、該可能性がある場合には、濁音を清音に変更してかな漢字変換候補を生成するようにしている。したがって、連濁を生じるようなかな文字列に対しても適切なかな漢字変換候補を得ることができる。さらに、かな漢字変換候補ごとに、連濁を考慮した候補であるか否かの連濁有無情報を付すようにしている。したがって、連濁を生じたものであるか否かを容易に判定することができる。
【0033】請求項2のかな漢字変換装置は、選択確定されたかな漢字変換候補の連濁有無情報が濁音変更有りを示す場合には、当該かな漢字変換候補に関連づけて、当該かな漢字変換候補を構成する文節ごとの文節変換候補を登録する登録手段を備えたことを特徴としている。したがって、連濁を生じるものについて、かな漢字変換候補と文節変換候補との間連づけを行うことができる。
【0034】請求項3のかな漢字変換装置は、登録手段が、選択確定されたかな漢字変換候補の連濁有無情報が濁音変更有りを示す場合には、当該かな漢字変換候補を対応するかな文字列に関連づけて変換情報記憶部に登録することを特徴としている。したがって、連濁を生じる読みと漢字との関係を自動的に登録することができ、操作性の向上を図ることができる。
【0035】請求項4のかな漢字変換装置は、選択確定されたかな漢字変換候補に関連づけて、当該かな漢字変換候補を構成する文節ごとの文節変換候補が登録されている場合には、各文節変換候補の使用頻度も更新するようにしたことを特徴としている。したがって、より正確に使用頻度を計数することができる。
【0036】請求項5のかな漢字変換装置は、与えられたかな文字列の連続する文節の品詞に基づき、連濁を生じる可能性があるか否かを判断し、連濁を生じる可能性がある連続した文節のうち、後の文節における最初のかな文字が濁音である場合には、当該濁音を清音に変更して変更かな文字列を生成するとともに、与えられたかな文字列だけでなく、変更かな文字列に対してもかな漢字変換候補を生成するようにしている。したがって、連濁を生じるようなかな文字列に対しても適切なかな漢字変換候補を得ることができる。
【0037】請求項7のかな漢字変換装置および請求項8のかな漢字変換方法は、読みに関連づけて、単語およびその使用頻度を記憶するとともに、複数の単語を群として関連づけ、当該群ごとに使用頻度を記憶しておき、選択確定されたかな漢字変換候補に用いられた単語の前記頻度を更新するとともに、当該単語の属する群の前記頻度を更新するようにしたことを特徴としている。したがって、群の使用頻度も考慮して、かな漢字変換候補の優先度を決定できるので、効率の良い変換を行うことができる。
【0038】請求項9のかな漢字変換装置および請求項10のかな漢字変換方法は、一の読みに異なる複数の文字列が対応する場合、異なる複数の文字列の対応する異なる文字を一の文字群として変換情報記憶部に記憶することにより、異なる複数の文字列を一の読みとして記憶する。また、文字群を参照して、読みを異なる複数の文字列に展開し、与えられたかな文字列に対して、複数の文字列に展開された読みを参照し、漢字混じりの文字列に変換することを特徴とする。
【0039】したがって、一の読みに異なる複数の文字列が対応する場合であっても、変換情報記憶部の記憶容量を増大することなく、正しい変換を行なうことができる。
【0040】請求項11のかな漢字変換装置は、文字列が繰り返しの文字を含む場合は、該繰り返しの文字を所定の繰り返し符号に変換することを特徴とする。したがって、繰り返しのある文字についても、変換情報記憶部の容量を増大することなく、正しい変換を行なうことができる。
【0041】請求項12のかな漢字変換装置は、かな文字列を含む文節が連濁を生じている場合には濁音を清音化し、清音化されたかな文字列が繰り返しの文字を含む場合は、該繰り返しの文字を所定の繰り返し符号に変換することを特徴とする。したがって、連濁を生じている場合であっても、繰り返しのある文字について、正しい変換を行なうことができる。
【0042】請求項13のかな漢字変換装置は、与えられたかな文字列が清音と該清音に後続する濁音であって該清音を濁音化した濁音を含む場合は、該濁音を所定の繰り返し符号に変換することを特徴とする。したがって、連濁以外の場合であって、清音と濁音が連続している場合であっても、繰り返しのある文字について、正しい変換を行なうことができる。
【0043】請求項14のかな漢字変換装置および請求項15のかな漢字変換方法は、繰り返しのある文字に対応する繰り返し符号を記憶する変換情報記憶部と、文字を繰り返し符号に変換すべきか否かの基準を記憶する繰り返し基準記憶部とを設け、文節を構成する文字について、繰り返し基準記憶部を参照して繰り返し符号に変換すべきか否かを判定する。繰り返し符号に変換すべきと判定された場合は、かな文字列を、変換情報記憶部を参照し、繰り返し符号を含む漢字混じりの文字列に変換することを特徴とする。
【0044】したがって、繰り返しのある文字についても、変換情報記憶部の容量を増大することなく、より正しい変換を行なうことができる。
【0045】
【実施例】図1に、この発明の一実施例によるかな漢字変換装置の全体構成を示す。連濁情報記憶部20には、品詞の組合わせと連濁の可能性との対応が、連濁情報として記憶されている。また、変換情報記憶部22には、漢字およびその品詞が、当該漢字の読みと関連付けられて記憶されている。
【0046】与えられたかな文字列は、文節区切手段12において文節に区切られる。複数の区切りが可能な場合には、区切り候補が複数生成される。文節に区切られたかな文字列は、品詞決定手段14に与えられる。品詞決定手段14は、文節の読みに基づいて、変換情報記憶部22を参照して各文節の品詞を決定する。濁音変更手段16は、品詞決定手段14からの品詞情報を受けて、連続する文節の品詞の組合わせと連濁情報記憶部20の連濁情報とに基づいて、連濁の可能性があるか否かを判断する。連濁の可能性がある場合には、当該文節の後の文節の先頭のかな文字が、濁音であるか否かを判断する。濁音であれば、これを清音に変更し、変更かな文字列を生成する。したがって、濁音変更手段16は、与えられたかな文字列だけでなく、変更かな文字列も変換手段24に向けて出力する。なお、連濁の可能性がない場合や、可能性があっても後の文節の先頭が濁音でない場合、濁音変更手段16は、与えられたかな文字列のみを変換手段24に向けて出力する。
【0047】変換手段24は、変換情報記憶部22の情報に基づいて、与えられたかな文字列および変更かな文字列の双方についてかな漢字変換候補を生成する。また、この際に、各かな漢字変換候補について、与えられたかな文字列に基づく変換候補であるのか、変更かな文字列に基づく変換候補であるのかを連濁有無情報として付加して出力する。
【0048】図2に、図1のかな漢字変換装置をCPU32を用いて実現した場合のハードウエア構成を示す。かな文字、変換命令、選択確定命令等を入力するためのキーボード28、かな漢字変換候補を表示するためのディスプレイ30、CPU32、プログラムを記憶したメモリ36、バッファ部34、記憶部18を備えている。バッファ部34は、入力されたかな文字列を保持する入力バッファ38、入力されたかな文字列につき、可能な文節区切りを全て保持する文節候補記憶バッファ40、かな漢字変換候補を保持する変換候補記憶バッファ42を備えている。また、記憶部18は、連濁情報記憶部20、濁音変更規則記憶部44、連濁タグ記憶部46、変換情報記憶部22を備えている。
【0049】連濁情報記憶部20には、図4に示すような連濁情報が予め記憶されている。この連濁情報は、連濁を生じ得る文節の組合わせをテーブルにしたものである。なお、他の実施例として、連濁を生じ得ない組合わせを連濁情報として記憶するようにしてもよい。
【0050】濁音変更規則記憶部44には、図5に示すように、濁音(たとえば「が」)とこれに対応する清音(たとえば「か」)とが関連付けられて記憶されている。
【0051】変換情報記憶部22には、図6に示すように、読みとこれに対応する漢字が記憶されている。さらに、各漢字毎に、使用頻度および品詞が記憶されている。
【0052】図3に、メモリ36に格納されたかな漢字変換プログラムのフローチャートを示す。CPU32は、キーボード28からの入力を待機している(ステップST1)。何等かの入力があると、それが変換キー入力であるか否かを判断する(ステップST2)。変換キー以外の入力であれば、与えられたかな文字列として、バッファ部34の入力バッファ38に保持する(ステップST6)。変換キーが押されて変換命令が入力されれば、CPU32は、入力されたかな文字列につき、変換情報記憶部22の変換情報(図6参照)を参照して、可能な全ての文節区切りの候補を生成する(ステップST3)。たとえば、図7に示すように、かな文字列「かぶしきがいしゃ」が入力された場合には、「か/ぶしき/がいしゃ」という文節区切り候補、「かぶ/しき/がいしゃ」という文節区切り候補、・・・・「かぶしきが/いしゃ」という文節区切り候補が得られる。
【0053】次に、CPU32は、これらの各文節区切り候補につき、図6の変換情報を参照してかな文字列を漢字混じりの文字列に変換する(ステップST4)。図8のように得られたかな漢字変換候補を、変換候補記憶バッファ42に記憶する。ここで、CPU32は、文節数が1であるか否かを判断する(ステップST5)。文節数が1でなければ(すなわち2以上の文節があれば)、ステップST7以下を実行する。
【0054】まず、図7に示すように、注目文節BSおよびこれに先行する文節FSを決める。次に、注目文節BSの品詞を決定する。品詞は、変換情報記憶部22の変換情報(図6)に基づいて容易に決定できる。同様にして、先行文節FSの品詞も決定する。なお、図7のPRnに示すように、先行文節FS'が、「名詞+助詞」というように複数の品詞の組合わせで構成される場合には、一番後の品詞をその文節の品詞として採用する。また、注目文節が複数の品詞の組合わせで構成される場合には、一番前の品詞をその文節の品詞として採用する。このようにして決定した注目文節と先行文節の品詞の組合わせが、連濁情報記憶部20の連濁情報(図4)に存在するか否かを判断する(ステップST8)。たとえば、区切り候補PR1において、「がいしゃ」を注目文節とした場合には、名詞+名詞の組合わせとなり、連濁を生じる可能性があることが判断できる。
【0055】図4の連濁情報に示された組合わせに該当しない場合(たとえば、図7の区切り候補PRnについて「いしゃ」を注目文節BS'とした場合)には、先行文節FSを注目文節BSとして同様の検討を、全ての文節について行う(ステップST7、ステップST9)。
【0056】ステップST8において、連濁の可能性がある場合には、注目文節BSの先頭のかな文字が濁音であるか否かを判断する(ステップST10)。先頭のかな文字が濁音でなく、この条件に合致しない場合には、先行文節FSを注目文節BSとして、ステップST8以下を、全ての文節について繰り返し実行する(ステップST7、ステップST9)。
【0057】ステップST10において、先頭のかな文字が濁音である場合には、濁音変更規則記憶部44に基づき(図5参照)、当該濁音を清音化する(ステップST11)。たとえば、図7の、区切り候補PR1において、「がいしゃ」を注目文節BSとした場合には、この条件に合致するので、「がいしゃ」が「かいしゃ」に変更されて清音化される。これにより、変更かな文字列「か/ぶしき/かいしゃ」を得て、図7に示すように、文節区切り候補APR1として、文節候補記憶バッファ40に追加する。
【0058】CPU32は、この変更かな文字列についても、変換情報記憶部22の変換情報に基づいて変換を行い、かな漢字変換候補を生成する(ステップST12)。つまり、図8に示すように、「可/武式/会社」というかな漢字変換候補XFA1を生成し、変換候補記憶バッファ42に追加する。なお、この際に、連濁を判断し変更かな文字列に基づいて変換を行った旨を示す、連濁フラグFAL1(連濁有無情報)を「1」にする。
【0059】その後、先行文節FSを注目文節BSとして、ステップST8以下を、全ての文節について繰り返し実行する(ステップST7、ステップST9)。このようにして、一つの区切り候補PR1についての処理が終了すると、次の区切り候補PR2について処理を行う(ステップST20)。
【0060】全ての区切り候補についての処理が終了すると(図7の区切り候補PRnの処理が終了すると)、変換候補記憶バッファ42に記憶されたかな漢字変換候補を、優先順位の高い順に、順次もしくは同時にディスプレイ30に表示する(ステップST13)。なお、優先順位は、頻度等に基づいて決定する。このようにして、連濁のあるかな文字列に対しても、操作者が特別の処理をすることなく、かな漢字変換候補を表示させることができる。
【0061】操作者は、ディスプレイ30に表示された候補から所望の候補を選択し、選択確定命令をキーボード28から入力する。CPU32は、選択確定されたかな漢字変換候補に、連濁フラグが立っているか(「1」であるか)否かを判定する(ステップST14)。連濁フラグが立っていなければ、連濁によって変更かな文字列に基づいて変換されたものではないので、ステップST16に進む。たとえば、図8の候補XFmが選択された場合には、連濁フラグが立っておらず、ステップST16に進む。
【0062】一方、連濁フラグが立っている場合には、連濁により変更かな文字列に基づいて変換されたものであるから、登録処理および連濁タグの生成処理を行った後に(ステップST15)ステップST16に進む。たとえば、図8の候補XFAz「株式/会社」が選択された場合には、連濁フラグが立っており、ステップST15が実行される。ステップST15において、CPU32は、連濁の生じた先行文節と注目文節の入力されたかな文字列「かぶしきがいしゃ」をよみとして、「株式会社」を登録する(図10参照)。さらに、図9に示すように、「株式会社」という連濁単語が、「株式」と「会社」という要素によって構成されていることを示す情報を、連濁タグ記憶部46に記憶する。これとともに、変換情報記憶部22の「株式会社」のところには、図10に示すように、連濁単語である旨を示すとともに、その連濁タグの記憶されている番地ADR1(図9)を記憶する。上記のようにして、連濁を有する単語が自動的に変換情報記憶部22に登録される。
【0063】次に、CPU32は、選択確定された候補が、連濁タグを持っているか否かを判断する(ステップST16)。ここでは、「株式/会社」を選択しており、「株式」「会社」のいずれにも連濁タグは立っていないので(図10参照)、ステップST18に進む。ステップST18においては、「株式」「会社」のそれぞれについて、変換情報記憶部22の頻度を+1する。以上のようにして、入力されたかな文字列「かぶしきがいしゃ」に対しての変換が行われる。
【0064】なお、次に、「かぶしきがいしゃ」を入力して変換を行うと、「かぶしきがいしゃ」が変換情報記憶部22に登録されているので、「株式会社」を候補として表示する。この時、「株式会社」が選択確定されると、ステップST16において連濁単語である旨が判定され(連濁タグがある旨が判定され)、ステップST17の処理を行う。ステップST17においては、連濁タグ記憶部46の連濁タグに基づいて、「株式会社」の要素が「株式」と「会社」であることを知り、「株式」および「会社」の頻度を+1する。その後、「株式会社」としての頻度を+1する(ステップST18)。したがって、連濁単語については、その要素単語にについても頻度の更新を行うことができる。
【0065】なお、上記実施例では、ステップST8において各文節の品詞を決定するようにしたが、ステップST3において各文節の品詞を保持しておき、ステップST8で使用するようにしてもよい。
【0066】図11に、この発明の他の実施例によるかな漢字変換装置の全体構成を示す。変換情報記憶部52には、単語およびその使用頻度が記憶されている。また、複数の単語が群として関連づけられており、各群についての使用頻度も記憶されている。
【0067】与えられたかな文字列は、変換手段50において、変換情報記憶部52の情報に基づき、かな漢字変換候補として出力される。この際、複数のかな漢字変換候補は、変換情報記憶部50に記憶されている単語の使用頻度および群の使用頻度に基づいて優先度が付される。変換候補記憶バッファ42は、各かな漢字変換候補を優先度とともに記憶する。変換候補記憶バッファ42に記憶されたかな漢字変換候補は、優先度の順に、順次または同時に表示される。操作者が、選択確定命令を入力してかな漢字変換候補を選択すると、変換候補記憶バッファ42からは、選択確定されたかな漢字変換候補が出力される。この際、漢字頻度更新手段56は、当該選択確定された変換候補に含まれる単語の頻度を更新する。また、群頻度更新手段58は、当該単語の属する群の頻度を更新する。
【0068】図11のかな漢字変換装置を、CPUを用いて実現した場合のハードウエア構成を図12に示す。変換情報記憶部52は、基本辞書60、地名辞書62、人名辞書64、グループ頻度テーブル66、辞書頻度テーブル68を備えている。図13に、基本辞書の構成を示す。読みに対する単語、品詞、使用頻度が記憶されており、さらに、当該単語が属するグループが記憶されている。図において、「風邪」は「医学」グループに属し、「長岡京」は「地名」グループに属することが示されている。地名辞書、人名辞書についても同様の構成である。
【0069】なお、この実施例においては、基本辞書は複数のグループに分けられている。その他の地名辞書、人名辞書は、それぞれの辞書で、「地名」「人名」というグループを形成している。また、複数の辞書にわたって形成されるグループもある。つまり、この実施例では、各グループを群として扱うとともに、各辞書も群として扱っている。
【0070】図14に、グループ頻度テーブルを示す。各グループごとに使用頻度が記憶されている。図15に、辞書頻度テーブルを示す。各辞書ごとに使用頻度が記憶されている。
【0071】図16に、メモリ36に格納されたかな漢字変換プログラムのフローチャートを示す。まず、かな文字列が入力されると(ステップST51)CPU32は、文節解析を行って、かな文字列を文節に区切り、基本辞書60、地名辞書52、人名辞書64等の変換情報を用いて、かな漢字変換候補を生成する(ステップST52)。次に、CPU32は、複数のかな漢字変換候補について、各文節の評価値Vを算出する。その算出式は、次のとおりである。
【0072】
V=WF・w1+SL・w2+IWL・w3+BU・w4 +DF・w5+GF・w6・・・・・・・・・・(1)ここで、WFは単語の頻度である。SLは文節の読みの長さであり、「きょうは」という文節であれば4となる。IWLは文節中の自立語の読みの長さであり、「きょうは」という文節であれば、自立語「きょう」の長さとして3となる。BUは直前にその単語を使用した場合に立つフラグであり、直前に使用があれば「1」なければ「0」となる。DFは単語の属する辞書の使用頻度、GFは単語の属するグループの使用頻度である。また、w1〜w6は重み係数である。
【0073】CPU32は、各変換候補についてその文節の評価値を合計して優先度を得る。この優先度の高い変換候補から順に、ディスプレイ30において表示する。操作者は、キーボード28から選択確定命令を入力して、これらの変換候補の中から所望のものを選択確定する(ステップST53)。CPU32は、選択確定された変換候補を、かな漢字文字列として、ソフトウエアまたはハードウエアに対して出力する。
【0074】次に、CPU32は、選択確定されたかな漢字変換候補に使用されている単語の頻度を更新する。つまり、図13に示す辞書の単語頻度を+1する。さらに、辞書のグループの項目を読んで(図13参照)、選択確定されたかな漢字変換候補に使用されている単語のグループを得る(ステップST54)。このようにして得たグループが、1つの辞書内にあるか否かを判断する(ステップST55)。
【0075】複数の辞書にわたってグループが形成されている場合には、その単語の存在する各辞書の辞書頻度を+1する(図15)。また、グループが1つの辞書内にある場合には、そのグループのグループ頻度を+1する(図16)。
【0076】このようにして更新された頻度は、次回以降の優先度の判定において、上記(1)式で考慮される。したがって、特定分野等の文章を作成している際に、変換効率を向上させることができる。
【0077】図17に、この発明のさらに他の実施例によるかな漢字変換装置の全体構成を示す。変換情報記憶部72には、読みに関連づけて漢字が記憶されている。また、漢字に対応する一の読みに異なる複数の文字列が対応する場合、異なる複数の文字列の対応する異なる文字を一の文字群([]でくくられた複数の文字(スペースを含む)をいう。図21参照。)として記憶することにより、異なる複数の文字列を一の読みとして記憶している。
【0078】展開手段74は、変換情報記憶部72に記憶された読みが文字群を有する場合は、文字群を参照し、異なる複数の文字列に展開する。
【0079】展開記憶部76には、展開手段74により複数の文字列に展開された読みを含め、変換情報記憶部72に記憶された読み、読みに関連付けられた漢字などが記憶される(図22参照)。
【0080】変換手段78は、与えられたかな文字列に対して、展開記憶部76を参照し、漢字混じりの文字列に変換してかな漢字変換候補を得る。
【0081】図17のかな漢字変換装置を、CPUを用いて実現した場合のハードウエア構成を図18に示す。変換情報記憶部72の具体的な構造は、つぎのようになっている。たとえば、図21(イ)に示すように、漢字「王位」に対応する一の読みには、異なる二つの文字列「おうい」、「おおい」が、対応するが、この二つの文字列の対応する異なる文字(第二文字)「う」および「お」を一の文字群[うお]として、記憶することにより、異なる二つの文字列「おうい」および「おおい」を、一の読み「お[うお]い」として記憶している。
【0082】図19に、メモリ36に格納されたかな漢字変換プログラムのフローチャートを示す。まず、CPU32は、変換処理に先立ち、辞書読み込み処理を行なう(ステップST61)。
【0083】図20に、辞書読み込み処理の詳しいフローチャートを示す。まず、CPU32は、変換情報記憶部72の内容を、そのまま、メモリ36の辞書記憶部80に読み込む(ステップST71)。つぎに、読み込んだ辞書記憶部80から、一行文のデータ(たとえば、図21における(イ)の行)を取り出す(ステップST72)。
【0084】つぎに、取り出した行の『漢字の読み』フィールドに文字列を表わす”[]”があるかを調べ(ステップST73)、ない場合は、『漢字の読み』フィールドの内容をそのまま、展開記憶部76に書き込み(ステップST76)、ステップS77に進む。
【0085】一方、取り出した行の『漢字の読み』フィールドに文字列を表わす”[]”がある場合は、”[]”の中の文字を一文字づつ取り出して、展開し、文字列の集合を作成し(ステップST74)、これを一つの読みとして、展開記憶部76に書き込む(ステップST75)。たとえば、図21の(イ)の行を取り出した場合、漢字の読み「お[うお]い」には、”[]”が含まれるから、これを展開し、図22の(ロ)に示すように、「おうい」および「おおい」の二つの文字列の集合を作成し、”一つの読み”として、展開記憶部76に書き込むことになる。
【0086】つぎに、CPU32は、一つの読みと、漢字、品詞および頻度とを、関連づける(ステップST77)。これを、読みから漢字へポインタを張る、という。
【0087】つぎに、取込んだ辞書記憶部80に記憶されている全ての行について、ステップS72〜ステップS77の処理を実施したかを調べる。まだ、残っている行がある場合は、同様の処理を繰り返す。全ての行について、処理を実施した場合は、辞書読み込み処理を終了する(ステップST78)。
【0088】辞書読み込み処理を終了すると、CPU32は、キーボード28からの入力を受け付ける(図19、ステップST62)。
【0089】CPU32は、キーボード28から入力されたかな文字列に対して、所定の区切り規則に基づいて、かな文字列を文節に区切り、所定の基準にしたがい文節解析を行なう(ステップST63)とともに、展開記憶部76を参照して、文節を構成するかな文字列に漢字をあてはめ、かな漢字変換候補を生成する。さらに、複数のかな漢字変換候補について、文節解析の結果を比較し、所定の優先度の高い変換候補から順に、ディスプレイ30に表示する(ステップST64)。
【0090】操作者は、変換候補の正否の検討を行ない(ステップST65)、変換候補の中に所望の候補がない場合は、当てはめられた漢字の修正、文節区切りの修正等変換結果の修正を行なう(ステップST66)。変換候補の中に所望の候補がある場合は、キーボード28から選択確定命令を入力して、これらの変換候補の中から所望のものを選択確定する。CPU32は、選択確定された変換候補を、かな漢字文字列として、ソフトウエアまたはハードウエアに対して出力する(ステップST67)。
【0091】このように、異なる複数の文字列を一の読みとして変換情報記憶部72に記憶するとともに、辞書として使用する場合は、読みを異なる複数の文字列に展開する。したがって、一の読みに異なる複数の文字列が対応する場合であっても、変換情報記憶部72の記憶容量を増大することなく、正しい変換を行なうことができる。
【0092】図23に、この発明のさらに他の実施例によるかな漢字変換装置の全体構成を示す。変換情報記憶部92には、読みに関連づけて、漢字が記憶されている。また、繰り返しのある文字に対応する繰り返し符号が記憶されている。
【0093】繰り返し基準記憶部94には、文字を繰り返し符号に変換すべきか否かの基準が記憶されている。文節区切手段96は、与えられたかな文字列を文節に区切る。
【0094】繰り返し判定手段98は、文節区切り手段96により区切られた文節を構成する文字について、繰り返し基準記憶部94を参照し、繰り返し符号に変換すべきか否かを判定する。
【0095】変換手段100は、文節を構成する文字が、繰り返し判定手段98により繰り返し符号に変換すべきとされた場合は、文節に区切られたかな文字列に対して、変換情報記憶部92を参照し、繰り返し符号を含む漢字混じりの文字列に変換してかな漢字変換候補を得る。
【0096】図23のかな漢字変換装置を、CPUを用いて実現した場合のハードウエア構成を図24に示す。記憶部102は、変換情報記憶部92、繰り返し基準記憶部94を備えている。
【0097】図25に、メモリ36に格納されたかな漢字変換プログラムのフローチャートを示す。まず、かな文字列が入力されると(ステップST81)CPU32は、繰り返し文字処理を行なう(ステップST82)。
【0098】繰り返し文字処理のフローチャートを図26に詳述する。入力文字列を得ると(ステップST91)、CPU32は、所定の区切り規則に基づいて、かな文字列を文節に区切る(ステップST92)。
【0099】次に、CPU32は、文節が所定の連濁条件を具備している場合は、その文節に対し連濁処理を行なう(ステップST93)。たとえば、文節「はなばな」は、連濁処理により、清音化され、「はなはな」となる。
【0100】次に、CPU32は、変換情報記憶部92を参照して、かな漢字変換候補を生成する(ステップST94)。「はなばな」については、「はなばな」、「ハナバナ」、「花場無」などが、「はなはな」については、「花花」などが変換候補として生成される。
【0101】次に、CPU32は、かなから構成される文節の読みの中に、繰り返し文字列があるか否かを判断する(ステップST95)。この判断は、連濁処理後の、かなから構成される読みの中に、同じ読みの文字列があるか否かを判断することにより行なわれる。たとえば、上述の例では、かなから構成される読み「はなばな」、「ハナバナ」の連濁処理後の読み「はなはな」、「ハナハナ」には、同じ読みの文字列があるため、もとの読み「はなばな」、「ハナバナ」の中に、繰り返し文字列があると判断される。
【0102】繰り返し文字列がある場合は、その文字列が、禁則に該当するか否かを判断する(ステップST96)。このステップでいう禁則とは、繰り返し文字列が、二以上の文節にわたっている場合は、繰り返し符号に変換しないというルールを言う。したがって、上述の「はなばな」などの繰り返し文字列は、いずれも一文節内にあるため、禁則に該当しない。
【0103】なお、かなから構成される読みに繰り返し文字列がない場合や、繰り返し文字列があっても、上述の禁則に該当する場合は、繰り返し符号に変換することなく、ステップST98に制御を移す(ステップST95、ST96)。
【0104】一方、文字列が禁則に該当しない場合、CPU32は、変換情報記憶部92を参照して、繰り返し文字列のうち後半の文字を、所定の繰り返し符号を用いて表現し、これを変換候補に挙げる(ステップST97)。
【0105】上述の例では、「はなばな」、「ハナバナ」は、それぞれ、「はなゞゝ」、「ハナヾヽ」として、変換候補に挙げられる。
【0106】次に、CPU32は、変換候補を構成する文節の中に同じ漢字の繰り返しがあるか否かを調べる(ステップST98)。上述の例では、「花花」が、該当する。
【0107】同じ漢字の繰り返しがある場合は、その漢字の繰り返しが、禁則に該当するか否かを判断する(ステップST99)。このステップでいう禁則とは、下記の(a)または(b)のいずれかに該当する場合は、繰り返し符号に変換しないというルールを言う。
【0108】(a)同じ漢字の繰り返しが、二以上の文節にわたっている。
(b)同じ読みの繰り返しがなく、かつ、連濁処理も行なわれていない。
【0109】たとえば、上述の「花花」は、一文節内にあり、かつ、連濁処理後の読み「はなはな」に同じ読みの繰り返しがあるから、禁則に該当しない。
【0110】なお、文節の中に同じ漢字の繰り返しがない場合や、繰り返しがあっても、上述の禁則に該当する場合は、繰り返し符号に変換することなく、繰り返し文字処理を終了する(ステップST98、ST99)。
【0111】一方、同じ漢字の繰り返しが禁則に該当しない場合、CPU32は、変換情報記憶部92を参照して、同じ漢字の繰り返しのうち後半の漢字を、所定の繰り返し符号を用いて表現し、これを変換候補に挙げる(ステップST100)。上述の例では、「花花」は、「花々」として変換候補に挙げられる。
【0112】したがって、上述の例では、「花場無」、「はなゞゝ」、「ハナヾヽ」、「花々」などが、変換候補として挙げられる。繰り返し文字処理を終了すると、CPU32は、制御をステップST83に移す(図25)。
【0113】CPU32は、次に、複数のかな漢字変換候補について、所定の基準にしたがい文節解析を行ない、複数のかな漢字変換候補について、文節解析の結果を比較し、所定の優先度の高い変換候補から順に、ディスプレイ30に表示する(ステップST83)。
【0114】操作者は、変換候補の正否の検討を行ない(ステップST84)、変換候補の中に所望の候補がない場合は、当てはめられた漢字の修正等、変換結果の修正を行ない、再び、ステップST82以下の処理を行なう(ステップST85)。変換候補の中に所望の候補がある場合は、キーボード28から選択確定命令を入力して、これらの変換候補の中から所望のものを選択確定する。CPU32は、選択確定された変換候補を、かな漢字文字列として出力する(ステップST86)。
【0115】このように、所定の基準に基づき、繰り返し符号に変換すべきか否かを判定し、繰り返し符号に変換すべきと判定された場合は、繰り返し符号を含む漢字混じりの文字列に変換する。したがって、繰り返しのある文字についても、変換情報記憶部92の容量を増大することなく、正しい変換を行なうことができる。
【0116】なお、上述の各実施例においては、CPU32を用いて、ハードウェア構成を実現する場合を例に説明したが、ハードウェア構成の一部または全部を、ハードウェアロジックにより実現することもできる。
【0117】
【発明の効果】請求項1のかな漢字変換装置および請求項6のかな漢字変換方法は、連続する文節の品詞によって連濁の可能性を判断し、該可能性がある場合には、濁音を清音に変更してかな漢字変換候補を生成するようにしている。したがって、連濁を生じるようなかな文字列に対しても適切なかな漢字変換候補を得ることができる。さらに、かな漢字変換候補ごとに、連濁を考慮した候補であるか否かの連濁有無情報を付すようにしている。
【0118】したがって、連濁を生じたものであるか否かを容易に判定することができる。すなわち、連濁の有無にかかわらず、変換効率を向上させることができる。
【0119】請求項2のかな漢字変換装置は、選択確定されたかな漢字変換候補の連濁有無情報が濁音変更有りを示す場合には、当該かな漢字変換候補に関連づけて、当該かな漢字変換候補を構成する文節ごとの文節変換候補を登録する登録手段を備えたことを特徴としている。
【0120】したがって、連濁を生じるものについて、かな漢字変換候補と文節変換候補との間連づけを行うことができる。すなわち、連濁を生ずる場合の変換効率を、さらに向上させることができる。
【0121】請求項3のかな漢字変換装置は、登録手段が、選択確定されたかな漢字変換候補の連濁有無情報が濁音変更有りを示す場合には、当該かな漢字変換候補を対応するかな文字列に関連づけて変換情報記憶部に登録することを特徴としている。
【0122】したがって、連濁を生じる読みと漢字との関係を自動的に登録することができ、操作性の向上を図ることができる。すなわち、連濁を生じる読みが入力された場合の変換効率を向上させることができる。
【0123】請求項4のかな漢字変換装置は、選択確定されたかな漢字変換候補に関連づけて、当該かな漢字変換候補を構成する文節ごとの文節変換候補が登録されている場合には、各文節変換候補の使用頻度も更新するようにしたことを特徴としている。
【0124】したがって、より正確に使用頻度を計数することができる。すなわち、連濁処理がなされた場合でも、各文節変換候補ごとの変換効率を向上させることができる。
【0125】請求項5のかな漢字変換装置は、与えられたかな文字列の連続する文節の品詞に基づき、連濁を生じる可能性があるか否かを判断し、連濁を生じる可能性がある連続した文節のうち、後の文節における最初のかな文字が濁音である場合には、当該濁音を清音に変更して変更かな文字列を生成するとともに、与えられたかな文字列だけでなく、変更かな文字列に対してもかな漢字変換候補を生成するようにしている。
【0126】したがって、連濁を生じるようなかな文字列に対しても適切なかな漢字変換候補を得ることができる。すなわち、連濁の有無にかかわらず、変換効率を、より向上させることができる。
【0127】請求項7のかな漢字変換装置および請求項8のかな漢字変換方法は、読みに関連づけて、単語およびその使用頻度を記憶するとともに、複数の単語を群として関連づけ、当該群ごとに使用頻度を記憶しておき、選択確定されたかな漢字変換候補に用いられた単語の前記頻度を更新するとともに、当該単語の属する群の前記頻度を更新するようにしたことを特徴としている。
【0128】したがって、群の使用頻度も考慮して、かな漢字変換候補の優先度を決定できるので、効率の良い変換を行うことができる。すなわち、操作者の扱う分野を自動的に判断することで、変換効率を向上させることができる。
【0129】請求項9のかな漢字変換装置および請求項10のかな漢字変換方法は、一の読みに異なる複数の文字列が対応する場合、異なる複数の文字列の対応する異なる文字を一の文字群として変換情報記憶部に記憶することにより、異なる複数の文字列を一の読みとして記憶する。また、文字群を参照して、読みを異なる複数の文字列に展開し、与えられたかな文字列に対して、複数の文字列に展開された読みを参照し、漢字混じりの文字列に変換することを特徴とする。
【0130】したがって、一の読みに異なる複数の文字列が対応する場合であっても、変換情報記憶部の記憶容量を増大することなく、正しい変換を行なうことができる。すなわち、一の読みに異なる複数の文字列が対応する場合であっても、変換効率を向上させることができる。
【0131】請求項11のかな漢字変換装置は、文字列が繰り返しの文字を含む場合は、該繰り返しの文字を所定の繰り返し符号に変換することを特徴とする。したがって、繰り返しのある文字についても、変換情報記憶部の容量を増大することなく、正しい変換を行なうことができる。すなわち、繰り返しのある文字を有する場合であっても、変換効率を向上させることができる。
【0132】請求項12のかな漢字変換装置は、かな文字列を含む文節が連濁を生じている場合には濁音を清音化し、清音化されたかな文字列が繰り返しの文字を含む場合は、該繰り返しの文字を所定の繰り返し符号に変換することを特徴とする。したがって、連濁を生じている場合であっても、繰り返しのある文字について、正しい変換を行なうことができる。すなわち、連濁を生じた繰り返しのある文字を有する場合であっても、変換効率を向上させることができる。
【0133】請求項13のかな漢字変換装置は、与えられたかな文字列が清音と該清音に後続する濁音であって該清音を濁音化した濁音を含む場合は、該濁音を所定の繰り返し符号に変換することを特徴とする。したがって、連濁以外の場合であって、清音と濁音が連続している場合であっても、繰り返しのある文字について、正しい変換を行なうことができる。すなわち、連濁の有無にかかわらず、繰り返しのある文字を有する場合に、変換効率を向上させることができる。
【0134】請求項14のかな漢字変換装置および請求項15のかな漢字変換方法は、繰り返しのある文字に対応する繰り返し符号を記憶する変換情報記憶部と、文字を繰り返し符号に変換すべきか否かの基準を記憶する繰り返し基準記憶部とを設け、文節を構成する文字について、繰り返し基準記憶部を参照して繰り返し符号に変換すべきか否かを判定する。繰り返し符号に変換すべきと判定された場合は、かな文字列を、変換情報記憶部を参照し、繰り返し符号を含む漢字混じりの文字列に変換することを特徴とする。
【0135】したがって、繰り返しのある文字についても、変換情報記憶部の容量を増大することなく、正しい変換を行なうことができる。すなわち、繰り返しのある文字を有する場合であっても、変換効率をより向上させることができる。




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013