Warning: copy(.htaccess): failed to open stream: Permission denied in /home/jp321/public_html/header.php on line 8
文書管理システム - キヤノン株式会社
米国特許情報 | 欧州特許情報 | 国際公開(PCT)情報 | Google の米国特許検索
 
     特許分類
A 農業
B 衣類
C 家具
D 医学
E スポ−ツ;娯楽
F 加工処理操作
G 机上付属具
H 装飾
I 車両
J 包装;運搬
L 化学;冶金
M 繊維;紙;印刷
N 固定構造物
O 機械工学
P 武器
Q 照明
R 測定; 光学
S 写真;映画
T 計算機;電気通信
U 核技術
V 電気素子
W 発電
X 楽器;音響


  ホーム -> 計算機;電気通信 -> キヤノン株式会社

発明の名称 文書管理システム
発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2007−4562(P2007−4562A)
公開日 平成19年1月11日(2007.1.11)
出願番号 特願2005−184954(P2005−184954)
出願日 平成17年6月24日(2005.6.24)
代理人 【識別番号】100090538
【弁理士】
【氏名又は名称】西山 恵三
発明者 増田 隆一
要約 課題
電子的な文書データの管理システムにおいて、文書の重要度判定にアクセス頻度を使用する際の判定をより正確にする。

解決手段
文書のアクセス頻度を測定する際、文書データを閲覧している時間をパラメータとして、計算するようにする。
特許請求の範囲
【請求項1】
電子的な文書管理システムにおいて、各ファイルに対する最新アクセス日時と、当該ファイルへの総アクセス時間と、前記最新アクセス日時と前記アクセス時間から計算されるファイルのアクセス頻度を表すアクセス頻度値とを保持する管理テーブルと、
ファイルへのアクセスがあった時点で、前記管理テーブル中の当該ファイルの最新アクセス日時とアクセス時間を更新記録するアクセス情報記録部と、
前期アクセス情報記録部と連動し、当該ファイルをアクセスしている時間を計測するアクセス時間計測部と、
前記管理テーブルの各ファイル毎のアクセス頻度指数を計算の上更新する頻度計算部と、定められた時期に前記頻度計算部を起動する起動部とを備えたことを特徴とする文書管理システム。
【請求項2】
前記、アクセス情報記録部と、アクセス時間計測部において、ファイルへのアクセス時間が、別途規定された下限閾値以下だった場合に、前記管理テーブル中の当該ファイルの最新アクセス日時とアクセス時間の更新を行わないことを特徴とする、請求項1に記載の文書管理システム。
【請求項3】
前記、アクセス情報記録部と、アクセス時間計測部において、ファイルへのアクセス時間が、別途規定された上限閾値を超える場合に、ファイルへのアクセス時間を、上限閾値、あるいは別途規定された上限値とみなして、前記管理テーブル中の当該ファイルの最新アクセス日時とアクセス時間の更新を行うことを特徴とする、請求項1、あるいは請求項2のいずれかに記載の文書管理システム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、文書の重要度を判定する際の、閲覧頻度の計算方法に関する。
【背景技術】
【0002】
従来より、電子的な文書管理システムにおいて、閲覧優先度や、文書廃棄の判断基準として、文書の重要度を計算し用いる方法がある。
【0003】
この、文書重要度の判定に、文書データの閲覧頻度、すなわち、文書データを開いた回数を基準とし、開いた回数が多いものを重要と判断する方法や、また、もっとも最近の時刻に閲覧された文書のほうを重要と判定する方法がある。
【0004】
又、別の従来例としては、特許文献1をあげることが出来る。
【特許文献1】特開2004−038400号公報
【発明の開示】
【発明が解決しようとする課題】
【0005】
しかし、一般に、電子的な文書管理システムにおいては、タイトルだけでは中身がわからないため、中身を確認するだけでも、データを開き閲覧する操作が発生する。したがって、単に開いた回数や、開いた時刻を計測するだけでは、実際に読むことが必要で開いたのか、単に見たい文書か確認するためだけに開いたのかわからない。このため、実際にはたいして重要でない文書であるにもかかわらず、閲覧回数が多い、あるいは最近閲覧されたとして、重要な文書と判定してしまう場合がある。
【課題を解決するための手段】
【0006】
上記課題に対し、文書を開いた回数や開いた時刻のみではなく、文書を開いていた時間を測定し、開いていた時間の長さを、閲覧頻度のパラメータの計算に使用するようにする。
【0007】
なぜなら、実際に読む文書は、開いている時間が長いが、必要としていない文書なら、すぐに閉じてしまうと考えられるからである。
【0008】
また、上記解決手段に加え、一定時間以下の閲覧は、閲覧としてカウントせず、一定時間を超えた閲覧のみの閲覧時間をパラメータとすることで、より正確に閲覧頻度を計算することもできる。
【0009】
さらに、電子的な文書管理システムでは、操作ミスで、文書を開きっぱなしにする可能性があるので、一定時間を超える閲覧は、ある一定時間の閲覧だったとみなすようにする。閲覧時間が無限に増加するのが防止できるので、操作ミスにより閲覧頻度が異常な値になるのを防止することができる。
【発明の効果】
【0010】
以上のように、文書を開いていた時間を測定し、開いていた時間の長さを、閲覧頻度のパラメータの計算に使用するようにすることで、より正確に、文書の閲覧状態を把握し、ひいては、文書の重要度を正確に把握することができる。
【0011】
また、一定時間以下の閲覧は、閲覧としてカウントせず、一定時間を超えた閲覧のみの閲覧時間をパラメータとする、あるいは、一定時間を超える閲覧は、ある一定時間の閲覧だったとみなすようにすることで、さらに正確に閲覧状態を把握することができるようになる。
【発明を実施するための最良の形態】
【0012】
以下、図面を用いて本発明の実施例について説明する。
【0013】
(第1実施例)
図1は請求項1の発明に係る文書管理システムの一実施例の構造図である。
【0014】
本図において、101はファイル名と最新アクセス日時とファイルへのアクセスの程度に応じてファイルに与えられるアクセス頻度値とを保持する管理テーブルである。102は、ファイルへのアクセスがあった時点で、前記管理テーブル中の当該ファイルへの最新アクセス日とアクセス頻度値を更新するアクセス情報記録部である。103は、前記管理テーブルの各ファイル毎のアクセス頻度指数を計算の上更新する頻度計算部である。104は、ファイルのアクセス開始時間と、終了時間を計測し、アクセスしていた時間を計算するための、アクセス時間計測部である。105は、頻度計算部を、定期的に起動するための起動部であり、内部に不図示のタイマを持っている。
【0015】
次に、上記構成要素の主な動作内容について図3と図4のフローチャートに従って説明する。
【0016】
アクセス情報記録部102は、ファイルへのアクセスがあると(301)、管理テーブル101に当該ファイルの最新アクセスを記録する(302)。
【0017】
アクセス時間計測部104は、当該ファイルのアクセスが開始されたことを検知し、時間の計測を開始する(303)。
【0018】
当該ファイルのアクセスが終了するのを待つ(304)。
【0019】
当該ファイルのアクセスが終了すると、アクセス時間計測部104は、当該ファイルのアクセスが終了したことを検知し、時間の計測を終了する。そして、アクセス時間の合計を、アクセス情報記録部102へ伝達する(305)。
【0020】
アクセス情報記録部102は、管理テーブル101の当該ファイルの、アクセス時間を更新する(306)。
【0021】
また、起動部105は、時刻の監視を行っており(401)、ある、別途指定された時刻がくると、頻度計算部103へ、頻度計算開始を支持する。
【0022】
頻度計算部103は、管理テーブル101に登録されている全てのファイルについて、更新された最新アクセス日時と、アクセス時間から、アクセス頻度値を計算しなおし、管理テーブル101のアクセス頻度値を更新する(402)。
【0023】
次に、以上の動作手順を、図2の管理テーブルにより具体的に説明する。
【0024】
アクセス時間計測部104の計測単位は分であり、分未満の時間については切り上げる。
【0025】
このとき、アクセス頻度値は、
アクセス頻度値=(現在日−最新アクセス日)/アクセス時間
で与えられる。すなわち、アクセス頻度値の値が小さいファイルほど、利用されており、重要ということになる。
【0026】
まず、ファイルアクセス時の、管理テーブル101の更新動作について説明する。
【0027】
2003年11月24日にファイルTEST1とCIRCLEを閲覧する操作があったとする。
【0028】
図5が、ファイルアクセスが発生する前の、管理テーブル101の状態である。
【0029】
この時点では、アクセス頻度値から、重要度が大きい順に、SAMPLE2、CLRCLE、TEST1と考えられる。実際、SAMPLE2は、長時間閲覧されていて、利用度が高かったと考えられる。他の2つは、確認のために一時的に開いたと判断できるような、アクセス時間である。
【0030】
さて、まず、TEST1へのアクセスがあったとする。
【0031】
アクセス情報記録部102は、ファイルTEST1へのアクセスがあった時点で、管理テーブル101にファイルTEST1の最新アクセス日を記録する。また、アクセス時間計測部104へ、ファイルTEST1のアクセス時間計測の開始を指示する。
【0032】
ファイルTEST1の閲覧が終了すると、アクセス時間計測部104は、閲覧の終了を検出し、ファイルを開いていた時間の合計を分単位で計算し、分以下は切り上げた後、値をアクセス情報記録部102へ、通知する。この実施例においては、14分間ファイルを開いていたとする。これは、かなりじっくりと見ていたと考えられる。
【0033】
アクセス情報記録部102は、通知されたファイルを開いていた時間、つまりアクセス時間を、管理テーブル上の、現在のアクセス時間値に加算し、管理テーブル101に記録する。図2においては、加算後の値が、15である。
【0034】
次に、ファイルCIRCLEへのアクセスがあったとする。しかし、これは、見たかったものではなく、すぐに閉じてしまい、アクセス時間が1分未満だった。この場合、加算するアクセス時間は1であり、管理テーブル101に記録されるアクセス時間の合計は2となる。
【0035】
これで、この日のファイルアクセスが終了だったとする。
【0036】
次に、アクセス頻度値の更新について説明する。
【0037】
起動部105の起動指示時刻が毎日午前1時に設定されていた場合、翌2003年11月25日の午前1時に呼び出された起動部104は、頻度計算部103を起動する。
【0038】
頻度計算部103は、管理テーブル101を参照して、現在時刻2003年11月25日とファイルTEST1の最新アクセス日時2003年11月24日との日数の差である1を、アクセス時間15で割った値0.067を求め、アクセス頻度値をこの値に更新する。
【0039】
同様に、ファイルCIRCLE、SAMPLE2についても、アクセス頻度値を計算する。ファイルCLRCLEのアクセス頻度値は、1/2=0.500、ファイルSAMPLE2のアクセス頻度値は、266/80=3.325となる(図6)。
【0040】
この状況を見ると、TEST1とCIRCLEが、アクセス直後のため、利用度が高いと判断される頻度値になっており、特に、TEST1の方が、閲覧時間が長かった分、より利用度が高いと判断できる頻度値になっている。
【0041】
CIRCLEは、ほとんど利用しなかったわけであるが、アクセス直後のため、この時点では、利用度が高いものと判断される頻度値になっている。
【0042】
さて、ここで、アクセス日、アクセス時間はそのままで、11月24日から7日経ったとする(図7)。すると、アクセス頻度値は、それぞれ、
TEST1 8/15=0.530
CIRCLE 8/2=4.000
SAMPLE2 273/80=3.413
となり、CIRCLEと、SAMPLE2とのアクセス頻度値の関係が、図6の場合と逆転する。
【0043】
つまり、短時間しかアクセスしなかったものは、頻度値の増加が大きく、利用度が低いと判断されるようになる。
【0044】
さらに、アクセス日、アクセス時間はそのままで、11月24日から100日経ったとする(図8)。すると、アクセス頻度値は、それぞれ、
TEST1 101/15=6.733
CIRCLE 101/2=50.500
SAMPLE2 366/80=4.575
となり、TEST1と、SAMPLE2のアクセス頻度値の関係も、図6の場合と逆転する。
【0045】
長期にわたってアクセスのない場合、総アクセス時間の長さそのものと、頻度値との関係が一致するようになってくる。
【0046】
(第2実施例)
第2実施例の動作について、図9、図10のフローチャートに従って説明する。
【0047】
第2実施例は、システムの構造は、第1実施例と同じだが、動作フローが異なる。
【0048】
ファイルへのアクセスがあると(901)、アクセス情報記録部102は、アクセス開始日時を内部に保持し、アクセスの開始を、アクセス時間計測部へ伝達する。アクセス時間計測部104は、当該ファイルのアクセスが開始されたことを検知して、また、時間の計測を開始する(902)。
【0049】
当該ファイルのアクセスが終了するのを待つ(903)。
【0050】
当該ファイルのアクセスが終了すると、アクセス時間計測部104は、当該ファイルのアクセスが終了したことを検知し、時間の計測を終了し、アクセス時間の合計を計算する(904)。計測したアクセス時間と、別途規定された閾値を比較し(905)、閾値以下である場合、当該ファイルへのアクセスはなかったものとみなして、処理を終了する。
【0051】
アクセス時間が、閾値を超えていた場合は、アクセス時間計測部104が、アクセス時間の合計を、アクセス情報記録部102へ伝達する。
【0052】
アクセス情報記録部102は、管理テーブル101の当該ファイルの、最新アクセス日と、アクセス時間を更新する(907)。
【0053】
また、起動部105は、時刻の監視を行っており(1001)、ある、別途指定された時刻がくると、頻度計算部103へ、頻度計算開始を支持する。
【0054】
頻度計算部103は、管理テーブル101に登録されている全てのファイルについて、更新された最新アクセス日時と、アクセス時間から、アクセス頻度値を計算しなおし、管理テーブル101のアクセス頻度値を更新する(1002)。
【0055】
次に、以上の動作手順を、図11の管理テーブルにより具体的に説明する。
【0056】
アクセス時間計測部104の計測単位は分であり、分未満の時間については切り上げる。
【0057】
このとき、アクセス頻度値は、
アクセス頻度値=(現在日−最新アクセス日)/アクセス時間
で与えられる。すなわち、アクセス頻度値の値が小さいファイルほど、利用されており、重要ということになる。
【0058】
また、ファイルアクセス時間の閾値は2分とする。
【0059】
また、管理テーブルで、アクセス時間が0だった場合、0での割り算はできなくなってしまうので、ファイルの作成時に、アクセス時間初期値として、1を設定するものとする。
【0060】
まず、ファイルアクセス時の、管理テーブル101の更新動作について説明する。
【0061】
2003年11月24日にファイルTEST1とCIRCLEを閲覧する操作があったとする。
【0062】
図5が、ファイルアクセスが発生する前の、管理テーブル101の状態である。
【0063】
この時点では、アクセス頻度値から、重要度が大きい順に、SAMPLE2、CLRCLE、TEST1と考えられる。実際、SAMPLE2は、長時間閲覧されていて、利用度が高かったと考えられる。他の2つは、作成後は、確認のために一度に2分以下しかアクセスしていないため、アクセス時間は1である。
【0064】
さて、まず、TEST1へのアクセスがあったとする。
【0065】
アクセス情報記録部102は、ファイルTEST1へのアクセスがあった時点で、アクセス開始日時を内部に記憶し、アクセス時間計測部104へ、ファイルTEST1のアクセス時間計測の開始を指示する。
【0066】
本実施例の場合、ファイルTEST1へのアクセス時間は14分だったとする。これは、かなりじっくりと見ていたと考えられる。
【0067】
ファイルTEST1の閲覧が終了すると、アクセス時間計測部104は、閲覧の終了を検出し、ファイルを開いていた時間の合計14を分単位で計算する。続けて、閾値2分と比較すると、14>2なので、アクセス時間の値をアクセス情報記録部102へ、通知する。
【0068】
アクセス情報記録部102は、保持していたアクセス開始日時を、管理テーブル101に記録する。また、通知されたファイルを開いていた時間、つまりアクセス時間を、管理テーブル上の、現在のアクセス時間値に加算し、管理テーブル101に記録する。図2においては、加算後の値が、15である。
【0069】
次に、ファイルCIRCLEへのアクセスがあったとする。しかし、これは、見たかったものではなく、すぐに閉じてしまい、アクセス時間が2分未満だったとする。この場合、アクセス時間が閾値未満なので、アクセス日時と、アクセス時間は更新されない。
【0070】
これで、この日のファイルアクセスが終了だったとする。このときの管理テーブルの状態が、図12である。
【0071】
次に、アクセス頻度値の更新について説明する。
【0072】
起動部105の起動指示時刻が毎日午前1時に設定されていた場合、翌2003年11月25日の午前1時に呼び出された起動部104は、頻度計算部103を起動する。
【0073】
頻度計算部103は、管理テーブル101を参照して、現在時刻2003年11月25日とファイルTEST1の最新アクセス日時2003年11月24日との日数の差である1を、アクセス時間15で割った値0.067を求め、アクセス頻度値をこの値に更新する。
【0074】
同様に、ファイルCIRCLE、SAMPLE2についても、アクセス頻度値を計算する。ファイルCLRCLEのアクセス頻度値は、32/1=32.000、ファイルSAMPLE2のアクセス頻度値は、266/80=3.325となる(図13)。
【0075】
実施例1と異なり、ファイルのアクセス時間が短いと、アクセス日時、アクセス時間が更新されず、閲覧しなかったものとみなされるため、アクセス頻度値から、重要度を判定する場合により正確になる。
【0076】
さて、ここで、アクセス日、アクセス時間はそのままで、11月24日から7日経ったとする(図14)。すると、アクセス頻度値は、それぞれ、
TEST1 8/15=0.530
CIRCLE 39/2=39.000
SAMPLE2 273/80=3.413
となる。
【0077】
(第3実施例)
第3実施例の動作について、図15、図16のフローチャートに従って説明する。
【0078】
ファイルへのアクセスがあると(1501)、アクセス情報記録部102は、アクセス開始日時を内部に保持し、アクセスの開始を、アクセス時間計測部へ伝達する。アクセス時間計測部104は、当該ファイルのアクセスが開始されたことを検知して、また、時間の計測を開始する(1502)。
【0079】
当該ファイルのアクセスが終了するのを待つ(1503)。
【0080】
当該ファイルのアクセスが終了すると、アクセス時間計測部104は、当該ファイルのアクセスが終了したことを検知し、時間の計測を終了し、アクセス時間の合計を計算する(1504)。計算したアクセス時間と、別途規定された下限閾値を比較し(1505)、下限閾値以下である場合、当該ファイルへのアクセスはなかったものとみなして、処理を終了する。
【0081】
アクセス時間が、下限閾値を超えていた場合、さらに、上限閾値とアクセス時間を比較する(1506)。
【0082】
アクセス時間が、上限閾値を超えていた場合、アクセス時間の合計値を、上限閾値と置き換える(1507)。
【0083】
アクセス時間計測部104が、アクセス時間の合計を、アクセス情報記録部102へ伝達する(1508)。
【0084】
アクセス情報記録部102は、管理テーブル101の当該ファイルの、最新アクセス日と、アクセス時間を更新する(1509)。
【0085】
また、起動部105は、時刻の監視を行っており(1601)、ある、別途指定された時刻がくると、頻度計算部103へ、頻度計算開始を支持する。
【0086】
頻度計算部103は、管理テーブル101に登録されている全てのファイルについて、更新された最新アクセス日時と、アクセス時間から、アクセス頻度値を計算しなおし、管理テーブル101のアクセス頻度値を更新する(1602)。
【0087】
本実施例においては、アクセス時間の上限閾値を決め、一度のアクセス時間の合計が、上限閾値を超えた場合は、アクセス時間が上限閾値だったとみなすようにしている。これは、電子化された文書管理システムの場合、見終わったのにファイルを開きっぱなしにしてしまう場合があり、開きっぱなしの状態をそのままアクセス時間としてカウントすると、無限にアクセス時間が増えるため、アクセス頻度値が、無意味になってしまう可能性があるためである。
【0088】
なお、上限閾値を超えた場合に設定するアクセス時間値は、上限閾値そのものとは別に定義された値を用いてもよい。
【図面の簡単な説明】
【0089】
【図1】文書管理システムの一実施例の構造図
【図2】管理テーブルの例
【図3】第1実施例のフローチャート
【図4】第1実施例のフローチャート
【図5】第1実施例の管理テーブルの遷移
【図6】第1実施例の管理テーブルの遷移
【図7】第1実施例の管理テーブルの遷移
【図8】第1実施例の管理テーブルの遷移
【図9】第2実施例のフローチャート
【図10】第2実施例のフローチャート
【図11】第2実施例の管理テーブルの遷移
【図12】第2実施例の管理テーブルの遷移
【図13】第2実施例の管理テーブルの遷移
【図14】第2実施例の管理テーブルの遷移
【図15】第3実施例のフローチャート
【図16】第3実施例のフローチャート
【符号の説明】
【0090】
101 管理テーブル
102 アクセス情報記録部
103 頻度計算部
104 アクセス時間計測部
105 起動部




 

 


     NEWS
会社検索順位 特許の出願数の順位が発表

URL変更
平成6年
平成7年
平成8年
平成9年
平成10年
平成11年
平成12年
平成13年


 
   お問い合わせ info@patentjp.com patentjp.com   Copyright 2007-2013