[go: up one dir, main page]

JP2016091429A - Information process system and control method - Google Patents

Information process system and control method Download PDF

Info

Publication number
JP2016091429A
JP2016091429A JP2014227494A JP2014227494A JP2016091429A JP 2016091429 A JP2016091429 A JP 2016091429A JP 2014227494 A JP2014227494 A JP 2014227494A JP 2014227494 A JP2014227494 A JP 2014227494A JP 2016091429 A JP2016091429 A JP 2016091429A
Authority
JP
Japan
Prior art keywords
data
rule
etl
processing
managed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014227494A
Other languages
Japanese (ja)
Inventor
啓晶 砥綿
Keisho Towata
啓晶 砥綿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014227494A priority Critical patent/JP2016091429A/en
Publication of JP2016091429A publication Critical patent/JP2016091429A/en
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide data of a processing treatment result with invariably high reliability without manually performing a processing treatment on data accumulated in the past when adding the processing treatment.SOLUTION: An information processing system according to one embodiment of the present invention includes a data storage server 102 and an ETL management server 101. The data storage server 102 stores data of a plurality of network devices gathered through a network and ETL execution-completed data, and provides the ETL execution-completed data for an analysis system which takes analysis. The ETL management server 101 manages execution of ETL and rules of ETL. The ETL management server 101 performs processing according to first and second rules when the second rule related to the first rule managed by a rule management part 302 is added. Further, even input data having been processed according to the first rule before the second rule is added is processed according to the second rule.SELECTED DRAWING: Figure 1

Description

本発明は、情報処理システムおよび制御方法に関する。   The present invention relates to an information processing system and a control method.

現在、サーバ上で稼働するアプリケーションのログや、市場で稼働する大量のデバイスの情報をサーバ上に収集、蓄積することが行われている。蓄積したデータは、アプリケーションやデバイスの品質向上、ユーザビリティの向上、または故障予測などに用いられ、集計や分析が行われる。サーバ上で稼働するアプリケーションとは、顧客に対して提供するWebサービスや、自社ユーザの業務を支援する企業向け社内システムのことである。また、デバイスとは、MFP(MultiFunction Peripheral)や、プリンタ、携帯電話、スマートフォン、PC(Personal Computer)など多岐にわたる。また、デバイスから収集したデータだけでなく、例えばデバイスの修理などのサポートのためのサービスマンの出動履歴データや、コールセンターへのクレーム情報なども分析対象となっている。このように、分析対象のデータのサイズや種別はますます多様化、大規模化している。   Currently, logs of applications operating on the server and information on a large amount of devices operating on the market are collected and accumulated on the server. The accumulated data is used for improving the quality of applications and devices, improving usability, or predicting failures, and is aggregated and analyzed. An application that runs on a server is a Web service provided to a customer or an in-house system for a company that supports the business of its own users. In addition, devices include a wide range of devices such as MFPs (Multi Function Peripherals), printers, mobile phones, smartphones, and PCs (Personal Computers). In addition to data collected from devices, service person dispatch history data for support such as device repair, and complaint information to a call center are also analyzed. As described above, the sizes and types of data to be analyzed are increasingly diversified and scaled up.

データを効率的に分析するために、蓄積したデータに対して加工処理が行われる。加工処理とは、データに含まれる不正なデータの除去、文字コード補正、符号の付与、正規化、及びフォーマットの統一などのことである。このような加工処理は、一般的にはETL(Extract Transform Load)と呼ばれている。ETLは、データを利用するユーザやシステムの要件にしたがって柔軟に追加や更新が行われる必要があり、1つの入力データに対して複数の出力データを管理することが求められる。
特許文献1は、基幹データベースから目的別データベースを抽出していく構成を採るデータベースシステムを開示している。特許文献1では、新たに生成した目的別データベースと前回の抽出時点の目的別データベースとの差分を管理し、再生要求があると、差分に従って過去のある時点で収集した目的別データベースを再生する。
In order to efficiently analyze the data, the accumulated data is processed. The processing includes removal of illegal data included in data, character code correction, code addition, normalization, and format unification. Such processing is generally called ETL (Extract Transform Load). The ETL needs to be added or updated flexibly according to the requirements of the user or system using the data, and is required to manage a plurality of output data for one input data.
Patent Document 1 discloses a database system that employs a configuration in which a purpose-specific database is extracted from a basic database. In Patent Document 1, a difference between a newly generated purpose-specific database and a purpose-specific database at the previous extraction time is managed, and when there is a reproduction request, the purpose-specific database collected at a certain past time is reproduced according to the difference.

特開平5−257765号公報JP-A-5-257765

しかしながら、特許文献1では、データの利用時に所望のデータを再生するため、再生処理をしている間はユーザまたはシステムが待ち状態になることが考えられる。また、加工処理の変更時には、管理者が差分データ及び最新データに対して加工処理を手動で適用する必要がある。   However, in Patent Document 1, since desired data is reproduced when data is used, it is considered that the user or the system is in a waiting state during the reproduction process. Further, when changing the processing, the administrator needs to manually apply the processing to the difference data and the latest data.

本発明は、加工処理を追加した際に、過去に蓄積されたデータに対しても手動で加工処理を実行することなく、常に信頼度の高い加工処理結果のデータを提供する情報処理システムの提供を目的とする。   The present invention provides an information processing system that always provides highly reliable processing result data without manually performing processing processing on data accumulated in the past when processing processing is added. With the goal.

本発明の一実施形態の情報処理システムは、ネットワークを介して収集した複数のネットワークデバイスのデータを記憶する第1記憶手段と、第1記憶手段で記憶されたデータに対して、分析に適したデータとするための加工を行う際の複数のルールを管理する管理手段と、第1記憶手段で記憶されたデータに対して、管理されたルールに従う加工を行う加工手段と、加工済みのデータを記憶する第2の記憶手段と、第2の記憶手段に記憶された加工済みのデータを、分析を行う分析システムに提供する提供手段と、有する。加工手段は、管理手段で管理されている第1のルールに関連する第2のルールが追加された場合に、第1及び第2のルールのそれぞれに従う加工を行う。さらに、第2のルールが追加される前に、第1のルールに従い加工が行われた第1記憶手段で記憶されたデータに対しても、第2のルールに従う加工を行う。   An information processing system according to an embodiment of the present invention is suitable for analysis of first storage means for storing data of a plurality of network devices collected via a network and data stored in the first storage means. Management means for managing a plurality of rules when processing to make data, processing means for processing the data stored in the first storage means according to the managed rules, and processed data Second storage means for storing, and providing means for providing processed data stored in the second storage means to an analysis system for performing analysis. The processing means performs processing according to each of the first and second rules when a second rule related to the first rule managed by the management means is added. Furthermore, before the second rule is added, the data stored in the first storage means processed according to the first rule is also processed according to the second rule.

本発明の情報処理システムによれば、加工処理を追加した際に、過去に蓄積されたデータに対しても手動で加工処理を実行することなく、常に信頼度の高い加工処理結果のデータを提供する情報処理システムの提供が可能となる。   According to the information processing system of the present invention, when machining processing is added, data of machining processing results with high reliability is always provided without manually performing processing processing on data accumulated in the past. An information processing system can be provided.

本発明の第1実施形態に係る情報処理システムの構成を示す図である。It is a figure which shows the structure of the information processing system which concerns on 1st Embodiment of this invention. 第1実施形態におけるサーバのハードウェア構成を示す図である。It is a figure which shows the hardware constitutions of the server in 1st Embodiment. ETL管理サーバのソフトウェアブロック図である。It is a software block diagram of an ETL management server. データ蓄積サーバのソフトウェアブロック図である。It is a software block diagram of a data storage server. データ収集サーバのソフトウェアブロック図である。It is a software block diagram of a data collection server. ETL管理サーバが管理端末に表示させる一覧画面を示す図である。It is a figure which shows the list screen which an ETL management server displays on a management terminal. ETL管理サーバが管理端末に表示させる新規追加画面を示す図である。It is a figure which shows the new addition screen which an ETL management server displays on a management terminal. ETL管理サーバのETLの実行を説明するフローチャートである。It is a flowchart explaining execution of ETL of an ETL management server. ルールが追加された際の処理を説明するフローチャートである。It is a flowchart explaining the process at the time of a rule being added. 非プライマリデータを削除する処理を説明するフローチャートである。It is a flowchart explaining the process which deletes non-primary data. 本発明の第2実施形態に係る情報処理システムの構成を示す図である。It is a figure which shows the structure of the information processing system which concerns on 2nd Embodiment of this invention. 第2実施形態におけるサーバ数指定画面を示す図である。It is a figure which shows the server number designation | designated screen in 2nd Embodiment. 本発明の第3実施形態におけるETL期限指定画面を示す図である。It is a figure which shows the ETL time limit designation | designated screen in 3rd Embodiment of this invention. ETL実行に必要なサーバ数の算出処理を説明するフローチャートである。It is a flowchart explaining the calculation process of the number of servers required for ETL execution.

以下、本発明を実施するための形態について図面などを参照して説明する。
(第1実施形態)
図1は、本発明の第1実施形態に係る情報処理システムの構成を示す図である。
図1において、インターネット100は、インターネットを表わしている。以下に説明する各サーバ101〜104、及び106や、管理端末105、分析端末107は、インターネットを介して相互に接続されている。なお、インターネット100は、インターネットに限定されず、企業内ネットワーク(イントラネット)であってもよい。
Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings.
(First embodiment)
FIG. 1 is a diagram showing a configuration of an information processing system according to the first embodiment of the present invention.
In FIG. 1, the Internet 100 represents the Internet. The servers 101 to 104 and 106 described below, the management terminal 105, and the analysis terminal 107 are connected to each other via the Internet. The Internet 100 is not limited to the Internet, and may be a corporate network (intranet).

ETL管理サーバ101は、ETLの実行とETLのルールを管理するサーバである。データを利用する前に、利用し易い形にデータを加工することが一般的である。具体的には、データに含まれる不正なデータの除去、文字コード補正、符号の付与、正規化、及びフォーマットの統一などの加工処理がある。本実施形態においては、このような加工処理のことをETLと呼ぶ。ETL管理サーバ101は、データ収集サーバ103の定期的なデータの収集のたびに、新たに収集されデータ蓄積サーバ102に蓄積されたデータに対してETLを実行する。また、ETL実行済のデータをデータ蓄積サーバ102に蓄積する。さらに、管理端末105からのルールの変更を受け付け、必要であればデータ蓄積サーバ102に蓄積された過去のデータに対しても自動的にETLを実行する。ルール変更に基づいて自動的にETLを実行することで、管理者がルール変更のたびに手動で過去のデータにETLを実行して蓄積するという手間を削減することができる。   The ETL management server 101 is a server that manages ETL execution and ETL rules. Before using data, it is common to process the data in a form that is easy to use. Specifically, there are processing processes such as removal of illegal data included in data, character code correction, sign assignment, normalization, and format unification. In the present embodiment, such processing is referred to as ETL. Each time the data collection server 103 periodically collects data, the ETL management server 101 executes ETL on the newly collected data stored in the data storage server 102. In addition, the ETL-executed data is stored in the data storage server 102. Furthermore, a rule change from the management terminal 105 is accepted, and if necessary, ETL is automatically executed on past data stored in the data storage server 102. By automatically executing the ETL based on the rule change, it is possible to reduce the trouble of the administrator manually executing and storing the ETL on past data every time the rule is changed.

データ蓄積サーバ102は、データ収集サーバ103が収集したデータや、ETL管理サーバがETLを行った結果の出力データを蓄積する。また、分析端末107や、データ利用サーバ群106からの要求に従ってETL実行済のデータを提供する。データ蓄積サーバ102は、FTP、HTTP、SMB、またはデータベース接続などの一般的なプロトコルでデータの入出力を受け付けることができるが、データの入出力が可能なプロトコルであればこれに限定されない。   The data accumulation server 102 accumulates data collected by the data collection server 103 and output data obtained as a result of ETL performed by the ETL management server. In addition, ETL-executed data is provided in accordance with requests from the analysis terminal 107 and the data use server group 106. The data storage server 102 can accept input / output of data by a general protocol such as FTP, HTTP, SMB, or database connection, but is not limited to this as long as it is a protocol capable of data input / output.

データ収集サーバ103は、業務サーバ群104等のネットワークデバイスから、データ分析に必要なデータを収集する。このとき、データ収集サーバ103は、業務サーバ群104の各サーバからFTP、HTTP、またはSMBなどのデータ転送プロトコルや、データベース接続によってデータを収集する。データの収集に用いるプロトコルは、業務サーバ群104の各サーバの提供するプロトコルに従う。本実施形態においては、そのプロトコルは限定しない。また、業務サーバ群104は、稼働中にデータの追加、及び更新が行われていくため、データ収集サーバ103は、定期的に業務サーバ群104からデータの収集を行う。これは、例えばLinux(登録商標)のcrontabや、Windows(登録商標)タスクスケジューラなどのOSの標準機能を利用して行ってもよいし、スケジュール管理機能を有するソフトウェアを利用してもよい。   The data collection server 103 collects data necessary for data analysis from a network device such as the business server group 104. At this time, the data collection server 103 collects data from each server of the business server group 104 by a data transfer protocol such as FTP, HTTP, or SMB, or database connection. The protocol used for data collection follows the protocol provided by each server of the business server group 104. In this embodiment, the protocol is not limited. In addition, since the business server group 104 adds and updates data during operation, the data collection server 103 periodically collects data from the business server group 104. This may be performed by using a standard function of the OS such as Linux (registered trademark) crontab or Windows (registered trademark) task scheduler, or software having a schedule management function.

業務サーバ群104は、データ分析とは別の目的で稼働するサーバマシンの集合である。例えば、インターネットを介して顧客に対してWebサービスを提供するサーバや、自社ユーザの業務を支援する企業向け社内システムが稼働するサーバである。また、近年はユーザ環境で動作するモバイル端末や、プリンタなどの業務機器もインターネットに接続できるようになっている。このようなデバイスから接続され、その管理を行うサーバであってもよい。また、業務サーバ群104は、物理的なサーバマシンであってもよいし、仮想環境に構築されたサーバマシンであってもよい。これらのサーバは、それぞれの業務目的のために構築されたサーバであるため、データ分析機能を有していない。そのため、前述のデータ収集サーバ103によってこれらのデータを統合的に収集することで初めてデータ分析が可能となる。   The business server group 104 is a set of server machines that operate for purposes other than data analysis. For example, a server that provides a Web service to a customer via the Internet, or a server that operates an in-house system for a company that supports the business of the company user. In recent years, mobile terminals operating in the user environment and business devices such as printers can be connected to the Internet. It may be a server connected from such a device and managing it. The business server group 104 may be a physical server machine or a server machine constructed in a virtual environment. Since these servers are constructed for each business purpose, they do not have a data analysis function. Therefore, data analysis is possible only when the data collection server 103 collects these data in an integrated manner.

管理端末105は、管理者が利用する端末である。管理者は、管理端末105を利用してETL管理サーバ101に対して、ルールの変更を指示する。ここで、管理端末105は、Webブラウザなどを介してETL管理サーバ101に接続することが可能であるが、ルールの変更の指示ができればこれに限定されない。   The management terminal 105 is a terminal used by an administrator. The administrator uses the management terminal 105 to instruct the ETL management server 101 to change the rule. Here, the management terminal 105 can be connected to the ETL management server 101 via a Web browser or the like. However, the management terminal 105 is not limited to this as long as an instruction to change the rule can be given.

データ利用サーバ群106は、データ蓄積サーバ102に蓄積されたETL実行済のデータを利用するためのサーバ群である。例えば、データ利用サーバ群106において、顧客に提供する業務システムのエラーの集計、及び監視を行うことで、業務システムの品質向上のためのデータ分析を行うことができる。また、他の例では、データ利用サーバ群106において、多数の端末が送信した使用状況のログからメンテナンスが必要な端末を特定することで、顧客に警告を行う、または顧客先に出向いてメンテナンスを実施するという活用が可能である。   The data use server group 106 is a server group for using ETL-executed data stored in the data storage server 102. For example, the data utilization server group 106 can perform data analysis for improving the quality of the business system by collecting and monitoring business system errors provided to the customer. In another example, in the data use server group 106, a terminal that requires maintenance is identified from usage logs transmitted by a large number of terminals, so that the customer is warned or the customer is visited for maintenance. It can be used to implement.

分析端末107は、分析者が直接的にデータ蓄積サーバ102に蓄積されたデータを参照することで、データ分析を行うための端末である。データ利用サーバ群106は、いくつかの特定の目的のためにデータ分析を行うサーバであるのに対し、分析端末107では、分析者がさまざまなツールやノウハウを用いてデータ分析を行う。データの活用は、まずはデータを検証することから開始することが定石である。そのため、分析端末107で得られたデータの知見をもとに、データ利用サーバ群106を設計、構築することで効果的にデータの活用が可能となる。
なお、図1では、各サーバ101〜104、及び106は、物理的に別々のサーバとして記載しているが、同一の物理サーバ内に各サーバを仮想サーバ機能として配置してもよい。
The analysis terminal 107 is a terminal for performing data analysis by referring to data stored in the data storage server 102 directly by an analyst. The data use server group 106 is a server that performs data analysis for some specific purposes, whereas in the analysis terminal 107, an analyst performs data analysis using various tools and know-how. The first step in utilizing data is to start by verifying the data. Therefore, data can be effectively used by designing and constructing the data use server group 106 based on the data knowledge obtained by the analysis terminal 107.
In FIG. 1, the servers 101 to 104 and 106 are illustrated as physically separate servers, but each server may be arranged as a virtual server function in the same physical server.

図2は、本実施形態に係るETL管理サーバ101、データ蓄積サーバ102、データ収集サーバ103、業務サーバ群104、及びデータ利用サーバ群106のハードウェア構成を示す図である。
図2において、Central Processing Unit(CPU)202は、装置全体の制御を行う。CPU202は、ハードディスク(HDD)205に格納されているアプリケーションプログラム、及びOS等を実行し、Randam Access Memory(RAM)203にプログラムの実行に必要な情報、ファイル等を一時的に格納する制御を行う。Read Only Memory(ROM)204は、記憶手段であり、内部には、基本I/Oプログラム等の各種データを記憶する。RAM203は、一時記憶手段であり、CPU202の主メモリ、ワークエリア等として機能する。HDD205は、外部記憶手段の一つであり、大容量メモリとして機能し、Webブラウザ等のアプリケーションプログラム、サービス群のプログラム、OS、及び関連プログラム等を格納している。ディスプレイ206は、表示手段であり、キーボード207から入力したコマンド等を表示するものである。インターフェース208は、外部装置I/Fであり、プリンタ、USB機器、または周辺機器等を接続する。キーボード207は、指示入力手段である。システムバス201は、装置内におけるデータの流れを司るものである。ネットワークインターフェースカード(NIC)209は、該インターフェース209、インターネット100を介して外部装置とのデータのやり取りを行う。
なお、上記コンピュータの構成は一例であり、図2の構成例に限定されるものではない。例えば、データやプログラムの格納先は、その特徴に応じてROM204、RAM203、またはHDD205などに変更することも可能である。
FIG. 2 is a diagram showing a hardware configuration of the ETL management server 101, the data storage server 102, the data collection server 103, the business server group 104, and the data use server group 106 according to the present embodiment.
In FIG. 2, a central processing unit (CPU) 202 controls the entire apparatus. The CPU 202 executes an application program, an OS, and the like stored in the hard disk (HDD) 205, and performs control to temporarily store information, files, and the like necessary for executing the program in the random access memory (RAM) 203. . A read only memory (ROM) 204 is a storage unit, and stores various data such as a basic I / O program therein. A RAM 203 is temporary storage means, and functions as a main memory, work area, and the like for the CPU 202. The HDD 205 is one of external storage means, functions as a large-capacity memory, and stores application programs such as a Web browser, a service group program, an OS, and related programs. A display 206 is a display means for displaying commands and the like input from the keyboard 207. An interface 208 is an external device I / F, and connects a printer, a USB device, a peripheral device, or the like. The keyboard 207 is an instruction input unit. The system bus 201 controls the flow of data in the apparatus. A network interface card (NIC) 209 exchanges data with an external device via the interface 209 and the Internet 100.
The configuration of the computer is an example, and is not limited to the configuration example of FIG. For example, the storage destination of data and programs can be changed to the ROM 204, the RAM 203, the HDD 205, or the like according to the characteristics.

図3は、ETL管理サーバ101の提供する機能モジュールを説明するためのソフトウェアブロック図である。
制御部301は、以下に説明する機能モジュールを呼び出してETLを実行するメイン実行部である。ルール管理部302は、ETLの実行を制御するためのルールを管理する。ルール管理部302は、データベースまたはXMLなどのテキストファイルとしてルールを保持する。
FIG. 3 is a software block diagram for explaining functional modules provided by the ETL management server 101.
The control unit 301 is a main execution unit that calls the functional modules described below and executes ETL. The rule management unit 302 manages rules for controlling execution of ETL. The rule management unit 302 holds the rules as a text file such as a database or XML.

ここで、ルール管理部302で管理するルールについて表Aを用いて説明する。
スケジュール列は、定期的にETLを実行するためのルール毎のスケジュールを表している。例えば、表Aにおいて、Per Dayと示されているものは、毎日ETLを実行するスケジュールである。また、Per 3hourと示されているものは3時間ごとにETLを実行するスケジュールである。分析者ができるだけリアルタイムなデータを分析できるように、データ収集サーバ103によるデータの収集頻度に応じてスケジュール設定を行うことが好ましい。
Here, rules managed by the rule management unit 302 will be described using Table A. FIG.
The schedule column represents a schedule for each rule for periodically executing ETL. For example, in Table A, what is indicated as Per Day is a schedule for executing ETL every day. Also, what is indicated as Per 3hour is a schedule for executing ETL every 3 hours. It is preferable to set a schedule according to the frequency of data collection by the data collection server 103 so that the analyst can analyze data in real time as much as possible.

入力パスルール列は、入力データのファイルパスのルールを示している。例えば、表Aの1行目のルールにおいては、/data/device/DEVICE_ALARM_*.csvに該当するファイルがETL対象になる。ここで、*とは任意の文字列を表わしている。表Aにおいては、入力パスルール、/data/device/DEVICE_ALARM_*.csvに該当するETLは1〜3行目であるため、ETL管理サーバ101は、3つのETLを実行する。   The input path rule column indicates a file path rule of input data. For example, in the rule in the first row of Table A, / data / device / DEVICE_ALARM_ *. Files corresponding to csv are subject to ETL. Here, * represents an arbitrary character string. In Table A, the input path rule, / data / device / DEVICE_ALARM_ *. Since the ETL corresponding to csv is the first to third lines, the ETL management server 101 executes three ETLs.

出力パスルール列は、出力データのファイルパスのルールを示している。ETL管理サーバ101は、ETL実行ファイルによる実行結果のデータを、出力パスルール列で定義されたパスに保存する。ここで、表Aの5行目の入力パスルールは、4行目の出力パスルールと一致していることがわかる。これは、/data/device/DEVICE_ENVIRONMENT_*.csvに関しては、4行目のETLを実行した後、さらに5行目のETLが実行されることを示している。   The output path rule column indicates a file path rule for output data. The ETL management server 101 stores the data of the execution result by the ETL execution file in the path defined by the output path rule string. Here, it can be seen that the input path rule in the fifth row of Table A matches the output path rule in the fourth row. This is / data / device / DEVICE_ENVIRONMENT_ *. Regarding csv, after the ETL on the fourth line is executed, the ETL on the fifth line is further executed.

ETL実行ファイルパス列は、ETLを実行するための実行モジュールのファイルパスを示している。ETL管理サーバ101は、ETL実行ファイルパスで示される実行ファイルを実行することで、入力ファイルに対してETLを適用することができる。
プライマリ列は、過去に蓄積され、既にルール管理部302が管理するルールに従うETLが行われた入力データに対しても、チェックが入ったルールに従うETLを実行するか否かを表している。なお、プライマリ列にチェックがあった場合の処理については、図9のフローチャートで詳述する。
データ読込部303は、ETL対象のデータをデータ蓄積サーバ102から読み込む機能を提供する。データ蓄積サーバ102は、HTTP、FTP、または一般的なデータベース接続方式などの1つ以上のデータ公開方式を有している。データ読込部303は、データ蓄積サーバ102の公開方式に合わせてデータを読み込み、一時的に中間データ管理部305に保存する。
The ETL execution file path column indicates the file path of the execution module for executing the ETL. The ETL management server 101 can apply the ETL to the input file by executing the execution file indicated by the ETL execution file path.
The primary column indicates whether or not to execute the ETL according to the checked rule for the input data that has been accumulated in the past and has already been subjected to the ETL according to the rule managed by the rule management unit 302. The processing when the primary column is checked will be described in detail with reference to the flowchart of FIG.
The data reading unit 303 provides a function of reading ETL target data from the data storage server 102. The data storage server 102 has one or more data disclosure methods such as HTTP, FTP, or a general database connection method. The data reading unit 303 reads data in accordance with the disclosure method of the data storage server 102 and temporarily stores it in the intermediate data management unit 305.

データ保存部304は、ETL実行済の出力データをデータ蓄積サーバ102に保存するための機能を有する。データ読込部303と同様に、データ蓄積サーバ102の公開方式に合わせてETL実行済のデータを保存する。
中間データ管理部305は、ETLの実行途中のデータを保存するための記憶領域である。
実行ファイル格納部306は、ETL実行ファイルを格納するための記憶領域である。ETL実行ファイルは、例えばスクリプトや実行ファイル(exe、jar)などのファイル形式であるがこれに限定しない。
The data storage unit 304 has a function for storing the output data on which ETL has been executed in the data storage server 102. Similar to the data reading unit 303, the data that has been subjected to ETL execution is stored in accordance with the disclosure method of the data storage server 102.
The intermediate data management unit 305 is a storage area for storing data during execution of ETL.
The execution file storage unit 306 is a storage area for storing an ETL execution file. The ETL execution file has a file format such as a script or an execution file (exe, jar), but is not limited thereto.

ETL実行部307は、実行ファイル格納部306に格納されたETL実行ファイルを起動してETLを実行する。ETLとは、例えば文字コード変換、改行コード削除、全角/半角変換、null値挿入、桁揃え、及び簡単な集計などの処理であるが、これらに限定しない。また、これらの処理を複数組み合わせたものであってもよい。
ルール受付部308は、管理端末105からの要求に従って、ルールの追加を受け付ける。ここで、ルール受付部308が管理端末105からルールの追加を受け付けるための管理画面について図6及び7を用いて説明する。
The ETL execution unit 307 activates the ETL execution file stored in the execution file storage unit 306 and executes the ETL. The ETL is, for example, character code conversion, line feed code deletion, full-width / half-width conversion, null value insertion, digit alignment, simple tabulation, and the like, but is not limited thereto. Further, a combination of these processes may be used.
The rule reception unit 308 receives the addition of a rule in accordance with a request from the management terminal 105. Here, a management screen for the rule receiving unit 308 to accept addition of a rule from the management terminal 105 will be described with reference to FIGS.

図6は、ETL管理サーバのルール管理部302が、管理しているルールを管理端末105に表示する一覧画面を示す図である。
ルール一覧601では、ルール管理部302が管理するルールを一覧表示させることができる。ユーザが反映ボタン603を押下(操作)すると、ルール受付部308は、プライマリ列にチェックが入っていたルールに関して、過去にデータ蓄積サーバ102に蓄積された入力データに対してもETLを実行する。上記処理については、図9のフローチャートを用いて詳述する。
FIG. 6 is a diagram showing a list screen on which the rules managed by the rule management unit 302 of the ETL management server are displayed on the management terminal 105.
In the rule list 601, rules managed by the rule management unit 302 can be displayed in a list. When the user presses (operates) the reflection button 603, the rule receiving unit 308 executes ETL on the input data stored in the data storage server 102 in the past with respect to the rule whose primary column is checked. The above process will be described in detail with reference to the flowchart of FIG.

本明細書において、プライマリとは、データ蓄積サーバ102に格納されたデータの中で、データの活用のためにもっとも相応しいデータであることを示す真偽値である。プライマリとして設定されたデータをプライマリデータと呼ぶこととする。プライマリデータは、多くのデータ利用サーバ群106や分析端末107に利用されるため、過去に蓄積されたデータに関しても常に取得できることが望ましい。従来は、過去に蓄積されたデータに関しては手動ですべてETLを実行することが必要であったが、本実施形態のようにプライマリとして指定された場合に、ETL管理サーバ101が自動的にETLを実行することで、手動による労力を削減することができる。   In this specification, the primary is a true / false value indicating that the data stored in the data storage server 102 is the most suitable data for use of the data. Data set as primary is referred to as primary data. Since primary data is used by many data utilization server groups 106 and analysis terminals 107, it is desirable that primary data can always be acquired. Conventionally, it has been necessary to manually execute ETL for all data accumulated in the past. However, when designated as primary as in this embodiment, the ETL management server 101 automatically executes ETL. By doing so, manual labor can be reduced.

また、プライマリデータは、永続的に取得できる必要のあるデータであるが、プライマリデータでないデータに関しては、一時的に取得できればよい。ここで、プライマリデータでないデータに関してもETLを実行し続ける理由は、すでにデータ利用サーバ群106がシステム結合されていた場合にも、データ利用サーバ群106を継続的に利用できるようにするためである。ただし、プライマリデータでないデータは、常に過去にわたって全て蓄積しておく必要はない。そのため、定期的に削除が必要となる。プライマリデータでないデータの削除については、図10のフローチャートを用いて後述する。   The primary data is data that needs to be acquired permanently, but data that is not primary data only needs to be temporarily acquired. Here, the reason why ETL continues to be executed even for data that is not primary data is to enable continuous use of the data use server group 106 even when the data use server group 106 is already system-coupled. . However, it is not always necessary to accumulate all data that is not primary data over the past. Therefore, it is necessary to delete periodically. Deletion of data that is not primary data will be described later with reference to the flowchart of FIG.

ユーザが新規追加ボタン602を押下すると、ルール受付部308は、図7に示す新規追加画面700を表示する。
図7のルール入力欄701では、ユーザが新規ルールの追加に必要な情報を入力することができる。チェックボックス702は、ETLを実行した結果データをプライマリデータとして登録するか否かを指定するためのチェックボックスである。ユーザがOKボタン703を押下することで、ルールがルール管理部302に登録される。
ここで、チェックボックス702にチェックが入っていた場合は、図6の一覧画面600でプライマリ列にチェックが入っていた場合と同様に、過去にデータ蓄積サーバ102に蓄積された入力データに対してもETLを実行する。このときの処理に関しても、図9に示すフローチャートと同様である。
When the user presses the new addition button 602, the rule receiving unit 308 displays a new addition screen 700 shown in FIG.
In the rule input field 701 in FIG. 7, the user can input information necessary for adding a new rule. A check box 702 is a check box for designating whether or not to register result data obtained by executing ETL as primary data. When the user presses an OK button 703, the rule is registered in the rule management unit 302.
Here, when the check box 702 is checked, as in the case where the primary column is checked in the list screen 600 of FIG. Also performs ETL. The processing at this time is also the same as the flowchart shown in FIG.

図4は、データ蓄積サーバ102の提供する機能モジュールを説明するためのソフトウェアブロック図である。
データ格納部501は、ETL実行前の入力データを記憶する第1記憶手段、及びETL実行後の加工済みデータを記憶する第2記憶手段として機能する記憶領域である。データ格納部501は、一般的には物理的な記憶媒体であるHDDやデータベースであるが、例えば仮想化されたオブジェクトストレージであってもよい。以下、表B〜表Eを用いてデータ格納部501に格納される入力データ及び出力データの一例を示す。
FIG. 4 is a software block diagram for explaining the functional modules provided by the data storage server 102.
The data storage unit 501 is a storage area that functions as a first storage unit that stores input data before ETL execution and a second storage unit that stores processed data after ETL execution. The data storage unit 501 is generally an HDD or database that is a physical storage medium, but may be a virtualized object storage, for example. Hereinafter, examples of input data and output data stored in the data storage unit 501 will be described using Tables B to E.

表Bは、データ収集サーバ103が業務サーバ群104から収集したアラーム履歴データの例である。アラーム履歴とは、業務サーバ群104と接続された多数のデバイスに何らかの問題が発生した際に業務サーバ群104に通知するアラームの履歴のことである。本実施形態においては、表Bで表わされるデータは、データ蓄積サーバ102の、/data/device/DEVICE_ALARM_*.csvで示されるパスに保存される。   Table B is an example of alarm history data collected from the business server group 104 by the data collection server 103. The alarm history is an alarm history notified to the business server group 104 when any problem occurs in a large number of devices connected to the business server group 104. In the present embodiment, the data represented in Table B is stored in the / data / device / DEVICE_ALARM_ *. It is stored in the path indicated by csv.

国コード列は、業務サーバ群104と接続されているデバイスが稼働している国を表わすコードである。発生日時分列は、アラームが発生した日時分のことである。解除日時分列は、アラームがユーザ、またはサービスマンに解除された日時分のことである。データ送信日時分列は、デバイスがアラーム履歴を業務サーバ群104に送信した日時分のことである。機種列は、デバイスの機種を識別するためのコードである。機番列は、デバイスのID(識別子)である。アラームコード列は、アラームの発生区分コードである。アラームレベル列は、アラームの深刻さを表わす数値である。   The country code string is a code representing the country in which the device connected to the business server group 104 is operating. The occurrence date / time column is the date / time at which the alarm occurred. The cancellation date / time column is the date / time when the alarm is canceled by the user or the service person. The data transmission date / time column is the date / time when the device transmits the alarm history to the business server group 104. The model column is a code for identifying the model of the device. The machine number column is an ID (identifier) of the device. The alarm code string is an alarm occurrence classification code. The alarm level column is a numerical value representing the seriousness of the alarm.

上記のアラーム履歴データにおいて、国コード列、機種列の2行目及び5行目に<LF>という改行コードが含まれている。また、5行目にはさらに<CR>という改行コードが含まれている。これは、不正な改行コードが含まれている一例である。ETL管理サーバ101は、この不正な改行コードを取り除くというETLを実行する。本実施形態において、表Aの1行目が表Bのデータに対して上述したETLを実行するためのルールである。ETL実行ファイルパスは、/var/etl/transform_rcd.jarになっているが、このETL実行ファイルを表Bのデータに対して実行した結果が表Cのデータである。
In the alarm history data, the line feed code <LF> is included in the second and fifth rows of the country code column and the model column. The fifth line further includes a line feed code <CR>. This is an example in which an invalid line feed code is included. The ETL management server 101 executes ETL to remove this invalid line feed code. In the present embodiment, the first row of Table A is a rule for executing the above-described ETL on the data of Table B. The ETL executable file path is / var / etl / transform_rcd. The result of executing this ETL execution file on the data in Table B is the data in Table C.

表Cでは、表Bと比較して、2行目及び5行目から、<LF>という不正な改行コードが取り除かれていることがわかる。このような不正な改行コードの混入は、デバイス内でデータを生成する際のソフトウェアバグや、デバイスとデータ収集サーバ103とのOSの不一致などにより発生する。不正な改行コードが混入した場合に、例えば分析端末107やデータ利用サーバ群106でデータを分析しようとした際に、データを正しく読み込めない事象が発生する。ETL管理サーバ101によってこのような不正な改行コードを取り除くことで、分析端末107やデータ利用サーバ群106でデータを正しく読み込むことが可能となる。   In Table C, it can be seen that an incorrect line feed code <LF> has been removed from the second and fifth lines compared to Table B. Such an incorrect line feed code is mixed due to a software bug when data is generated in the device, an OS mismatch between the device and the data collection server 103, or the like. When an illegal line feed code is mixed, for example, when data is analyzed by the analysis terminal 107 or the data use server group 106, an event in which the data cannot be read correctly occurs. By removing such an illegal line feed code by the ETL management server 101, the analysis terminal 107 and the data use server group 106 can correctly read the data.

ここで、表Cの5行目には、<CR>という改行コードが取り除かれていないことが分かる。これは、ETL実行ファイルである/var/etl/transform_rcd.jarの実装時には、<CR>という改行コードがデータに含まれるという想定がなかったために、上述したETLでは取り除かれずに残ってしまった改行コードである。このような場合には、ETL実行ファイルを新規に実装し、ルールを追加する必要がある。表Aの3行目が追加されたルールを表している。3行目のルールのETL実行ファイル/var/etl/transform_rcd2.jarによるETL処理では、<CR>という改行コードについても削除することが可能である。ここで、ETL管理サーバ101でのプライマリデータは、3行目のルールによってETLを実行したデータとすればよい。
Here, it can be seen that the line feed code <CR> is not removed in the fifth line of Table C. This is the ETL executable file / var / etl / transform_rcd. When the jar is implemented, since there is no assumption that the line feed code <CR> is included in the data, the line feed code remains without being removed by the ETL described above. In such a case, it is necessary to newly install an ETL executable file and add rules. The rule in which the third row of Table A is added is shown. ETL execution file of the rule on the third line / var / etl / transform_rcd2. In the ETL process by jar, it is possible to delete a line feed code <CR>. Here, the primary data in the ETL management server 101 may be data obtained by executing ETL according to the rule in the third row.

表Dは、データ収集サーバ103が業務サーバ群104から収集したデバイス内環境データの例である。本実施形態においては、表Dで表わされるデータは、データ蓄積サーバ102に、/data/device/DEVICE_ENVIRONMENT_*.csvで示されるパスに保存される。   Table D is an example of in-device environment data collected from the business server group 104 by the data collection server 103. In the present embodiment, the data represented in Table D is sent to the data storage server 102 as / data / device / DEVICE_ENVIRONMENT_ *. It is stored in the path indicated by csv.

国コード列は、業務サーバ群104と接続されているデバイスが稼働している国を表わすコードである。データ生成日時分列は、機内温度、機内湿度、及び定着ローラ表面温度を測定し、記録した日時分のことである。データ送信日時分列は、デバイスがデバイス内環境データを業務サーバ群104に送信した日時分のことである。機種列は、デバイスの機種を識別するためのコードである。機番列は、デバイスのID(識別子)である。機内温度列は、デバイスの内部の温度である。機内湿度列は、デバイスの内部の湿度である。定着ローラ表面温度列は、デバイス内の定着ローラの表面温度のことである。   The country code string is a code representing the country in which the device connected to the business server group 104 is operating. The data generation date / time column is the date / time when the in-machine temperature, the in-machine humidity, and the fixing roller surface temperature are measured and recorded. The data transmission date and time column is the date and time when the device transmitted the in-device environment data to the business server group 104. The model column is a code for identifying the model of the device. The machine number column is an ID (identifier) of the device. The in-machine temperature column is the temperature inside the device. The in-machine humidity column is the humidity inside the device. The fixing roller surface temperature column is a surface temperature of the fixing roller in the device.

上記のデバイス内環境データにおいて、2行目及び6行目の定着ローラ表面温度列の値が異常に高温となっている。これは、デバイス内の温度計測機器が故障しており、サービスマンにパーツ交換が施されていないために不正なデータとなっている一例である。ETL管理サーバ101は、この不正なデータをすべてnull値に変換するというETLを実行する。
In the in-device environment data, the values of the fixing roller surface temperature columns in the second and sixth rows are abnormally high. This is an example in which the temperature measurement device in the device is out of order and the data is not correct because no parts have been exchanged by the service person. The ETL management server 101 executes an ETL that converts all the invalid data into null values.

表Eは、ETL管理サーバ101がETLを実行した結果のデバイス内環境データの例である。表Eでは、表Dと比較して、2行目及び7行目の機内温度、機内湿度、及び定着ローラ表面温度の各列のデータがnull値となっていることがわかる。表Dのような異常な値がデータに混入している場合に、データ利用サーバ群106及び分析端末107での分析の際に正しい分析結果を得ることができない。例えば、統計分析による外れ値検出を行うことができない。そのため、ETL管理サーバ101によるETLによってあらかじめnull値としておくことによって、データ利用サーバ群106及び分析端末107での分析対象から除外することができ、分析結果の精度向上が期待できる。
以上が、図5に示すデータ格納部501に格納されるデータの例である。
Table E is an example of in-device environment data as a result of the ETL management server 101 executing ETL. In Table E, it can be seen that the data in each column of the in-machine temperature, the in-machine humidity, and the fixing roller surface temperature in the second and seventh rows are null values as compared with Table D. When an abnormal value as shown in Table D is mixed in the data, a correct analysis result cannot be obtained at the time of analysis by the data use server group 106 and the analysis terminal 107. For example, outlier detection by statistical analysis cannot be performed. Therefore, by setting the null value in advance by the ETL by the ETL management server 101, it can be excluded from the analysis target in the data use server group 106 and the analysis terminal 107, and improvement in accuracy of the analysis result can be expected.
The above is an example of data stored in the data storage unit 501 shown in FIG.

図4のデータ蓄積サーバ102の説明に戻る。データ転送部502は、ETL管理サーバ101からのデータの入出力要求、及びデータ収集サーバ103からのデータ入力要求に応じて、データ格納部501に格納されたデータを転送する。また、データ利用サーバ群106及び分析端末107等の分析を行う分析システムからのデータ出力要求に応じて、データ格納部501に格納されたデータを提供する。データ転送のプロトコルは、例えばHTTPやFTP、データベース接続などであるが、これに限定されない。   Returning to the description of the data storage server 102 in FIG. The data transfer unit 502 transfers the data stored in the data storage unit 501 in response to a data input / output request from the ETL management server 101 and a data input request from the data collection server 103. Further, the data stored in the data storage unit 501 is provided in response to a data output request from an analysis system that performs analysis such as the data use server group 106 and the analysis terminal 107. The data transfer protocol is, for example, HTTP, FTP, database connection, or the like, but is not limited thereto.

図5は、データ収集サーバ103の提供する機能モジュールを説明するためのソフトウェアブロック図である。
制御部401は、定期的に収集ルール管理部404を確認し、収集すべきデータが存在するか否かを確認する。収集すべきデータが存在していた場合には、業務サーバ群104からデータを収集し、データ蓄積サーバ102に格納する。
FIG. 5 is a software block diagram for explaining functional modules provided by the data collection server 103.
The control unit 401 periodically checks the collection rule management unit 404 to check whether there is data to be collected. If there is data to be collected, the data is collected from the business server group 104 and stored in the data storage server 102.

データ収集部402は、業務サーバ群104からデータを取得する。データの取得に用いるプロトコルは、業務サーバ群104の提供するプロトコルに従う。データ格納部403は、データ収集部402によって取得したデータを、データ蓄積サーバ102に格納する。データ格納部403がデータを格納するためのプロトコルは、データ蓄積サーバ102に従う。収集ルール管理部404は、業務サーバ群104からデータを収集するための収集ルールを管理するデータベースである。ここで、表Fを用いて収集ルールについて説明する。
The data collection unit 402 acquires data from the business server group 104. The protocol used for data acquisition follows the protocol provided by the business server group 104. The data storage unit 403 stores the data acquired by the data collection unit 402 in the data storage server 102. The protocol for storing data in the data storage unit 403 follows the data storage server 102. The collection rule management unit 404 is a database that manages collection rules for collecting data from the business server group 104. Here, the collection rule will be described using Table F.

スケジュール列は、データ収集を実行するスケジュールを表している。例えば、表Fにおいて、Per Dayと示されているものは、毎日データを収集するスケジュールである。また、Per 3hourと示されているものは、3時間ごとにデータを収集するスケジュールである。業務サーバ群104がデータを提供する頻度、スケジュールに応じてデータを収集することが望ましい。
取得先列は、データ取得先の業務サーバ群104のエンドポイントを示している。1行目は、HTTPによる取得先を例示し、2行目は、FTPによる取得先を例示している。
The schedule column represents a schedule for executing data collection. For example, in Table F, what is indicated as Per Day is a schedule for collecting data every day. Also, what is indicated as Per 3hour is a schedule for collecting data every 3 hours. It is desirable to collect data according to the frequency and schedule at which the business server group 104 provides data.
The acquisition destination column indicates the end point of the business server group 104 that is the data acquisition destination. The first line exemplifies the acquisition source by HTTP, and the second line exemplifies the acquisition destination by FTP.

蓄積パスルール列は、データ蓄積サーバ102への格納先のパスを示している。データの格納時は、*で示される箇所には取得時の日時を文字列として挿入することが望ましい。例えば、1行目に示される収集ルールにより、2014年9月30日に取得したデータは、/data/device/DEVICE_ALARM_20140930.csvというパスに保存される。
プロトコル列は、データ収集部402が業務サーバ群104からのデータを収集する際に用いるプロトコルを示している。このように、プロトコルを切り替えることによって、多様な業務サーバ群104からデータを取得することができる。
The accumulation path rule column indicates a storage destination path to the data accumulation server 102. When storing data, it is desirable to insert the date and time of acquisition as a character string at the location indicated by *. For example, according to the collection rule shown in the first row, data acquired on September 30, 2014 is / data / device / DEVICE_ALARM_20140930. It is stored in a path called csv.
The protocol column indicates a protocol used when the data collection unit 402 collects data from the business server group 104. In this way, data can be acquired from various business server groups 104 by switching protocols.

次に、ETL管理サーバ101によるETLの実行について、図8のフローチャート図を用いて説明する。
ETL管理サーバ101の制御部301は、定期的にステップS801〜ステップS806までの処理を呼び出す。その周期は限定しないが、本実施形態では数分程度である。
Next, ETL execution by the ETL management server 101 will be described with reference to the flowchart of FIG.
The control unit 301 of the ETL management server 101 periodically calls up the processing from step S801 to step S806. Although the period is not limited, it is about several minutes in this embodiment.

ステップS801で、ETL管理サーバ101の制御部301は、ルール管理部302に問い合わせてルールを参照する。
ステップS802で、ETL管理サーバ101の制御部301は、スケジュールに合致するルールについて、ステップS803〜ステップS805の処理を適用する。例えば、表Aにおいて、スケジュール列にPer Dayと記載されているルールであれば、前回のETL実行時から1日以上経過していた場合にスケジュールに合致するものとする。スケジュールの合致の判定は、独自の機能として実装してもよいし、Linux(登録商標)でのCrontab機能や、Windows(登録商標)でのタスクスケジューラ機能を利用してもよい。
In step S801, the control unit 301 of the ETL management server 101 refers to the rule by inquiring of the rule management unit 302.
In step S802, the control unit 301 of the ETL management server 101 applies the processing in steps S803 to S805 to the rule that matches the schedule. For example, in Table A, if the rule is described as Per Day in the schedule column, it is assumed that the rule matches the schedule when one or more days have passed since the previous ETL execution. The determination of schedule match may be implemented as an original function, or a Crontab function in Linux (registered trademark) or a task scheduler function in Windows (registered trademark) may be used.

ステップS803で、ETL管理サーバ101の制御部301は、データ蓄積サーバ102に問い合わせて、ETL実行前の入力データを取得する。
ステップS804で、ETL管理サーバ101の制御部301は、ETL実行部307を呼び出す。ETL実行部307は、実行ファイル格納部306に格納されているETL実行ファイルを取得し、入力データに対してETLを実行する。ここで、ETL実行ファイルは、実行ファイル格納部306上で、表AのETL実行ファイルパス列に記載のパスに格納されている。
In step S803, the control unit 301 of the ETL management server 101 inquires of the data storage server 102 and acquires input data before ETL execution.
In step S804, the control unit 301 of the ETL management server 101 calls the ETL execution unit 307. The ETL execution unit 307 acquires the ETL execution file stored in the execution file storage unit 306 and executes ETL on the input data. Here, the ETL execution file is stored in the path described in the ETL execution file path column of Table A on the execution file storage unit 306.

ステップS805で、ETL管理サーバ101の制御部301は、ETLを実行した出力データを、データ蓄積サーバ102に転送する。データ蓄積サーバ102は、出力データを受け取り、データ格納部501に保存する。このとき、データ格納部501内での保存先は、表Aの出力パスルール列に従う。   In step S <b> 805, the control unit 301 of the ETL management server 101 transfers the output data obtained by executing the ETL to the data storage server 102. The data storage server 102 receives the output data and stores it in the data storage unit 501. At this time, the storage destination in the data storage unit 501 follows the output path rule string in Table A.

以上説明したように、ETL管理サーバ101は、ルール管理部302に保存されたルールに従って定期的にETLを実行することで、継続的にデータ収集サーバ103が取得するデータに対してETLを実行することができる。   As described above, the ETL management server 101 continuously executes ETL on data acquired by the data collection server 103 by periodically executing ETL according to the rules stored in the rule management unit 302. be able to.

次に、管理端末105のユーザが、ETL管理サーバ101のルール管理部302が提供する一覧画面600で反映ボタン603を押下した際の処理について、図9のフローチャートを用いて説明する。なお、新規追加画面700におけるOKボタン703を押下した際も同様の処理が適用される。   Next, processing when the user of the management terminal 105 presses the reflection button 603 on the list screen 600 provided by the rule management unit 302 of the ETL management server 101 will be described with reference to the flowchart of FIG. Note that the same processing is applied when the OK button 703 on the new addition screen 700 is pressed.

ステップS901で、ETL管理サーバ101の制御部301は、ルール管理部302に新規登録、または変更されたルールを登録する。
ステップS902で、ETL管理サーバ101のルール管理部302は、新規登録、または変更されたルールがプライマリ指定されているか否かを判定する。プライマリ指定されていた場合は、ステップS903へ処理を分岐する。プライマリ指定されていなかった場合は、本フローチャートの処理を終了する。
ステップS903で、ETL管理サーバ101の制御部301は、過去にデータ蓄積サーバ102に蓄積された入力データのうち、表Aの入力パスルールに合致するすべてのデータを取得する。そして、ETL管理サーバ101の制御部301は、ETL実行部307を呼び出す。ETL実行部307は、ステップS903で取得したすべての入力データに対して、実行ファイル格納部306から取得したETL実行ファイルを実行する。
ステップS904で、ETL管理サーバ101の制御部301は、ステップS903でETLを実行したすべての出力データを、データ蓄積サーバ102に転送する。データ蓄積サーバ102は、出力データを受け取り、データ格納部501に保存する。このとき、保存先は表Aの出力パスルールに従う。
In step S <b> 901, the control unit 301 of the ETL management server 101 registers a newly registered or changed rule in the rule management unit 302.
In step S902, the rule management unit 302 of the ETL management server 101 determines whether a newly registered or changed rule is designated primary. If the primary is designated, the process branches to step S903. If the primary is not designated, the process of this flowchart is terminated.
In step S903, the control unit 301 of the ETL management server 101 acquires all data that matches the input path rule of Table A among the input data stored in the data storage server 102 in the past. Then, the control unit 301 of the ETL management server 101 calls the ETL execution unit 307. The ETL execution unit 307 executes the ETL execution file acquired from the execution file storage unit 306 with respect to all the input data acquired in step S903.
In step S <b> 904, the control unit 301 of the ETL management server 101 transfers all output data for which ETL has been executed in step S <b> 903 to the data storage server 102. The data storage server 102 receives the output data and stores it in the data storage unit 501. At this time, the storage destination follows the output path rule of Table A.

なお、新規登録、または変更されたルールがプライマリ指定されていた場合に、ステップS903において取得する入力データが、その他のルールを実行した結果であった場合には、その関連するルールについてもステップS903〜S904を実行してもよい。例えば、表Aにおいて、5行目のルールがプライマリ指定されており、5行目の入力パスルールは4行目の出力パスルールと一致している。このような場合に、4行目のルールがプライマリ指定されていなくても、過去に蓄積されたデータに対して4行目のルールを実行するようにしてもよい。   When a newly registered or changed rule is designated as primary, if the input data acquired in step S903 is the result of executing another rule, the related rule is also set in step S903. -S904 may be executed. For example, in Table A, the rule on the 5th row is designated primary, and the input path rule on the 5th row matches the output path rule on the 4th row. In such a case, even if the fourth row rule is not designated as primary, the fourth row rule may be executed on data accumulated in the past.

以上説明したように、図9の処理により、ユーザが管理端末105を介してルールを追加する際に、追加するルールがプライマリ指定したルールであった場合には、過去に蓄積されたすべてのデータに対して自動的にETLを実行することができる。例えば、既にルール管理部302に管理されている第1のルールに関連する第2のルールを新たに追加した場合に、第2のルールが追加される前に、第1のルールに従って加工が行われた入力データに対しても、第2のルールに従う加工を行うことができる。これにより、2つの関連するルールを同一の期間の入力データに対して実行することができるため、常に信頼度の高い、有用なデータを提供すること可能となる。従来の技術では、手動でETLを実行し、その結果データを管理する必要があったが、本実施形態によりその管理の手間を削減することができる。   As described above, when the user adds a rule via the management terminal 105 by the process of FIG. 9, if the rule to be added is a rule designated primary, all the data accumulated in the past ETL can be automatically executed for For example, when a second rule related to the first rule already managed by the rule management unit 302 is newly added, the processing is performed according to the first rule before the second rule is added. Processing according to the second rule can also be performed on the input data. As a result, two related rules can be executed on input data in the same period, so that it is possible to always provide highly reliable and useful data. In the conventional technique, it is necessary to manually execute the ETL and manage the data as a result, but this embodiment can reduce the management effort.

次に、プライマリ指定されなかった出力データ(非プライマリデータ)に関して、一定期間経過後に削除する処理について、図10のフローチャートを用いて説明する。
ETL管理サーバ101の制御部301は、定期的にステップS1001〜ステップS1006までの処理を呼び出す。その周期は限定しないが、本実施形態では数分程度である。
Next, processing for deleting output data (non-primary data) not designated as primary after a predetermined period will be described with reference to the flowchart of FIG.
The control unit 301 of the ETL management server 101 periodically calls up the processing from step S1001 to step S1006. Although the period is not limited, it is about several minutes in this embodiment.

ステップS1001で、ETL管理サーバ101の制御部301は、データ蓄積サーバ102に蓄積されたETLを実行した結果の出力データすべてに対してステップS1002〜ステップS1005の処理を繰り返す。
ステップS1002で、ETL管理サーバ101の制御部301は、出力データの生成日時を参照する。出力データの生成日時は、出力データのファイルのプロパティを参照することで取得できる。
ステップS1003で、ETL管理サーバ101の制御部301は、出力データを生成するためのルールを、ルール管理部302に問い合わせてルールを参照することで取得する。例えば、出力データが出力パスルール/data/device/etl/DEVICE_ALARM_ETL_TRANSFORM_RCD_2_*.csvに合致する場合には、表Aの3行目のルールによって生成された出力データであることがわかる。
ステップS1004で、ETL管理サーバ101の制御部301は、出力データが削除対象であるか否かを判定する。削除対象となるのは、ステップS1002で取得した生成日時が一定期間以上過去であり、ステップS1003で取得したルールで、プライマリ指定されていないものである。ここで、一定期間以上過去であるとは、例えば1か月程度の期間を想定しているがこれに限定されず、所定の時間に設定すればよい。削除対象となる期間は、データを利用する分析端末107や、データ利用サーバ群106の取得頻度に応じてあらかじめ設定されることが望ましい。削除対象であった場合にはステップS1005へ処理は進み、削除対象でなかった場合にはステップS1006へ処理を分岐させる。
ステップS1006で、ETL管理サーバ101の制御部301は、削除対象となった出力データのファイルを削除する。
In step S <b> 1001, the control unit 301 of the ETL management server 101 repeats the processing of steps S <b> 1002 to S <b> 1005 for all output data as a result of executing the ETL stored in the data storage server 102.
In step S1002, the control unit 301 of the ETL management server 101 refers to the generation date and time of output data. The generation date and time of output data can be obtained by referring to the properties of the output data file.
In step S1003, the control unit 301 of the ETL management server 101 obtains a rule for generating output data by referring to the rule management unit 302 and referring to the rule. For example, if the output data is output path rule / data / device / etl / DEVICE_ALARM_ETL_TRANSFORM_RCD_2_ *. If it matches csv, it is found that the output data is generated by the rule in the third row of Table A.
In step S1004, the control unit 301 of the ETL management server 101 determines whether the output data is a deletion target. What is to be deleted is that the generation date and time acquired in step S1002 is in the past for a certain period and the rule acquired in step S1003 is not designated as primary. Here, for example, a period of about one month is assumed as being past for a certain period or longer, but the present invention is not limited to this, and may be set to a predetermined time. The period to be deleted is preferably set in advance according to the acquisition frequency of the analysis terminal 107 that uses data and the data use server group 106. If it is a deletion target, the process proceeds to step S1005. If it is not a deletion target, the process branches to step S1006.
In step S1006, the control unit 301 of the ETL management server 101 deletes the output data file to be deleted.

以上説明したように、図10の処理により、プライマリ指定されていないデータに関しては、ETL管理サーバ101が一定期間経過後に自動的に削除する。分析端末107や、データ利用サーバ群106のユーザは、プライマリ指定されていないデータも引き続き利用する必要があるが、プライマリデータではないので永続的に保持する必要がないためである。上記により、プライマリデータは、常に取得できるようにしつつ、既存のユーザやシステムに影響を与えずに、かつデータ蓄積容量を削減することが可能である。   As described above, the ETL management server 101 automatically deletes data that is not designated as primary by the processing of FIG. This is because the analysis terminal 107 and the user of the data use server group 106 need to continue to use data that is not designated as primary, but it is not primary data and does not need to be retained permanently. As described above, it is possible to reduce the data storage capacity without affecting the existing user or system while allowing the primary data to be always acquired.

以上のように、本実施形態によれば、ETLを実行するためのルール追加時に、管理者が手動でETLを実行する必要がなく、常に信頼度の高いETL実行結果の出力データを提供することができる。   As described above, according to the present embodiment, when adding a rule for executing an ETL, the administrator does not need to manually execute the ETL, and always provides output data of a highly reliable ETL execution result. Can do.

(第2実施形態)
次に、本発明の第2実施形態に係る情報処理システムについて説明する。第1実施形態では、ETLのルール追加時に、自動的に過去に蓄積されたデータに対してETLを実行することが可能である。本実施形態では、第1実施形態で実行される処理を管理者の所望の台数のサーバにおいて実行する方法について説明する。なお、第1実施形態と同一の構成のものには同一の符号を付し、説明を省略する。
(Second Embodiment)
Next, an information processing system according to the second embodiment of the present invention will be described. In the first embodiment, when an ETL rule is added, it is possible to automatically execute ETL on data accumulated in the past. In the present embodiment, a method for executing the processing executed in the first embodiment on the number of servers desired by the administrator will be described. In addition, the same code | symbol is attached | subjected to the thing of the structure same as 1st Embodiment, and description is abbreviate | omitted.

図11は、本実施形態に係るシステム構成を示す図である。
ETL実行サーバ群108は、ETLを実行するためのサーバ群である。ETL管理サーバ101は、ルール追加時に実行される過去にデータ蓄積サーバ102に蓄積された入力データに対するETLを、ETL実行サーバ群108に指示することにより短時間で実行することが可能となる。過去に蓄積されたアプリケーションログや、デバイスのデータは、非常に大規模になるため、このように過去に蓄積されたデータに対するETLは複数のサーバで実行することが望ましい。
FIG. 11 is a diagram showing a system configuration according to the present embodiment.
The ETL execution server group 108 is a server group for executing ETL. The ETL management server 101 can execute the ETL for the input data stored in the data storage server 102 in the past executed at the time of adding the rule to the ETL execution server group 108 in a short time. Since application logs and device data accumulated in the past are very large, it is desirable to execute ETL for data accumulated in the past in a plurality of servers.

図12は、管理者がETLを実行するサーバ数を設定するサーバ数指定画面1200を示す図である。
サーバ数指定画面1200は、ETL管理サーバ101のルール管理部302が提供する一覧画面600で管理者が反映ボタン603を押下した際、または、新規追加画面700でOKボタン703を押下した際に表示される。
FIG. 12 is a diagram showing a server number designation screen 1200 on which the administrator sets the number of servers that execute ETL.
The server number designation screen 1200 is displayed when the administrator presses the reflection button 603 on the list screen 600 provided by the rule management unit 302 of the ETL management server 101 or when the OK button 703 is pressed on the new addition screen 700. Is done.

サーバ数入力欄1201は、管理者がETLを実行するための所望のサーバ数を指定するための入力欄である。管理者は、追加したETLのルールに基づいて出力されるデータを利用する開始期限と、サーバを複数台起動するコストとを勘案してサーバ数を指定する。
OKボタン1202は、過去に蓄積されたデータに対してETLを開始するためのボタンである。管理者がOKボタン1202を押下すると、図9のフローチャートで示したETLが開始される。
The server number input field 1201 is an input field for the administrator to specify a desired number of servers for executing ETL. The administrator designates the number of servers in consideration of the start deadline for using data output based on the added ETL rule and the cost of starting a plurality of servers.
An OK button 1202 is a button for starting ETL for data accumulated in the past. When the administrator presses the OK button 1202, the ETL shown in the flowchart of FIG. 9 is started.

以上のように、本実施形態によれば、管理者の指定したサーバ数で過去に蓄積されたデータに対するETLを実行することが可能となり、短時間でETLの実行を完了させることができる。   As described above, according to the present embodiment, it is possible to execute ETL on data accumulated in the past with the number of servers designated by the administrator, and execution of ETL can be completed in a short time.

次に、本発明の第3実施形態に係るシステムについて説明する。第2実施形態では、管理者の所望の台数のサーバにおいて、過去に蓄積されたデータに対するETLを実行することが可能である。これに対して、本実施形態では、過去に蓄積されたデータに対してETLを実行する際に、管理者がETLを完了させるまでの期限を入力することで、自動的にETL実行サーバ数を算出し、ETLを実行する方法について説明する。なお、第1及び第2実施形態と同一の構成のものには同一の符号を付し、説明を省略する。   Next, a system according to a third embodiment of the present invention will be described. In the second embodiment, it is possible to execute ETL on data accumulated in the past in the server of the number of managers desired. On the other hand, in this embodiment, when executing ETL on data accumulated in the past, the administrator inputs the time limit until ETL is completed, so that the number of ETL execution servers is automatically set. A method for calculating and executing ETL will be described. In addition, the same code | symbol is attached | subjected to the thing of the same structure as 1st and 2nd embodiment, and description is abbreviate | omitted.

図13は、管理者がETLを終了させるまでの期限を設定するETL期限指定画面1300を示す図である。
ETL期限指定画面1300は、ETL管理サーバ101のルール管理部302が提供する一覧画面600で管理者が反映ボタン603を押下した際、または、新規追加画面700でOKボタン703を押下した際に表示される。
期限入力欄1301は、管理者がETLの実行を終了させるまでの期限を指定するための入力欄である。管理者は、追加したETLのルールに基づいて出力されるデータを利用する開始期限に応じて期限を入力することができる。
算出結果1302は、管理者が期限入力欄1301で指定した期限までにETLを完了させるために必要なサーバ数を表示する画面である。
OKボタン1303は、過去に蓄積されたデータに対してETLを開始するためのボタンである。管理者がOKボタン1303を押下すると、図9のフローチャートで示したETLを、算出したサーバ数で開始する。
ETL実行に要する時間は、ETL実行ファイルの処理内容によって異なる。従って、ETLを完了させるために必要なサーバ数も、ETL実行ファイルの処理内容によって異なる。ここで、サーバ数の算出方法について以下で説明する。
FIG. 13 is a diagram showing an ETL time limit designation screen 1300 for setting a time limit until the administrator ends the ETL.
The ETL deadline designation screen 1300 is displayed when the administrator presses the reflection button 603 on the list screen 600 provided by the rule management unit 302 of the ETL management server 101 or when the OK button 703 is pressed on the new addition screen 700. Is done.
The time limit input field 1301 is an input field for designating a time limit until the administrator finishes the ETL execution. The administrator can input the time limit according to the start time limit for using the data output based on the added ETL rule.
The calculation result 1302 is a screen that displays the number of servers necessary for completing the ETL by the time limit specified by the administrator in the time limit input field 1301.
An OK button 1303 is a button for starting ETL for data accumulated in the past. When the administrator presses an OK button 1303, the ETL shown in the flowchart of FIG. 9 is started with the calculated number of servers.
The time required for ETL execution varies depending on the processing contents of the ETL execution file. Therefore, the number of servers required to complete the ETL also differs depending on the processing content of the ETL executable file. Here, a method for calculating the number of servers will be described below.

図14は、指定された期限までにETLの実行を完了させるために必要なサーバ数を算出する処理を説明するフローチャートである。
ステップS1401で、ETL管理サーバ101のルール管理部302は、追加されるルールを参照する。
ステップS1402で、ETL管理サーバ101のルール管理部302は、ステップS1401で参照したルールの、入力パスルールをもとに試行データを取得する。試行データとは、ETLの実行に要するサーバ数を算出するために、ETL実行時間を計測するための入力データである。入力パスルールに指定されているデータであれば、任意のデータを試行データとして取得できる。
ステップS1403で、ETL管理サーバ101のルール管理部302は、ETL実行部307を呼び出して試行データに対してETLを実行する。
ステップS1404で、ETL管理サーバ101のルール管理部302は、ステップS1403におけるETL実行に要した時間と、試行データのデータ量から、1MBあたりのETL実行時間を算出する。
ステップS1405で、ETL管理サーバ101のルール管理部302は、データ読込部303を呼び出して、データ蓄積サーバ102に過去に蓄積されたETL対象のデータのデータ量を取得する。
ステップS1406で、ステップS1404において算出した1MBあたりのETL実行時間と、ステップS1405で取得したETL対象のデータのデータ量をもとに、ETL実行に必要なサーバ数を算出する。ETLは、各行のETLを単純に別々のサーバで処理すればよいので、必要なサーバ数は、1MBあたりのETL実行時間から容易に算出できる。例えば、1MBあたりのETL実行時間が0.2秒で、ETL対象のデータのデータ量が100GBであった場合には、1台で実行した場合の実行時間は、0.2*100,000=10,000秒である。ユーザが1時間(3600秒)以内にETLを完了させたい場合には、10,000/3600=2.78となるので、サーバ数は3台となる。
FIG. 14 is a flowchart for explaining processing for calculating the number of servers necessary for completing the execution of the ETL by the designated time limit.
In step S1401, the rule management unit 302 of the ETL management server 101 refers to the added rule.
In step S1402, the rule management unit 302 of the ETL management server 101 acquires trial data based on the input path rule of the rule referenced in step S1401. The trial data is input data for measuring the ETL execution time in order to calculate the number of servers required for ETL execution. Arbitrary data can be acquired as trial data as long as the data is specified in the input path rule.
In step S1403, the rule management unit 302 of the ETL management server 101 calls the ETL execution unit 307 to execute ETL on the trial data.
In step S1404, the rule management unit 302 of the ETL management server 101 calculates an ETL execution time per MB from the time required for ETL execution in step S1403 and the amount of trial data.
In step S <b> 1405, the rule management unit 302 of the ETL management server 101 calls the data reading unit 303 to acquire the data amount of the ETL target data stored in the data storage server 102 in the past.
In step S1406, the number of servers required for ETL execution is calculated based on the ETL execution time per MB calculated in step S1404 and the data amount of the ETL target data acquired in step S1405. Since the ETL only needs to process the ETL for each row by a separate server, the required number of servers can be easily calculated from the ETL execution time per 1 MB. For example, if the ETL execution time per MB is 0.2 seconds and the data amount of the ETL target data is 100 GB, the execution time when executed by one unit is 0.2 * 100,000 = 10,000 seconds. If the user wants to complete the ETL within one hour (3600 seconds), 10,000 / 3600 = 2.78, so the number of servers is three.

以上のように、本実施形態によれば、試行データに対するETL実行時間を算出することにより、管理者が指定した期限までにETLを完了させ、取得することができる。   As described above, according to the present embodiment, by calculating the ETL execution time for the trial data, the ETL can be completed and acquired by the time limit specified by the administrator.

(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
(Other embodiments)
The present invention supplies a program that realizes one or more functions of the above-described embodiments to a system or apparatus via a network or a storage medium, and one or more processors in a computer of the system or apparatus read and execute the program This process can be realized. It can also be realized by a circuit (for example, ASIC) that realizes one or more functions.

以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形および変更が可能である。   As mentioned above, although preferable embodiment of this invention was described, this invention is not limited to these embodiment, A various deformation | transformation and change are possible within the range of the summary.

Claims (9)

ネットワークを介して収集した複数のネットワークデバイスのデータを記憶する第1記憶手段と、
前記第1記憶手段で記憶されたデータに対して、分析に適したデータとするための加工を行う際の複数のルールを管理する管理手段と、
前記第1記憶手段で記憶されたデータに対して、前記管理されたルールに従う加工を行う加工手段と、
加工済みのデータを記憶する第2の記憶手段と、
前記第2の記憶手段に記憶された加工済みのデータを、分析を行う分析システムに提供する提供手段と、を有し、
前記加工手段は、前記管理手段で管理されている第1のルールに関連する第2のルールが追加された場合に、前記第1のルール及び第2のルールのそれぞれに従う加工を行い、
さらに、前記第2のルールが追加される前に前記第1のルールに従い加工が行われた前記第1記憶手段で記憶されたデータに対しても、前記第2のルールに従う加工を行うことを特徴とする情報処理システム。
First storage means for storing data of a plurality of network devices collected via a network;
Management means for managing a plurality of rules when processing the data stored in the first storage means to obtain data suitable for analysis;
Processing means for processing the data stored in the first storage means according to the managed rules;
Second storage means for storing processed data;
Providing means for providing processed data stored in the second storage means to an analysis system for performing analysis;
The processing means performs processing according to each of the first rule and the second rule when a second rule related to the first rule managed by the management means is added,
Furthermore, the processing according to the second rule is performed on the data stored in the first storage means that has been processed according to the first rule before the second rule is added. A featured information processing system.
前記加工手段が前記管理されたルールに従う加工を行うために使用するサーバの台数を設定する設定手段をさらに備えることを特徴とする請求項1に記載の情報処理システム。   The information processing system according to claim 1, further comprising a setting unit configured to set the number of servers used for the processing unit to perform processing according to the managed rule. 前記設定手段は、前記管理されたルールに従う加工が終了する期限および該加工を行うデータのデータ量に基づき、前記サーバの台数を算出することを特徴とする請求項2に記載の情報処理システム。   The information processing system according to claim 2, wherein the setting unit calculates the number of the servers based on a time limit for finishing the processing according to the managed rule and a data amount of data to be processed. 前記設定手段は、前記管理されたルールに従う加工を行うために使用するサーバの台数または、該加工が終了する期限を設定するための画面を表示することを特徴とする請求項3に記載の情報処理システム。   The information according to claim 3, wherein the setting unit displays a screen for setting the number of servers used for performing processing according to the managed rule or a time limit for finishing the processing. Processing system. 前記管理手段は、管理するルール毎に該ルールに従う加工を行うスケジュールを管理し、
前記加工手段は、前記スケジュールに基づいて前記ルールに従う加工を行う、ことを特徴とする請求項1ないし4のいずれか1項に記載の情報処理システム。
The management means manages a schedule for processing according to the rule for each rule to be managed,
The information processing system according to claim 1, wherein the processing unit performs processing according to the rule based on the schedule.
前記管理手段は、前記管理されたルールの変更、または新たに管理するルールの追加を行うための画面を表示することを特徴とする請求項1ないし5のいずれか1項に記載の情報処理システム。   The information processing system according to claim 1, wherein the management unit displays a screen for changing the managed rule or adding a newly managed rule. . 前記管理手段は、前記管理手段が表示する画面での操作に従って前記変更または追加を行う前に、前記管理されたルールに従う加工が行われたデータに対しても、前記変更または追加を行ったルールに従う処理を行うか否かを設定することを特徴とする請求項6に記載の情報処理システム。   The management means, the rule that has made the change or addition to the data that has been processed according to the managed rules before making the change or addition according to the operation on the screen displayed by the management means 7. The information processing system according to claim 6, wherein whether or not to perform processing according to is set. 前記管理手段が表示する画面において、前記管理されたルールに従う加工が行われたデータに対して、前記変更または追加を行ったルールに従う処理を行わないことを設定した場合には、前記管理されたルールに従う加工が行われたデータを、所定の時間が経過した後に削除する削除手段を備えることを特徴とする請求項7に記載の情報処理システム。   In the screen displayed by the management means, if it is set not to perform the process according to the rule that has been changed or added to the data that has been processed according to the managed rule, the managed The information processing system according to claim 7, further comprising a deletion unit that deletes the data processed according to the rule after a predetermined time has elapsed. ネットワークを介して収集した複数のネットワークデバイスのデータを記憶する第1記憶工程と、
前記第1記憶工程において記憶されたデータに対して、分析に適したデータとするための加工を行う際の複数のルールを管理する管理工程と、
前記第1記憶工程において記憶されたデータに対して、前記管理されたルールに従う加工を行う加工工程と、
加工済みのデータを記憶する第2の記憶工程と、
前記第2の記憶工程において記憶された加工済みのデータを、分析を行う分析システムに提供する提供工程と、を有し、
前記加工工程において、前記管理工程で管理されている第1のルールに関連する第2のルールが追加された場合に、前記第1のルール及び第2のルールのそれぞれに従う加工を行い、
さらに、前記第2のルールが追加される前に前記第1のルールに従い加工が行われた前記第1記憶工程において記憶されたデータに対しても、前記第2のルールに従う加工を行うことを特徴とするシステムの制御方法。
A first storage step of storing data of a plurality of network devices collected via a network;
A management step for managing a plurality of rules when processing the data stored in the first storage step to obtain data suitable for analysis;
A processing step for performing processing according to the managed rule for the data stored in the first storage step;
A second storage step for storing processed data;
Providing the processed data stored in the second storage step to an analysis system for performing analysis,
In the processing step, when a second rule related to the first rule managed in the management step is added, processing according to each of the first rule and the second rule,
Furthermore, the processing according to the second rule is also performed on the data stored in the first storage step that has been processed according to the first rule before the second rule is added. A control method of the system.
JP2014227494A 2014-11-07 2014-11-07 Information process system and control method Pending JP2016091429A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014227494A JP2016091429A (en) 2014-11-07 2014-11-07 Information process system and control method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014227494A JP2016091429A (en) 2014-11-07 2014-11-07 Information process system and control method

Publications (1)

Publication Number Publication Date
JP2016091429A true JP2016091429A (en) 2016-05-23

Family

ID=56017046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014227494A Pending JP2016091429A (en) 2014-11-07 2014-11-07 Information process system and control method

Country Status (1)

Country Link
JP (1) JP2016091429A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11663232B2 (en) 2018-09-06 2023-05-30 Omron Corporation Data processing apparatus, data processing method, and data processing program stored on computer-readable storage medium
JP2024510286A (en) * 2021-09-02 2024-03-06 エルジー エナジー ソリューション リミテッド Battery data management system and related method

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11663232B2 (en) 2018-09-06 2023-05-30 Omron Corporation Data processing apparatus, data processing method, and data processing program stored on computer-readable storage medium
JP2024510286A (en) * 2021-09-02 2024-03-06 エルジー エナジー ソリューション リミテッド Battery data management system and related method
JP7683028B2 (en) 2021-09-02 2025-05-26 エルジー エナジー ソリューション リミテッド Battery data management system and related methods

Similar Documents

Publication Publication Date Title
US9384115B2 (en) Determining and monitoring performance capabilities of a computer resource service
US20140036306A1 (en) Device management system, control method for device management system, and storage medium
US20060116981A1 (en) Method and system for automated data collection and analysis of a computer system
US12288061B2 (en) Application instrumentation and event tracking
US10884892B2 (en) Non-transitory computer-readable storage medium, display control method and display control device for observing anomolies within data
CN109672722B (en) Data deployment method and device, computer storage medium and electronic equipment
CN110955547B (en) Management method, system, equipment and readable storage medium for interface abnormal information
US9461884B2 (en) Information management device and computer-readable medium recorded therein information management program
US20220164703A1 (en) Model acceptance determination support system and model acceptance determination support method
JP2016091429A (en) Information process system and control method
JP4928480B2 (en) Job processing system and job management method
CN112383448B (en) Monitoring data processing method and device
JP6015750B2 (en) Log collection server, log collection system, and log collection method
JP6576160B2 (en) Management system, management system control method, and program
JP2016024486A (en) Data utilization system and control method therefor
JP2016177567A (en) Task management device, method and program
CN112035425A (en) Log storage method and device and computer system
JP5519436B2 (en) Information analysis apparatus, information analysis method, information analysis system and program for analyzing system stability
CN110955587A (en) A method and device for determining equipment to be replaced
CN107908629B (en) Information query method, terminal and equipment
JP2016051426A (en) Analysis system and control method of analysis system
JP2009181494A (en) Job processing system and job information acquisition method
JP6750270B2 (en) Information processing apparatus, information processing method, and program
US20160011916A1 (en) Computer, association calculation method, and storage medium
JP2016091317A (en) Data management system and data management method