[go: up one dir, main page]

WO2024189717A1 - Data shaping apparatus, data shaping system, user terminal apparatus, data shaping method, and data shaping program - Google Patents

Data shaping apparatus, data shaping system, user terminal apparatus, data shaping method, and data shaping program Download PDF

Info

Publication number
WO2024189717A1
WO2024189717A1 PCT/JP2023/009506 JP2023009506W WO2024189717A1 WO 2024189717 A1 WO2024189717 A1 WO 2024189717A1 JP 2023009506 W JP2023009506 W JP 2023009506W WO 2024189717 A1 WO2024189717 A1 WO 2024189717A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
child
shaping
semantic information
parent
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
PCT/JP2023/009506
Other languages
French (fr)
Japanese (ja)
Inventor
賢一 小泉
仁 平野
諭 志賀
史郎 古谷
洋平 川嵜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Mitsubishi Electric Building Solutions Corp
Original Assignee
Mitsubishi Electric Corp
Mitsubishi Electric Building Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp, Mitsubishi Electric Building Solutions Corp filed Critical Mitsubishi Electric Corp
Priority to PCT/JP2023/009506 priority Critical patent/WO2024189717A1/en
Publication of WO2024189717A1 publication Critical patent/WO2024189717A1/en
Anticipated expiration legal-status Critical
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors

Definitions

  • the present disclosure relates to a data shaping device, a data shaping system, a user terminal device, a data shaping method, and a data shaping program.
  • Patent Document 1 discloses a semantic inference system that infers the meaning of a column included in a table using a concept that represents the meaning of information.
  • the semantic inference system of Patent Document 1 selects candidate meanings for the column, and calculates a score indicating the similarity between the selected candidate meaning and the meaning of each column included in the table other than the column to be inferred.
  • the semantic inference system of Patent Document 1 uses the calculated score to identify the meaning of the column to be inferred from among the candidate meanings of the column.
  • Patent Document 1 if there is no information matching the contents of a column in a concept, a column name with low similarity to the contents of the column may be assigned, which poses the problem of not being able to correctly infer the meaning.
  • the purpose of this disclosure is to achieve accurate data formatting by providing a mechanism for registering parent data, which is a concept that expresses the meaning of information, for information that does not have a column name assigned to it.
  • the data shaping device is a data shaping device that shapes table data, a storage unit that stores semantic information used for shaping the table data, in which child data and parent data representing the meaning of the child data are associated with each other and registered; an analysis unit that uses the semantic information to determine whether or not field data to which a column name is not assigned among field data included in the setting data set in the table data is registered as child data in the semantic information; a detection unit that detects the field data to which a column name is not assigned as unformatted data if the field data to which a column name is not assigned is not registered in the semantic information as child data;
  • the data processing device further includes a registration unit that receives input of parent data when the unformatted data is treated as child data, and registers the received parent data in the semantic information as parent data of the unformatted data.
  • parent data which is a concept expressing meaning
  • child data which is field data to which no column name is assigned, in the semantic information used to shape table data. Therefore, the data shaping device according to the present disclosure has the effect of being able to appropriately enrich the semantic information and realize accurate data shaping.
  • FIG. 1 is a diagram showing an example of the overall configuration of a data shaping system according to a first embodiment.
  • 1 is a diagram showing an example of the configuration of a data shaping device according to a first embodiment
  • FIG. 2 is a diagram showing a configuration example of a user terminal device according to the first embodiment
  • 4 is a flow diagram showing the operation of the data shaping system according to the first embodiment.
  • 5A to 5C are schematic diagrams showing an example of data shaping processing according to the first embodiment
  • 7 is a schematic diagram showing another example of the data shaping process according to the first embodiment;
  • FIG. 4 is a diagram showing an example of a presentation screen according to the first embodiment.
  • FIG. 13 is a diagram showing an example of the configuration of a data shaping device according to a modified example of the first embodiment.
  • FIG. 11 is a flow diagram showing the operation of the data shaping system according to the second embodiment.
  • FIG. 11 is a schematic diagram showing a data shaping process according to the second embodiment.
  • FIG. 13 is a diagram
  • FIG. 1 is a diagram showing an example of the overall configuration of a data shaping system 500 according to the present embodiment.
  • FIG. 2 is a diagram showing an example of the configuration of the data shaping device 100 according to the present embodiment.
  • FIG. 3 is a diagram showing an example of a configuration of the user terminal device 200 according to the present embodiment.
  • the data shaping system 500 includes a data shaping device 100 and a user terminal device 200 .
  • the data shaping device 100 is a device that shapes the table data 51 .
  • the user terminal device 200 is a device used by a user.
  • the data formatting device 100 and the user terminal device 200 communicate with each other via a network.
  • the data shaping device 100 is a computer.
  • the data shaping device 100 includes a processor 910, as well as other hardware such as a memory 921, an auxiliary storage device 922, an input interface 930, an output interface 940, and a communication device 950.
  • the processor 910 is connected to the other hardware via signal lines and controls the other hardware.
  • the data shaping device 100 includes, as functional elements, an acquisition unit 110, an analysis unit 120, a shaping unit 130, a detection unit 140, a presentation unit 150, a registration unit 160, and a storage unit 170.
  • the storage unit 170 stores table data 51 and semantic information 52.
  • the user terminal device 200 is a computer.
  • the user terminal device 200 includes a processor 910, as well as other hardware such as a memory 921, an auxiliary storage device 922, an input interface 930, an output interface 940, and a communication device 950.
  • the processor 910 is connected to the other hardware via signal lines and controls the other hardware.
  • the user terminal device 200 has a screen display unit 210 and a memory unit 220 as functional elements.
  • each device of the data shaping system 500 may be referred to as each device of the data shaping system 500 .
  • the same reference numerals are used for the hardware of each device in the data shaping system 500.
  • each device in the data shaping system 500 has its own hardware.
  • the hardware will be described using the data shaping device 100 as an example.
  • the same description as for the data shaping device 100 can also be applied to the hardware of the user terminal device 200.
  • the functions of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 are realized by software.
  • the storage unit 170 is provided in the memory 921. Note that the storage unit 170 may be provided in the auxiliary storage device 922, or may be provided separately in the memory 921 and the auxiliary storage device 922.
  • the processor 910 is a device that executes a data shaping program.
  • the data shaping program is a program that realizes the functions of the acquisition unit 110, the analysis unit 120, the shaping unit 130, the detection unit 140, the presentation unit 150, and the registration unit 160.
  • the processor 910 is an IC that performs arithmetic processing. Specific examples of the processor 910 are a CPU, a DSP, and a GPU.
  • IC is an abbreviation for Integrated Circuit.
  • CPU is an abbreviation for Central Processing Unit.
  • DSP is an abbreviation for Digital Signal Processor.
  • GPU is an abbreviation for Graphics Processing Unit.
  • the memory 921 is a storage device that temporarily stores data. Specific examples of the memory 921 are SRAM and DRAM. SRAM is an abbreviation for Static Random Access Memory. DRAM is an abbreviation for Dynamic Random Access Memory.
  • the auxiliary storage device 922 is a storage device that stores data. A specific example of the auxiliary storage device 922 is a HDD.
  • the auxiliary storage device 922 may also be a portable storage medium such as an SD (registered trademark) memory card, a CF, a NAND flash, a flexible disk, an optical disk, a compact disk, a Blu-ray (registered trademark) disk, or a DVD. Note that HDD is an abbreviation for Hard Disk Drive. SD (registered trademark) is an abbreviation for Secure Digital. CF is an abbreviation for CompactFlash (registered trademark). DVD is an abbreviation for Digital Versatile Disk.
  • the input interface 930 is a port that is connected to an input device such as a mouse, keyboard, or touch panel. Specifically, the input interface 930 is a USB terminal. The input interface 930 may also be a port that is connected to a LAN.
  • USB is an abbreviation for Universal Serial Bus.
  • LAN is an abbreviation for Local Area Network.
  • the output interface 940 is a port to which a cable of a display device 941 such as a display is connected.
  • the output interface 940 is a USB terminal or an HDMI (registered trademark) terminal.
  • the display is an LCD.
  • the output interface 940 is also called a display interface.
  • HDMI (registered trademark) is an abbreviation for High Definition Multimedia Interface.
  • LCD is an abbreviation for Liquid Crystal Display.
  • the communication device 950 has a receiver and a transmitter.
  • the communication device 950 is connected to a communication network such as a LAN, the Internet, a telephone line, or Wi-Fi (registered trademark).
  • the communication device 950 is a communication chip or NIC.
  • NIC is an abbreviation for Network Interface Card.
  • the data shaping program is executed in the data shaping device 100.
  • the data shaping program is loaded into the processor 910 and executed by the processor 910.
  • Memory 921 stores not only the data shaping program but also the OS.
  • OS is an abbreviation for Operating System.
  • Processor 910 executes the data shaping program while executing the OS.
  • the data shaping program and the OS may be stored in the auxiliary storage device 922.
  • the data shaping program and the OS stored in the auxiliary storage device 922 are loaded into the memory 921 and executed by the processor 910. Note that part or all of the data shaping program may be incorporated into the OS.
  • the data shaping device 100 may include multiple processors that replace the processor 910. These multiple processors share the task of executing the data shaping program. Each processor is a device that executes the data shaping program in the same way as the processor 910.
  • the data, information, signal values and variable values used, processed or output by the data shaping program are stored in memory 921, auxiliary storage device 922, or in a register or cache memory within processor 910.
  • the “parts" of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 may be read as “circuits,”"steps,"”procedures,"”processes," or “circuitry.”
  • the data shaping program causes a computer to execute acquisition processing, analysis processing, shaping processing, detection processing, presentation processing, and registration processing.
  • the "processes” of the acquisition processing, analysis processing, shaping processing, detection processing, presentation processing, and registration processing may be read as "programs,””programproducts,""computer-readable storage media storing programs," or “computer-readable recording media recording programs.”
  • the data shaping method is a method performed by the data shaping device 100 executing the data shaping program.
  • the data shaping program may be provided by being stored in a computer-readable recording medium. Also, the data shaping program may be provided as a program product.
  • each device of the data shaping system 500 corresponds to a data shaping method.
  • the program that realizes the operation of each device of the data shaping system 500 corresponds to a data shaping program.
  • FIG. 4 is a flow diagram showing the operation of the data shaping system 500 according to this embodiment.
  • step S101 the acquisition unit 110 of the data shaping device 100 acquires table data 51 to be subjected to the data shaping process.
  • the acquiring unit 110 acquires table data 51 input by a user.
  • the user inputs the table data to the data shaping device 100 by placing the table data in a network storage.
  • the user may cause the data shaping device 100 to refer to the table data by operating a web application.
  • the table data 51 may be data in a relational database format, or may be text data in a CSV format defined by the user (CSV is an abbreviation for comma-separated values).
  • the acquisition unit 110 acquires the table data 51 and stores it in the storage unit 170. Note that the acquisition unit 110 may acquire the table data 51 in any manner as long as it can acquire the table data 51 that is the target of the data shaping process.
  • the acquisition unit 110 also determines which columns in the table data 51 are to be processed for data reformatting. For example, the columns to be processed for data reformatting are specified by the user.
  • FIG. 5 is a schematic diagram showing an example of the data shaping process according to the present embodiment.
  • An example of table data 51 according to the present embodiment will be described with reference to FIG.
  • the table data 51 is data in a table format as shown in FIG.
  • the column names are set as date and time, X[G], Y[G], and Z[G] indicating acceleration, and remarks.
  • the data set in each row of each column is called setting data.
  • the data included in the setting data set in each row of each column is called field data.
  • the setting data for "column name: X[G]" at “date and time: 7/1” is "0.1.”
  • the setting data for "column name: remarks” at “date and time: 7/1” is "No abnormalities.”
  • the setting data for "column name: remarks” at “date and time: 7/2” is "Board failure due to power outage.”
  • the field data included in the setting data "Board failure due to power outage” is, for example, “power outage” and "board.”
  • the field data included in the setting data "no abnormality” is, for example, "no abnormality” itself. The method for determining the field data will be described later.
  • the semantic information 52 is used to format the table data 51 . As shown in FIG. 5, child data and parent data representing the meaning of the child data are registered in association with each other.
  • Semantic information 52 is expressed in a tabular format, with field data, which is the words written in the fields of the table data, as child data, and the concept that expresses the meaning of the field data as parent data. Semantic information 52 may also be data in which parent data and child data are organized in a graph structure or other format.
  • step S102 the analysis unit 120 determines whether or not there is field data to which a column name is not assigned in each row of the column to be shaped in the table data 51.
  • analysis unit 120 extracts words from the setting data of each row of the column to be shaped in table data 51. Then, analysis unit 120 determines each of the extracted words as field data to which a column name is not assigned.
  • step S103 the analysis unit 120 uses the semantic information 52 to determine whether or not field data contained in the setting data set in the table data 51 that does not have a column name assigned thereto is registered in the semantic information 52 as child data. Specifically, the following applies:
  • analysis unit 120 When performing data shaping processing on table data 51 for the first time, analysis unit 120 extracts words from the setting data of each row of the column to be shaped in table data 51. Analysis unit 120 extracts words using a method such as morphological analysis, for example. Other methods may be used as long as they can extract words from the setting data of each row of the column to be shaped in table data 51.
  • the words extracted from the setting data vary depending on the method used for extraction, and any words may be extracted.
  • "power outage” and "board” are extracted as “field data with no column name assigned” from the setting data "board failure due to power outage”.
  • "power outage”, "board”, and “failure” may be extracted from the setting data "board failure due to power outage”.
  • "No abnormality”, "Power outage”, and "Board” are field data to which no column name is assigned.
  • step S103 If there is field data to which a column name has not been assigned, the process proceeds to step S103. If there is no field data to which a column name has not been assigned, the process ends.
  • the analysis unit 120 uses the semantic information 52 to determine whether or not field data to which a column name is not assigned is registered in the semantic information 52 as child data.
  • the analysis unit 120 determines whether or not each of the field data items "no abnormality”, "power outage”, and “circuit board” is registered in the semantic information 52 as child data.
  • “power outage” and “circuit board” are registered in the semantic information 52, but "no abnormality” is not registered.
  • step S104 For "field data to which no column name is assigned" registered in the semantic information 52, the process proceeds to step S104, where data shaping processing is performed. On the other hand, for "field data to which no column name is assigned" that is not registered in the semantic information 52, the process proceeds to step S105, where the data is processed as unformatted data.
  • step S104 The formatting process is a process performed when field data to which no column name is assigned is registered in the semantic information 52 .
  • the shaping unit 130 treats the field data to which a column name is not assigned as child data.
  • the shaping unit 130 selects parent data corresponding to the child data registered in the semantic information 52 as the column name of the field data to which a column name is not assigned.
  • the shaping unit 130 then shapes the table data 51 by allocating the field data to which a column name is not assigned to the selected column name.
  • the example in FIG. 5 shows the first data shaping process.
  • the field data “power outage” and “circuit board” that are not assigned a column name are registered in the semantic information 52 .
  • the shaping unit 130 selects the parent data "Cause” corresponding to the child data "Power Outage” registered in the semantic information 52 as the column name of "Power Outage”.
  • the shaping unit 130 also selects the parent data "Faulty Part” corresponding to the child data "Circuit Board” registered in the semantic information 52 as the column name of "Circuit Board”.
  • the shaping unit 130 assigns "power outage” to the selected column name "cause”.
  • the shaping unit 130 also assigns "circuit board” to the selected column name "fault location”.
  • the shaping unit 130 creates a new column in the table data 51, and shapes the table data 51 by assigning "power outage” to the column name "cause” and “circuit board” to the column name "fault location”.
  • step S104 the process returns to step S102 and repeats the process until there is no field data to which a column name has not been assigned in the column being processed.
  • the detection process is a process performed when field data to which a column name is not assigned is not registered in the semantic information 52 .
  • the detection unit 140 detects, as the unformatted data 31, “field data to which no column name is assigned” that is not registered in the semantic information 52, that is, that is not registered in the semantic information 52.
  • FIG. 6 is a schematic diagram showing another example of the data shaping process according to the present embodiment.
  • the process is shown for a case where “normal” which is “field data to which no column name is assigned” is not registered in the semantic information 52 .
  • the detection unit 140 detects “no abnormality” as the unformatted data 31, which is “field data to which no column name is assigned” that is not registered in the semantic information 52.
  • step S106> the presentation unit 150 transmits a presentation screen 211 presenting the unformatted data 31 to the user terminal device 200 .
  • FIG. 7 is a diagram showing an example of a presentation screen 211 according to the present embodiment.
  • the presentation screen 211 displays the current table data 51 in which “No abnormalities” is highlighted as unformatted data, and the current semantic information 52 . Then, the presentation screen 211 displays a message such as, "Please add parent data that expresses the meaning of child data 1: No abnormalities to the semantic information. Also, if there is child data that corresponds to the added parent data, please add it to child data 2 and onwards. Press the edit button to add it.”
  • presentation screen 211 is a screen that prompts the user to input parent data that represents the concept or meaning of child data for which parent data is not registered, and child data related to the parent data.
  • the presentation screen 211 prompts the user to input parent data that represents the concept or meaning of the child data ⁇ No abnormalities'' for which no parent data is registered, and child data related to the parent data.
  • Step S107 the screen display unit 210 of the user terminal device 200 displays the presentation screen 211 on the display device 941.
  • the screen display unit 210 accepts input of parent data when the unformatted data 31 is child data via the presentation screen 211.
  • the screen display unit 210 may also accept input of child data related to the unformatted data 31 and corresponding to the parent data, together with the parent data when the unformatted data 31 is child data, via the presentation screen 211.
  • the presentation screen 211 accepts user operations.
  • the user registers parent data and additional child data in the row of child data 1 "No abnormality" presented in the current semantic information 52.
  • the semantic information 52 is in a table format, but the user would similarly register parent data and additional child data even if the semantic information 52 were in a graph format.
  • the registration method may be keyboard input of words, drag-and-drop of words, or voice operation. 7, "Analysis result" is input as parent data of child data 1 "No abnormality”.
  • child data 2 "No problem” and child data 3 "Normal” are input as child data related to child data 1 "No abnormality”.
  • the screen display unit 210 of the user terminal device 200 transmits the parent data, which is the child data of the unformatted data 31 and which has been accepted via the presentation screen 211, to the data shaping device 100 via the communication device 950. If input of child data related to the unformatted data 31 is also accepted together with the parent data, the screen display unit 210 transmits the child data related to the unformatted data 31 together with the parent data to the data shaping device 100 via the communication device 950.
  • the registration unit 160 receives input of parent data when the unformatted data 31 is treated as child data, and registers the received parent data in the semantic information 52 as parent data of the unformatted data 31 .
  • parent data when unformatted data 31 is child data is input by the user from presentation screen 211 and transmitted to data shaping device 100.
  • registration unit 160 registers the parent data when unformatted data 31 is child data input by the user in semantic information 52.
  • registration unit 160 registers the child data related to unformatted data 31 together with parent data in semantic information 52.
  • step S108 the process returns to step S102 and repeats the process until there is no field data in the column being processed that does not have a column name assigned to it.
  • the data shaping process will be further described using the example of FIG.
  • the example of FIG. 6 shows an example of the data shaping process from the second time onwards.
  • the detection unit 140 detects that the unformatted data is "normal” (step S105).
  • the presentation unit 150 transmits a presentation screen 211 to the user terminal device 200 to prompt the user to input parent data corresponding to the unformatted data "normal” and child data other than "normal” corresponding to the parent data (step S106).
  • the parent data "Analysis result" received via the presentation screen 211 and the child data "No problem” and “Normal” related to the unformatted data "No abnormality” are transmitted to the data shaping device 100 (step S107).
  • the registration unit 160 receives the parent data "Analysis result” accepted via the presentation screen 211 and the child data "No problem” and “Normal” related to the unformatted data “No abnormalities”, and registers them in the semantic information 52 (step S108).
  • the analysis unit 120 determines that there is "No abnormality" as field data to which a column name is not assigned (step S102).
  • a column name is not assigned to the field data "No abnormality”. For example, if "No abnormality" is not assigned to any of the columns added in the previous data shaping process, the analysis unit 120 determines that "No abnormality" is field data to which a column name is not assigned.
  • the analysis unit 120 determines that the field data "No abnormality" to which no column name is assigned is registered as child data in the semantic information 52 (step S103). Then, the shaping unit 130 uses the semantic information 52 to select the parent data "Analysis Results” as the column name of the field data "No Abnormality” to which no column name is assigned. As a result of the first data shaping process, the parent data "Analysis Results” and the child data "No Problem” and “Normal” related to "No Abnormality" are registered in the semantic information 52 for the child data "No Abnormality”. The shaping unit 130 then creates a new column in the table data 51 and shapes the table data 51 by assigning "No Abnormality" to the column name "Analysis Results” (step S104).
  • the data shaping device 100 has been described as displaying the presentation screen 211 on the user terminal device 200.
  • input from the user such as parent data of the unshaped data and child data related to the unshaped data
  • the data shaping device 100 may be configured to display the presentation screen 211 on a display device.
  • the registration unit 160 of the data shaping device 100 accepts input from the user via the presentation screen 211 displayed on the display device of the data shaping device 100.
  • each device in data shaping system 500 are realized by software.
  • the functions of each device in data shaping system 500 may be realized by hardware.
  • each device in data shaping system 500 includes electronic circuitry 909 in place of processor 910 .
  • the data shaping device 100 will be described as an example, but the same description can also be applied to the user terminal device 200.
  • FIG. 8 is a diagram showing an example of the configuration of a data shaping device 100 according to a modified example of this embodiment.
  • the electronic circuit 909 is a dedicated electronic circuit for realizing the functions of the acquisition unit 110, the analysis unit 120, the shaping unit 130, the detection unit 140, the presentation unit 150, and the registration unit 160.
  • the electronic circuit 909 is a single circuit, a composite circuit, a programmed processor, a parallel programmed processor, a logic IC, a GA, an ASIC, or an FPGA.
  • GA is an abbreviation for Gate Array.
  • ASIC is an abbreviation for Application Specific Integrated Circuit.
  • FPGA is an abbreviation for Field-Programmable Gate Array.
  • the functions of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 may be realized by a single electronic circuit, or may be distributed across multiple electronic circuits.
  • some of the functions of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 may be realized by electronic circuits, and the remaining functions may be realized by software. Also, some or all of the functions of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 may be realized by firmware.
  • Each of the processor and electronic circuit is also called processing circuitry.
  • the functions of the acquisition unit 110, analysis unit 120, formatting unit 130, detection unit 140, presentation unit 150, and registration unit 160 are realized by the processing circuitry.
  • the data shaping system provides a mechanism for allowing the user to add meaning or concept to field values or words to which no column name has been assigned. This allows the data shaping device 100 according to the present embodiment to perform data shaping using appropriate semantic information, thereby realizing accurate data shaping.
  • the data shaping device 100 can perform data shaping using the appropriate semantic information entered by the user, thereby achieving accurate data shaping.
  • Embodiment 2 differences from and additions to the first embodiment will be mainly described.
  • components having the same functions as those in the first embodiment are given the same reference numerals, and the description thereof will be omitted.
  • the detection unit 140 determines whether or not the field data assigned to the column names of the table data 51 spans two or more column names, based on the table data 51 and the semantic information 52. If the detection unit 140 determines that the field data is assigned across two or more column names, it detects the field data as suspicious data 32.
  • the presentation unit 150 also highlights the suspicious data 32 and transmits a correction screen 212 that accepts corrections to the suspicious data 32 .
  • the registration unit 160 reflects the correction of the suspicious data 32 in the table data 51 .
  • each device of the data shaping system 500 corresponds to a data shaping method.
  • the program that realizes the operation of each device of the data shaping system 500 corresponds to a data shaping program.
  • FIG. 9 is a flow diagram showing the operation of the data shaping system 500 according to the present embodiment.
  • the data shaping process according to this embodiment is performed, for example, after the data shaping process according to the first embodiment is completed.
  • step S201 the detection unit 140 determines whether the field data assigned to a column name in the table data 51 spans two or more column names.
  • FIG. 10 is a schematic diagram showing the data shaping process according to the present embodiment.
  • child data such as “power outage,””flooding,””collision,””circuitboard,” etc. are registered for parent data “cause.”
  • child data such as “circuit board,””sensor,””motor,” etc. are registered for parent data “fault location.”
  • two field data, "power outage” and “circuit board” are registered for the column name "cause,” as in table data 51 after the first shaping in Fig. 10.
  • the field data "circuit board” is distributed across two column names, "cause” and "fault location.”
  • the detection unit 140 determines whether the field data assigned to the column names in the table data 51 spans two or more column names. In the example of FIG. 10, the field data "PCB" is distributed across two column names, "Cause” and "Faulty Location".
  • the detection unit 140 determines that the field data is distributed across two or more column names, it detects the field data as suspicious data 32 .
  • the detection unit 140 detects the field data “PCB” that is set across two column names “Cause” and “Faulty Part” as suspicious data 32 .
  • step S202 the presentation unit 150 highlights the suspicious data 32 and transmits to the user terminal device 200 a correction screen 212 that accepts corrections to the suspicious data 32.
  • FIG. 11 is a diagram showing an example of the correction screen 212 according to the present embodiment.
  • the correction screen 212 accepts corrections to the suspicious data 32 .
  • the correction screen 212 displays table data 51 after the data shaping process of the first embodiment is completed, and semantic information 52. Then, suspicious data 32 in the table data 51 is highlighted. Also, a message is displayed to the user to prompt him/her to correct the data requiring attention in the table data 51. For example, a message such as "Two or more pieces of data are set in the column name 'Cause'. If you wish to correct the data, please press the Correct button and make the correction. If you wish to correct the semantic information, please press the Correct button and make the correction" is displayed.
  • step S 203 the screen display unit 210 of the user terminal device 200 displays the correction screen 212 on the display device 941 , and accepts corrections to the suspicious data 32 in the table data 51 via the correction screen 212 .
  • the user performs an operation to correctly rewrite the table data 51 on the correction screen 212.
  • the operation method may be keyboard input of words, drag and drop of words, or voice operation.
  • the screen display unit 210 accepts a correction such as deleting "Circuit Board" from the two field data "Power Outage” and "Circuit Board” set in the column name "Cause".
  • the screen display unit 210 of the user terminal device 200 transmits the corrections to the suspicious data 32 in the table data 51 received via the correction screen 212 to the data shaping device 100 via the communication device 950.
  • step S204 the registration unit 160 receives the correction of the suspicious data 32 in the table data 51 from the user terminal device 200. Then, the registration unit 160 reflects the correction of the suspicious data 32 in the table data 51 in the table data 51. In the example of FIG. 11, a correction is reflected that deletes the field data "Substrate” from the column name "Cause".
  • the correction screen 212 may display a message urging the user to correct suspicious data in the table data, and also indicating that semantic information can be corrected.
  • the screen display unit 210 may accept a correction to the semantic information together with the correction of the suspicious data via the correction screen 212. Then, the screen display unit 210 may transmit the correction to the semantic information together with the correction of the suspicious data accepted via the correction screen 212 to the data shaping device.
  • the data shaping system when the field value allocated to the added column may not be allocated to the correct column in the shaped table data, it detects it as suspicious data. Then, the detected suspicious data is presented to the user, and the user can edit the shaped table data. In this way, in the data shaping system according to the present embodiment, after the data shaping process of the first embodiment, the user's correction can be further reflected in the table data. Therefore, the data shaping system according to the present embodiment can realize more accurate data shaping.
  • each unit of each device of the data shaping system is described as an independent functional block.
  • the configuration of each device of the data shaping system does not have to be the configuration as in the above-mentioned embodiment.
  • the functional block of each device of the data shaping system may have any configuration as long as it can realize the functions described in the above-mentioned embodiment.
  • each device of the data shaping system may be a system composed of multiple devices, not just one device.
  • a combination of multiple parts of the first and second embodiments may be implemented.
  • one part of these embodiments may be implemented.
  • any combination of these embodiments may be implemented, either as a whole or in part. That is, in the first and second embodiments, the respective embodiments can be freely combined, or any of the components in each embodiment can be modified, or any of the components in each embodiment can be omitted.
  • Unformatted data 32 Data requiring caution, 51 Table data, 52 Semantic information, 100 Data formatting device, 110 Acquisition unit, 120 Analysis unit, 130 Formatting unit, 140 Detection unit, 150 Presentation unit, 160 Registration unit, 170, 220 Storage unit, 200 User terminal device, 210 Screen display unit, 211 Presentation screen, 212 Correction screen, 500 Data formatting system, 909 Electronic circuit, 910 Processor, 921 Memory, 922 Auxiliary storage device, 930 Input interface, 940 Output interface, 941 Display device, 950 Communication device.

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

A data shaping apparatus (100) shapes table data (51). A storage unit (170) stores semantic information (52) in which child data and parent data representing the meaning of the child data are registered in association with each other. An analysis unit (120) determines whether or not field data to which a column name is not assigned is registered in the semantic information (52) as child data. If the field data to which the column name is not assigned is not registered in the semantic information (52) as child data, a detection unit (140) detects the field data to which the column name is not assigned as unshaped data. A registration unit (160) receives an input of parent data when the unshaped data is defined as child data, and registers the received parent data as parent data of the unshaped data in the semantic information (52).

Description

データ整形装置、データ整形システム、ユーザ端末装置、データ整形方法、およびデータ整形プログラムDATA FORMING DEVICE, DATA FORMING SYSTEM, USER TERMINAL DEVICE, DATA FORMING METHOD, AND DATA FORMING PROGRAM

 本開示は、データ整形装置、データ整形システム、ユーザ端末装置、データ整形方法、およびデータ整形プログラムに関する。 The present disclosure relates to a data shaping device, a data shaping system, a user terminal device, a data shaping method, and a data shaping program.

 テーブルデータの列のフィールド値が、任意の文章、カテゴリ名、またはラベル名である、あるいはテーブルデータ運用途中から意味が変わってしまっているといったケースがある。このようなケースは、データベースのテーブルデータを参照するアプリケーションあるいはシステムが、予期せぬデータを参照してエラーを起こす原因となる。
 このようなエラーを回避するために、テーブルデータの列名を整理し、データを適切な列に割り振るデータ整形が必要である。
There are cases where the field values of columns in table data are arbitrary text, category names, or label names, or the meaning of the table data has changed during operation. In such cases, applications or systems that refer to the table data in the database may refer to unexpected data and cause errors.
To avoid such errors, data formatting is required to organize the column names of the table data and assign the data to the appropriate columns.

 特許文献1には、情報の意味を表す概念を使って、表に含まれる列の意味を推定する意味推定システムが開示されている。特許文献1の意味推定システムは、列の意味の候補を選択し、選択した意味の候補と、表に含まれる推定対象となる列以外の個々の列の意味との類似度を示すスコアを算出する。そして、特許文献1の意味推定システムは、算出したスコアを用いて、列の意味の候補の中から、推定対象となる列の意味を特定する。 Patent Document 1 discloses a semantic inference system that infers the meaning of a column included in a table using a concept that represents the meaning of information. The semantic inference system of Patent Document 1 selects candidate meanings for the column, and calculates a score indicating the similarity between the selected candidate meaning and the meaning of each column included in the table other than the column to be inferred. The semantic inference system of Patent Document 1 then uses the calculated score to identify the meaning of the column to be inferred from among the candidate meanings of the column.

特許第6988991号公報Patent No. 6988991

 特許文献1の技術では、列の内容に適合する情報が概念に存在しない場合、列の内容と類似度が低い列名が割り当てられる可能性があり、意味を正しく推定できないという課題がある。 In the technology of Patent Document 1, if there is no information matching the contents of a column in a concept, a column name with low similarity to the contents of the column may be assigned, which poses the problem of not being able to correctly infer the meaning.

 本開示では、列名が割り当てられていない情報に対して、その情報の意味を表す概念である親データを登録させる仕組みを設けることで、正確なデータ整形を実現することを目的とする。 The purpose of this disclosure is to achieve accurate data formatting by providing a mechanism for registering parent data, which is a concept that expresses the meaning of information, for information that does not have a column name assigned to it.

 本開示に係るデータ整形装置は、テーブルデータを整形するデータ整形装置において、
 前記テーブルデータの整形に用いられ、子データとその子データの意味を表す親データとが対応付けられて登録されている意味情報を記憶する記憶部と、
 前記意味情報を用いて、前記テーブルデータに設定された設定データに含まれるフィールドデータのうち列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されているか否かを判定する解析部と、
 前記列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されていなければ、前記列名が割り当てられていないフィールドデータを未整形データとして検出する検出部と、
 前記未整形データを子データとしたときの親データの入力を受け付け、受け付けた親データを前記未整形データの親データとして前記意味情報に登録する登録部とを備える。
The data shaping device according to the present disclosure is a data shaping device that shapes table data,
a storage unit that stores semantic information used for shaping the table data, in which child data and parent data representing the meaning of the child data are associated with each other and registered;
an analysis unit that uses the semantic information to determine whether or not field data to which a column name is not assigned among field data included in the setting data set in the table data is registered as child data in the semantic information;
a detection unit that detects the field data to which a column name is not assigned as unformatted data if the field data to which a column name is not assigned is not registered in the semantic information as child data;
The data processing device further includes a registration unit that receives input of parent data when the unformatted data is treated as child data, and registers the received parent data in the semantic information as parent data of the unformatted data.

 本開示に係るデータ整形装置では、テーブルデータの整形に用いられる意味情報において、列名が割り当てられていないフィールドデータである子データについて、意味を表す概念である親データを登録させることができる。よって、本開示に係るデータ整形装置によれば、意味情報を適切に充実させることができ、正確なデータ整形を実現することができるという効果を奏する。 In the data shaping device according to the present disclosure, parent data, which is a concept expressing meaning, can be registered for child data, which is field data to which no column name is assigned, in the semantic information used to shape table data. Therefore, the data shaping device according to the present disclosure has the effect of being able to appropriately enrich the semantic information and realize accurate data shaping.

実施の形態1に係るデータ整形システムの全体構成例を示す図。FIG. 1 is a diagram showing an example of the overall configuration of a data shaping system according to a first embodiment. 実施の形態1に係るデータ整形装置の構成例を示す図。1 is a diagram showing an example of the configuration of a data shaping device according to a first embodiment; 実施の形態1に係るユーザ端末装置の構成例を示す図。FIG. 2 is a diagram showing a configuration example of a user terminal device according to the first embodiment; 実施の形態1に係るデータ整形システムの動作を示すフロー図。4 is a flow diagram showing the operation of the data shaping system according to the first embodiment. 実施の形態1に係るデータ整形処理の例を示す模式図。5A to 5C are schematic diagrams showing an example of data shaping processing according to the first embodiment; 実施の形態1に係るデータ整形処理の別例を示す模式図。7 is a schematic diagram showing another example of the data shaping process according to the first embodiment; 実施の形態1に係る提示画面の例を示す図。FIG. 4 is a diagram showing an example of a presentation screen according to the first embodiment. 実施の形態1の変形例に係るデータ整形装置の構成例を示す図。FIG. 13 is a diagram showing an example of the configuration of a data shaping device according to a modified example of the first embodiment. 実施の形態2に係るデータ整形システムの動作を示すフロー図。FIG. 11 is a flow diagram showing the operation of the data shaping system according to the second embodiment. 実施の形態2に係るデータ整形処理を示す模式図。FIG. 11 is a schematic diagram showing a data shaping process according to the second embodiment. 実施の形態2に係る修正画面の例を示す図。FIG. 13 is a diagram showing an example of a correction screen according to the second embodiment.

 以下、本実施の形態について、図を用いて説明する。各図中、同一または相当する部分には、同一符号を付している。実施の形態の説明において、同一または相当する部分については、説明を適宜省略または簡略化する。図中の矢印はデータの流れまたは処理の流れを主に示している。 The present embodiment will be described below with reference to the drawings. In each drawing, the same or corresponding parts are given the same reference numerals. In the description of the embodiment, the description of the same or corresponding parts will be omitted or simplified as appropriate. The arrows in the drawings mainly indicate the flow of data or the flow of processing.

 実施の形態1.
***構成の説明***
 図1は、本実施の形態に係るデータ整形システム500の全体構成例を示す図である。
 図2は、本実施の形態に係るデータ整形装置100の構成例を示す図である。
 図3は、本実施の形態に係るユーザ端末装置200の構成例を示す図である。
Embodiment 1.
***Configuration Description***
FIG. 1 is a diagram showing an example of the overall configuration of a data shaping system 500 according to the present embodiment.
FIG. 2 is a diagram showing an example of the configuration of the data shaping device 100 according to the present embodiment.
FIG. 3 is a diagram showing an example of a configuration of the user terminal device 200 according to the present embodiment.

 本実施の形態に係るデータ整形システム500は、データ整形装置100とユーザ端末装置200を備える。
 データ整形装置100は、テーブルデータ51をデータ整形する装置である。
 ユーザ端末装置200は、ユーザにより用いられる装置である。
 データ整形装置100とユーザ端末装置200は、ネットワークを介して通信する。
The data shaping system 500 according to this embodiment includes a data shaping device 100 and a user terminal device 200 .
The data shaping device 100 is a device that shapes the table data 51 .
The user terminal device 200 is a device used by a user.
The data formatting device 100 and the user terminal device 200 communicate with each other via a network.

 データ整形装置100は、コンピュータである。データ整形装置100は、プロセッサ910を備えるとともに、メモリ921、補助記憶装置922、入力インタフェース930、出力インタフェース940、および通信装置950といった他のハードウェアを備える。プロセッサ910は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。 The data shaping device 100 is a computer. The data shaping device 100 includes a processor 910, as well as other hardware such as a memory 921, an auxiliary storage device 922, an input interface 930, an output interface 940, and a communication device 950. The processor 910 is connected to the other hardware via signal lines and controls the other hardware.

 データ整形装置100は、機能要素として、取得部110と解析部120と整形部130と検出部140と提示部150と登録部160と記憶部170とを備える。記憶部170には、テーブルデータ51と意味情報52が記憶される。 The data shaping device 100 includes, as functional elements, an acquisition unit 110, an analysis unit 120, a shaping unit 130, a detection unit 140, a presentation unit 150, a registration unit 160, and a storage unit 170. The storage unit 170 stores table data 51 and semantic information 52.

 ユーザ端末装置200は、コンピュータである。ユーザ端末装置200は、プロセッサ910を備えるとともに、メモリ921、補助記憶装置922、入力インタフェース930、出力インタフェース940、および通信装置950といった他のハードウェアを備える。プロセッサ910は、信号線を介して他のハードウェアと接続され、これら他のハードウェアを制御する。 The user terminal device 200 is a computer. The user terminal device 200 includes a processor 910, as well as other hardware such as a memory 921, an auxiliary storage device 922, an input interface 930, an output interface 940, and a communication device 950. The processor 910 is connected to the other hardware via signal lines and controls the other hardware.

 ユーザ端末装置200は、機能要素として、画面表示部210と記憶部220とを備える。 The user terminal device 200 has a screen display unit 210 and a memory unit 220 as functional elements.

 以下において、データ整形装置100とユーザ端末装置200との各装置を、データ整形システム500の各装置と呼ぶ場合がある。
 ここでは説明を簡単にするために、データ整形システム500の各装置のハードウェアに同じ符号を付して説明している。しかし、データ整形システム500の各装置は個別のハードウェアを備えていることは自明である。
 また、以下では、データ整形装置100を例としてハードウェアの説明をする。ユーザ端末装置200のハードウェアについてもデータ整形装置100と同様の説明を適用することができる。
Hereinafter, the data shaping device 100 and the user terminal device 200 may be referred to as each device of the data shaping system 500 .
For ease of explanation, the same reference numerals are used for the hardware of each device in the data shaping system 500. However, it is self-evident that each device in the data shaping system 500 has its own hardware.
In the following, the hardware will be described using the data shaping device 100 as an example. The same description as for the data shaping device 100 can also be applied to the hardware of the user terminal device 200.

 取得部110と解析部120と整形部130と検出部140と提示部150と登録部160の機能は、ソフトウェアにより実現される。記憶部170は、メモリ921に備えられる。なお、記憶部170は、補助記憶装置922に備えられていてもよいし、メモリ921と補助記憶装置922に分散して備えられていてもよい。 The functions of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 are realized by software. The storage unit 170 is provided in the memory 921. Note that the storage unit 170 may be provided in the auxiliary storage device 922, or may be provided separately in the memory 921 and the auxiliary storage device 922.

 プロセッサ910は、データ整形プログラムを実行する装置である。データ整形プログラムは、取得部110と解析部120と整形部130と検出部140と提示部150と登録部160の機能を実現するプログラムである。
 プロセッサ910は、演算処理を行うICである。プロセッサ910の具体例は、CPU、DSP、GPUである。ICは、Integrated Circuitの略語である。CPUは、Central Processing Unitの略語である。DSPは、Digital Signal Processorの略語である。GPUは、Graphics Processing Unitの略語である。
The processor 910 is a device that executes a data shaping program. The data shaping program is a program that realizes the functions of the acquisition unit 110, the analysis unit 120, the shaping unit 130, the detection unit 140, the presentation unit 150, and the registration unit 160.
The processor 910 is an IC that performs arithmetic processing. Specific examples of the processor 910 are a CPU, a DSP, and a GPU. IC is an abbreviation for Integrated Circuit. CPU is an abbreviation for Central Processing Unit. DSP is an abbreviation for Digital Signal Processor. GPU is an abbreviation for Graphics Processing Unit.

 メモリ921は、データを一時的に記憶する記憶装置である。メモリ921の具体例は、SRAM、あるいはDRAMである。SRAMは、Static Random Access Memoryの略語である。DRAMは、Dynamic Random Access Memoryの略語である。
 補助記憶装置922は、データを保管する記憶装置である。補助記憶装置922の具体例は、HDDである。また、補助記憶装置922は、SD(登録商標)メモリカード、CF、NANDフラッシュ、フレキシブルディスク、光ディスク、コンパクトディスク、ブルーレイ(登録商標)ディスク、DVDといった可搬の記憶媒体であってもよい。なお、HDDは、Hard Disk Driveの略語である。SD(登録商標)は、Secure Digitalの略語である。CFは、CompactFlash(登録商標)の略語である。DVDは、Digital Versatile Diskの略語である。
The memory 921 is a storage device that temporarily stores data. Specific examples of the memory 921 are SRAM and DRAM. SRAM is an abbreviation for Static Random Access Memory. DRAM is an abbreviation for Dynamic Random Access Memory.
The auxiliary storage device 922 is a storage device that stores data. A specific example of the auxiliary storage device 922 is a HDD. The auxiliary storage device 922 may also be a portable storage medium such as an SD (registered trademark) memory card, a CF, a NAND flash, a flexible disk, an optical disk, a compact disk, a Blu-ray (registered trademark) disk, or a DVD. Note that HDD is an abbreviation for Hard Disk Drive. SD (registered trademark) is an abbreviation for Secure Digital. CF is an abbreviation for CompactFlash (registered trademark). DVD is an abbreviation for Digital Versatile Disk.

 入力インタフェース930は、マウス、キーボード、あるいはタッチパネルといった入力装置と接続されるポートである。入力インタフェース930は、具体的には、USB端子である。なお、入力インタフェース930は、LANと接続されるポートであってもよい。USBは、Universal Serial Busの略語である。LANは、Local Area Networkの略語である。 The input interface 930 is a port that is connected to an input device such as a mouse, keyboard, or touch panel. Specifically, the input interface 930 is a USB terminal. The input interface 930 may also be a port that is connected to a LAN. USB is an abbreviation for Universal Serial Bus. LAN is an abbreviation for Local Area Network.

 出力インタフェース940は、ディスプレイといった表示機器941のケーブルが接続されるポートである。出力インタフェース940は、具体的には、USB端子またはHDMI(登録商標)端子である。ディスプレイは、具体的には、LCDである。出力インタフェース940は、表示器インタフェースともいう。HDMI(登録商標)は、High Definition Multimedia Interfaceの略語である。LCDは、Liquid Crystal Displayの略語である。 The output interface 940 is a port to which a cable of a display device 941 such as a display is connected. Specifically, the output interface 940 is a USB terminal or an HDMI (registered trademark) terminal. Specifically, the display is an LCD. The output interface 940 is also called a display interface. HDMI (registered trademark) is an abbreviation for High Definition Multimedia Interface. LCD is an abbreviation for Liquid Crystal Display.

 通信装置950は、レシーバとトランスミッタを有する。通信装置950は、LAN、インターネット、電話回線、あるいはWi-Fi(登録商標)といった通信網に接続している。通信装置950は、具体的には、通信チップまたはNICである。NICは、Network Interface Cardの略語である。 The communication device 950 has a receiver and a transmitter. The communication device 950 is connected to a communication network such as a LAN, the Internet, a telephone line, or Wi-Fi (registered trademark). Specifically, the communication device 950 is a communication chip or NIC. NIC is an abbreviation for Network Interface Card.

 データ整形プログラムは、データ整形装置100において実行される。データ整形プログラムは、プロセッサ910に読み込まれ、プロセッサ910によって実行される。メモリ921には、データ整形プログラムだけでなく、OSも記憶されている。OSは、Operating Systemの略語である。プロセッサ910は、OSを実行しながら、データ整形プログラムを実行する。データ整形プログラムおよびOSは、補助記憶装置922に記憶されていてもよい。補助記憶装置922に記憶されているデータ整形プログラムおよびOSは、メモリ921にロードされ、プロセッサ910によって実行される。なお、データ整形プログラムの一部または全部がOSに組み込まれていてもよい。 The data shaping program is executed in the data shaping device 100. The data shaping program is loaded into the processor 910 and executed by the processor 910. Memory 921 stores not only the data shaping program but also the OS. OS is an abbreviation for Operating System. Processor 910 executes the data shaping program while executing the OS. The data shaping program and the OS may be stored in the auxiliary storage device 922. The data shaping program and the OS stored in the auxiliary storage device 922 are loaded into the memory 921 and executed by the processor 910. Note that part or all of the data shaping program may be incorporated into the OS.

 データ整形装置100は、プロセッサ910を代替する複数のプロセッサを備えていてもよい。これら複数のプロセッサは、データ整形プログラムの実行を分担する。それぞれのプロセッサは、プロセッサ910と同じように、データ整形プログラムを実行する装置である。 The data shaping device 100 may include multiple processors that replace the processor 910. These multiple processors share the task of executing the data shaping program. Each processor is a device that executes the data shaping program in the same way as the processor 910.

 データ整形プログラムにより利用、処理または出力されるデータ、情報、信号値および変数値は、メモリ921、補助記憶装置922、または、プロセッサ910内のレジスタあるいはキャッシュメモリに記憶される。 The data, information, signal values and variable values used, processed or output by the data shaping program are stored in memory 921, auxiliary storage device 922, or in a register or cache memory within processor 910.

 取得部110と解析部120と整形部130と検出部140と提示部150と登録部160の各部の「部」を「回路」、「工程」、「手順」、「処理」、あるいは「サーキットリー」に読み替えてもよい。データ整形プログラムは、取得処理と解析処理と整形処理と検出処理と提示処理と登録処理を、コンピュータに実行させる。取得処理と解析処理と整形処理と検出処理と提示処理と登録処理の「処理」を「プログラム」、「プログラムプロダクト」、「プログラムを記憶したコンピュータ読取可能な記憶媒体」、または「プログラムを記録したコンピュータ読取可能な記録媒体」に読み替えてもよい。また、データ整形方法は、データ整形装置100がデータ整形プログラムを実行することにより行われる方法である。
 データ整形プログラムは、コンピュータ読取可能な記録媒体に格納されて提供されてもよい。また、データ整形プログラムは、プログラムプロダクトとして提供されてもよい。
The "parts" of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 may be read as "circuits,""steps,""procedures,""processes," or "circuitry." The data shaping program causes a computer to execute acquisition processing, analysis processing, shaping processing, detection processing, presentation processing, and registration processing. The "processes" of the acquisition processing, analysis processing, shaping processing, detection processing, presentation processing, and registration processing may be read as "programs,""programproducts,""computer-readable storage media storing programs," or "computer-readable recording media recording programs." The data shaping method is a method performed by the data shaping device 100 executing the data shaping program.
The data shaping program may be provided by being stored in a computer-readable recording medium. Also, the data shaping program may be provided as a program product.

***動作の説明***
 次に、本実施の形態に係るデータ整形システム500の各装置の動作について説明する。データ整形システム500の各装置の動作手順は、データ整形方法に相当する。また、データ整形システム500の各装置の動作を実現するプログラムは、データ整形プログラムに相当する。
*** Operation Description ***
Next, the operation of each device of the data shaping system 500 according to the present embodiment will be described. The operation procedure of each device of the data shaping system 500 corresponds to a data shaping method. Also, the program that realizes the operation of each device of the data shaping system 500 corresponds to a data shaping program.

 図4は、本実施の形態に係るデータ整形システム500の動作を示すフロー図である。 FIG. 4 is a flow diagram showing the operation of the data shaping system 500 according to this embodiment.

<取得処理>
 ステップS101において、データ整形装置100の取得部110は、データ整形処理の対象となるテーブルデータ51を取得する。
 例えば、取得部110は、ユーザにより入力されるテーブルデータ51を取得する。ユーザはネットワークストレージにテーブルデータを置くといった方式でテーブルデータをデータ整形装置100に入力する。あるいは、ユーザは、ウェブアプリケーションの操作により、データ整形装置100にテーブルデータを参照させるといった方式でもよい。
 テーブルデータ51は、リレーショナルデータベース形式のデータでもよい。あるいは、ユーザが任意に定義したCSV形式などのテキストデータでもよい。CSVは、comma-separated valuesの略語である。
<Acquisition process>
In step S101, the acquisition unit 110 of the data shaping device 100 acquires table data 51 to be subjected to the data shaping process.
For example, the acquiring unit 110 acquires table data 51 input by a user. The user inputs the table data to the data shaping device 100 by placing the table data in a network storage. Alternatively, the user may cause the data shaping device 100 to refer to the table data by operating a web application.
The table data 51 may be data in a relational database format, or may be text data in a CSV format defined by the user (CSV is an abbreviation for comma-separated values).

 取得部110は、テーブルデータ51を取得し、記憶部170に記憶する。なお、取得部110は、データ整形処理の対象となるテーブルデータ51を取得することができればどのような方式でテーブルデータ51を取得してもよい。 The acquisition unit 110 acquires the table data 51 and stores it in the storage unit 170. Note that the acquisition unit 110 may acquire the table data 51 in any manner as long as it can acquire the table data 51 that is the target of the data shaping process.

 また、取得部110は、テーブルデータ51のうちデータ整形の処理対象となる列を決定する。例えば、データ整形の処理対象となる列はユーザにより指定される。 The acquisition unit 110 also determines which columns in the table data 51 are to be processed for data reformatting. For example, the columns to be processed for data reformatting are specified by the user.

 図5は、本実施の形態に係るデータ整形処理の例を示す模式図である。
 図5を用いて、本実施の形態に係るテーブルデータ51の例について説明する。
 テーブルデータ51は、図5に示すように表形式のデータである。
 図5のテーブルデータ51では、列名として日時と、加速度を示すX[G],Y[G],Z[G]と、備考が設定されている。
FIG. 5 is a schematic diagram showing an example of the data shaping process according to the present embodiment.
An example of table data 51 according to the present embodiment will be described with reference to FIG.
The table data 51 is data in a table format as shown in FIG.
In the table data 51 in FIG. 5, the column names are set as date and time, X[G], Y[G], and Z[G] indicating acceleration, and remarks.

 各列の各行に設定されているデータを設定データと呼ぶ。
 また、各列の各行に設定されている設定データに含まれるデータをフィールドデータと呼ぶ。
 例えば、「日時:7/1」の「列名:X[G]」の設定データは、「0.1」である。また、「日時:7/1」の「列名:備考」の設定データは、「異常なし」である。また、「日時:7/2」の「列名:備考」の設定データは、「停電により基板が故障」である。
 そして、設定データ「停電により基板が故障」に含まれるフィールドデータは、例えば「停電」と「基板」である。また、設定データ「異常なし」に含まれるフィールドデータは、例えば「異常なし」そのものである。
 フィールドデータの決定手法については後述する。
The data set in each row of each column is called setting data.
Moreover, the data included in the setting data set in each row of each column is called field data.
For example, the setting data for "column name: X[G]" at "date and time: 7/1" is "0.1." The setting data for "column name: remarks" at "date and time: 7/1" is "No abnormalities." The setting data for "column name: remarks" at "date and time: 7/2" is "Board failure due to power outage."
The field data included in the setting data "Board failure due to power outage" is, for example, "power outage" and "board." The field data included in the setting data "no abnormality" is, for example, "no abnormality" itself.
The method for determining the field data will be described later.

 図5の例では、列名「備考」の列が、データ整形の処理対象となる列としてユーザにより指定されたものとする。 In the example in Figure 5, the column named "Notes" is specified by the user as the column to be processed for data formatting.

 次に、図5を用いて、本実施の形態に係る意味情報52の例について説明する。
 意味情報52は、テーブルデータ51の整形に用いられる。
 図5に示すように、子データとその子データの意味を表す親データとが対応付けられて登録されている。
Next, an example of the semantic information 52 according to the present embodiment will be described with reference to FIG.
The semantic information 52 is used to format the table data 51 .
As shown in FIG. 5, child data and parent data representing the meaning of the child data are registered in association with each other.

 意味情報52は、テーブルデータのフィールドに記載されてる単語であるフィールドデータを子データとし、そのフィールドデータの意味を表す概念を親データとして、表形式で表される。また、意味情報52は、親データと子データをグラフ構造あるいはその他の形式で整理したデータでもよい。 Semantic information 52 is expressed in a tabular format, with field data, which is the words written in the fields of the table data, as child data, and the concept that expresses the meaning of the field data as parent data. Semantic information 52 may also be data in which parent data and child data are organized in a graph structure or other format.

<解析処理:ステップS102およびステップS103>
 ステップS102において、解析部120は、テーブルデータ51においてデータを整形する対象となる列の各行に、列名が割り当てられていないフィールドデータがあるか否かを判定する。
 テーブルデータ51に対して最初にデータ整形処理をする場合は、解析部120は、テーブルデータ51においてデータを整形する対象となる列の各行の設定データから単語を抽出する。そして、解析部120は、抽出した単語の各々を、列名が割り当てられていないフィールドデータとして判定する。
<Analysis Process: Steps S102 and S103>
In step S102, the analysis unit 120 determines whether or not there is field data to which a column name is not assigned in each row of the column to be shaped in the table data 51.
When performing data shaping processing on table data 51 for the first time, analysis unit 120 extracts words from the setting data of each row of the column to be shaped in table data 51. Then, analysis unit 120 determines each of the extracted words as field data to which a column name is not assigned.

 ステップS103において、解析部120は、意味情報52を用いて、テーブルデータ51に設定された設定データに含まれるフィールドデータのうち、列名が割り当てられていないフィールドデータが子データとして意味情報52に登録されているか否かを判定する。
 具体的には、以下の通りである。
In step S103, the analysis unit 120 uses the semantic information 52 to determine whether or not field data contained in the setting data set in the table data 51 that does not have a column name assigned thereto is registered in the semantic information 52 as child data.
Specifically, the following applies:

 テーブルデータ51に対して最初にデータ整形処理をする場合、解析部120は、テーブルデータ51においてデータを整形する対象となる列の各行の設定データから単語を抽出する。解析部120は、例えば、形態素解析といった手法を用いて単語を抽出する。テーブルデータ51においてデータを整形する対象となる列の各行の設定データから単語を抽出することができれば、その他の手法を用いてもよい。 When performing data shaping processing on table data 51 for the first time, analysis unit 120 extracts words from the setting data of each row of the column to be shaped in table data 51. Analysis unit 120 extracts words using a method such as morphological analysis, for example. Other methods may be used as long as they can extract words from the setting data of each row of the column to be shaped in table data 51.

 図5の例では、「列名:備考」の「異常なし」と「停電により基板が故障」が、データを整形する対象となる列の各行の設定データである。そして、図5に示すように、設定データ「異常なし」から「異常なし」が「列名が割り当てられていないフィールドデータ」として抽出される。また、設定データ「停電により基板が故障」からは「停電」と「基板」が「列名が割り当てられていないフィールドデータ」として抽出されるものとする。 In the example in Figure 5, "No abnormalities" and "Board failure due to power outage" in "Column name: Notes" are the setting data for each row of the column that is the target of data formatting. Then, as shown in Figure 5, "No abnormalities" is extracted from the setting data "No abnormalities" as "field data with no column name assigned." In addition, "Power outage" and "Board" are extracted from the setting data "Board failure due to power outage" as "field data with no column name assigned."

 設定データから抽出される単語は、抽出に用いる手法により異なるものであり、どのような単語が抽出されてもよい。本実施の形態では、設定データ「停電により基板が故障」からは「停電」と「基板」が「列名が割り当てられていないフィールドデータ」として抽出される。しかし、設定データ「停電により基板が故障」から「停電」と「基板」と「故障」が抽出されてもよい。
 図5の例では、「異常なし」と「停電」と「基板」が、列名が割り当てられていないフィールドデータとなる。
The words extracted from the setting data vary depending on the method used for extraction, and any words may be extracted. In this embodiment, "power outage" and "board" are extracted as "field data with no column name assigned" from the setting data "board failure due to power outage". However, "power outage", "board", and "failure" may be extracted from the setting data "board failure due to power outage".
In the example of FIG. 5, "No abnormality", "Power outage", and "Board" are field data to which no column name is assigned.

 列名が割り当てられていないフィールドデータがあれば、ステップS103に進む。
 列名が割り当てられていないフィールドデータがなければ、処理を終了する。
If there is field data to which a column name has not been assigned, the process proceeds to step S103.
If there is no field data to which a column name has not been assigned, the process ends.

 次に、解析部120は、意味情報52を用いて、列名が割り当てられていないフィールドデータが、子データとして意味情報52に登録されているか否かを判定する。
 図5の例では、解析部120は、フィールドデータである「異常なし」と「停電」と「基板」との各々が、子データとして意味情報52に登録されているか否かを判定する。
 図5では、「停電」と「基板」は意味情報52に登録されているが、「異常なし」は登録されていない。
Next, the analysis unit 120 uses the semantic information 52 to determine whether or not field data to which a column name is not assigned is registered in the semantic information 52 as child data.
In the example of FIG. 5, the analysis unit 120 determines whether or not each of the field data items "no abnormality", "power outage", and "circuit board" is registered in the semantic information 52 as child data.
In FIG. 5, "power outage" and "circuit board" are registered in the semantic information 52, but "no abnormality" is not registered.

 意味情報52に登録されている「列名が割り当てられていないフィールドデータ」については、ステップS104に進み、データ整形処理を行う。
 一方、意味情報52に登録されていない「列名が割り当てられていないフィールドデータ」については、ステップS105に進み、未整形データとして処理を行う。
For "field data to which no column name is assigned" registered in the semantic information 52, the process proceeds to step S104, where data shaping processing is performed.
On the other hand, for "field data to which no column name is assigned" that is not registered in the semantic information 52, the process proceeds to step S105, where the data is processed as unformatted data.

<整形処理:ステップS104>
 整形処理は、列名が割り当てられていないフィールドデータが意味情報52に登録されている場合の処理である。
 ステップS104において、整形部130は、列名が割り当てられていないフィールドデータを子データとする。整形部130は、意味情報52に登録されている子データに対応する親データを、列名が割り当てられていないフィールドデータの列名として選定する。そして、整形部130は、選定された列名に、列名が割り当てられていないフィールドデータを振り分けることによりテーブルデータ51を整形する。
<Shaping process: step S104>
The formatting process is a process performed when field data to which no column name is assigned is registered in the semantic information 52 .
In step S104, the shaping unit 130 treats the field data to which a column name is not assigned as child data. The shaping unit 130 selects parent data corresponding to the child data registered in the semantic information 52 as the column name of the field data to which a column name is not assigned. The shaping unit 130 then shapes the table data 51 by allocating the field data to which a column name is not assigned to the selected column name.

 図5の例では、第1回のデータ整形処理を表している。
 図5の例では、列名が割り当てられていないフィールドデータである「停電」と「基板」は意味情報52に登録されている。
 整形部130は、意味情報52に登録されている子データ「停電」に対応する親データ「原因」を、「停電」の列名として選定する。また、整形部130は、意味情報52に登録されている子データ「基板」に対応する親データ「故障部位」を、「基板」の列名として選定する。
 そして、整形部130は、選定された列名「原因」に「停電」を振り分ける。また、整形部130は、選定された列名「故障部位」に「基板」を振り分ける。具体的には、整形部130は、テーブルデータ51に新たな列を作成し、列名「原因」に「停電」を、列名「故障部位」に「基板」を振り分けることによりテーブルデータ51を整形する。
The example in FIG. 5 shows the first data shaping process.
In the example of FIG. 5, the field data “power outage” and “circuit board” that are not assigned a column name are registered in the semantic information 52 .
The shaping unit 130 selects the parent data "Cause" corresponding to the child data "Power Outage" registered in the semantic information 52 as the column name of "Power Outage". The shaping unit 130 also selects the parent data "Faulty Part" corresponding to the child data "Circuit Board" registered in the semantic information 52 as the column name of "Circuit Board".
Then, the shaping unit 130 assigns "power outage" to the selected column name "cause". The shaping unit 130 also assigns "circuit board" to the selected column name "fault location". Specifically, the shaping unit 130 creates a new column in the table data 51, and shapes the table data 51 by assigning "power outage" to the column name "cause" and "circuit board" to the column name "fault location".

 ステップS104の処理が完了すると、処理はステップS102に戻り、処理対象の列において、列名が割り当てられていないフィールドデータが無くなるまで処理を繰り返す。 When step S104 is completed, the process returns to step S102 and repeats the process until there is no field data to which a column name has not been assigned in the column being processed.

<検出処理:ステップS105>
 検出処理は、列名が割り当てられていないフィールドデータが意味情報52に登録されていない場合の処理である。
 検出部140は、意味情報52に登録されていない、すなわち意味情報52に未登録の「列名が割り当てられていないフィールドデータ」を未整形データ31として検出する。
<Detection process: step S105>
The detection process is a process performed when field data to which a column name is not assigned is not registered in the semantic information 52 .
The detection unit 140 detects, as the unformatted data 31, “field data to which no column name is assigned” that is not registered in the semantic information 52, that is, that is not registered in the semantic information 52.

 図6は、本実施の形態に係るデータ整形処理の別例を示す模式図である。
 図6の例では、「列名が割り当てられていないフィールドデータ」である「異常なし」が意味情報52に登録されていない場合の処理を示している。
 図6の例では、検出部140は、意味情報52に登録されていない「列名が割り当てられていないフィールドデータ」である「異常なし」を未整形データ31として検出する。
FIG. 6 is a schematic diagram showing another example of the data shaping process according to the present embodiment.
In the example of FIG. 6, the process is shown for a case where “normal” which is “field data to which no column name is assigned” is not registered in the semantic information 52 .
In the example of FIG. 6, the detection unit 140 detects “no abnormality” as the unformatted data 31, which is “field data to which no column name is assigned” that is not registered in the semantic information 52.

<提示処理:ステップS106>
 ステップS106において、提示部150は、未整形データ31を提示する提示画面211をユーザ端末装置200に送信する。
<Presentation process: step S106>
In step S<b>106 , the presentation unit 150 transmits a presentation screen 211 presenting the unformatted data 31 to the user terminal device 200 .

 図7は、本実施の形態に係る提示画面211の例を示す図である。
 図7に示すように、提示画面211には、未整形データである「異常なし」が強調表示された現在のテーブルデータ51と、現在の意味情報52とが表示される。
 そして、提示画面211には、例えば、「子データ1「異常なし」の意味を表す親データを意味情報に追加してください。また、追加した親データに対応する子データがあれば、子データ2以降に追加してください。修正ボタンを押下して追加してください。」といったメッセージが表示される。
FIG. 7 is a diagram showing an example of a presentation screen 211 according to the present embodiment.
As shown in FIG. 7, the presentation screen 211 displays the current table data 51 in which “No abnormalities” is highlighted as unformatted data, and the current semantic information 52 .
Then, the presentation screen 211 displays a message such as, "Please add parent data that expresses the meaning of child data 1: No abnormalities to the semantic information. Also, if there is child data that corresponds to the added parent data, please add it to child data 2 and onwards. Press the edit button to add it."

 このように、提示画面211は、親データが登録されていない子データについて、その子データの概念あるいは意味を表す親データと、その親データに関連する子データとの入力をユーザに促す画面である。
 図7の例では、提示画面211は、親データが登録されていない子データ「異常なし」について、子データ「異常なし」の概念あるいは意味を表す親データと、その親データに関連する子データとの入力をユーザに促す。
In this way, presentation screen 211 is a screen that prompts the user to input parent data that represents the concept or meaning of child data for which parent data is not registered, and child data related to the parent data.
In the example of Figure 7, the presentation screen 211 prompts the user to input parent data that represents the concept or meaning of the child data ``No abnormalities'' for which no parent data is registered, and child data related to the parent data.

<入力受付処理:ステップS107>
 ステップS107において、ユーザ端末装置200の画面表示部210は、表示機器941に提示画面211を表示する。そして、画面表示部210は、提示画面211を介して未整形データ31を子データとしたときの親データの入力を受け付ける。また、画面表示部210は、提示画面211を介して、未整形データ31を子データとしたときの親データとともに、未整形データ31に関連する子データであって親データに対応する子データの入力を受け付けてもよい。
<Input Reception Processing: Step S107>
In step S107, the screen display unit 210 of the user terminal device 200 displays the presentation screen 211 on the display device 941. The screen display unit 210 then accepts input of parent data when the unformatted data 31 is child data via the presentation screen 211. The screen display unit 210 may also accept input of child data related to the unformatted data 31 and corresponding to the parent data, together with the parent data when the unformatted data 31 is child data, via the presentation screen 211.

 提示画面211は、ユーザの操作を受け付ける。ユーザは、現在の意味情報52に提示された子データ1「異常なし」の行に親データおよび追加の子データを登録する。ここでは、意味情報52は表形式であるが、グラフ形式の意味情報52であっても同様にユーザは親データおよび追加の子データを登録する。登録方法は単語のキーボード入力、単語をドラッグアンドドロップ、あるいは音声操作でもよい。
 図7の例では、子データ1「異常なし」の親データとして「分析結果」が入力されている。また、子データ1「異常なし」に関連する子データとして、子データ2「問題なし」および子データ3「正常」が入力されている。
The presentation screen 211 accepts user operations. The user registers parent data and additional child data in the row of child data 1 "No abnormality" presented in the current semantic information 52. Here, the semantic information 52 is in a table format, but the user would similarly register parent data and additional child data even if the semantic information 52 were in a graph format. The registration method may be keyboard input of words, drag-and-drop of words, or voice operation.
7, "Analysis result" is input as parent data of child data 1 "No abnormality". In addition, child data 2 "No problem" and child data 3 "Normal" are input as child data related to child data 1 "No abnormality".

 そして、ユーザ端末装置200の画面表示部210は、提示画面211を介して受け付けた、未整形データ31を子データとしたときの親データを、通信装置950によりデータ整形装置100に送信する。親データとともに未整形データ31に関連する子データの入力も受け付けた場合は、画面表示部210は、親データとともに未整形データ31に関連する子データも、通信装置950によりデータ整形装置100に送信する。 Then, the screen display unit 210 of the user terminal device 200 transmits the parent data, which is the child data of the unformatted data 31 and which has been accepted via the presentation screen 211, to the data shaping device 100 via the communication device 950. If input of child data related to the unformatted data 31 is also accepted together with the parent data, the screen display unit 210 transmits the child data related to the unformatted data 31 together with the parent data to the data shaping device 100 via the communication device 950.

 図7の例では、未整形データ31である「異常なし」を子データとしたときの意味を表す親データとして、「分析結果」がデータ整形装置100に送信される。また、未整形データ31である「異常なし」に関連する子データとして、「問題なし」と「正常」がデータ整形装置100に送信される。 In the example of FIG. 7, "Analysis results" is sent to the data shaping device 100 as parent data that represents the meaning of the unformatted data 31 "No abnormalities" as child data. In addition, "No problems" and "Normal" are sent to the data shaping device 100 as child data related to the unformatted data 31 "No abnormalities."

<登録処理:ステップS108>
 登録部160は、未整形データ31を子データとしたときの親データの入力を受け付け、受け付けた親データを未整形データ31の親データとして意味情報52に登録する。
 具体的には、未整形データ31を子データとしたときの親データは、提示画面211からユーザにより入力され、データ整形装置100に送信される。そして、登録部160が、ユーザにより入力された、未整形データ31を子データとしたときの親データを意味情報52に登録する。親データとともに未整形データ31に関連する子データの入力を受信した場合は、登録部160は、親データとともに未整形データ31に関連する子データも意味情報52に登録する。
 図6の登録処理後の意味情報52では、未整形データ31である「異常なし」を子データとしたときの意味を表す親データとして、「分析結果」が登録されている。また、未整形データ31である「異常なし」に関連する子データとして、「問題なし」と「正常」が登録されている。
<Registration process: step S108>
The registration unit 160 receives input of parent data when the unformatted data 31 is treated as child data, and registers the received parent data in the semantic information 52 as parent data of the unformatted data 31 .
Specifically, parent data when unformatted data 31 is child data is input by the user from presentation screen 211 and transmitted to data shaping device 100. Then, registration unit 160 registers the parent data when unformatted data 31 is child data input by the user in semantic information 52. When receiving input of child data related to unformatted data 31 together with parent data, registration unit 160 registers the child data related to unformatted data 31 together with parent data in semantic information 52.
6, "analysis result" is registered as parent data expressing the meaning when "no abnormality" which is the unformatted data 31 is treated as child data. In addition, "no problem" and "normal" are registered as child data related to "no abnormality" which is the unformatted data 31.

 ステップS108の処理が完了すると、処理はステップS102に戻り、処理対象の列において、列名が割り当てられていないフィールドデータが無くなるまで処理を繰り返す。 When step S108 is completed, the process returns to step S102 and repeats the process until there is no field data in the column being processed that does not have a column name assigned to it.

 図6の例を用いて、データ整形処理についてさらに説明する。
 図6の例では、第2回以降のデータ整形処理の例を表している。
 図6の例では、検出部140は、未整形データ「異常なし」を検出する(ステップS105)。
 提示部150は、未整形データ「異常なし」に対応する親データと、その親データに対応する「異常なし」の以外の子データを入力するように、提示画面211をユーザ端末装置200に送信する(ステップS106)。
 提示画面211を介して受け付けた親データ「分析結果」と、未整形データ「異常なし」に関連する子データ「問題なし」と「正常」がデータ整形装置100に送信される(ステップS107)。
 そして、登録部160は、提示画面211を介して受け付けた親データ「分析結果」と、未整形データ「異常なし」に関連する子データ「問題なし」と「正常」を受信し、意味情報52に登録する(ステップS108)。
The data shaping process will be further described using the example of FIG.
The example of FIG. 6 shows an example of the data shaping process from the second time onwards.
In the example of FIG. 6, the detection unit 140 detects that the unformatted data is "normal" (step S105).
The presentation unit 150 transmits a presentation screen 211 to the user terminal device 200 to prompt the user to input parent data corresponding to the unformatted data "normal" and child data other than "normal" corresponding to the parent data (step S106).
The parent data "Analysis result" received via the presentation screen 211 and the child data "No problem" and "Normal" related to the unformatted data "No abnormality" are transmitted to the data shaping device 100 (step S107).
Then, the registration unit 160 receives the parent data "Analysis result" accepted via the presentation screen 211 and the child data "No problem" and "Normal" related to the unformatted data "No abnormalities", and registers them in the semantic information 52 (step S108).

 その後、ステップS102から処理が繰り返される。
 解析部120は、列名が割り当てられていないフィールドデータとして「異常なし」があると判定する(ステップS102)。第1回のデータ整形処理が終わった後のテーブルデータ51では、フィールドデータ「異常なし」について列名が割り当てられていない。例えば、前のデータ整形処理において追加された列のどこにも「異常なし」が振り分けられていない場合に、「異常なし」を列名が割り当てられていないフィールドデータと判定する。
Thereafter, the process is repeated from step S102.
The analysis unit 120 determines that there is "No abnormality" as field data to which a column name is not assigned (step S102). In the table data 51 after the first data shaping process is completed, a column name is not assigned to the field data "No abnormality". For example, if "No abnormality" is not assigned to any of the columns added in the previous data shaping process, the analysis unit 120 determines that "No abnormality" is field data to which a column name is not assigned.

 解析部120は、列名が割り当てられていないフィールドデータ「異常なし」が子データとして意味情報52に登録されていると判定する(ステップS103)。
 そして、整形部130は、意味情報52を用いて、列名が割り当てられていないフィールドデータ「異常なし」の列名として、親データである「分析結果」を選定する。第1回のデータ整形処理により、意味情報52には、子データ「異常なし」に対して、親データ「分析結果」と、「異常なし」に関連する子データ「問題なし」と「正常」が登録されている。そして、整形部130は、テーブルデータ51に新たな列を作成し、列名「分析結果」に、「異常なし」を振り分けることによりテーブルデータ51を整形する(ステップS104)。
The analysis unit 120 determines that the field data "No abnormality" to which no column name is assigned is registered as child data in the semantic information 52 (step S103).
Then, the shaping unit 130 uses the semantic information 52 to select the parent data "Analysis Results" as the column name of the field data "No Abnormality" to which no column name is assigned. As a result of the first data shaping process, the parent data "Analysis Results" and the child data "No Problem" and "Normal" related to "No Abnormality" are registered in the semantic information 52 for the child data "No Abnormality". The shaping unit 130 then creates a new column in the table data 51 and shapes the table data 51 by assigning "No Abnormality" to the column name "Analysis Results" (step S104).

 ***他の構成***
<変形例1>
 本実施の形態では、データ整形装置100は、ユーザ端末装置200に提示画面211を表示するものとして説明した。よって、未整形データの親データおよび未整形データに関連する子データといったユーザからの入力は、ユーザ端末装置200からネットワークを介して送信される。しかし、データ整形装置100の表示機器に提示画面211を表示する構成でもよい。この場合、データ整形装置100の登録部160が、データ整形装置100の表示機器に表示された提示画面211を介して、ユーザからの入力を受け付ける。
***Other configurations***
<Modification 1>
In the present embodiment, the data shaping device 100 has been described as displaying the presentation screen 211 on the user terminal device 200. Thus, input from the user, such as parent data of the unshaped data and child data related to the unshaped data, is transmitted from the user terminal device 200 via a network. However, the data shaping device 100 may be configured to display the presentation screen 211 on a display device. In this case, the registration unit 160 of the data shaping device 100 accepts input from the user via the presentation screen 211 displayed on the display device of the data shaping device 100.

<変形例2>
 本実施の形態では、データ整形システム500の各装置の機能がソフトウェアで実現される。変形例として、データ整形システム500の各装置の機能がハードウェアで実現されてもよい。
 具体的には、データ整形システム500の各装置は、プロセッサ910に替えて電子回路909を備える。
 以下において、データ整形装置100を例に説明するが、ユーザ端末装置200においても同様の説明を適用することができる。
<Modification 2>
In this embodiment, the functions of each device in data shaping system 500 are realized by software. As a modification, the functions of each device in data shaping system 500 may be realized by hardware.
Specifically, each device in data shaping system 500 includes electronic circuitry 909 in place of processor 910 .
In the following, the data shaping device 100 will be described as an example, but the same description can also be applied to the user terminal device 200.

 図8は、本実施の形態の変形例に係るデータ整形装置100の構成例を示す図である。
 電子回路909は、取得部110と解析部120と整形部130と検出部140と提示部150と登録部160の機能を実現する専用の電子回路である。電子回路909は、具体的には、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ロジックIC、GA、ASIC、または、FPGAである。GAは、Gate Arrayの略語である。ASICは、Application Specific Integrated Circuitの略語である。FPGAは、Field-Programmable Gate Arrayの略語である。
FIG. 8 is a diagram showing an example of the configuration of a data shaping device 100 according to a modified example of this embodiment.
The electronic circuit 909 is a dedicated electronic circuit for realizing the functions of the acquisition unit 110, the analysis unit 120, the shaping unit 130, the detection unit 140, the presentation unit 150, and the registration unit 160. Specifically, the electronic circuit 909 is a single circuit, a composite circuit, a programmed processor, a parallel programmed processor, a logic IC, a GA, an ASIC, or an FPGA. GA is an abbreviation for Gate Array. ASIC is an abbreviation for Application Specific Integrated Circuit. FPGA is an abbreviation for Field-Programmable Gate Array.

 取得部110と解析部120と整形部130と検出部140と提示部150と登録部160の機能は、1つの電子回路で実現されてもよいし、複数の電子回路に分散して実現されてもよい。 The functions of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 may be realized by a single electronic circuit, or may be distributed across multiple electronic circuits.

 別の変形例として、取得部110と解析部120と整形部130と検出部140と提示部150と登録部160の一部の機能が電子回路で実現され、残りの機能がソフトウェアで実現されてもよい。また、取得部110と解析部120と整形部130と検出部140と提示部150と登録部160の一部またはすべての機能がファームウェアで実現されてもよい。 As another variation, some of the functions of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 may be realized by electronic circuits, and the remaining functions may be realized by software. Also, some or all of the functions of the acquisition unit 110, analysis unit 120, shaping unit 130, detection unit 140, presentation unit 150, and registration unit 160 may be realized by firmware.

 プロセッサと電子回路の各々は、プロセッシングサーキットリとも呼ばれる。つまり、取得部110と解析部120と整形部130と検出部140と提示部150と登録部160の機能は、プロセッシングサーキットリにより実現される。 Each of the processor and electronic circuit is also called processing circuitry. In other words, the functions of the acquisition unit 110, analysis unit 120, formatting unit 130, detection unit 140, presentation unit 150, and registration unit 160 are realized by the processing circuitry.

***本実施の形態の効果の説明***
 以上のように、本実施の形態に係るデータ整形システムでは、列名が割り当てられなかったフィールド値あるいは単語に対して、意味あるいは概念をユーザに追加させる仕組みを設けている。これにより、本実施の形態に係るデータ整形装置100では、適切な意味情報を用いてデータ整形を行うことができるため、正確なデータ整形を実現することができる。
***Description of Effects of This Embodiment***
As described above, the data shaping system according to the present embodiment provides a mechanism for allowing the user to add meaning or concept to field values or words to which no column name has been assigned. This allows the data shaping device 100 according to the present embodiment to perform data shaping using appropriate semantic information, thereby realizing accurate data shaping.

 本実施の形態に係るデータ整形システムでは、フィールド値に定義した意味あるいは概念に紐づかない情報があるとき、意味情報の追加をユーザに促すことで、正確な列名付与ができるとともに、データ整形作業を効率化できる。 In the data reformatting system according to this embodiment, when there is information in the field value that is not linked to the defined meaning or concept, the user is prompted to add semantic information, allowing for accurate column naming and making data reformatting more efficient.

 本実施の形態に係るデータ整形システムでは、第1回のデータ整形後に、追加した列のいずれかの列にフィールドデータが振り分けられていないレコードのフィールドデータを、未整形データとして検出する。そして、本実施の形態に係るデータ整形システムでは、未整形データをユーザに提示し、意味あるいは概念を表す親データの追加をユーザに促す。そしてユーザにより入力された親データを意味情報に登録したら、データ解析およびデータ整形を再度実行する。そして、追加した列にフィールドデータが振り分けられていないレコードが無くなるまでこの作業を繰り返す。これにより、本実施の形態に係るデータ整形装置100では、ユーザにより入力された適切な意味情報を用いてデータ整形を行うことができるため、正確なデータ整形を実現することができる。 In the data shaping system according to this embodiment, after the first data shaping, the field data of a record in which field data has not been assigned to any of the added columns is detected as unshaped data. Then, in the data shaping system according to this embodiment, the unshaped data is presented to the user, and the user is prompted to add parent data that represents a meaning or concept. Then, once the parent data entered by the user is registered in the semantic information, data analysis and data shaping are performed again. Then, this process is repeated until there are no records in which field data has not been assigned to the added columns. As a result, the data shaping device 100 according to this embodiment can perform data shaping using the appropriate semantic information entered by the user, thereby achieving accurate data shaping.

 実施の形態2.
 本実施の形態では、主に、実施の形態1と異なる点および実施の形態1に追加する点について説明する。
 本実施の形態において、実施の形態1と同様の機能を有する構成については同一の符号を付し、その説明を省略する。
Embodiment 2.
In this embodiment, differences from and additions to the first embodiment will be mainly described.
In this embodiment, components having the same functions as those in the first embodiment are given the same reference numerals, and the description thereof will be omitted.

***構成の説明***
 本実施の形態に係るデータ整形システム500、データ整形装置100、およびユーザ端末装置200の構成は、実施の形態1と同様である。
 本実施の形態では、検出部140は、テーブルデータ51と意味情報52とに基づいて、テーブルデータ51の列名に振り分けられたフィールドデータが2つ以上の列名に跨っているか否かを判定する。そして、検出部140は、フィールドデータが2つ以上の列名に跨って振り分けられていると判定すると、当該フィールドデータを要注意データ32として検出する。
 また、提示部150は、要注意データ32を強調表示するとともに、要注意データ32の修正を受け付ける修正画面212を送信する。
 登録部160は、要注意データ32の修正をテーブルデータ51に反映する。
***Configuration Description***
The configurations of the data shaping system 500, data shaping device 100, and user terminal device 200 according to this embodiment are the same as those in the first embodiment.
In this embodiment, the detection unit 140 determines whether or not the field data assigned to the column names of the table data 51 spans two or more column names, based on the table data 51 and the semantic information 52. If the detection unit 140 determines that the field data is assigned across two or more column names, it detects the field data as suspicious data 32.
The presentation unit 150 also highlights the suspicious data 32 and transmits a correction screen 212 that accepts corrections to the suspicious data 32 .
The registration unit 160 reflects the correction of the suspicious data 32 in the table data 51 .

***動作の説明***
 次に、本実施の形態に係るデータ整形システム500の各装置の動作について説明する。データ整形システム500の各装置の動作手順は、データ整形方法に相当する。また、データ整形システム500の各装置の動作を実現するプログラムは、データ整形プログラムに相当する。
*** Operation Description ***
Next, the operation of each device of the data shaping system 500 according to the present embodiment will be described. The operation procedure of each device of the data shaping system 500 corresponds to a data shaping method. Also, the program that realizes the operation of each device of the data shaping system 500 corresponds to a data shaping program.

 図9は、本実施の形態に係るデータ整形システム500の動作を示すフロー図である。
 本実施の形態に係るデータ整形処理は、例えば、実施の形態1のデータ整形処理が完了した後に実施される。
FIG. 9 is a flow diagram showing the operation of the data shaping system 500 according to the present embodiment.
The data shaping process according to this embodiment is performed, for example, after the data shaping process according to the first embodiment is completed.

 ステップS201において、検出部140は、テーブルデータ51において列名に振り分けられたフィールドデータが2つ以上の列名に跨っているか否かを判定する。 In step S201, the detection unit 140 determines whether the field data assigned to a column name in the table data 51 spans two or more column names.

 図10は、本実施の形態に係るデータ整形処理を示す模式図である。
 図10の意味情報52では、親データ「原因」に、「停電」、「冠水」、「衝突」、「基板」、・・・といった子データ登録されている。また、親データ「故障部位」に、「基板」、「センサ」、「モータ」、・・・といった子データ登録されている。この意味情報52を用いて、データ整形処理を実施すると、図10の第1回整形後のテーブルデータ51のように、列名「原因」に対して、「停電」と「基板」の2つのフィールドデータが登録される。つまり、フィールドデータ「基板」は、列名「原因」と「故障部位」の2つの列名に跨って振り分けられる。
FIG. 10 is a schematic diagram showing the data shaping process according to the present embodiment.
In the semantic information 52 of Fig. 10, child data such as "power outage,""flooding,""collision,""circuitboard," etc. are registered for parent data "cause." Furthermore, child data such as "circuit board,""sensor,""motor," etc. are registered for parent data "fault location." When data shaping processing is performed using this semantic information 52, two field data, "power outage" and "circuit board," are registered for the column name "cause," as in table data 51 after the first shaping in Fig. 10. In other words, the field data "circuit board" is distributed across two column names, "cause" and "fault location."

 検出部140は、テーブルデータ51において列名に振り分けられたフィールドデータが2つ以上の列名に跨っているか否かを判定する。
 図10の例では、フィールドデータ「基板」は、列名「原因」と「故障部位」の2つの列名に跨って振り分けられている。
The detection unit 140 determines whether the field data assigned to the column names in the table data 51 spans two or more column names.
In the example of FIG. 10, the field data "PCB" is distributed across two column names, "Cause" and "Faulty Location".

 検出部140は、フィールドデータが2つ以上の列名に跨って振り分けられていると判定すると、当該フィールドデータを要注意データ32として検出する。
 図10の例では、検出部140は、2つの列名「原因」と「故障部位」に跨って設定されているフィールドデータ「基板」を、要注意データ32として検出する。
When the detection unit 140 determines that the field data is distributed across two or more column names, it detects the field data as suspicious data 32 .
In the example of FIG. 10, the detection unit 140 detects the field data “PCB” that is set across two column names “Cause” and “Faulty Part” as suspicious data 32 .

 ステップS202において、提示部150は、要注意データ32を強調表示するとともに、要注意データ32の修正を受け付ける修正画面212をユーザ端末装置200に送信する。 In step S202, the presentation unit 150 highlights the suspicious data 32 and transmits to the user terminal device 200 a correction screen 212 that accepts corrections to the suspicious data 32.

 図11は、本実施の形態に係る修正画面212の例を示す図である。
 修正画面212は、要注意データ32の修正を受け付ける。
 図11に示すように、修正画面212では、実施の形態1のデータ整形処理が完了した後のテーブルデータ51と、意味情報52とを表示する。そして、テーブルデータ51における要注意データ32を強調表示する。
 また、ユーザに、テーブルデータ51における要注意データの修正を促すメッセージを表示する。例えば、「列名「原因」に2つ以上のデータが設定されています。修正する場合は、修正ボタンを押下して修正してください。意味情報を修正する場合は修正ボタンを押下して修正してください。」といったメッセージが表示される。
FIG. 11 is a diagram showing an example of the correction screen 212 according to the present embodiment.
The correction screen 212 accepts corrections to the suspicious data 32 .
11, the correction screen 212 displays table data 51 after the data shaping process of the first embodiment is completed, and semantic information 52. Then, suspicious data 32 in the table data 51 is highlighted.
Also, a message is displayed to the user to prompt him/her to correct the data requiring attention in the table data 51. For example, a message such as "Two or more pieces of data are set in the column name 'Cause'. If you wish to correct the data, please press the Correct button and make the correction. If you wish to correct the semantic information, please press the Correct button and make the correction" is displayed.

 ステップS203において、ユーザ端末装置200の画面表示部210は、表示機器941に修正画面212を表示し、修正画面212を介してテーブルデータ51に対する要注意データ32の修正を受け付ける。
 例えば、ユーザは、修正画面212においてテーブルデータ51を正しく書き換えるといった操作を行う。操作方法は単語のキーボード入力、単語をドラッグアンドドロップ、あるいは音声操作でもよい。
 図11の例では、画面表示部210は、列名「原因」に設定されている2つのフィールドデータ「停電」、「基板」から、「基板」を削除するといった修正を受け付ける。
In step S 203 , the screen display unit 210 of the user terminal device 200 displays the correction screen 212 on the display device 941 , and accepts corrections to the suspicious data 32 in the table data 51 via the correction screen 212 .
For example, the user performs an operation to correctly rewrite the table data 51 on the correction screen 212. The operation method may be keyboard input of words, drag and drop of words, or voice operation.
In the example of FIG. 11, the screen display unit 210 accepts a correction such as deleting "Circuit Board" from the two field data "Power Outage" and "Circuit Board" set in the column name "Cause".

 そして、ユーザ端末装置200の画面表示部210は、修正画面212を介して受け付けたテーブルデータ51に対する要注意データ32の修正を、通信装置950によりデータ整形装置100に送信する。 Then, the screen display unit 210 of the user terminal device 200 transmits the corrections to the suspicious data 32 in the table data 51 received via the correction screen 212 to the data shaping device 100 via the communication device 950.

 ステップS204において、登録部160は、ユーザ端末装置200からテーブルデータ51に対する要注意データ32の修正を受信する。そして、登録部160は、テーブルデータ51に対する要注意データ32の修正をテーブルデータ51に反映する。
 図11の例では、列名「原因」からフィールドデータ「基板」を削除する修正が反映されている。
In step S204, the registration unit 160 receives the correction of the suspicious data 32 in the table data 51 from the user terminal device 200. Then, the registration unit 160 reflects the correction of the suspicious data 32 in the table data 51 in the table data 51.
In the example of FIG. 11, a correction is reflected that deletes the field data "Substrate" from the column name "Cause".

***他の構成***
<変形例3>
 図11に示すように、修正画面212では、テーブルデータにおける要注意データの修正を促すとともに、意味情報について修正することも可能である旨のメッセージを表示してもよい。
 画面表示部210は、修正画面212を介して要注意データの修正とともに、意味情報の修正を受け付けてもよい。そして、画面表示部210は、修正画面212を介して受け付けた要注意データの修正とともに、意味情報の修正をデータ整形装置に送信してもよい。
***Other configurations***
<Modification 3>
As shown in FIG. 11, the correction screen 212 may display a message urging the user to correct suspicious data in the table data, and also indicating that semantic information can be corrected.
The screen display unit 210 may accept a correction to the semantic information together with the correction of the suspicious data via the correction screen 212. Then, the screen display unit 210 may transmit the correction to the semantic information together with the correction of the suspicious data accepted via the correction screen 212 to the data shaping device.

***本実施の形態の効果の説明***
 以上のように、本実施の形態に係るデータ整形システムでは、整形後のテーブルデータを対象に、追加した列に振り分けられたフィールド値が正しい列に振り分けられていない可能性がある場合に、要注意データとして検出する。そして、検出された要注意データをユーザに提示するとともに、整形後のテーブルデータをユーザに編集させることができる。このように、本実施の形態に係るデータ整形システムでは、実施の形態1のデータ整形処理の後、さらにテーブルデータにユーザの修正を反映することができる。よって、本実施の形態に係るデータ整形システムによれば、より正確なデータ整形を実現することができる。
***Description of Effects of This Embodiment***
As described above, in the data shaping system according to the present embodiment, when the field value allocated to the added column may not be allocated to the correct column in the shaped table data, it detects it as suspicious data. Then, the detected suspicious data is presented to the user, and the user can edit the shaped table data. In this way, in the data shaping system according to the present embodiment, after the data shaping process of the first embodiment, the user's correction can be further reflected in the table data. Therefore, the data shaping system according to the present embodiment can realize more accurate data shaping.

 以上の実施の形態1および2では、データ整形システムの各装置の各部を独立した機能ブロックとして説明した。しかし、データ整形システムの各装置の構成は、上述した実施の形態のような構成でなくてもよい。データ整形システムの各装置の機能ブロックは、上述した実施の形態で説明した機能を実現することができれば、どのような構成でもよい。また、データ整形システムの各装置は、1つの装置でなく、複数の装置から構成されたシステムでもよい。
 また、実施の形態1および2のうち、複数の部分を組み合わせて実施しても構わない。あるいは、これらの実施の形態のうち、1つの部分を実施しても構わない。その他、これらの実施の形態を、全体としてあるいは部分的に、どのように組み合わせて実施しても構わない。
 すなわち、実施の形態1および2では、各実施の形態の自由な組み合わせ、あるいは各実施の形態の任意の構成要素の変形、もしくは各実施の形態において任意の構成要素の省略が可能である。
In the above first and second embodiments, each unit of each device of the data shaping system is described as an independent functional block. However, the configuration of each device of the data shaping system does not have to be the configuration as in the above-mentioned embodiment. The functional block of each device of the data shaping system may have any configuration as long as it can realize the functions described in the above-mentioned embodiment. In addition, each device of the data shaping system may be a system composed of multiple devices, not just one device.
In addition, a combination of multiple parts of the first and second embodiments may be implemented. Alternatively, one part of these embodiments may be implemented. In addition, any combination of these embodiments may be implemented, either as a whole or in part.
That is, in the first and second embodiments, the respective embodiments can be freely combined, or any of the components in each embodiment can be modified, or any of the components in each embodiment can be omitted.

 なお、上述した実施の形態は、本質的に好ましい例示であって、本開示の範囲、本開示の適用物の範囲、および本開示の用途の範囲を制限することを意図するものではない。上述した実施の形態は、必要に応じて種々の変更が可能である。例えば、フロー図あるいはシーケンス図を用いて説明した手順は、適宜に変更してもよい。 The above-described embodiments are essentially preferred examples, and are not intended to limit the scope of the present disclosure, the scope of application of the present disclosure, or the scope of use of the present disclosure. The above-described embodiments can be modified in various ways as necessary. For example, the procedures described using flow charts or sequence diagrams may be modified as appropriate.

 31 未整形データ、32 要注意データ、51 テーブルデータ、52 意味情報、100 データ整形装置、110 取得部、120 解析部、130 整形部、140 検出部、150 提示部、160 登録部、170,220 記憶部、200 ユーザ端末装置、210 画面表示部、211 提示画面、212 修正画面、500 データ整形システム、909 電子回路、910 プロセッサ、921 メモリ、922 補助記憶装置、930 入力インタフェース、940 出力インタフェース、941 表示機器、950 通信装置。 31 Unformatted data, 32 Data requiring caution, 51 Table data, 52 Semantic information, 100 Data formatting device, 110 Acquisition unit, 120 Analysis unit, 130 Formatting unit, 140 Detection unit, 150 Presentation unit, 160 Registration unit, 170, 220 Storage unit, 200 User terminal device, 210 Screen display unit, 211 Presentation screen, 212 Correction screen, 500 Data formatting system, 909 Electronic circuit, 910 Processor, 921 Memory, 922 Auxiliary storage device, 930 Input interface, 940 Output interface, 941 Display device, 950 Communication device.

Claims (10)

 テーブルデータを整形するデータ整形装置において、
 前記テーブルデータの整形に用いられ、子データとその子データの意味を表す親データとが対応付けられて登録されている意味情報を記憶する記憶部と、
 前記意味情報を用いて、前記テーブルデータに設定された設定データに含まれるフィールドデータのうち列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されているか否かを判定する解析部と、
 前記列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されていなければ、前記列名が割り当てられていないフィールドデータを未整形データとして検出する検出部と、
 前記未整形データを子データとしたときの親データの入力を受け付け、受け付けた親データを前記未整形データの親データとして前記意味情報に登録する登録部と
を備えるデータ整形装置。
A data formatting device for formatting table data, comprising:
a storage unit that stores semantic information used for shaping the table data, in which child data and parent data representing the meaning of the child data are associated with each other and registered;
an analysis unit that uses the semantic information to determine whether or not field data to which a column name is not assigned among field data included in the setting data set in the table data is registered as child data in the semantic information;
a detection unit that detects the field data to which a column name is not assigned as unformatted data if the field data to which a column name is not assigned is not registered in the semantic information as child data;
a registration unit that receives an input of parent data when the unformatted data is treated as child data, and registers the received parent data in the semantic information as parent data of the unformatted data.
 前記データ整形装置は、
 前記意味情報に登録されていれば、登録されている子データに対応する親データを前記列名が割り当てられていないフィールドデータの列名として選定し、選定された列名に前記列名が割り当てられていないフィールドデータを振り分けることにより前記テーブルデータを整形する整形部を備える請求項1に記載のデータ整形装置。
The data shaping device comprises:
2. The data shaping device according to claim 1, further comprising a shaping unit that, if registered in the semantic information, selects parent data corresponding to the registered child data as a column name of field data to which the column name is not assigned, and shapes the table data by allocating the field data to which the column name is not assigned to the selected column name.
 前記解析部は、
 前記テーブルデータにおいてデータを整形する対象となる列の各行の設定データから単語を抽出し、抽出した単語の各々を前記列名が割り当てられていないフィールドデータとして選定し、前記列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されているか否かを判定する請求項2に記載のデータ整形装置。
The analysis unit is
A data shaping device as described in claim 2, which extracts words from the setting data of each row of a column to be shaped in the table data, selects each of the extracted words as field data to which a column name is not assigned, and determines whether the field data to which a column name is not assigned is registered as child data in the semantic information.
 前記データ整形装置は、
 前記未整形データを提示する提示画面を送信する提示部を備え、
 前記登録部は、
 前記提示画面を介して、前記未整形データを子データとしたときの親データの入力を受け付ける請求項1から請求項3のいずれか1項に記載のデータ整形装置。
The data shaping device comprises:
a presentation unit that transmits a presentation screen for presenting the unformatted data;
The registration unit is
4. The data shaping device according to claim 1, further comprising: a display screen that displays a display of the unshaped data and a display of the parent data.
 前記登録部は、
 前記提示画面を介して、前記未整形データを子データとしたときの親データとともに、前記未整形データに関連する子データであって前記親データに対応する子データの入力を受け付け、受け付けた前記親データと前記親データに対応する子データを前記意味情報に登録する請求項4に記載のデータ整形装置。
The registration unit is
A data shaping device as described in claim 4, which accepts input of child data related to the unformatted data and corresponding to the parent data, along with parent data when the unformatted data is treated as child data, via the presentation screen, and registers the accepted parent data and the child data corresponding to the parent data in the semantic information.
 前記検出部は、
 前記テーブルデータと前記意味情報とに基づいて、前記テーブルデータにおいて、列名に振り分けられたフィールドデータが2つ以上の列名に跨っているか否かを判定し、2つ以上の列名に跨っていると判定すると、当該フィールドデータを要注意データとして検出し、
 前記提示部は、
 前記要注意データを強調表示するとともに、前記要注意データの修正を受け付ける修正画面を送信し、
 前記登録部は、
 前記要注意データの修正を前記テーブルデータに反映する請求項4または請求項5に記載のデータ整形装置。
The detection unit is
determining whether or not field data assigned to a column name in the table data spans two or more column names based on the table data and the semantic information, and if it is determined that the field data spans two or more column names, detecting the field data as suspicious data;
The presentation unit is
highlighting the suspicious data and transmitting a correction screen for accepting corrections to the suspicious data;
The registration unit is
6. The data shaping device according to claim 4, wherein correction of the suspicious data is reflected in the table data.
 テーブルデータを整形するデータ整形装置とユーザにより利用されるユーザ端末装置であって前記データ整形装置と通信するユーザ端末装置とを備えるデータ整形システムにおいて、
 前記データ整形装置は、
 前記テーブルデータの整形に用いられ、子データとその子データの意味を表す親データとが対応付けられて登録されている意味情報を記憶する記憶部と、
 前記テーブルデータに設定された設定データに含まれるフィールドデータのうち列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されていなければ、前記列名が割り当てられていないフィールドデータを未整形データとして検出する検出部と、
 前記未整形データを提示する提示画面を前記ユーザ端末装置に送信する提示部と
を備え、
 前記ユーザ端末装置は、
 前記提示画面を表示し、前記提示画面を介して前記未整形データを子データとしたときの親データの入力を受け付ける画面表示部を備え、
 前記データ整形装置は、さらに、
 前記提示画面を介して受け付けた、前記未整形データを子データとしたときの親データを前記意味情報に登録する登録部を備えるデータ整形システム。
A data shaping system including a data shaping device that shapes table data and a user terminal device that is used by a user and communicates with the data shaping device,
The data shaping device comprises:
a storage unit that stores semantic information used for shaping the table data, in which child data and parent data representing the meaning of the child data are associated with each other and registered;
a detection unit that detects, if field data to which a column name is not assigned among field data included in the setting data set in the table data is not registered as child data in the semantic information, the field data to which a column name is not assigned as unformatted data;
a presentation unit that transmits a presentation screen that presents the unformatted data to the user terminal device;
The user terminal device
a screen display unit that displays the presentation screen and receives input of parent data when the unformatted data is set as child data via the presentation screen;
The data shaping device further comprises:
A data shaping system comprising a registration unit that registers parent data, when the unshaped data accepted via the presentation screen is treated as child data, in the semantic information.
 テーブルデータを整形するデータ整形装置と通信し、ユーザにより利用されるユーザ端末装置において、
 前記テーブルデータの整形に用いられ、子データとその子データの意味を表す親データとが対応付けられて登録されている意味情報を備え、前記テーブルデータに設定された設定データに含まれるフィールドデータのうち列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されていなければ、前記列名が割り当てられていないフィールドデータを未整形データとして検出する前記データ整形装置から、前記未整形データを提示する提示画面を受信し、前記提示画面を表示し、前記提示画面を介して前記未整形データを子データとしたときの親データの入力を受け付け、前記提示画面を介して受け付けた、前記未整形データを子データとしたときの親データを、通信装置により前記データ整形装置に送信する画面表示部を備えるユーザ端末装置。
A user terminal device communicates with a data formatting device that formats table data and is used by a user,
A user terminal device comprising: a screen display unit that receives a presentation screen presenting the unformatted data from the data shaping device, the screen display unit being used to shape the table data and including semantic information in which child data and parent data representing the meaning of the child data are registered in correspondence with each other; and a screen display unit that displays the presentation screen, accepts input of parent data when the unformatted data is treated as child data via the presentation screen, and transmits the parent data when the unformatted data is treated as child data, which was accepted via the presentation screen, to the data shaping device via a communication device, if field data included in setting data set in the table data and to which a column name is not assigned is not registered in the semantic information as child data, the data shaping device detects the field data to which a column name is not assigned as unformatted data.
 テーブルデータを整形するデータ整形装置に用いられるデータ整形方法において、
 コンピュータが、前記テーブルデータの整形に用いられ、子データとその子データの意味を表す親データとが対応付けられて登録されている意味情報を用いて、前記テーブルデータに設定された設定データに含まれるフィールドデータのうち列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されているか否かを判定し、
 コンピュータが、前記列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されていなければ、前記列名が割り当てられていないフィールドデータを未整形データとして検出し、
 コンピュータが、前記未整形データを子データとしたときの親データの入力を受け付け、受け付けた親データを前記未整形データの親データとして前記意味情報に登録する登録するデータ整形方法。
A data shaping method for use in a data shaping device for shaping table data, comprising:
a computer uses semantic information used for shaping the table data, in which child data and parent data expressing the meaning of the child data are associated and registered, to determine whether or not field data to which a column name is not assigned, among field data included in setting data set in the table data, is registered as child data in the semantic information;
if the field data to which a column name is not assigned is not registered as child data in the semantic information, the computer detects the field data to which a column name is not assigned as unformatted data;
A data formatting method in which a computer receives an input of parent data when the unformatted data is treated as child data, and registers the received parent data in the semantic information as parent data of the unformatted data.
 テーブルデータを整形するデータ整形装置に用いられるデータ整形プログラムにおいて、
 前記テーブルデータの整形に用いられ、子データとその子データの意味を表す親データとが対応付けられて登録されている意味情報を記憶する記憶処理と、
 前記意味情報を用いて、前記テーブルデータに設定された設定データに含まれるフィールドデータのうち列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されているか否かを判定する解析処理と、
 前記列名が割り当てられていないフィールドデータが子データとして前記意味情報に登録されていなければ、前記列名が割り当てられていないフィールドデータを未整形データとして検出する検出処理と、
 前記未整形データを子データとしたときの親データの入力を受け付け、受け付けた親データを前記未整形データの親データとして前記意味情報に登録する登録処理と
をコンピュータに実行させるデータ整形プログラム。
A data shaping program for use in a data shaping device for shaping table data, comprising:
a storage process for storing semantic information used in shaping the table data, the semantic information being registered in association with child data and parent data representing the meaning of the child data;
an analysis process using the semantic information to determine whether or not field data to which a column name is not assigned among field data included in the setting data set in the table data is registered as child data in the semantic information;
a detection process for detecting the field data to which a column name is not assigned as unformatted data if the field data to which a column name is not assigned is not registered as child data in the semantic information;
a data shaping program that causes a computer to execute a registration process of accepting input of parent data when the unformatted data is treated as child data, and registering the accepted parent data in the semantic information as parent data of the unformatted data.
PCT/JP2023/009506 2023-03-13 2023-03-13 Data shaping apparatus, data shaping system, user terminal apparatus, data shaping method, and data shaping program Pending WO2024189717A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/JP2023/009506 WO2024189717A1 (en) 2023-03-13 2023-03-13 Data shaping apparatus, data shaping system, user terminal apparatus, data shaping method, and data shaping program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2023/009506 WO2024189717A1 (en) 2023-03-13 2023-03-13 Data shaping apparatus, data shaping system, user terminal apparatus, data shaping method, and data shaping program

Publications (1)

Publication Number Publication Date
WO2024189717A1 true WO2024189717A1 (en) 2024-09-19

Family

ID=92754582

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2023/009506 Pending WO2024189717A1 (en) 2023-03-13 2023-03-13 Data shaping apparatus, data shaping system, user terminal apparatus, data shaping method, and data shaping program

Country Status (1)

Country Link
WO (1) WO2024189717A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016194060A1 (en) * 2015-05-29 2016-12-08 株式会社日立製作所 Data configuration analyzing device and data configuration analyzing method
JP2017525033A (en) * 2014-06-30 2017-08-31 マイクロソフト テクノロジー ライセンシング,エルエルシー Understanding tables for searching
WO2018025707A1 (en) * 2016-08-05 2018-02-08 日本電気株式会社 Table-meaning estimating system, method, and program
US20220343191A1 (en) * 2021-04-22 2022-10-27 Optum Technology, Inc. Machine learning techniques for predictive structural analysis

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017525033A (en) * 2014-06-30 2017-08-31 マイクロソフト テクノロジー ライセンシング,エルエルシー Understanding tables for searching
WO2016194060A1 (en) * 2015-05-29 2016-12-08 株式会社日立製作所 Data configuration analyzing device and data configuration analyzing method
WO2018025707A1 (en) * 2016-08-05 2018-02-08 日本電気株式会社 Table-meaning estimating system, method, and program
US20220343191A1 (en) * 2021-04-22 2022-10-27 Optum Technology, Inc. Machine learning techniques for predictive structural analysis

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
AKIO JIN, MASAYUKI INOUE, TAKUYA SARUWATARI, TERUKO MIYATA, DAISUKE HAMURO, NORIAKI IZUMI: "An Evaluation on Discerning Hidden Critical Rules in Legacy Information Systems", IEICE TECHNICAL REPORT, KBSE, IEICE, JP, vol. 117, no. 295 (KBSE2017-26), 3 November 2017 (2017-11-03), JP, pages 1 - 6, XP009557368 *
HOSHINO, TAKASHI; TSUNAKAWA, MITSUAKI; MACHIHARA, HIROKI: "Inter-Database Relationships Discovery and Retrieval Method for Multidatabase Environment", IPSJ SIG TECHNICAL REPORT, INFORMATION PROCESSING SOCIETY OF JAPAN (IPSJ), JP, vol. 98, no. 58, 10 July 1998 (1998-07-10), JP, pages 389 - 396, XP009558700 *

Similar Documents

Publication Publication Date Title
US9042653B2 (en) Associating captured image data with a spreadsheet
US20080301553A1 (en) Verifying compliance of user interfaces with desired guidelines
CN110750654A (en) Knowledge graph acquisition method, device, equipment and medium
US20220004885A1 (en) Computer system and contribution calculation method
CN106648569B (en) Target serialization realization method and device
US7720814B2 (en) Repopulating a database with document content
CN110362630B (en) Data management method, device, equipment and computer-readable storage medium
CN112799760B (en) Form rendering method and device
CN111598707A (en) Page generation method and electronic equipment
CN111414727A (en) Method and device for editing header and footer of PDF (Portable document Format) document and electronic equipment
US20200342169A1 (en) Information processing apparatus and non-transitory computer readable medium storing program
WO2024189717A1 (en) Data shaping apparatus, data shaping system, user terminal apparatus, data shaping method, and data shaping program
CN113517047A (en) Medical data acquisition method, device, electronic device and storage medium
CN115756761A (en) Mirror image start-stop method and device, electronic equipment and readable storage medium
US20160042022A1 (en) Data coordination support apparatus and data coordination support method
JP6657574B2 (en) Prescription output program, apparatus, and method
CN114692579A (en) Method, device, equipment and storage medium for storing electronic official document examination and approval traces
CN112650809B (en) Method and device for formatting tree structure data and electronic equipment
US20240303425A1 (en) Spreadsheet apparatus, spreadsheet method and non-transitory computer readable recording medium
CN113569182B (en) Data processing method, device, storage medium and electronic device
CN114675795B (en) Method, device and storage medium for overprinting medical records
CN119883466B (en) Software interface language switching processing method, device and storage medium
WO2025069360A1 (en) Setting management device, setting management method, and setting management program
US20230385540A1 (en) Information processing method, information processing apparatus, and storage medium
JP7754026B2 (en) Database control device, database control method, and program

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23927340

Country of ref document: EP

Kind code of ref document: A1