[go: up one dir, main page]

JP7513294B2 - STORAGE APPARATUS, STORAGE SYSTEM, FAILURE RECOVERY METHOD, AND PROGRAM - Google Patents

STORAGE APPARATUS, STORAGE SYSTEM, FAILURE RECOVERY METHOD, AND PROGRAM Download PDF

Info

Publication number
JP7513294B2
JP7513294B2 JP2022109430A JP2022109430A JP7513294B2 JP 7513294 B2 JP7513294 B2 JP 7513294B2 JP 2022109430 A JP2022109430 A JP 2022109430A JP 2022109430 A JP2022109430 A JP 2022109430A JP 7513294 B2 JP7513294 B2 JP 7513294B2
Authority
JP
Japan
Prior art keywords
storage
setting information
information
setting
specific information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2022109430A
Other languages
Japanese (ja)
Other versions
JP2024007965A (en
Inventor
武人 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Platforms Ltd
Original Assignee
NEC Platforms Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Platforms Ltd filed Critical NEC Platforms Ltd
Priority to JP2022109430A priority Critical patent/JP7513294B2/en
Publication of JP2024007965A publication Critical patent/JP2024007965A/en
Application granted granted Critical
Publication of JP7513294B2 publication Critical patent/JP7513294B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Description

本発明は、ストレージ装置、ストレージシステム、障害復旧方法、及びプログラムに関する。 The present invention relates to a storage device, a storage system, a failure recovery method, and a program.

従来、RAID(Redundant Array of Independent Disk)構成のストレージシステムにおいて、ハードディスク等のディスク障害により縮退状態になった場合は物理的なディスク交換による復旧手段しか無かった。ハードディスクにおける障害はたとえそれが一部分であっても、ディスク全体に波及する恐れがあるからである。この点、SSD(Solid State Drive)のようなフラッシュメモリ等の不揮発性の半導体記憶装置では、不良ブロックを使用せずに、他の領域を使用しながら運用を続けられるというメリットがある。 Conventionally, in a storage system with a RAID (Redundant Array of Independent Disks) configuration, if a disk failure such as a hard disk caused the system to enter a degraded state, the only way to recover was to physically replace the disk. This is because a failure in a hard disk, even if it was only a partial failure, could affect the entire disk. In this regard, non-volatile semiconductor storage devices such as flash memory in SSDs (Solid State Drives) have the advantage that they can continue operation while using other areas without using bad blocks.

特許文献1には以下のような不揮発性半導体記憶装置が開示されている。1つの不揮発性半導体記憶装置内でRAIDシステムを構築し、ブロック単位で故障箇所の置換を可能としている。障害が発生すると、記憶領域の置換を自動で実行することが可能である。これにより、複数のストレージ装置を用いてRAIDを構築した場合とは異なり、ストレージ装置の交換が不要となる。 Patent Document 1 discloses the following non-volatile semiconductor memory device. A RAID system is constructed within a single non-volatile semiconductor memory device, making it possible to replace faulty areas on a block-by-block basis. When a failure occurs, it is possible to automatically replace the storage area. This makes it unnecessary to replace the storage device, as opposed to constructing a RAID using multiple storage devices.

特開2013-125513号公報JP 2013-125513 A

なお、上記先行技術文献の各開示を、本書に引用をもって繰り込むものとする。以下の分析は、本発明者らによってなされたものである。 The disclosures of the above-mentioned prior art documents are incorporated herein by reference. The following analysis was conducted by the present inventors.

ところで、ディスク装置の障害にはデータの読み書きに関係する障害以外に、ディスク装置に設定するディスク固有情報の不一致により障害と判断される場合がある。例えば、32GBの容量設定値が故障により8GBに変更になってしまうケースなどである。この場合においてディスク固有設定情報はRAIDを構築済みのストレージシステムでは再設定できないため、ディスク装置を取り外して再設定用の別装置(RAID環境ではなく、ディスク単体をシステムが認識できる環境)で編集することになる。従ってディスク固有情報の修正に伴って装置の取り外し作業が発生し、結局のところディスクを物理的に交換するのと同等の手間がかかる事となる。 Incidentally, in addition to failures related to reading and writing data, disk device failures can also be determined to be due to discrepancies in the disk-specific information set on the disk device. For example, a failure can cause a capacity setting of 32 GB to change to 8 GB. In such cases, disk-specific setting information cannot be reconfigured in a storage system where RAID has already been configured, so the disk device must be removed and edited on a separate device for reconfiguration (not in a RAID environment, but in an environment where the system can recognize the disk individually). Therefore, correcting the disk-specific information requires the removal of the device, which ultimately takes the same amount of work as physically replacing the disk.

本発明はストレージ装置(ディスク装置)のストレージ(ディスク)固有情報に起因する障害時において、装置を取り外すことなく障害の復旧が可能な、ストレージ装置、ストレージシステム、障害復旧方法及びプログラムを提供することを目的とする。 The present invention aims to provide a storage device, a storage system, a failure recovery method, and a program that can recover from a failure caused by storage (disk) specific information of a storage device (disk device) without removing the device.

本発明乃至開示の第一の視点によれば、ストレージの設定情報であるストレージ設定情報を保持する保持部と、ストレージの障害時に通知されるストレージ障害通知に応じて、ストレージ設定情報とストレージに設定されているストレージ固有情報とを照合する照合部と、照合部の照合結果に基づいてストレージ設定情報をストレージ固有情報として設定する設定部と、を有するストレージ装置が提供される。 According to a first aspect of the present invention or disclosure, a storage device is provided that has a storage unit that holds storage setting information, which is storage setting information, a comparison unit that compares the storage setting information with storage-specific information set in the storage in response to a storage fault notification that is notified when a fault occurs in the storage, and a setting unit that sets the storage setting information as storage-specific information based on the comparison result of the comparison unit.

本発明乃至開示の第二の視点によれば、複数のストレージ装置と、複数のストレージ装置のいずれかにおいて障害が検出された場合に、ストレージ障害通知を、複数のストレージ装置のうち、障害発生に係るストレージ装置へ通知する障害通知部と、障害に係るストレージ装置の設定部が、ストレージ設定情報を、ストレージ固有情報として設定した場合に、障害に係るストレージ装置を再構築するための制御を行う再構築部と、を有する制御装置を含む、ストレージシステムが提供される。 According to a second aspect of the present invention and disclosure, there is provided a storage system including a control device having: a plurality of storage devices; a failure notification unit that, when a failure is detected in any of the plurality of storage devices, sends a storage failure notification to a storage device involved in the occurrence of the failure among the plurality of storage devices; and a reconstruction unit that, when a setting unit of the storage device involved in the failure sets storage setting information as storage specific information, performs control to reconstruct the storage device involved in the failure.

本発明乃至開示の第三の視点によれば、複数のストレージ装置のいずれかにおいて障害が検出された場合に、ストレージ障害通知を、複数のストレージ装置のうち、障害発生に係るストレージ装置へ通知するステップと、ストレージ障害通知に応じて、ストレージの設定情報であるストレージ設定情報と、ストレージに設定されているストレージ固有情報とを照合するステップと、照合の結果、ストレージ設定情報と、ストレージ固有情報と、が一致しない場合には、ストレージ設定情報を、ストレージ固有情報として設定するステップと、障害に係るストレージ装置を再構築するための制御を行うステップと、を含む障害復旧方法が提供される。 According to a third aspect of the present invention or disclosure, there is provided a failure recovery method including the steps of: when a failure is detected in any of a plurality of storage devices, sending a storage failure notification to a storage device related to the occurrence of the failure among the plurality of storage devices; in response to the storage failure notification, comparing storage setting information, which is setting information of the storage, with storage specific information set in the storage; if the comparison shows that the storage setting information and the storage specific information do not match, setting the storage setting information as the storage specific information; and performing control to reconstruct the storage device related to the failure.

本発明乃至開示の第四の視点によれば、複数のストレージ装置のいずれかにおいて障害が検出された場合に、ストレージ障害通知を、複数のストレージ装置のうち、障害発生に係るストレージ装置へ通知する処理と、ストレージ障害通知に応じて、ストレージの設定情報であるストレージ設定情報と、ストレージに設定されているストレージ固有情報とを照合する処理と、照合の結果、ストレージ設定情報と、ストレージ固有情報と、が一致しない場合には、ストレージ設定情報を、ストレージ固有情報として設定する処理と、障害に係るストレージ装置を再構築するための制御を行う処理と、をコンピュータに実行させるためのプログラムが提供される。 According to a fourth aspect of the present invention or disclosure, a program is provided for causing a computer to execute the following steps when a fault is detected in one of a plurality of storage devices: sending a storage fault notification to a storage device involved in the fault among the plurality of storage devices; comparing storage setting information, which is setting information for the storage, with storage-specific information set in the storage in response to the storage fault notification; setting the storage setting information as storage-specific information when the storage setting information and the storage-specific information do not match as a result of the comparison; and controlling the reconstruction of the storage device involved in the fault.

本発明乃至開示の各視点によれば、本発明は、ストレージ装置(ディスク装置)のストレージ(ディスク)固有情報に起因する障害時において、装置を取り外すことなく障害の復旧が可能な、ストレージ装置、ストレージシステム、障害復旧方法及びプログラムが提供される。 According to each of the aspects of the present invention and disclosure, the present invention provides a storage device, a storage system, a failure recovery method, and a program that can recover from a failure caused by storage (disk) specific information of a storage device (disk device) without removing the device.

一実施形態に係るストレージ装置の構成の一例を示すブロック図である。2 is a block diagram showing an example of a configuration of a storage device according to an embodiment. FIG. 「ストレージ設定情報」及び「ストレージ固有情報」の項目の一例を示す図である。FIG. 13 is a diagram showing an example of items of "storage setting information" and "storage specific information." 第1の実施形態にかかるストレージシステムの構成の概略を示す概念図である。1 is a conceptual diagram showing an outline of the configuration of a storage system according to a first embodiment. 第1の実施形態にかかるストレージシステムの構成の一例を示すブロック図である。1 is a block diagram illustrating an example of a configuration of a storage system according to a first embodiment. 第1の実施形態のストレージシステムの動作を示すためのフローチャートである。4 is a flowchart showing the operation of the storage system of the first embodiment. 第1の実施形態に係るストレージシステムのハードウエア構成の一例を示す図である。FIG. 1 is a diagram illustrating an example of a hardware configuration of a storage system according to a first embodiment.

初めに、一実施形態の概要について説明する。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、この概要の記載はなんらの限定を意図するものではない。また、各図におけるブロック間の接続線は、双方向及び単方向の双方を含む。一方向矢印については、主たる信号(データ)の流れを模式的に示すものであり、双方向性を排除するものではない。更に、本願開示に示す回路図、ブロック図、内部構成図、接続図などにおいて、明示は省略するが、入力ポート及び出力ポートが各接続線の入力端及び出力端のそれぞれに存在する。入出力インタフェースも同様である。 First, an overview of one embodiment will be described. Note that the reference numerals in the drawings attached to this overview are added to each element for convenience as an example to aid in understanding, and the description of this overview is not intended to be limiting in any way. Furthermore, the connection lines between blocks in each figure include both bidirectional and unidirectional ones. One-way arrows are used to indicate the flow of the main signal (data) and do not exclude bidirectionality. Furthermore, although not explicitly shown in the circuit diagrams, block diagrams, internal configuration diagrams, connection diagrams, etc. shown in this disclosure, input ports and output ports exist at the input and output ends of each connection line. The same applies to input/output interfaces.

図1は一実施形態に係るストレージ装置の構成の一例を示すブロック図である。この図にあるように、一実施形態に係るストレージ装置10は、保持部11と、照合部12と、設定部13と、を有する。 Figure 1 is a block diagram showing an example of the configuration of a storage device according to one embodiment. As shown in this figure, a storage device 10 according to one embodiment has a holding unit 11, a matching unit 12, and a setting unit 13.

保持部11は、ストレージの設定情報であるストレージ設定情報を保持する。「ストレージ」とはSSD(Solid State Drive)、ハードディスク、その他の書き換え可能な記憶媒体を指す。「ストレージの設定情報」とは、少なくともストレージ容量、発行コマンドキュー設定、キャッシュの有効又は無効の設定のうちの一が含まれる情報であって、後述するストレージ固有情報と同一の項目が含まれる情報である。ストレージ設定情報は、SSDやハードディスク等においては、内蔵の基盤内のEPROM(Erasable Programmable Read Only Memory)などにリストとして保持される。 The storage unit 11 stores storage setting information, which is storage setting information. "Storage" refers to SSDs (Solid State Drives), hard disks, and other rewritable storage media. "Storage setting information" refers to information that includes at least one of the following: storage capacity, issued command queue settings, and cache enable/disable settings, and is information that includes the same items as the storage specific information described below. In SSDs, hard disks, etc., the storage setting information is stored as a list in an EPROM (Erasable Programmable Read Only Memory) in the built-in board.

照合部12は、ストレージの障害時に通知されるストレージ障害通知に応じて、ストレージ設定情報とストレージに設定されているストレージ固有情報とを照合する。「ストレージ障害通知」とは、障害を検出されたホストやコントローラから通知されるコマンドである。「ストレージ固有情報」とは、上述の「ストレージ設定情報」と同一の項目が含まれる情報である。「ストレージ固有情報」はそのストレージ装置に関する種々の設定情報が含まれる固有の情報である。工場出荷時に設定されているため、通常の運用時に書き換える必要はないので、専用のソフトウエアを用いて更新を行う必要がある。特に、RAID構成となっているストレージ装置について、一旦システムから取り外して単体の状態でPC等に接続し、変更する必要がある。 The collation unit 12 compares the storage setting information with the storage specific information set in the storage in response to a storage fault notification that is notified when a fault occurs in the storage. A "storage fault notification" is a command notified from a host or controller in which a fault is detected. "Storage specific information" is information that includes the same items as the above-mentioned "storage setting information." "Storage specific information" is unique information that includes various setting information related to the storage device. Since it is set at the factory, it does not need to be rewritten during normal operation, so it is necessary to update it using dedicated software. In particular, for storage devices that have a RAID configuration, it is necessary to remove them from the system and connect them to a PC or the like in a standalone state to make the changes.

図2に「ストレージ固有情報」の項目の一例を示す。なおこの項目は「ストレージ設定情報」と共通である。この図にある各項目に関して設定値が付与され、ストレージ装置内に格納されている。 Figure 2 shows an example of an item in "storage specific information." This item is also common to "storage setting information." A setting value is assigned to each item in this figure and is stored in the storage device.

設定部13は、照合部の照合結果に基づいて前記ストレージ設定情報を前記ストレージ固有情報として設定する。照合部の照合結果である一致か不一致かの結果に応じて、保持されている設定情報をストレージ固有情報として書き換える。 The setting unit 13 sets the storage setting information as the storage specific information based on the result of the comparison by the comparison unit. Depending on the result of the comparison by the comparison unit, which is a match or mismatch, the setting information held is rewritten as storage specific information.

一実施形態のストレージ装置は、障害によりストレージ固有情報が失われたり、壊れたりした場合に、通常であればストレージ装置を交換したり、ストレージ装置を取り外してストレージ固有情報を修正する必要に迫られるが、障害通知のコマンドに応じて、保持されているストレージ設定情報をストレージ固有情報として書き込むことで、新たなディスクとして再構築が可能となる。つまり、ストレージ装置を取り外すことなく、ディスクの再構築が可能となる。 In one embodiment of the storage device, if storage-specific information is lost or corrupted due to a failure, it would normally be necessary to replace the storage device or remove the storage device to correct the storage-specific information. However, in response to a failure notification command, the stored storage setting information is written as storage-specific information, making it possible to reconstruct the disk as a new disk. In other words, it is possible to reconstruct the disk without removing the storage device.

以下に具体的な実施の形態について、図面を参照して更に詳しく説明する。なお、各実施形態において同一構成要素には同一の符号を付し、その説明を省略する。 Specific embodiments are described in more detail below with reference to the drawings. Note that the same components in each embodiment are given the same reference numerals and their description is omitted.

[第1の実施形態]
図3は、第1の実施形態にかかるストレージシステムの構成の概略を示す概念図である。この図にあるように、本実施形態のストレージシステム100は、コントローラ101に接続されているホスト装置104と、コントローラ101と、SSD#1(102)、SSD#2(103)とからなる。図のようにストレージシステム100はサーバ等のホスト装置104が含まれていても良い。SSD#1(102)とSSD#2(103)とはRAID構成をとっている。なお、SSDに関してはRAID構成の類型により2以上のSSDがコントローラに接続されることになるためSSDの台数は2台に限られない。
[First embodiment]
3 is a conceptual diagram showing an outline of the configuration of a storage system according to the first embodiment. As shown in this figure, the storage system 100 of this embodiment is composed of a host device 104 connected to a controller 101, the controller 101, SSD #1 (102), and SSD #2 (103). As shown in the figure, the storage system 100 may include a host device 104 such as a server. SSD #1 (102) and SSD #2 (103) have a RAID configuration. Note that, regarding SSDs, the number of SSDs is not limited to two, since two or more SSDs are connected to the controller depending on the type of RAID configuration.

図4は、第1の実施形態にかかるストレージシステムの構成の一例を示すブロック図である。この図にあるように、本実施形態のストレージシステム100は、制御装置14と、ストレージ装置#1(17)、#2(18)を含む。制御装置14は障害通知部15と、再構築部16と、を有する。この他ストレージシステム100はホスト装置を有していても良い。ストレージ装置#1、#2(17、18)は、図示していないが、上述の通り、保持部11と、照合部12と、設定部13と、を有する。なおこれらの構成については上記一実施形態で記載済みであるので説明は省略する。 Figure 4 is a block diagram showing an example of the configuration of a storage system according to the first embodiment. As shown in this figure, the storage system 100 of this embodiment includes a control device 14 and storage devices #1 (17) and #2 (18). The control device 14 has a fault notification unit 15 and a reconstruction unit 16. The storage system 100 may also have a host device. Although not shown, as described above, the storage devices #1 and #2 (17 and 18) have a retention unit 11, a collation unit 12, and a setting unit 13. Note that these configurations have been described in the above embodiment, so explanations will be omitted.

制御装置14は、一般的にはRAIDコントローラが該当する。ただし、制御装置14の機能は、ソフトウエアモジュールあるいはハードウエアモジュールによって実現されるが、これら機能については、ホスト装置側にソフトウエアモジュールを置き、これを実行することで実現されても良い。 The control device 14 is generally a RAID controller. However, although the functions of the control device 14 are realized by a software module or a hardware module, these functions may also be realized by placing a software module on the host device side and executing this.

障害通知部15は、複数のストレージ装置のいずれかにおいて障害が検出された場合に、ストレージ障害通知を、複数のストレージ装置のうち、障害発生に係るストレージ装置へ通知する。障害の検出については、ストレージシステム100の制御装置14において検出しても良いし、ストレージシステム100が接続しているホスト装置104において検出しても良い。本実施形態における「障害」とは、ストレージ装置内のディスク固有情報が失われる、又は破壊される事態を含む。 When a fault is detected in one of the multiple storage devices, the fault notification unit 15 notifies a storage fault notification to the storage device involved in the fault. The fault may be detected in the control device 14 of the storage system 100, or in the host device 104 to which the storage system 100 is connected. In this embodiment, a "fault" includes a situation in which disk-specific information in a storage device is lost or destroyed.

再構築部16は、障害に係るストレージ装置10の設定部13が、ストレージ設定情報を、ストレージ固有情報として設定した場合に、障害に係るストレージ装置を再構築するための制御を行う。失われた、又は壊れたディスク固有情報をストレージ設定情報により書き換えたストレージ装置を再び使用できるようにするために、再構築が行われる。再構築処理は、RAID構成でのリビルド動作の処理に該当する。 When the setting unit 13 of the storage device 10 involved in the failure sets the storage setting information as storage specific information, the reconstruction unit 16 performs control to reconstruct the storage device involved in the failure. Reconstruction is performed so that the storage device in which lost or broken disk specific information has been rewritten with the storage setting information can be used again. The reconstruction process corresponds to the process of a rebuild operation in a RAID configuration.

上述の通り、ストレージ装置が有する照合部12は、ストレージ装置の障害時に通知されるストレージ障害通知に応じて、前記ストレージ設定情報と前記ストレージに設定されているストレージ固有情報とを照合するが、ストレージ設定情報と、ストレージ固有情報と、が一致する場合には、ストレージの交換が必要な旨を通知する交換通知部(図示せず)を有しても良い。 As described above, the comparison unit 12 of the storage device compares the storage setting information with the storage-specific information set in the storage in response to a storage fault notification notified when a fault occurs in the storage device, and may also have an exchange notification unit (not shown) that notifies the user that the storage needs to be replaced if the storage setting information and the storage-specific information match.

また、本実施形態のストレージシステムのストレージ装置は、RAID構成をとっているが、RAID構成はRAID0を除くいずれの構成をとっても構わない。例えばミラーリングを構成するRAID1、RAID10や、パリティを用いたRAID5、RAID6の構成をとっていても構わない。 The storage device of the storage system of this embodiment has a RAID configuration, but the RAID configuration may be any configuration other than RAID 0. For example, it may be a RAID 1 or RAID 10 configuration that configures mirroring, or a RAID 5 or RAID 6 configuration that uses parity.

[システムの動作]
図5は本実施形態のストレージシステムの動作を示すためのフローチャートである。この図にあるようにシステムの運用中に故障検知がなされた場合(ステップS01,Y)に、ストレージ設定情報がストレージ固有情報と一致しているか照合する(ステップS02)。これらの情報が一致している場合(ステップS02,Y)にはディスクドライブ等の故障の可能性があるため、ストレージ装置を交換する必要がある(ステップS07)。交換後に再構築処理を実行する(ステップS08)。
[System Operation]
5 is a flow chart showing the operation of the storage system of this embodiment. As shown in this figure, if a failure is detected during system operation (step S01, Y), the storage setting information is checked to see if it matches the storage specific information (step S02). If the information matches (step S02, Y), there is a possibility of a disk drive or other failure, so the storage device must be replaced (step S07). After replacement, a reconstruction process is executed (step S08).

次にストレージ設定情報がストレージ固有情報と一致していない場合(ステップS02,N)には、ストレージ固有情報に起因した故障であるとして、ストレージ設定情報をストレージ固有情報として設定する(ステップS03)。すると制御装置14(RAIDコントローラ)からは新規ストレージ装置として認識される(ステップS04)。この状態で通常RAID構成で行われている再構築(リビルド)処理を行う(ステップS05)ことで復旧することが可能である。 Next, if the storage setting information does not match the storage specific information (step S02, N), it is determined that the failure is due to the storage specific information, and the storage setting information is set as the storage specific information (step S03). The control device 14 (RAID controller) then recognizes it as a new storage device (step S04). In this state, recovery is possible by performing the rebuild process that is normally performed in a RAID configuration (step S05).

再構築処理後、システムが復旧した場合には(ステップS06,Y)、再び通常の運用に戻ることができる。システムが復旧しない場合には(ステップS06,N)、故障箇所が他にも存在するということで、ストレージ装置の交換(ステップS07)となる。 If the system recovers after the reconstruction process (step S06, Y), it can return to normal operation. If the system does not recover (step S06, N), this means that there is another fault, and the storage device will be replaced (step S07).

[ハードウエア構成]
本実施形態のストレージシステムは、図6に例示する構成を備える。例えば、ストレージシステムはホスト装置104とRAIDコントローラ101、SSD#1(102)とSSD#2(103)と、を有し、SSDはそれぞれI/Oインタフェース(105、110)、EPROM(不揮発性メモリ)(106、111)、キャッシュメモリ(107、112)、プロセッサ(108、113)、フラッシュメモリ(109、114)を有する。
[Hardware configuration]
The storage system of this embodiment has a configuration exemplified in Fig. 6. For example, the storage system has a host device 104, a RAID controller 101, an SSD #1 (102) and an SSD #2 (103), and each SSD has an I/O interface (105, 110), an EPROM (non-volatile memory) (106, 111), a cache memory (107, 112), a processor (108, 113), and a flash memory (109, 114).

ホスト装置104及びRAIDコントローラ101は図示していないがコンピュータを構成する要素であるCPU、メモリ、I/Oインタフェースを少なくとも有する。 Although not shown, the host device 104 and the RAID controller 101 have at least a CPU, memory, and an I/O interface, which are components that make up a computer.

図6に示す構成は、ストレージシステムのハードウエア構成を限定する趣旨ではない。ストレージシステムは、図示しないハードウエアを含んでもよい。また、ストレージシステムに含まれるSSD等の数も図6の例示に限定する趣旨ではなく、例えば、3以上のSSDがストレージ装置10に含まれていてもよい。 The configuration shown in FIG. 6 is not intended to limit the hardware configuration of the storage system. The storage system may include hardware not shown. Furthermore, the number of SSDs and other devices included in the storage system is not intended to be limited to the example shown in FIG. 6. For example, three or more SSDs may be included in the storage device 10.

ストレージシステムの機能は、SSD(102、103)のEPROM(106、111)に格納された設定プログラム、照合プログラム、RAIDコントローラ101又はホスト装置104の記憶域に格納された障害通知プログラムや再構築プログラム、交換通知プログラム等といったプログラム群(処理モジュール)と、設定プログラムが使用するストレージ設定情報やストレージ固有情報等のデータ群により実現される。当該処理モジュールは、例えば、EPROM(106、111)に格納された各プログラムをプロセッサ(108、113)が実行することで実現される。また、そのプログラムは、ネットワークを介してダウンロードするか、あるいは、プログラムを記憶した記憶媒体を用いて、更新することができる。更に、上記処理モジュールは、半導体チップにより実現されてもよい。即ち、上記処理モジュールが行う機能を何らかのハードウエア、及び/又は、ソフトウエアで実行する手段があればよい。 The functions of the storage system are realized by a set of programs (processing modules) such as a setting program stored in the EPROM (106, 111) of the SSD (102, 103), a matching program, a fault notification program, a reconstruction program, and a replacement notification program stored in the storage area of the RAID controller 101 or the host device 104, and a set of data such as storage setting information and storage specific information used by the setting programs. The processing modules are realized, for example, by the processor (108, 113) executing each program stored in the EPROM (106, 111). The programs can be downloaded via a network or updated using a storage medium that stores the programs. Furthermore, the processing modules may be realized by semiconductor chips. That is, it is sufficient to have some means for executing the functions performed by the processing modules using some hardware and/or software.

[ハードウエアの動作]
ストレージシステムは動作中において、障害を検出すると、ホスト装置104又はRAIDコントローラ101のCPUにおいて障害通知プログラムが実行される。以下、一例としてSSD#1に障害が発生した場合を説明する。同プログラムはI/Oインタフェース105を介して、故障が検出されたストレージ装置に通知のメッセージを送る。メッセージを受けてEPROM106から読み出されプロセッサ108上で照合プログラムが実行状態となる。
[Hardware Operation]
When the storage system detects a fault during operation, a fault notification program is executed in the CPU of the host device 104 or the RAID controller 101. The following describes an example in which a fault occurs in SSD #1. The program sends a notification message via the I/O interface 105 to the storage device in which the fault was detected. Upon receiving the message, the program is read from the EPROM 106 and the verification program is put into execution on the processor 108.

照合プログラムは、EPROM106又はフラッシュメモリ109にリストとして格納されているストレージ設定情報とストレージ固有情報とを照合する。その結果一致する場合には、交換通知プログラムがプロセッサ108において実行され、交換通知のメッセージをI/Oインタフェース105を介して送信する。ホスト装置104では交換通知のメッセージを受けて、ストレージ装置の交換が必要との情報を表示デバイス等により出力する。 The comparison program compares the storage setting information stored as a list in EPROM 106 or flash memory 109 with the storage-specific information. If the results match, the replacement notification program is executed in processor 108 and sends a replacement notification message via I/O interface 105. Upon receiving the replacement notification message, host device 104 outputs information that the storage device needs to be replaced via a display device or the like.

照合の結果一致しない場合には、設定プログラムがEPROM106から読み出されプロセッサ108上で実行状態となる。同プログラムはEPROM106又はフラッシュメモリ上に格納されているストレージ設定情報を読み出し、ストレージ固有情報が格納されているEPROM106等の記憶域に書き込む。 If the comparison results in a mismatch, the configuration program is read from EPROM 106 and executed on processor 108. The program reads the storage configuration information stored in EPROM 106 or flash memory, and writes it to a storage area such as EPROM 106 where storage-specific information is stored.

書き込み後、ホスト装置104又はRAIDコントローラ101上で再構築プログラムがメモリから呼び出されCPUにて実行される。RAIDコントローラ101は故障が検出され、ストレージ設定情報が書き込まれればストレージ装置を新たに認識し、故障が発生していない他方のストレージ装置からデータを転送する等の再構築(リビルド)処理を実行する。 After writing, the reconstruction program is called from memory on the host device 104 or the RAID controller 101 and executed by the CPU. If the RAID controller 101 detects a failure and the storage setting information is written, it recognizes the storage device as a new one and executes a reconstruction (rebuild) process, such as transferring data from the other storage device where no failure has occurred.

[効果の説明]
上記第1の実施形態に係るストレージシステムにより、特にRAID構成をとっているストレージ装置であるSSDにおいて、ストレージ固有情報を修復することにより、機器の取り外しをすることなく、新たなストレージ装置として認識させることが可能であり、再構築(リビルド)処理をすることにより、故障によるシステムの障害を復旧することが可能である。
[Effects]
With the storage system according to the first embodiment described above, particularly in an SSD, which is a storage device having a RAID configuration, it is possible to have the storage device recognized as a new storage device without removing the device by repairing the storage-specific information, and it is possible to recover from a system failure due to a breakdown by performing a reconstruction (rebuild) process.

前述の実施形態の一部又は全部は、以下の各付記のようにも記載することができる。しかしながら、以下の各付記は、あくまでも、本発明の単なる例示に過ぎず、本発明は、かかる場合のみに限るものではない。
[付記1]
上述の第一の視点に係るストレージ装置のとおりである。
[付記2]
ストレージ装置は、SSD(ソリッドステートドライブ)で構成されている、好ましくは付記1のストレージ装置。
[付記3]
ストレージ設定情報及びストレージ固有情報は、少なくともストレージ容量、発行コマンドキュー設定、キャッシュ有効又は無効設定、のうち一の情報を含む、好ましくは付記2のストレージ装置。
[付記4]
設定部は、照合部による照合の結果、ストレージ設定情報と、ストレージ固有情報と、が一致しない場合に、ストレージ設定情報を、ストレージ固有情報として設定する、好ましくは付記3のストレージ装置。
[付記5]
照合部による照合の結果、前記ストレージ設定情報と、前記ストレージ固有情報と、が一致する場合に、ストレージ装置の交換が必要な旨を通知する交換通知部と、を有する、好ましくは付記4のストレージ装置。
[付記6]
上述の第二の視点に係るストレージシステムのとおりである。
[付記7]
複数のストレージ装置は、ミラーリングを構成している、好ましくは付記6のストレージシステム。
[付記8]
複数のストレージ装置のうち、少なくとも一のストレージ装置にパリティ領域を有する、好ましくは付記6のストレージシステム。
[付記9]
上述の第三の視点に係る障害復旧方法のとおりである。
[付記10]
上述の第四の視点に係るプログラムのとおりである。
なお、付記9及び付記10は、付記1と同様に、付記2~付記5に展開することが可能である。
A part or all of the above-described embodiments can be described as the following supplementary notes. However, the following supplementary notes are merely examples of the present invention, and the present invention is not limited to such cases.
[Appendix 1]
This is the same as the storage device according to the first aspect described above.
[Appendix 2]
The storage device is preferably the storage device of appendix 1, which is configured with an SSD (solid state drive).
[Appendix 3]
Preferably, the storage device of appendix 2, wherein the storage setting information and the storage specific information include at least one of information on storage capacity, issued command queue setting, and cache enable/disable setting.
[Appendix 4]
Preferably, in the storage device according to appendix 3, when the collation by the collation unit shows that the storage setting information and the storage specific information do not match, the setting unit sets the storage setting information as the storage specific information.
[Appendix 5]
Preferably, the storage device of appendix 4 has an exchange notification unit that notifies the user that the storage device needs to be replaced when the storage setting information and the storage specific information match as a result of the comparison by the comparison unit.
[Appendix 6]
This is the same as the storage system according to the second aspect described above.
[Appendix 7]
Preferably, the storage system according to claim 6, wherein the plurality of storage devices are configured in a mirroring configuration.
[Appendix 8]
A storage system preferably as described in appendix 6, wherein at least one of the multiple storage devices has a parity area.
[Appendix 9]
This is the same as the failure recovery method according to the third aspect described above.
[Appendix 10]
This is as per the program related to the fourth perspective mentioned above.
In addition, Supplementary Notes 9 and 10 can be expanded into Supplementary Notes 2 to 5, similar to Supplementary Note 1.

なお、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。本発明の全開示(特許請求の範囲を含む)の枠内において、更にその基本的技術思想に基づいて、実施形態ないし実施形態の変更・調整が可能である。また、本発明の全開示の枠内において種々の開示要素(各請求項の各要素、各実施形態ないし実施形態の各要素、各図面の各要素等を含む)の多様な組み合わせ、ないし、選択(部分的削除を含む)が可能である。すなわち、本発明は、特許請求の範囲を含む全開示、技術的思想に従って当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。 The disclosures of the above cited patent documents are incorporated herein by reference. Within the framework of the entire disclosure of the present invention (including the scope of the claims), modifications and adjustments of the embodiments and the embodiments are possible based on the basic technical ideas. Furthermore, within the framework of the entire disclosure of the present invention, various combinations and selections (including partial deletions) of the various disclosed elements (including each element of each claim, each embodiment and each element of each embodiment, each element of each drawing, etc.) are possible. In other words, the present invention naturally includes various modifications and corrections that a person skilled in the art would be able to make in accordance with the entire disclosure, including the scope of the claims, and the technical ideas. In particular, with regard to the numerical ranges described in this document, any numerical value or subrange included in the range should be interpreted as being specifically described even if not otherwise specified.

10 :ストレージ装置
11 :保持部
12 :照合部
13 :設定部
14 :制御装置
15 :障害通知部
16 :再構築部
17 :ストレージ装置#1
18 :ストレージ装置#2
100 :ストレージシステム
101 :RAIDコントローラ、コントローラ
102 :SSD #1
103 :SSD #2
104 :ホスト装置
105、110 :I/Oインタフェース
106、111 :EPROM
107、112 :キャッシュメモリ
108、113 :プロセッサ
109、114 :フラッシュメモリ
10: storage device 11: holding unit 12: collation unit 13: setting unit 14: control device 15: fault notification unit 16: reconstruction unit 17: storage device #1
18: Storage device #2
100: Storage system 101: RAID controller, controller 102: SSD #1
103: SSD #2
104: host device 105, 110: I/O interface 106, 111: EPROM
107, 112: cache memory 108, 113: processor 109, 114: flash memory

Claims (9)

ストレージの設定情報であるストレージ設定情報を保持する保持部と、
前記ストレージの障害時に通知されるストレージ障害通知に応じて、前記ストレージ設定情報と前記ストレージに設定されているストレージ固有情報とを照合する照合部と、
前記照合部による照合の結果、前記ストレージ設定情報と、前記ストレージ固有情報と、が一致しない場合に、前記ストレージ設定情報を前記ストレージ固有情報として設定する設定部と、
前記照合部による照合の結果、前記ストレージ設定情報と、前記ストレージ固有情報と、が一致する場合に、ストレージ装置の交換が必要な旨を通知する交換通知部と、
を有するストレージ装置。
A storage unit that stores storage setting information, which is setting information of the storage;
a collation unit that collates the storage setting information with storage specific information set in the storage in response to a storage failure notification that is notified when a failure occurs in the storage;
a setting unit that sets the storage setting information as the storage unique information when the storage setting information and the storage unique information do not match as a result of the comparison by the comparison unit;
an exchange notification unit that notifies the user that a storage device needs to be replaced when the storage setting information and the storage specific information match as a result of the comparison by the comparison unit;
A storage device having the above configuration.
前記ストレージ装置は、SSD(Solid State Drive)で構成されている、請求項1のストレージ装置。 The storage device of claim 1, wherein the storage device is configured with an SSD (Solid State Drive). 前記ストレージ設定情報及び前記ストレージ固有情報は、少なくともストレージ容量、発行コマンドキュー設定、キャッシュ有効又は無効設定、のうち一の情報を含む請求項2のストレージ装置。 The storage device of claim 2, wherein the storage setting information and the storage specific information include at least one of the following information: storage capacity, issued command queue setting, and cache enable/disable setting. 前記設定部は、前記照合部による照合の結果、前記ストレージ設定情報と、前記ストレージ固有情報と、が一致しない場合に、前記ストレージ設定情報を、前記ストレージ固有情報として設定する、
請求項3のストレージ装置。
when the comparison result by the comparison unit indicates that the storage setting information and the storage specific information do not match, the setting unit sets the storage setting information as the storage specific information.
The storage device of claim 3.
請求項1からのいずれか一に記載の複数のストレージ装置と、
前記複数のストレージ装置のいずれかにおいて障害が検出された場合に、前記ストレージ障害通知を、前記複数のストレージ装置のうち、障害発生に係るストレージ装置へ通知する障害通知部と、
前記障害に係るストレージ装置の前記設定部が、前記ストレージ設定情報を、前記ストレージ固有情報として設定した場合に、前記障害に係るストレージ装置を再構築するための制御を行う再構築部と、
を有する制御装置を含む、ストレージシステム。
A plurality of storage devices according to any one of claims 1 to 4 ;
a fault notification unit that notifies a storage fault notification to a storage device involved in the occurrence of the fault among the plurality of storage devices when a fault is detected in any of the plurality of storage devices;
a reconstruction unit that performs control for reconstructing the storage device related to the failure when the setting unit of the storage device related to the failure sets the storage setting information as the storage specific information;
A storage system including a control device having a
前記複数のストレージ装置は、ミラーリングを構成している、請求項のストレージシステム。 6. The storage system according to claim 5 , wherein the plurality of storage devices are configured in a mirroring configuration. 前記複数のストレージ装置のうち、少なくとも一のストレージ装置にパリティ領域を有する、請求項のストレージシステム。 6. The storage system according to claim 5 , wherein at least one of said plurality of storage devices has a parity area. 以下の各ステップをコンピュータが実行する障害復旧方法であって、
複数のストレージ装置のいずれかにおいて障害が検出された場合に、ストレージ障害通知を、前記複数のストレージ装置のうち、障害発生に係るストレージ装置へ通知するステップと、
前記通知に応じて、ストレージの設定情報であるストレージ設定情報と、前記ストレージに設定されているストレージ固有情報とを照合するステップと、
照合の結果、前記ストレージ設定情報と、前記ストレージ固有情報と、が一致しない場合には、前記ストレージ設定情報を、前記ストレージ固有情報として設定するステップと、
照合の結果、前記ストレージ設定情報と、前記ストレージ固有情報と、が一致する場合に、ストレージ装置の交換が必要な旨を通知するステップと、
前記障害に係るストレージ装置を再構築するための制御を行うステップと、
を含む障害復旧方法。
A disaster recovery method in which a computer executes the following steps:
when a fault is detected in any one of a plurality of storage devices, sending a storage fault notification to a storage device involved in the fault occurrence among the plurality of storage devices;
In response to the notification, comparing storage setting information, which is setting information of the storage, with storage specific information set in the storage;
a step of setting the storage setting information as the storage specific information when the storage setting information and the storage specific information do not match as a result of the comparison;
a step of notifying the user that the storage device needs to be replaced when the storage setting information and the storage specific information match as a result of the comparison;
performing control for reconstructing the storage device related to the failure;
Disaster recovery methods, including:
複数のストレージ装置のいずれかにおいて障害が検出された場合に、ストレージ障害通知を、前記複数のストレージ装置のうち、障害発生に係るストレージ装置へ通知する処理と、
前記通知に応じて、ストレージの設定情報であるストレージ設定情報と、前記ストレージに設定されているストレージ固有情報とを照合する処理と、
照合の結果、前記ストレージ設定情報と、前記ストレージ固有情報と、が一致しない場合には、前記ストレージ設定情報を、前記ストレージ固有情報として設定する処理と、
照合の結果、前記ストレージ設定情報と、前記ストレージ固有情報と、が一致する場合に、ストレージ装置の交換が必要な旨を通知する処理と、
前記障害に係るストレージ装置を再構築するための制御を行う処理と、
をコンピュータに実行させるためのプログラム。
When a fault is detected in any one of a plurality of storage devices, a storage fault notification is sent to a storage device involved in the fault occurrence among the plurality of storage devices;
In response to the notification, a process of comparing storage setting information, which is setting information of the storage, with storage specific information set in the storage;
a process of setting the storage setting information as the storage specific information when the storage setting information and the storage specific information do not match as a result of the comparison;
If the storage setting information and the storage specific information match as a result of the comparison, a process of notifying that the storage device needs to be replaced;
A process of performing control for reconstructing the storage device related to the failure;
A program for causing a computer to execute the following.
JP2022109430A 2022-07-07 2022-07-07 STORAGE APPARATUS, STORAGE SYSTEM, FAILURE RECOVERY METHOD, AND PROGRAM Active JP7513294B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022109430A JP7513294B2 (en) 2022-07-07 2022-07-07 STORAGE APPARATUS, STORAGE SYSTEM, FAILURE RECOVERY METHOD, AND PROGRAM

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022109430A JP7513294B2 (en) 2022-07-07 2022-07-07 STORAGE APPARATUS, STORAGE SYSTEM, FAILURE RECOVERY METHOD, AND PROGRAM

Publications (2)

Publication Number Publication Date
JP2024007965A JP2024007965A (en) 2024-01-19
JP7513294B2 true JP7513294B2 (en) 2024-07-09

Family

ID=89544579

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022109430A Active JP7513294B2 (en) 2022-07-07 2022-07-07 STORAGE APPARATUS, STORAGE SYSTEM, FAILURE RECOVERY METHOD, AND PROGRAM

Country Status (1)

Country Link
JP (1) JP7513294B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2025113688A (en) 2024-01-23 2025-08-04 株式会社リコー Liquid ejection head and liquid ejection device

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120239970A1 (en) 2010-10-06 2012-09-20 International Business Machines Corporation Methods for redundant array of independent disk (raid) storage recovery
JP2017138781A (en) 2016-02-03 2017-08-10 Necプラットフォームズ株式会社 Disk array controller, storage system, method, and program
JP2018026734A (en) 2016-08-10 2018-02-15 富士通株式会社 Fault location identification program, apparatus, and method
JP2019198155A (en) 2018-05-08 2019-11-14 東芝三菱電機産業システム株式会社 Parameter adjustment device for power conversion device
JP2020149615A (en) 2019-03-15 2020-09-17 株式会社バッファロー Equipment management systems, network equipment, management equipment, and programs
JP2022048612A (en) 2020-09-15 2022-03-28 株式会社リコー Information processing system, information processing device, display method, program

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120239970A1 (en) 2010-10-06 2012-09-20 International Business Machines Corporation Methods for redundant array of independent disk (raid) storage recovery
JP2017138781A (en) 2016-02-03 2017-08-10 Necプラットフォームズ株式会社 Disk array controller, storage system, method, and program
JP2018026734A (en) 2016-08-10 2018-02-15 富士通株式会社 Fault location identification program, apparatus, and method
JP2019198155A (en) 2018-05-08 2019-11-14 東芝三菱電機産業システム株式会社 Parameter adjustment device for power conversion device
JP2020149615A (en) 2019-03-15 2020-09-17 株式会社バッファロー Equipment management systems, network equipment, management equipment, and programs
JP2022048612A (en) 2020-09-15 2022-03-28 株式会社リコー Information processing system, information processing device, display method, program

Also Published As

Publication number Publication date
JP2024007965A (en) 2024-01-19

Similar Documents

Publication Publication Date Title
CN103136074B (en) Data storage method and data storage system of multiple disk array systems
US7062704B2 (en) Storage array employing scrubbing operations using multiple levels of checksums
JP5052193B2 (en) Storage control device and storage control method
US7661044B2 (en) Method, apparatus and program product to concurrently detect, repair, verify and isolate memory failures
JP5152603B2 (en) Disk array device and firmware update method thereof
CN100368976C (en) Disk array apparatus and backup method of data
US7535255B2 (en) Logic integrated circuit having dynamic substitution function, information processing apparatus using the same, and dynamic substitution method of logic integrated circuit
JP2007334593A (en) RAID controller and RAID device
WO2002088922A2 (en) Storage array employing scrubbing operations at the disk-controller level
JP2006079418A (en) Storage control device, control method, and program
CN107870731B (en) Management method of Redundant Array of Independent Disks (RAID) system and electronic equipment
US7620786B2 (en) Storage recovery using a delta log
WO2023020031A1 (en) Memory fault recovery method, system, and memory
JP7513294B2 (en) STORAGE APPARATUS, STORAGE SYSTEM, FAILURE RECOVERY METHOD, AND PROGRAM
US20090125754A1 (en) Apparatus, system, and method for improving system reliability by managing switched drive networks
JP5040331B2 (en) Storage device, storage device control method, and storage device control program
CN107273241A (en) The redundancy backup and automatic recovery method of a kind of important parameter
CN110046065A (en) A kind of storage array method for reconstructing, device, equipment and storage medium
JP6707939B2 (en) Control device, storage device, control method, and program
JP5644795B2 (en) Storage device, data recovery method and program
JP6734305B2 (en) Disk array controller, storage device, storage device recovery method, and disk array controller recovery program
JP2008084168A (en) Information processing apparatus and data restoration method
JP4176908B2 (en) Disk array device
JP2005284449A (en) Information recording medium array system and its restoration method
JP4893180B2 (en) Failure recovery method for storage device, failure recovery program, and control device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230926

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240418

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20240430

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240528

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240620

R150 Certificate of patent or registration of utility model

Ref document number: 7513294

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150