System zur Ermittlung von Fehlerursachen
Beschreibung
Die Erfindung bezieht sich auf ein System zur Ermittlung von Fehlerursachen einschließlich einer rechnerunterstützten Erzeugung von Hypothesen und zur Durchführung ihrer Verifikation im Rahmen einer Fehlerursachenanalyse. Das System ist geeignet zur Unterstützung der Fehlerursachensuche im Fall von eintretenden Fehlerereignissen in industriellen Anlagen.
Für die Fehlerursachenanalyse können unterschiedliche Methoden und Techniken eingesetzt werden. Dazu gehören die Fehlerbaumanalyse (Fault Tree Analysis) oder die Fehlerursachenanalyse (Root Cause Analysis) in diversen Varianten, wie beispielsweise beschrieben in [Reliability Center, Inc.: Root Cause Failure Analysis Methods, Hopewell, USA, 1997] oder [ASB Group Inc., Risk and Reliability Division: Root Cause Analysis Handbook: A Guide to Effective Incident Investigation, Knox- ville, USA, 1999].
Bei einer solchen Fehlerursachenanalyse werden typischerweise folgende Schritte durchlaufen:
1. Durchführung einer FMEA (Failure Mode And Effects Analysis) zur Bestimmung der wirklich wichtigen Fehler.
2. Durchführung der eigentlichen Fehlerursachenanalyse für jeden der signifikanten Fehler. Dabei werden folgende Teilschritte durchlaufen: a) Sicherstellung aller benötigten Informationen, die Rückschlüsse auf Verlauf und Ursachen des Fehlers erlauben, beispielsweise beschädigte Komponenten, Lage derselben, Interviews mit Operateuren, Prozessdaten, usw. b) Organisation der Fehlerursachenanalyse. Festlegung der benötigten Ressourcen und Durchführungsplan.
c) Eigentliche Analyse zum Beispiel anhand von Fehlerbäumen und Ermittlung der Fehlerursachen. Hierbei werden Fehlerbäume aufgestellt, mit denen ausgehend vom Fehlerereignis über mehrere Ursachenebenen die Fehlerursachen ermittelt werden können.
3. Umsetzen der Verbesserungen. Dazu werden die ermittelten Fehlerursachen sowie Empfehlungen für Abhilfemassnahmen zu den entsprechenden Entscheidungsträger kommuniziert und es wird ein Aktionsplan festgelegt, nach dem die Empfehlungen durchgeführt werden. Konnte dieser Aktionsplan erfolgreich abgeschlossen werden, ist die Analyse beendet.
Hypothesen für Fehlerursachen werden im Schritt 2c benötigt, wenn ausgehend vom Fehlerereignis wiederholt die Frage gestellt wird, was zu dem Fehlerereignis führen konnte. Hypothesen sind somit Vermutungen über die Fehlerursache, die auf Erfahrungswissen beruhen. Verifiziert werden Hypothesen, indem die zuvor sichergestellten Informationen über den Fehler herangezogen werden und damit die Hypothese bestätigt oder widerlegt werden kann. Wird eine Hypothese auf diese Weise bestätigt, so wird der durch die Hypothese beschriebene Sachverhalt zu einer Tatsache oder einem Fakt. Für diese Tatsache kann wiederum die Frage gestellt werden, was zu diesem Fakt führen konnte, d.h. es werden weitere Hypothesen aufgestellt.
Nachteil der bekannten Verfahren ist, daß die Erstellung von Hypothesen und deren Verifikation von der Erfahrung des oder der Fehleranalysten abhängt. Selbst wenn geeignete Fehlerbäume, zum Beispiel aus Fehlermodellen generiert, vorliegen, so sind diese noch nicht direkt für die vorliegende Fehleranalyse einsetzbar. Vielmehr müssen solche Fehlerbäume und auch die darin enthaltenen Hypothesen an das spezielle, zu untersuchende Fehlerereignis angepasst werden. Hierzu ist ein erfahrener Fehleranalyst notwendig.
Der Erfindung liegt die Aufgabe zugrunde, ein System zur Ermittlung von Fehlerursachen anzugeben, das eine automatisierte Ermittlung von Hypothesen und deren Verifikation im Rahmen einer dazu erforderlichen Fehlerursachenanalyse ermöglicht.
Diese Aufgabe wird durch ein System zur Ermittlung von Fehlerursachen gelöst, das eine automatisierte Ermittlung von Hypothesen und deren Verifikation einschließt, und das die im Anspruch 1 angegebenen Merkmale aufweist. Vorteilhafte Ausgestaltungen sind in weiteren Ansprüchen angegeben.
Das System unterstützt einen Benutzer bei der Analyse von ausgewählten Fehlerereignissen, indem es Vorschläge für die Abarbeitung eines allgemeinen Fehlermodells macht. Diese Vorschläge betreffen einen geeigneten Einstiegspunkt in das Modell und insbesondere geeignete Hypothesen und Verifikationsmöglichkeiten, die eine effiziente Durchführung der Fehlerursachenanalyse ermöglichen. Dazu benutzt das System Erfahrungen, die in bereits durchgeführten Fehleranalysen gewonnen wurden und die in einer Erfahrungsbibliothek verfügbar sind.
Eine weitere Beschreibung der Erfindung und deren Vorteile erfolgt nachstehend anhand von Ausführungsbeispielen, die in Zeichnungsfiguren dargestellt sind.
Es zeigen:
Fig. 1 das Blockschema eines erfindungsgemäßen Systems zur automatischen Erzeugung von Hypothesen und ihrer Verifikation zur Ermittlung von Fehlerursachen, Fig. 2 eine Darstellung der Arbeitsweise des Systems,
Fig. 3 eine Beschreibung des aktuellen Fehlerereignisses,
Fig. 4 eine prinzipielle Darstellung des allgemeinen Fehlermodells,
Fig. 5 eine Darstellung zur Kategorisierung der Fehlermodelle,
Fig. 6 wesentliche Inhalte einer Fehlerhypothese,
Fig. 7 aufeinander verweisende Fehlermodelle, und
Fig. 8 die Einbindung einer Erfahrungshypothese in die Abarbeitung des allgemeinen Fehlermodells.
Das vorgeschlagene System kann lokal in einem Rechner implementiert sein und genutzt werden. Bevorzugt wird jedoch eine Implementierung im Internet, weil dann auf einfache Weise eine weltweite Nutzung für Service-Zwecke möglich ist.
Fig. 1 zeigt das Schema eines Systems zur automatischen Erzeugung von Hypothesen und ihrer Verifikation zur Ermittlung von Fehlerursachen. Das System ist gegliedert in Mittel für eine Dateneingabe und Visualisierung 10, eine Datenverarbeitungseinrichtung 20 und einen Datenspeicher 30. Als ein Mittel für die Dateieingabe und zur Visualisierung wird ein üblicher Web Browser 11 verwendet. Die Datenverarbeitungseinrichtung 20 enthält eine Bearbeitungseinheit zur Fehlerursachenanalyse 21 , die die Abarbeitung der Fehlerursachenanalyse koordiniert. Für die Abarbeitung stehen weitere Komponenten zur Verfügung, die Detailschritte unterstützen, nämlich ein erster Vergleicher 22, ein zweiter Vergleicher 23 und eine Hypothesen-Auswahl 24. Die Bearbeitungseinheit zur Fehlerursachenanalyse 21 verwendet Daten aus dem Datenspeicher 30, wobei ein Zugriff auf eine Fehlerereignisse-Liste 32, ein allgemeines Fehlermodell 33 und eine Erfahrungsdatenbank 34 erfolgt. Zwischen- und Endergebnisse der Fehlerursachenanalyse werden in einem Protokoll aktuelle Fehlerursachenanalyse 31 abgelegt. In das Protokoll 31 werden aufgenommen: das jeweils ausgewählte aktuelle Fehlerereignis mit Beschreibung, ein geeigneter Einstiegspunkt in das allgemeine Fehlermodell, ausgewählte Erfahrungsfehleranalysen, eine Liste von ausgewählten Erfahrungsfehlerhypothesen und das Ergebnis der Fehlerursachenanalyse, d.h. die ermittelten Fehlerursachen. Benutzereingaben werden von der Bearbeitungseinheit zur Fehlerursachenanalyse 21 über den Web Browser 11 angefordert. Ergebnisse werden dem Benutzer über den Web Browser 11 dargestellt.
Fig. 2 zeigt ein Ablaufdiagramm zur Darstellung der Arbeitsweise des Systems.
In Schritt 100 wählt der Benutzer über die Web Browser-Oberfläche 11 ein zu untersuchendes Fehlerereignis aus der Liste der Fehlerereignisse 32 aus und speichert es in der Komponente Protokoll aktuelle Fehlerursachenanalyse 31 ab. Auf die Beschreibung dieses aktuellen Fehlerereignisses wird in Fig. 3 näher eingegangen.
In Schritt 200 vergleicht das System mittels des ersten Vergleichers 22 die Beschreibung des aktuellen Fehlerereignisses (siehe Fig. 3) mit den Inhalten des allgemeinen Fehlermodells 33 und schlägt Einstiegspunkte für die Fehleranalyse vor. Das System benutzt dabei die gemeinsamen Attribute der Beschreibung des aktuellen Fehlerereignisses und des allgemeinen Fehlermodells, wie Fehlertitel, Fehlertext, Auswir-
kungen, Fehlercode und Fehlerort, und überprüft deren Werte auf Gleichheit bzw. Ähnlichkeit. Ein geeignetes Verfahren, das diese Überprüfung leistet, ist beispielsweise das Nearest-Neighbor Verfahren [I. Watson: Applying Case-Based Reasoning: Techniques for Enterprise Systems, Morgan Kaufmann Publishers, Inc., San Francisco, 1997, pages 23 bis 33]. Den Aufbau des allgemeinen Fehlermodells zeigen Fig. 4, Fig. 6 und Fig. 7. Falls das System mehrere als Einstiegspunkt für die Fehleranalyse geeignete Fehlerbäume vorschlägt, wählt der Benutzer den geeignetsten aus. Das System speichert eine Beschreibung des Einstiegspunkts in der Komponente Protokoll aktuelle Fehlerursachenanalyse 31 ab.
In Schritt 300 vergleicht das System mittels des zweiten Vergleichers 23 die Beschreibung des aktuellen Fehlerereignisses mit den Erfahrungsfehleranalysen der Erfahrungsdatenbank 34 und schlägt geeignete Erfahrungsfehleranalysen vor. Ähnlich wie in Schritt 200 vergleicht hier das System die gemeinsamen Attribute von aktuellem Fehlerereignis und den Erfahrungsfehleranalysen. Das Nearest-Neighbor Verfahren ist auch hier für die Ähnlichkeitsprüfung geeignet. Eine Erfahrungsfehleranalyse zeigt, wie und mit welchem Ergebnis ein Fehlerereignis analysiert wurde. Es werden insbesondere die im Verlauf der Analyse entscheidenden Hypothesen und ihre Verifikation in einer Liste zusammengefaßt. Der Benutzer wählt die geeignetsten Erfahrungsfehleranalysen aus. Das System speichert diese Erfahrungsfehleranalysen in der Komponente Protokoll aktuelle Fehlerursachenanalyse 31 ab.
In Schritt 400 faßt das System mittels der Komponente Hypothesen-Auswahl 24 die Listen aller ausgewählten Erfahrungshypothesen zusammen und schlägt dem Benutzer die Kandidaten für eine aktuelle Fehleranalyse vor. Dabei werden insbesondere die Hypothesen berücksichtigt, die
in vielen Fehleranalysen vorkamen, eine Schlüsselrolle bei der Ursachenidentifikation hatten, weil beispielsweise die zugehörigen Verifikationen eine besondere Tragweite hatten, von den Durchführenden als besonders wichtig eingestuft wurden, zum Beispiel, weil mit einer Untersuchung ein ganzer Ursachenkomplex ausgegrenzt werden konnte, oder, die mit sehr geringem Aufwand zu verifizieren waren.
Der Benutzer wählt diejenigen Hypothesen aus, die er im Rahmen der aktuellen Fehleranalyse verwenden möchte. Das System speichert diese Erfahrungshypothesen in der Komponente Protokoll aktuelle Fehlerursachenanalyse 31 ab.
In Schritt 500 werden die im Schritt 400 ausgewählten Hypothesen in die Abarbeitung des allgemeinen Fehlermodells eingebunden. Zur Durchführung der Fehleranalyse folgt das System dem allgemeinen Fehlermodell und bearbeitet die darin enthaltenen Hypothesen. Bei jeder Hypothese prüft das System durch Vergleich der Attribute, ob geeignete Erfahrungshypothesen vorhanden sind. In diesem Fall wird die Erfahrungshypothese inklusive Verifikation verwendet, ansonsten wird die Hypothese aus dem allgemeinen Modell beibehalten. Das System speichert die ermittelten Fehlerursachen als das Ergebnis der Fehlerursachenanalyse in der Komponente Protokoll aktuelle Fehlerursachenanalyse 31 ab.
Fig. 3 zeigt die Darstellung eines aktuellen Fehlerereignisses. Dazu wird das Fehlerereignis in den Attributen Fehlertext, Auswirkungen des Fehlers, Zeitpunkt, zu dem der Fehler aufgetreten ist, den intern verwendeten Fehlercode aus der Fehlercodeliste und den Fehlerort beschrieben. Zusätzlich wird auf weitere Systemaufzeichnungen verwiesen, die die Prozeßsituation zum Fehlerzeitpunkt wiedergeben. Dazu gehören die Prozeßdaten, wie sie vom Leitsystem aufgezeichnet werden, das Operator-Logbuch und die Arbeitsberichte aus dem Wartungsmanagementsystem.
Fig. 4 zeigt die prinzipielle Darstellung eines Fehlermodells. Die oberste Ebene beinhaltet ein Prozeßmodell mit mehreren Prozeßschritten. Jeder Prozeßschritt kann in weitere Prozeßschritten untergliedert werden. Zu jedem Prozeßschritt gibt es Fehlerereignisse und kritische Prozeß-Komponenten.
Die nächst tiefere Ebene des Modells beinhaltet Fehlerbäume. Fehlerbäume sind, wie in Fig. 5 zu sehen ist, kategorisiert. Ein Fehlerbaum kann sich aus mehreren Teilbäumen zusammensetzen. Dies wird in Fig. 5 durch die Pfeile angedeutet und ist in Fig. 7 näher erläutert.
Die Knoten eines Fehlerbaumes repräsentieren Fehlerhypothesen. Wesentlicher inhaltlicher Bestandteil einer Fehlerhypothese ist eine Checkliste zur Verifikation. Auf die Inhalte einer Hypothese wird in Fig. 6 näher eingegangen.
Fig. 5 zeigt die Kategorisierung der Fehlermodelle. Die dazu erstellten industriespezifischen Fehlermodelle sind jeweils typisch für eine bestimmte Industrie, wie beispielsweise Fehlermodelle für die Zementindustrie oder Fehlermodelle für die Stahlindustrie. Diese Kategorie der Fehlermodelle hat als obersten Knoten das Fehlerereignis. Ein Fehlerereignis ist ein unerwünschter Zustand, der die Produktion beeinträchtigt.
Eine zweite Kategorie gemäß Fig. 5 beschreibt Komponentenfehler. Diese Modelle sind allgemeingültiger, sind also in unterschiedlichen Industrien anwendbar. Typischerweise verweisen Hypothesen der industriespezifischen Fehlermodelle auf Komponentenfehlermodelle.
Die dritte Kategorie der Fehlermodelle beschreibt sehr allgemeingültige Fehlerzusammenhänge. Solche Fehler haben beispielsweise ihre Ursachen in unzureichendem Training der Mitarbeiter, organisatorischen Mißständen oder Problemen in der Instandhaltung. Diese Modelle sind den industriespezifischen Fehlermodellen und den Komponentenfehlermodellen unterlagert.
Fig. 6 zeigt die wesentlichen Inhalte einer Fehlerhypothese am Beispiel einer Reinigungsanlage von Stahlplatten. Zur Hypothese gehört eine Beschreibung der Fehlerzusammenhänge. Außerdem wird der Hypothese die betroffene Komponente oder das betroffene Teil-System zugeordnet. Eine Checkliste beschreibt Kriterien wie die Hypothese verifiziert werden kann. Zu jedem Kriterium ist der Aufwand für die Diagnose mit angegeben. Der Hypothese können komplexe eigenständige Fehlerbäume unterlagert sein. Dieser Verweis steht in der Fehlerbaumreferenz.
Fig. 7 zeigt am Beispiel des Fehlerereignisses 'Unzureichenende Produktqualität' wie Fehlerbäume aufeinander verweisen und wie auf diese Weise komplexe und umfangreiche Fehlerzusammenhänge modeliiert werden können.
Fig. 8 greift das Beispiel aus Fig. 7 auf und zeigt wie die Fehlerhypothese 'Fehler in der Reinigungsanlage' bei der Abarbeitung des allgemeinen Fehlermodells durch eine passende Erfahrungshypothese ersetzt wird. Der gesamte Fehlerbaum (in der Darstellung links) kann durch den erheblich kleineren Fehlerbaum der Erfahrungshypothese (in der Darstellung rechts) ersetzt werden, was den Aufwand für die Abarbeitung erheblich verkürzen kann.