Künstliche Neuronale Netze

Künstliche Neuronale Netze sind mittlerweile der am häufigsten verwendete Ansatz zur Black-Box-Modellierung verschiedener technischer, chemischer und biologischer Systeme. Die Vorteile von Neuronalen Netzwerken liegen im Wesentlichen in ihrem komplexen nichtlinearen Verhalten. Durch dieses können komplexe Prozesse ohne genaue Kenntnis der vorherrschenden physikalischen Zusammenhänge und Gegebenheiten in ihrem Ein- Ausgangsverhalten beliebig genau nachgebildet werden, Weitere Vorteile sind ihre Adaptionsfähigkeit an beliebige Ein- / Ausgangsdaten, ihre Fehlertoleranz und die Verarbeitung ungenauer oder gar widersprüchlicher Informationen.

Struktur Neuronaler Netze

Die Architektur eines Neuronalen Netzes ist inspiriert durch die Struktur des biologischen Nervensystems. Im Unterschied zu klassischen technischen Systemen mit einer leistungsfähigen Zentraleinheit besteht ein Neuronales Netz aus einer komplexen Verknüpfung einer großen Anzahl einfacher Verarbeitungseinheiten, den so genannten Neuronen. Neuronale Netze unterscheiden sich hinsichtlich des Übertragungsverhaltens eines Neurons oder auch Netzknotens (die so genannte Aktivierungsfunktion) sowie der Anordnung und der Verknüpfung der verschiedenen Netzknoten. Die zur Funktionsapproximation gebräuchlichsten Neuronalen Netze sind dabei das Multi-Layer-Perzeptron (MLP) und Radialbasisfunktionen-Netze (RBF). Beide sind vorwärtsgerichtete Netze, d.h. der Informationsfluss ist über die Schichten des Netzes streng von den Ein- zu den Ausgängen angeordnet, ohne dass von folgenden oder der gleichen Schicht Informationen in den Neuronen verarbeitet werden. Als Aktivierungsfunktionen kommen verschiedene Ansätze zum Einsatz, vgl. Tabelle.

 

Typischer Weise sind das für RBF-Netze radialsymmetrische Funktionen mit genau einem Extremum und monoton abfallenden Flanken. Häufig verwendet man Gaußfunktionen als Basisfunktionen für RBF-Netze, die dann zur entsprechenden Abbildung überlagert werden. Wichtigste Parameter sind hier die Lage der Stützstelle, der Gültigkeitsradius und die Gewichte der Übergänge zwischen den Schichten, die im Training des Netzes so optimiert werden, dass die Funktion möglichst gut angenähert wird.

 

Ein MLP-Netz besteht aus einer Eingangs-, einer oder mehreren verdeckten und einer Ausgangsschicht. Das beduetet, die Eingangswerte werden durch die Eingangsschicht auf die folgende verdeckte Schicht verteilt, dort verarbeitet und an die folgende Schicht weitergegeben. Die Ausgangsschicht bündelt die Werte der letzten verdeckten Schicht und verarbeitet diese zu den Ausgängen des Netzes. Die Aktivierungsfunktion in den Neuronen ist häufig linear in der Ein- und Ausgangsschicht, während die Funktionen der verdeckten Schichten variieren können. Häufig sind dies Tangenshyperbolikus-Funktionen. Die Neuronen der einzelnen Schichten sind vollverknüpft. Dabei gibt es nur Vorwärtsverknüpfungen (Feed forward net). Es werden keine Schichten übersprungen.

 

Aktivierungsfunktionen von MLP- (oben) und RBF-Netzen (unten)

Einsatz Neuronaler Netze am IRT

Die Modellerstellung und Identifikation mit Hilfe von Künstliche Neuronalen Netzen ist am IRT im Rahmen der Prozessregelung beim Laserstrahlschweißen erfolgreich eingesetzt worden. Zu diesem Zweck wurde ein MLP-Netz implementiert, welches zusätzlich mit analytischem Prozesswissen verknüpft ist. Das damit identifizierte Prozessmodell diente als Grundlage für den Entwurf eines Modellgestützten Prädiktiven Reglers.

Prozessmodell des Laserstrahlschweißens mit integriertem analytischen Teilmodell M

Ebenfalls werden im Rahmen des SFB 686 „Modellbasierte Regelung der Niedertemperaturverbrennung“ Neuronale Netze verwendet. Speziell die CAI-Verbrennung wird zunächst mit einem neuronale Netz modelliert, solange in den beteiligten Teilprojekten im SFB noch physikalische Modelle entwickelt werden. Hier kommen Netze der Form NNSSIF zum Einsatz. Diese haben den Vorteil, dass sie bereits Eigenschaften einer Zustandsraumdarstellung mitbringen. Wird diese Form des MLP-Netzes linearisiert, so erhält man automatisch einen zeitdiskreten Zustandsraum mit einer Rückführung des Modellierungsfehlers ε(t), vgl. Bild. Diese Eigenschaft kann vorteilhaft verwendet werden, wenn dieses Netz um einen extended Kalmanfilter erweitert wird. Dieser wurde im SFB686 in Verbindung mit einem nichtlinearen Modellgestützten Prädiktiven Regler umgesetzt.

Neural Network StateSpace Innovations Form (NNSSIF)

Literatur

[1] Bollig, A.: Prädiktive Prozessregelung beim Schweißen mit Laserstrahlung, Fortschritt-Berichte VDI, Reihe 8, Nr. 1020, VDI-Verlag, Düsseldorf 2004
[2] Bollig, A.: Prädiktive Regelung mit Neuronalen Netzen. at - Automatisierungstechnik 51 (2003), Heft 2, S. 69-77, Oldenbourg Verlag
[3] Bollig, A.; Rake, H.; Kratzsch, Ch.; Kaierle, S.: Application of Neuro-Predictive control to laser beam welding. 15th IFAC world congress, 21.-26.7.2002, Barcelona
[4] Hoffmann, K.; Seebach, D.; Pischinger, S.; Abel, D.: Neural Networks for Controlling future low Temperature Combustion Technologies, 3rd IFAC Advanced Fuzzy and Neural Network Workshop, 29-30.10.2007, Proceedings, Valenciennes, France
[5] Isermann, R.: Identifikation Dynamischer systeme, Band I+II. Springer-Verlag, Berlin, 1988
[6] Nelles, O.; Ernst, S.;Isermann, R.: Neuronale Netze zur Identifikation nichtlinearer dynamischer Systeme: Ein Überblick. at - Automatisierungstechnik 45 (1997), Heft 6, S. 251-262, Oldenbourg-Verlag