Next: Lernen in BW1 Up: Knowbots Previous: Minimales reaktives System
Ein großer Nachteil des reaktiven Systems besteht in seiner Starrheit; es kann, sieht man von einfachen Variationen innerhalb vorgegebener Grenzen einmal ab, nichts dazu lernen. Es setzt `auf eine bestimmte Weise' Einwirkungen der Umwelt in bestimmte Reaktionsweisen um, ohne daß sich diese Reaktionsweise f für die Dauer der Existenz dieses Systems nennenswert ändert. Die `Reaktionsweise f' kann man als eine Funktion auffassen, die Elemente aus der Menge S der Stimuli in Elemente der Menge R der Reaktionen abbildet.
Damit aus einem nicht lernfähigen reaktiven System ein lernfähiges System wird, bedarf es der Möglichkeit, die Reaktionsweise f substantiell ändern zu können, d.h. man muß eine aktuelle Version von f durch eine andere Version f' aus der Menge F der möglichen Reaktionsweisen ersetzen können.
In solch einem System gibt es eine zusätzliche Lernfunktion L, die die aktuelle Version einer Reaktionsweise f durch Rückgriff auf die Menge F der möglichen Reaktionsweisen gegen eine neue Version f' austauscht.
Ein blindes Lernen, das eine aktuelle Reaktionsweise f durch `irgendeine andere' Reaktionsweise f' ersetzt, ist jedoch nicht sehr effektiv. Bei großer Populationsdichte und hohen Vermehrungsraten läß t sich über `lange' Zeiträume möglicherweise auch auf diese Weise eine Verbesserung erzielen. Verhaltensbezogenes Lernen beschränkt sich jedoch auf den Bereich eines Individuums und ereignet sich in einem vergleichsweise `kurzen' Zeitraum. Dies scheint nur möglich zu sein, wenn man annimmt, daß verhaltensbezogenes Lernen als informiertes Lernen realisiert ist. Das Mindeste, was man dann von einem lernfähigen System fordern müßte, wäre, daß es über Bewertungskriterien verfügen kann, die über die Ausgestaltung der Reaktionsweise f mitentscheiden können. Eine solche Evaluation könnte z.B. Umwelteinwirkungen zum Ausgangspunkt von Bewertungen zu machen.
Neben der reinen Verhaltensfunktion f gibt es dann sowohl eine Bewertungsfunktion ev, die Umwelteinwirkungen mittels positiver oder negativer Bewertungszahlen indiziert, und eine modifizierte Lernfunktion L, die bei der Auswahl von neuen Verhaltensweisen f' aus F auch Bewertungszahlen berücksichtigt.
Next: Lernen in BW1 Up: Knowbots Previous: Minimales reaktives System
© 1995 Gerd Döben-Henisch, INM Frankfurt