Knowbotic Interface Project



Agenten: Menschliche Wahrnehmung - Visuell

This is a working paper which will probably be rewritten several times in the next months





AUTHOREN: Gerd Döben-Henisch
FIRST DATE: December 27, 1995
DATE of LAST CHANGE: May-22, 1996



Für die nachfolgenden Zusammenfassungen wurden vor allem die folgenden Quellen benutzt: MURCH/ WOODWORTH (1978), SHEPERD SS.296-323 (1993), SCHIFF (1980), GRÜSSER/ GRÜSSER-CORNEHLS (1987), KOLB/ WHISHAW (1993).

Visuelle Stimuli, Receptoren, und visuelles System



  1. Bei den visuellen Stimuli handelt es sich um einen Ausschnitt aus dem Bereich der elektromagnetischen Wellen im Bereich von ca. 380nm - 760nm. Rezipiertes Licht stammt entweder direkt von einer Lichtquelle, die das Licht emittiert, oder von einem Reflektor, der das Licht selektiv oder unspezifisch absorbiert bzw. reflektiert.

  2. Als visueller Sensor dient beim menschlichen Agenten das Auge. Es besteht aus dem dioptrischen Apparat (ein nicht exakt zentriertes, zusammengesetztes Linsensystem) mit einer Netzhaut als receptorischer Fläche. Die Brechkraft der Linse und die Pupillenweite können durch neuronal kontrollierte glatte Muskeln verändert werden. Die Netzhaut entsteht aus einer Ausstülpung des Zwischenhirnbodens und ist daher ein Teil des Gehirns.

  3. In der Netzhaut gibt es Photorezeptoren, die sich aus etwa 120 Millionen Stäbchen und 6 Millionen Zapfen zusammensetzen. Im Zentrum der Netzhaut finden sich überwiegend Zapfen, an der Peripherie mit ihrer geringeren Auflösung, Stäbchen. An der Stelle des schärfsten Sehens, an der Fovea Centralis, gibt es nur Zapfen. Die Reaktionen der Photoreceptoren hängen u.a. von Sehfarbstoffen (Rhodopsin) ab, die spezifisch auf bestimmte Wellenlängen des Lichtes reagieren. Während die Stäbchen nur ein einziges Maximum bei ca. 500 nm aufweisen, kann man bei den Zapfen drei verschiedene Typen (430 nm blauviolett, 530 nm gelbgrün, 560 nm gelb) entsprechend drei unterschiedlicher Maxima aufzeigen. Nur mit den Zapfen ist Farbensehen möglich. Dabei kommt die Identifikation durch Vergleich aller gleichzeitigen Signale der verschiedenen Zapfen zustande.

  4. Das sekundäre Receptorpotential der Photoreceptoren wird auf die nachgeschalteten Bipolarzellen und die Horizontalzellen übertragen. Dabei ist eine nachgeschaltete Bipolarzelle für mehrere Receptorzellen zuständig; die nachgeschaltete Bipolarzelle kodiert also ein receptives Feld, das sich in ein Zentrum und in eine Peripherie aufteilt, die unterschiedlich ausgewertet werden. Je nachdem bewirken die Rezeptoren in den Bipolarzellen eine Depolarisation oder eine Hyperpolarisation. Peripherie und Zentrum wirken in der Regel antagonistisch: wenn die Peripherie Depolarisation bewirkt, bewirkt das Zentrum Hyperpolarisation, und umgekehrt. Hier zeigt sich das Prinzip der Signalkonvergenz und der lateralen Inhibition. Dies gilt auch für die nächste Schicht von Ganglienzellen und Amakrinen in der Netzhaut. Das optische Bild, das die Eingangsschicht der Receptoren erregt, wird schon in der Netzhaut in ein mehrfaches Erregungsmuster unterschiedlicher Ganglienzelltypen umgesetzt.

  5. Die visuelle Information wird durch die den Sehnerv bildenden Axone (ca. 1 Million) der retinalen Ganglienzellen in das Gehirn übertragen. Die wichtigste und stärkste Projektion der Retina ist ihre Verbindung mit dem Corpus geniculatum laterale (CGL). Das CGL dient der Objekterkennung, dem Farbensehen, dem Bewegungssehen und dem stereoskopischen Tiefensehen. Die Verbindung der Netzhaut mit dem Hypothalamus dient u.a. der Ankopplung des Tageslichtwechsels an den endogenen Schlaf-Wach-Rhythmus. Ein Teil der Verbindung der Retina mit der Area praetectalis dient der Regelung der Pupillenweite. Es bestehen indirekte Verbindungen zu den blickmotorischen Zentren, über die die vertikalen Augenbewegungen und die Vergenzbewegungen gesteuert werden. Die Projektion in die Colliculi superiores dient der Steuerung der reflektorischen Blickmotorik durch Saccaden. Verbindungen über den Kern des optischen Traktes werden bewegungsspezifische Informationen ausgewertet, die im Zusammenwirken mit den Vestibulariskernen die Wahrnehmung von Eigenbewegungen unterstützen. Insgesamt zeigt sich eine retinotope Organisation des zentralen visuellen Systems.

  6. Im primären visuellen Cortex, der die retinotope Organisation der Signale im Prinzip übernimmt, finden sich auch rezeptive Felder, diese zeichnen sich jedoch durch sehr spezifisches Antwortverhalten aus. So reagieren parallel angeordnete On- bzw. Off-Zonen einiger einfacher rezeptiver Felder spezifisch auf bestimmte Postionen und Orientierungen. Andere komplexe rezeptive Felder reagieren spezifisch auf Reizmusterwechsel (Bewegungen) und Bewegungsrichtung in der x-y-Ebene sowie auf Hell-Dunkel-Konturen, Ausdehnung, spezielle Konturen und Konturunterbrechungen und Ecken. Ferner gibt es unterschiedliche binoculare Integrationsmechanismen, die die receptiven Erregungsmuster beider Augen miteinander in Beziehung setzen, u.a. ist dies für das stereoskopische Tiefensehen notwendig.

  7. Außerhalb des primären visuellen Cortex findet sch auch eine, meist hochspezialisierte, visuelle Vearbeitung. So werden Konturen bestimmter Orientierung und Konturunterbrechungen unterschieden. Andere Nervenzellen sind farbspezifisch, andere stellen Beziehungen zwischen visuellen Mustern und Objektkonzepten her. Andere reagieren auf Bewegungsänderungen entlang der z-Achse. Es gibt spezialisierte Neuronen für Gesichter unterschieden nach Frontansicht oder Profilansicht. Im Zusammenhang damit gibt es scheinbar auch eine Auswertung der emotionalen Komponenten von Gesichtern. Wieder andere Zellen hängen von komplexen visuellen Mustern ab, die speziell erlernt worden sind.

    Das Grundprinzip, das sich hier andeutet, ist die parallele Anordnung abstrahierter Informationen auf sehr vielen verschiedenen Ebenen, die dann auf höhreren Ebenen integriert werden. Diese Integrationsmechanismen sind aber weithin noch nicht aufgeklärt.


Phänomenaler Raum



  1. Die Koordinaten und die räumliche Ordnung der Gegenstände des phänomenalen Raumes erscheinen uns unverändert, auch wenn sich das Netzhautbild durch aktive Augen-, Kopf- oder Körperbewegungen verschiebt. Darüberhinaus haben die Objekte in dem uns unmittelbar umgebenden Greifraum multimodale Eigenchaften. Der phänomenale Objektbegriff umfaßt neben den visuellen Eigenschaften in gleicher Weise auch taktile, olfaktorische, gustatorische und oft auch auditorische Eigenschaften.

  2. Vom Standunkt des Erlebens aus wird angenommen, dass im einzelnen die folgenden Informationen verfügbar sind (ohne dass deren Zustandekommen analysiert wird):

    1. wir können Objekte bzgl. ihrer visuellen Gestalt unterscheiden und sie dadurch von einem Hintergrund bzw. einer Umgebung abheben.
    2. wir können Texturen (inklusive Farben) unterscheiden.
    3. Anhand von Texturgradienten lassen sich Formen, Größen, Stellungen, Entfernungen und Eigenbewegungen erkennen.
    4. Wir können die lokale Reflexion eines Objektes als Helligkeit erfassen und die spezifische spektrale Zusammensetzung als Sättigung.
    5. an einer einzelnen Gestalt können wir weitere 'Teilgestalten' unterscheiden.
    6. wir können erkannte Objekte relative zueinander anordnen, d.h. wir haben eine dreidimensionale Raumorganisation.
    7. wir können die Tatsache und die Geschwindigkeit von Veränderungen in der Beschaffenheit von Objekten und deren Lage zueinander erkennen:

      • Veränderungen der Texturen.
      • Veränderungen der Formen.
      • Veränderungen der Größe.
      • Veränderungen der lokalen und allgemeinen Lichtstärke.
      • Veränderungen von Positionen zusammen mit Bewegungen.


    8. Die Veränderungsgeschwindigkeit von Objekten relativ zueinander sagt etwas über die relative Entfernung dieser Objekte aus.
    9. Die Überlappung eines Objektes B durch ein Objekt A sagt etwas über die relative Anordnung.
    10. Der Verlauf des Schattens sagt etwas über Lichtquellen und die Positionierung von Objekten.
    11. Die lineare Perspektive sagt auch etwas über Standpunkt und Entfernung.
    12. Die bekannte Größe eines Objektes hilft bei der Einschätzung von Objektereignissen.
    13. Die Höhe im visuellen Feld kann Entfernung kodieren.
    14. Die Fähigkeit, Details an einem Objekt zu erkennen, nimmt mit der allgemeinen Helligkeit und der Entfernung ab.

    15. Allen visuell identifizierten Objekten können weitere, nicht-visuelle Eigenschaften zugeordnet sein:

      • diverse Bewegungen (Augen, Kopf, Körper).
      • Berührungs- und Druckwerte.
      • Geruch und Geschmackswerte.
      • Geräusche.


    16. Ambivalente Strukturen lassen sich meist durch Bewegungen auflösen.





    Comments are welcomed to doeb@inm.de





    INM




    Daimlerstrasse 32, 60314 Frankfurt am Main, Deutschland. Tel +49- (0)69-941963-0, Tel-Gerd: +49(0)69-941963-10