Was ist lernen und warum lernen Hunde?

Unter Lernen versteht man den absichtlichen (intentionales Lernen) und den beiläufigen (inzidentelles und implizites Lernen) Erwerb von neuen Fertigkeiten. Der Lernzuwachs kann sich auf geistigem, körperlichem, charakterlichem oder sozialem Gebiet ereignen. 

Aus lernpsychologischer Sicht wird Lernen als ein Prozess der relativ stabilen Veränderung des Verhaltens, Denkens oder Fühlens aufgrund von Erfahrung oder neu gewonnenen Einsichten und des Verständnisses (verarbeiteter Wahrnehmung der Umwelt oder Bewusstwerdung eigener Regungen) aufgefasst.

Die Fähigkeit zu lernen ist für Mensch und Tier eine Grundvoraussetzung dafür, sich den Gegebenheiten des Lebens und der Umwelt anpassen zu können, darin sinnvoll zu agieren und sie gegebenenfalls im eigenen Interesse zu verändern. So ist für den Menschen die Fähigkeit zu lernen auch eine Voraussetzung für ein reflektiertes Verhältnis zu sich, zu den anderen und zur Welt. Die Resultate des Lernprozesses sind nicht immer von den Lernenden in Worte fassbar (implizites Wissen) oder eindeutig messbar.

Welche Lernformen (Lernprozesse) gibt es?

Wir kennen eine Vielzahl an Lernformen. Diese sind unterschiedlich im Charakter, dem zeitlichen Verlauf, der Stabilität des Erlernten, dem Kontext sowie den beteiligten neuronalen Strukturen.

Nachfolgend eine Liste an Lernformen:

  • Habituation (Gewöhnung)
  • Sensitivierung (Sensibilisierung)
  • Klassische Konditionierung
  • Operante / instrumentelle Konditionierung (trial and error oder Versuch und Irrtum)
  • Lernen durch Einsicht
  • Prägung (im strengen Sinn der Ethologie existiert Prägung beim Hund nicht)
  • Nachahmung
  • Soziales Lernen
  • Geschmacksvermeidungslernen
  • Furchtkonditionierung
  • Unterscheidungslernen
  • Raumlernen
  • Zeitlernen

Wir beschränken uns auf die für uns wichtigsten und beeinflussbarsten Lernformen, die wir für das alltägliche Zusammenleben mit dem Hund sowie spezifisch für das Training mit dem Hund kennen und verstehen sollten.

Die klassische Konditionierung

Wir kennen eine Vielzahl an Lernformen. Diese sind unterschiedlich im Charakter, dem zeitlichen Verlauf, der Stabilität des Erlernten, dem Kontext sowie den beteiligten neuronalen Strukturen.

Nachfolgend eine Liste an Lernformen:

  • Habituation (Gewöhnung)
  • Sensitivierung (Sensibilisierung)
  • Klassische Konditionierung
  • Operante / instrumentelle Konditionierung (trial and error oder Versuch und Irrtum)
  • Lernen durch Einsicht
  • Prägung (im strengen Sinn der Ethologie existiert Prägung beim Hund nicht)
  • Nachahmung
  • Soziales Lernen
  • Geschmacksvermeidungslernen
  • Furchtkonditionierung
  • Unterscheidungslernen
  • Raumlernen
  • Zeitlernen

Wir beschränken uns auf die für uns wichtigsten und beeinflussbarsten Lernformen, die wir für das alltägliche Zusammenleben mit dem Hund sowie spezifisch für das Training mit dem Hund kennen und verstehen sollten.

Die klassische Konditionierung

I. P. Pawlow, ein russischer Physiologe, entdeckte 1918 bei seinen Untersuchungen zu den Verdauungsprozessen von Hunden durch Zufall die Zusammenhänge der klassischen Konditionierung.

Er stellte fest, dass die Hunde verstärkt speichelten, wenn seine Assistenten den Tieren Futter brachten. Die Tiere speichelten jedoch bereits dann, wenn sie den Assistenten bzw. das Futter noch gar nicht sehen konnten: Um die Reaktion auszulösen, genügte es den Tieren anscheinend, den Assistenten zu hören.

„Tatsächlich konnte jeder Reiz, den der Hund als der Fütterung regelmäßig vorausgehend wahrnehmen konnte, die gleiche Reaktion auslösen wie das Futter selbst.“ Zimbardo (1992, 230)

Pawlow ging diesem Phänomen nach und untersuchte es ausgiebig – an Hunden. Es blieb dem zweiten bedeutsamen Vertreter der klassischen Konditionierung, J. B. Watson, überlassen, diese Theorie am Menschen auszuprobieren.

Die Abbildung unterhalb zeigt seine Versuchsapparatur, die die Speichelmenge des Hundes auf verschiedene Reize misst:

Bildquelle: Lefrancois (1994, 18) 

Ein Schlauch im Mund des Hundes leitet den Speichel in einen Behälter. Dieser ist wiederum mit einem Aufzeichnungsschreiber verbunden, so dass die Daten auf Papier festgehalten werden konnten.

Wenn Sie etwas schmackhaftes zu Essen vor sich stehen haben, beginnt in Ihrem Mund i.d.R. eine erhöhte Speichelproduktion. Da Reiz (Nahrung) und Reaktion (Speichelfluss) des Verdauungssystems von nichts anderem abhängen, also als automatisch, angeboren, vorprogrammiert oder als Anlage bezeichnet werden können, nannte Pawlow diese Reaktion unbedingten Reflex (unbedingt = nicht erfahrungsbedingt). In Amerika wurde der russische Begriff als unconditional reflex (unkonditionierter Reflex, UCR) übernommen.

Bevor wir zu Pawlows bekannten Versuch kommen, hier notwendige Begrifflichkeiten:

(Stimulus und Reiz sind in diesem Kontext identisch!)

 Ein neutraler Stimulus (NS) ist ein Reiz, der keine spezifische Reaktion auslöst.

 Ein unkonditionierter Stimulus (UCS für unconditioned stimuli) ist ein Reiz, der ohne Konditionierung, also ohne Lernen eine Reaktion / einen Reflex auslöst. Ein UCS löst eine natürliche (angeborene) Reaktion aus – deshalb unkonditioniert.

Beispiel: Das vor Ihnen stehende Leibgericht (= UCS) löst ohne vorheriges Lernen Speichelfluss aus.

Ein Schlag auf das Knie (= UCS) löst die natürliche Reaktion der Muskelkontraktion aus. 

 Ein unkonditionierte Reaktion / ein unkonditionierter Reflex (UCR für unconditioned reaction / reflex) ist eine angeborene Reaktion / Reflex auf einen unkonditionierten Stimulus. 

[Handelt es sich bei dem Reiz um einen reflexauslösenden Reiz, so ist das Ergebnis ein Reflex (z.B. UCR = conditioned reflex = konditionierter Reflex). Handelt es sich nicht um einen reflexauslösenden Reiz, so ist das Ergebnis eine Reaktion (z.B. UCR = conditioned reaction). Das ‚R‘ kann demnach für Reflex und Reaktion stehen – je nach auslösendem Reiz. ]

Beispiel: Das vor Ihnen stehende Liebgericht löst ohne vorheriges Lernen Speichelfluss (UCR) aus.

Ein Schlag auf das Knie löst die natürliche Reaktion der Muskelkontraktion (UCR) aus. 

 Ein konditionierter Stimulus (CS für conditioned stimuli) ist ein Reiz, der durch Lernen entstanden ist und eine konditionierte Reaktion / einen konditionierten Reflex auslöst. Da der Stimulus nicht mehr natürlich ist (sondern erlernt = konditioniert). Das Tier hat mit diesem Stimulus nun eine Erwartung verknüpft. 

 Eine konditionierte Reaktion / ein konditionierter Reflex (CR für conditioned reaction / reflex) ist eine Reaktion / Reflex auf einen konditionierten Stimulus (CS).

 Pawlows Theorie der klassischen Konditionierung

In seinem bekanntesten Versuch paart Pawlow die Futtergabe mit einem zweiten (neutralen) Reiz, einem Glockenton. Kurz vor jeder Futtergabe wird einem Hund ein Glockenton dargeboten, was nach einigen Wiederholungen dazu führt, dass der Glockenton alleine genügt, um die Speichelproduktion des Tieres anzuregen. Der Hund hat den Glockenton mit dem Futter assoziiert. 

Neben der folgenden Darstellung können Sie eine interaktive Simulation starten.

CS (konditionierter Stimulus): Der bedingte (= erfahrungsbedingte) Auslöser (CS; Glocke) ist ursprünglich ein neutraler Reiz (NS; Glocke), der aufgrund der mehrmaligen Kopplung mit einem unkonditionierten Stimulus (UCS; Futter) eine gelernte oder bedingte Reaktion bewirkt. 

CR (konditionierte Reaktion / konditionierter Reflex): Die bedingte Reaktion / der bedingte Reflex (Speichelabsonderung) ist eine erlernte Reaktion. 

Durch die wiederholte Darbietung von Glockenton (NS) und Futter (UCS) beginnt der Hund mit der Speichelabsonderung (CR), wenn er allein die Glocke (CS) hört.

Die operante Konditionierung

B. F. Skinner teilte Thorndikes Ansicht, dass jegliches Verhalten durch bisher erlebte Verhaltenskonsequenzen beeinflusst werde. 1930 beschrieb Skinner seine Experimente mit der Skinnerbox (nach ihm benannte Variante eines Problemkäfigs), in der mit Ratten und Tauben Versuche durchführte. Skinner stützte sich dabei zunächst auf Thorndikes Arbeiten und entwickelte dessen Theorien weiter: Während sich Thorndike auf das grundlegende Versuch-und-Irrtum-Verhalten konzentrierte, rückte Skinner verschiedene Arten der Verstärkung als Konsequenz für ein gezeigtes Verhalten in den Mittelpunkt seiner Forschung.

Beispiel: Skinner sperrte eine Versuchsratte in einen Käfig, in welchem sich einige Signallampen zum testen der Differenzierung und Generalisation (siehe unten) sowie ein Fressnapf befand, der von Außen gefüllt werden konnte. Weiterhin gab es in diesem Käfig einen Hebel, der je nach Versuchstier und Versuchsanordnung eine andere Konsequenz darbot:

Ratte 1 bekam Futter, wenn sie den Hebel betätigte, Ratte 2 konnte durch das Betätigen des Hebels Strom abschalten, der durch das Bodengitter (siehe Grafik) floss und Ratte 3 erhielt einen Stromschlag, wenn sie den Hebel betätigte. 

Nach mehreren Versuchen betätigten Ratte 1 und Ratte 2 immer wieder den Hebel, während Ratte 3 den Hebel nicht mehr betätigte. 

Die Ratten hatten gelernt, Verhalten mit positiven Konsequenzen (Futter bekommen, Strom abschalten) zu wiederholen und negative Konsequenzen (Stromschlag) zu vermeiden. Skinner nannte diesen Lerneffekt: ‚Lernen durch Verstärkung‘ oder auch ‚Lernen am Erfolg‘: das Verhalten (z.B. Strom des Käfigbodens abschalten) befriedigt das Bedürfnis und verstärkt das Verhalten. 

Skinner unternahm weitere Versuche in Verbindung mit Signallampen:

Beispielsweise bekam das Tier nur Nahrung, wenn es den Hebel betätigte und die Deckenlampe brannte.

Das Tier konnte auf verschiedene Zusätze konditioniert werden: Es gilt nicht nur eine Tätigkeit auszuführen (den Hebel zu betätigen), um die Reaktion auszulösen, sondern es muss eine zweite Bedingung (z.B. das Brennen einer Lampe) erfüllt sein.

Die Versuchstiere (in der Skinnerbox) hatten gelernt, durch das eigene Verhalten positive bzw. angenehme Konsequenzen („satisfier“) herbeizuführen und unangenehme Konsequenzen („annoyer“) zu vermeiden bzw. zu verringern. 

„In Skinners Perspektive kann das Verhalten des Tieres vollständig durch äußere Erfahrungen (Stimuli aus der Umwelt) erklärt werden – durch die Nahrungsdeprivation und Einsatz von Nahrungsmitteln als Verstärkung.“ Zimbardo & Gerrig (1999, 208)

 Bei der operanten Konditionierung erfolgt eine Verstärkung auf eine gezeigte Verhaltensweise. 

Als Verstärkung zählt eine bestimmte Konsequenz, die über die Wiederholung des gezeigten Verhaltens entscheidet.

Skinners Lerntheorie basiert auf dem Einsatz der Verstärkung nachdem ein „lernendes“ Individuum eine erwünschte Verhaltensweise gezeigt hat.

Beispiel: Ein Schüler kommt wiederholt verspätet in den Schulunterricht. Da die Mitschüler bewundernd lachen und die Lehrer nichts gegen den Regelverstoß unternehmen, empfindet der Schüler die Konsequenz für sein Verhalten als positiv.

Durch diesen positiven Verstärker wird der Schüler voraussichtlich auch in Zukunft zu spät kommen, um wieder in den Genuss des Verstärkers zu kommen.

Operant bedeutet, an bzw. in seiner Umwelt zu operieren (einzugreifen). Durch das Emittieren einer Verhaltensweise ist es einem Individuum möglich, die Umwelt zu beeinflussen. „Im wörtlichen Sinne bedeutet operant  „die Umwelt beeinflussend“ oder „in ihr wirksam werdend“ (Skinner 1938).“ Zimbardo & Gerrig (1999, 219)

Beim operanten Konditionieren ist demnach ein Individuum von sich ausgehend aktiv, da es eine ‚Operation‘ in der Umwelt vornimmt: Ein Verhalten wird gezeigt (vorgenommen, gemacht), welches die Reaktion der Umwelt hervorruft (= Konsequenz auf das Verhalten). Operanten Verhalten muss nicht geplant sein: Viele Verhaltensweisen der operanten Konditionierung werden spontan emittiert.