現時点では個人が学習・実行していない行動を確立するプロセスをシェーピングと呼びます。 シェーピングは、目標行動に近い行動を強化する手順とも定義され、連続的な近似性とも呼ばれます。
この理論では、望ましい行動の近似値に近い行動を強化していきます。 生物が自発的に目標とする行動を正確に示すとは限らないため、シェーピングのプロセスは不可欠です。 しかし、望ましい行動に近い行動を強化することで、必要な行動を教えたり学んだりすることができます。 例えば、犬に新しい芸を教えたり、子供に歩き方を教えたりするようなものです。
How Shaping of Behavior works?
行動の形成は、決して複雑ではありませんが、実際には最も単純なプロセスではありません。 B.F.スキナーが行ったシェーピングの最初の実験は、ハトにボウリングを教えるというもので、ハトはくちばしでボールを横取りしてピンに向かって路地を進むように徐々に教えられました。
スキナーがネズミに餌のレバーの押し方を教えた実験では、ネズミは直感で突然、自発的に行動を起こしたわけではありませんでした。 ネズミにとっての目標行動は、レバーを押すことであり、その場合には餌が与えられる。 しかし、当然ながらネズミは自発的にレバーを押すことはありません。 そこで調教師は、最初は目標行動の粗い近似行動にも報酬を与えていました。 例えば、正しい方向に一歩進んだだけでもよしとする。
この手順の重要な点は、目標とする行動に近い新しい行動にのみ報酬を与えることです。
この手順で重要なのは、目標とする行動に近い新しい行動だけに報酬を与えることです。例えば、ラットの実験では、ラットがレバーに触れたら、後ろ足で立ち上がっても報酬は与えませんでした。 そして、目標とする行動が達成されると、目標とする行動に向けての連続した近似行動には報酬が与えられなくなるのです。 このように、シェイピングはオペラント条件付けの原理を用いて、適切な行動を強化し、望ましくない行動を阻止することで、対象が行動を学習するように訓練します。
シェーピングのプロセスに含まれるステップ
- まずは、望ましい目標行動に少しでも近い行動を強化します
- 次に、目標行動に近い行動を強化します。 また、前の行動を強化してはいけません。
- 目標の行動にさらに近い反応・行動を強化し続けます。
- 目標行動が達成されるまで、連続した近似値を強化し続ける。
- 目標行動が達成されたら、最終的な反応のみを強化する。
応用
シェーピングは、主に行動の実験的分析に使用される条件付けパラダイムとも定義されます。 行動を教えるために、連続した近似値を強化する方法は、人間でも動物でも効果があることがわかっています。
例1: 犬に言葉の命令に従う方法を教えることは、シェーピングのわかりやすい例の1つです。 当然のことながら、子犬は自動的に目標とする行動をとることはできません。
シェーピングは人間の学習にも使われます。
シェーピングは人間の学習にも使われています。子供の特定の行動を形成するために、連続的に報酬を与えることは非常に効果的です。 教師がジョニーに教室全員の前で話すことを教えようとしているとします。 ジョニーは内気な子なので、すぐにスピーチをすることはできないでしょう。 そこで、ジョニーにスピーチをしたらご褒美を約束するのではなく、それに近い行動にご褒美を与えるべきです。 例えば、クラスの前に立ったときにご褒美を与えます。 次に、クラスの前に行って挨拶をしたとき。 次に、本の一節を読むことができたら、ご褒美を与えます。 そして最後に、スピーチができたときです。 要するに、報酬は連続したものでなければならず、以前の反応で報酬を保持することはできないのです。
.