動物も人間も、褒められるとその行動を積極的に行うようになり、叱られれば控えるようになります。このように行動の後に続く結果によって、その後の行動が増えたり減ったりする学習のことをオペラント条件づけと呼びます。
今回はオペラント条件づけについて具体例を交えながら分かりやすく解説していきます。古典的条件づけとの違いも見ていきましょう。
目次
オペラント条件づけとは
オペラント条件づけ
とは、自発的な行動に何らかの刺激を随伴させることにより、その行動の生起頻度や反応強度を変化させる操作手続きのことを指し、「道具的条件づけ」とも呼ばれます。
オペラント条件づけの意味と定義
私たちが日頃行う自発的な行動の殆どは、行動の後に続く「快」「不快」の経験に基づいています。行動した後に、良い結果に結びづけば自然と行動頻度は増えますし、嫌なことに繋がったとすれば二度と同じことはしなくなるでしょう。
こうした直後の報酬や罰によって自発的な行動が増えたり減ったりする学習(訓練)のことをオペラント条件づけと呼ぶのです。
心理学における「学習」とは、単に学ぶということだけではなく「経験によって行動が変化すること」を指します。
オペラント条件づけの具体例
- お腹がすいたからご飯を食べる(→食欲が満たされる)
- 黒板が見えないから眼鏡をかける(→見えるようになる)
- イライラするからカラオケに行く(→ストレスが発散される)
こうした行動もすべてオペラント条件づけに即していると言えます。「行動直後に発生した刺激」が「自発的な行動の理由」となっているかがポイントです。
最後の例を見てみましょう。「カラオケに行ったらストレスが発散された」という経験を得ることで、今後イライラすることがあればカラオケに行く頻度が増えると予想出来ますね。
オペラント条件づけと古典的条件づけの違い
条件づけには「オペラント条件づけ」と「古典的条件づけ」の2種類が存在します。それぞれの目的と特徴は以下の通りです。
目的 | 特性 | |
オペラント条件づけ | 刺激により行動を増減させる | 自発的な行動(能動的) |
古典的条件づけ | 特定の条件反射の引き金になる刺激を増やす | 条件反射(受動的) |
オペラント条件づけは、刺激により行動の頻度を増やしたり減らしたりする学習
のことでした。さらに行動のすべてが自発的に行われているという特徴があります。
古典的条件づけは、生理的な反応を別の刺激と結びづけさせる学習のことを指します。この時起きる反応は自分の意思ではコントロールできません。
古典的条件づけには「パブロフの犬」という有名な実験があります。これは犬にエサを与える直前に毎回ベル音を聞かせることで、ベル音を聞いただけでも唾液が分泌するように条件づけさせるものです。
オペラントの対義語としてレスポンデント条件づけという呼び方をされることもあります。レスポンデント(respondent)の意味には「応答する」「反応する」という意味があります。
※古典的条件づけについてはこちらの記事も併せてご参照ください
オペラント条件づけに関する研究:スキナーの実験
オペラント条件づけはアメリカの心理学者、B.F.スキナーの研究により発見されました。
スキナーはスキナー箱と呼ばれる自ら考案した実験ボックスを用意し、その中に空腹のネズミを入れました。スキナー箱の内部には、レバーを押すとエサが出てくる仕組みが施されています。
箱の中を動き回るネズミは、そのうち偶然レバーを押してエサ皿に出たエサを食べることが出来ます。このような状況を何度も繰り返していくうちに「レバーを押したら餌が出る」と学習し、ネズミはその後も積極的にレバーを押すようになりました。
スキナーはこうした実験により、自発的な行動(レバーを押すこと)が形成されていく過程のことをオペラント条件づけと名づけました。条件づけされた「自発的な行動」はオペラント反応やオペラント行動とも呼ばれます。
オペラントとは英語のオペレート(operat)を由来としたスキナーの造語です。オペレートには「効果的に作動させる」という意味があります。
オペラント条件づけに関する用語
強化子(強化刺激):好子と嫌子
オペラント条件づけでは「行動直後に発生した刺激」のことを強化子(きょうかし)、または強化刺激と呼びます。さらにこの強化子には好子と嫌子の2種類が存在します。
- 【正の強化子 別名「好子」(こうし)】
自発行動を促進させたい時に使用されるもので、主に学習者に好まれる刺激を指します。 - 【負の強化子 別名「嫌子」(けんし)】
好子の逆で、主に学習者が不快に感じる刺激を指します。自発行動をやめさせたり、代わりに別の行動を獲得させたいときに使用します。
強化と罰(弱化)、消去
好子や嫌子を用いて行動を増加させることを「強化」、行動を減少させることを「罰」と呼びます。罰には「強化」の対義語として「弱化」が用いられることもあります。
一度は条件づけされても、その後の行動で適切な強化が行われなければ行動頻度も減少する一方です。これを「消去」と言います。
では、ここまでの用語をスキナーの実験結果に当てはめて見てみましょう。
行動直後に発生した「餌が出る」という刺激が強化子です。これはネズミにとって好ましい刺激なので好子となります。さらに「レバーを押す」というオペラント反応は増加したので、好子により強化された、と考えることが出来ます。
レバーを押しても餌が出なくなれば、いずれネズミのオペラント反応は消去されます。
強化スケジュール
強化子を与えるタイミングにも色々なパターンがあります。毎回強化子を与える方法は「連続強化スケジュール」(固定時間間隔強化)、ときどき強化子を与える方法を「部分強化スケジュール」(変動時間間隔強化)と呼びます。
強化子はその都度必ず与えなくとも、自発的な行動は維持されることが分かっています。寧ろ連続強化を行うより、部分強化を採用したほうが条件づけが消去されにくいのです。
部分強化スケジュールには以下の4種類が存在します。
種類 | 方法 | 例 |
固定比率スケジュール(FR) | 一定の回数の反応ごとに強化 | スタンプカード、トークンエコノミー法 |
変動比率スケジュール(VR) | 間隔は一定ではないが、平均して一定回数の反応ごとに強化 | 宝くじ、スロット |
固定間隔スケジュール(FI) | 一定時間ごとに強化 | 月の給与、ゲームのログインボーナス |
変動間隔スケジュール(VI) | 時間間隔はランダムだが、平均して一定時間ごとに強化 | 魚釣り、抜き打ちテスト |
三項随伴性(ABC理論)
三項随伴性とは「先行条件」ー「行動」ー「結果」という3つの枠組みから、オペラント条件づけをより詳しく分析する方法です。先行条件(Antecedent)行動(Behavior)結果(Consequence)の頭文字からABC理論とも呼ばれています。
三項随伴性を活用することで、数多くの問題行動の解決に役立てることができます。
A 条件 | B 行動 | C 結果(強化子) | 行動の頻度 | |
正の強化 | 太ったので | 筋トレをする | 痩せた(好子出現) | 増加 |
正の罰(弱化) | 毎晩 | 遅くまで読書をする | 風邪を引いた(嫌子出現) | 減少 |
負の強化 | 頭が痛いので(不快) | 薬を飲む | 痛みが取れた(嫌子消失) | 増加 |
負の罰(弱化) | ゲームをしていたら(快) | 兄弟喧嘩になった | ゲームを没収された(好子消失) | 減少 |
上記の表にも採用されている通り、私たちの自発的な行動は大きく分けて4つのパターンがあると考えられています。正は刺激を与えること、負は取り除くことだと考えるのがポイントです。
- 正の強化 : 好子(良いこと)の出現により行動が増加する
- 正の罰(弱化): 嫌子(悪いこと)の出現により行動が減少する
- 負の強化 : 嫌子(悪いこと)の消失により行動が増加する
- 負の罰(弱化): 好子(良いこと)の消失により行動が減少する
シェイピング
シェイピングとは、一定の目標行動に至るまでの行動を段階的にスモールステップの形で設定し、順次遂行していくことで目標行動に近づける方法です。
小さな達成感や喜びが、さらなる目標に挑戦する原動力に繋がり、目標達成への行動の生起頻度を上げるという仕組みであり、オペラント条件づけの原理に基づいた方法です。
例えば、不登校の生徒に対して、保健室に居るだけで良いから学校に行く→午前だけでも教室で授業を受ける→通常通り投稿するという具合に徐々に目標行動に近づけていくことが挙げられます。
※シェイピングについてはこちらの記事も併せてご参照ください
トークンエコノミー法
一定の課題を遂行出来たときに、トークン(代替貨幣)を報酬として与え、目標とする行動を強化する方法です。
こちらもオペラント条件づけの原理に基づいた方法であり、望ましい行動をした直後に報酬(ご褒美)をあげることで、その行動の生起頻度を上げるという仕組みです。
例えば、宿題をした日にはカレンダーにスタンプ(トークン)を押し、スタンプが10個貯まるとゲームを買ってもらえるとすれば、宿題をする頻度が増える(目標行動が強化)ことが挙げられます。
※トークンエコノミー法についてはこちらの記事も併せてご参照ください
オペラント条件づけの人間行動への影響
スキナーはオペラント条件づけの理論を確立しただけでなく、「行動分析学」の創始者であることもよく知られています。
行動分析学とは字の如く、人や動物の行動を分析する一つの学問体系のことです。我々の行動を形成する基本的な原理は、オペラント条件づけと古典的条件づけの2つに基づいていると考えられています。
さらにこの行動分析学を発展させ、社会生活における諸問題の解決に応用しようと確立されたものが応用行動分析学(Applied Behavior Analysis)です。臨床(使用される現場)では英語の頭文字をとって「ABA」と呼ばれています。
ABAは教育、医療、企業、スポーツなど多くの分野で活用されており、中でも発達障害や自閉症スペクトラムの支援に欠かせないものとなっています。ABAではまず障害児の問題行動の前後を分析することから始まります。ここで上述したABC理論(三項随伴性理論)を用いるのです。
また、オペラント条件づけそのものも心理療法に応用されています。例えば認知行動療法では、自らの行動をもって少しずつ心を回復に向かわせて行きます。その際、好子を用いたり嫌子を減少させることで、自発的な行動の範囲や頻度を徐々に拡大させることが可能です。
※応用行動分析についてはこちらの記事も併せてご参照ください
オペラント条件づけの日常での応用
日常生活でオペラント条件づけが生かせる場面は数多く存在します。ここでは具体的な応用方法を見ていきましょう。
子供の教育
例えば教室で騒がしくしている子供がいるとします。何度注意してもなかなか改善されない場合はどうすれば良いでしょうか。
強化子の説明で行動頻度を減少させるには、嫌子を出現させるか好子を消失させると良いと解説しました。一般的に何度も注意されることは嫌子になりそうなものですが、もし子供が「先生に構ってもらえている」と捉えていたらそれは好子となります。
ここでは敢えて騒がしいことを注意せず、存在を無視してみましょう。少し酷かもしれませんが、子供は自分に反応を示さないあなたが気掛かりになり、問題行動を控えるようになるかもしれません。
自分自身の価値観を当てはめずに、個々の性格や自発行動の原因をきちんと見極めることが大切です。
犬のしつけ
犬のしつけに最も多く活用されるのは、褒めたり餌をあげたりする「正の強化」と、叩いたり大きな声で叱るといった「正の罰」ではないでしょうか。しかし、正の罰は使い方を間違えると犬の不安やストレスに繋がり余計に問題行動を悪化させることがあります。
犬に嫌子を与えるときは、委縮させてしまうような直接的な罰を控えましょう。代わりに活用したいのがサプライズです。苦痛を与えるのではなく、びっくりさせて問題行動を妨害するのが目的です。
正の罰で用いられる嫌子は「嫌がること」だけを指している訳ではありません。「消失すれば行動が促進される刺激全般のこと」を指します。よって、犬が嫌がることだけを用いる必要はないのです。
オペラント条件づけについて学べる本
オペラント条件づけの学習に適した書籍をご紹介します。
オペラント心理学入門 ー行動分析への道ー
オペラント条件づけと古典的条件づけのことだけを、丁寧に分かりやすく解説しています。日常での具体例や、あらゆる場面での解決策もぜひ参考にしてみましょう。
行動分析学をより深く科学的に理解するのに適した一冊です。
使える行動分析学 じぶん実験のすすめ
仕事、勉強、恋愛、ダイエット…、自身のための自発的な行動は、何故かなかなか起こす気になりません。そんな時も、行動分析学の理論を応用すれば行動を変えることが出来ます。
専門書よりも自己啓発書に近く、とにかく自分を変えてみたい!と思われている方にお勧めです。
行動分析学マネジメント 人と組織を変える方法論
「前向きな意見の出る職場作り」「成長に繋がる褒め方」など、理想的な組織を持つには行動分析学に基づくマネジメントを行うことが重要となってきます。
本書ではビジネスシーンにおいて実際に起きている問題をストーリー仕立てで紹介し、行動分析学の専門家がより具体的に解説しています。人材育成の一環として、リーダーや経営者の方にはぜひ一度目を通してほしい一冊です。
関連するキーワード
今回ご紹介したオペラント条件付けに関連するキーワードをまとめます。サイト内に記事があるものについてはリンクを付けておりますので、併せてご参照ください。
行動の裏にある意味を考えてみる
我々の自発的な行動はすべて、オペラント条件づけにより定着していることが分かりました。
「どうして続かないのか」「どうしてやめられないのか」といった悩みには、まず自身の行動を客観的に見直すことが大切です。強化子を変更したり強化スケジュールを上手く活用し、新たなオペラント条件づけを試みましょう。
【記事のまとめ】
・オペラント条件づけとは、報酬や罰によって自発的な行動が増えたり減ったりする学習(経験によって行動が変化すること)を指す。
・条件づけは2種類あり、オペラント条件づけのほか、生理的な反応を別の刺激と結びづけさせる学習を指す古典的条件づけがある。古典的条件づけが自分の意思でコントロールできない受動的な学習に対して、オペラント条件づけは行動が自発的に行われる能動的な学習である。
・自発行動を促進させたいときに使用される「好子」と自発行動をやめさせたいときに使用される「嫌子」があるり、好子や嫌子を用いて行動を増加させることを「強化」、減少させることを「罰」と呼ぶ。
・「正」は刺激を与えること、「負」は取り除くことを表し、正の強化は「好子の出現により行動が増加」、正の罰は「嫌子の出現により行動が減少」、負の強化は「嫌子の消失により行動が増加」、負の罰は「好子の消失により行動が減少」となる。
・毎回強化子を与える方法を「連続強化スケジュール」、ときどき強化子を与える方法を「部分強化スケジュール」と呼び、連続強化より部分強化の方が、条件づけが消去されにくい。
・オペラント条件付けは認知行動療法などの心理療法に応用されているほか、教育やしつけなど日常生活においても多くの場面で生かされている。
参考文献
- 徳田克己・髙見令英文 (2003).『ヒューマンサービスに関わる人のための教育心理学』化書房博文社 13-19.
- 鹿取廣人・杉本敏夫・鳥居修晃 (1996). 『心理学 第3版』東京大学出版会 27,28,65-74.
- 杉山尚子『行動分析学入門ーヒトの行動の思いがけない理由』集英社
- カウンセラーウェブ『三項随伴性とは(ABC分析)』