ヒトはなぜ「手に入らないものを追い続ける」のか?──不合理な行動を計算モデルから解き明かす|菅原通代
「手に入らないほど欲しくなる」。このような経験はないでしょうか。
アイドルの追っかけや競りといった日常の一場面から、ギャンブル依存やストーカーなどの疾患や犯罪に至るまで、手に入らない対象に執着して何度も接近しようとする行動は、我々の社会のさまざまな領域で見られます。
なぜ私たちは手に入らないものを追い続けるのか──この行動の基盤にある認知計算過程を研究しているのが、早稲田大学文学学術院・特別研究員(RPD)の菅原通代さんです。
「いま私たちはどんな時代を生きているのか?」──デサイロではこの観点から人文・社会科学分野の研究や研究者の方々を紹介してきました。興味深い研究を紹介するシリーズ「Research Curation」では、菅原さんの研究に注目。
実験心理学や数理行動神経科学の観点から、一見不合理に見える人間の行動原理を解き明かす菅原さんの研究について、ご自身へのメールインタビューを含めて掲載します。
菅原 通代(すがわら・みちよ)
早稲田大学 文学学術院 学振特別研究員(RPD)。専門は行動の計算論モデリング。臨床心理士。論文に”Dissociation between asymmetric value updating and perseverance in human reinforcement learning”, Scientific Reports, 2021.や ”Choice perseverance underlies pursuing a hard-to-get target in an avatar choice task”, Frontiers in Psychology, 2022. など。
Q:まずは菅原さんの研究内容について、概要をご説明いただけますか?
ヒトは常になにかを選択しながら生きています。電車に乗るために走るかどうか、今年の夏はどこへ旅行に行こうか、夕食に何を食べようか……。しかし、なぜその選択をしたのか、瞬時に説明できる人はあまりいないと思います。
私の専門領域である行動の計算論モデリングは、意思決定の科学と言い換えることができます。行動の計算論モデリングで「行動」は、情報処理の産物であると仮定します。言葉で説明することが難しい非意識的な情報処理プロセスを計算式で表現した「モデル」を用いて、なぜその行動を選ぶのかという「理由」を明らかにしようとしています。
例えば、私がよく用いる強化学習モデルでは、ある行動によって得られた良い結果を価値として記憶し、それぞれの行動の価値を比較することで行動を決定すると考えます。得られた結果からどのように価値を計算するのか、どのように価値を比較して一つの行動を選ぶのかといった情報処理プロセスを計算式で表現します。さらに、個々の情報の重要性は人によって少しずつ異なるため、それを説明するためのパラメータという変数も組み込みます。行動を決める情報処理プロセスを計算式で表現すると、次はどんな行動をとるか、別な場面ではどんな行動になるか予測することもできます。
一方、現実の選択場面で我々は、一般的な強化学習モデルで予測しづらい行動をとることがあります。良い結果が得られないのに同じ行動を繰り返すような場合です。一般的な強化学習モデルでは、これまでに選んだ行動の「結果」を考えて次の選択をしますが、私はこのモデルに、これまでに自分が「選んだ」ことの価値を組み込みました。その結果、不合理に見える行動が、「選んだ」ことの価値を重視するために生じるという可能性に辿り着きました。このように私は、不合理に見える行動も説明可能な情報処理プロセスの産物であると考え、その基盤にある情報処理プロセスについて研究をしています。
Q:現在のテーマに興味を持ち、研究をはじめた理由や経緯を教えてください。
私はもともと臨床心理学を専攻しており、衝動的あるいは強迫的な行動がなぜ生じるのかに興味を持っていました。臨床心理学では、問題行動が起きる状況を患者さんと一緒に整理し、行動が生じる環境を見直し、行動に向かう気持ちが落ち着くよう訓練することで、適応的な行動を促す働きかけを学びました。その一方で、私は問題行動が生じる仕組みに強く惹かれたのです。
臨床心理士として現場で働き、患者さんのお話を聞いていると、さまざまな疑問がどんどん湧きあがってきました。その湧き上がる疑問をそのままにしておけず、私は臨床業務と並行して研究にも携わるようになりました。
国立長寿医療研究センターで認知症の縦断研究に従事していた際、「自分の認知能力が年々低下している」と悩む参加者さんがいました。しかし、行動データだけを見ると、特に問題はないように見えるのです。私はこの矛盾がどこからくるのか確かめたくなりました。
行動の背景にある認知プロセスというブラックボックスの中身を、どうやって覗くことが出来るか考えていた時に、計算論モデリングと出会いました。幸い所属研究室では、個人からさまざまな指標を多面的に取っていたので、モデリングとの相性がとても良かったのです。
これを機に、私は32歳で名古屋大学の博士課程に入学しました。そして、もともと関心のあった不合理行動が日常生活の中にも数多くあることに気がつき、現在のテーマに取り組むこととなりました。
Q:研究を進める過程で、このテーマにどのような面白さや魅力を感じていますか?
「手に入らないものを追い続けてしまう」経験は、誰でも一度はあるのではないかと思います。誰もが経験したことがある事実にも関わらず、この現象は最大の効用を求めるという意思決定の理論から少しはみ出しています。私はこの矛盾に一番面白さを感じています。
ヒトを含む動物は、自分が選んだ結果がどうだったかに応じて次の行動を選ぶと考えられていますが、結果が悪くても同じ行動を取り続ける、同じ対象を追い続ける場合があるのです。
私は自身の研究で、選んだあとの「結果」よりも、自分が選んできた「履歴」を大事にすることで、この現象が生じる可能性を示しました。さらに、たとえ良い結果がずっと返ってこなくても、自分で選び続けた選択肢は魅力的になっていくことも分かりました。
この追跡行動は、情熱と捉えることもできますし、異常と捉えることもできます。コインの裏表のように、良きにも悪しきにも変化する要素を兼ね備えているところに可能性を感じます。
Q:影響を受けた本や先行研究などがあれば教えてください。
私は多くの人が共感できる疑問について研究したいので、行動経済学者ダン・アリエリーの著書である『予想通りに不合理』が好きです。ヒトの様々なバイアスに焦点を当てたユニークなアイディアが散りばめられており、読んでいて楽しい気分になります。
また、神経科学者ターリ・シャーロットが行なってきた『楽観主義』の研究に、多大な影響を受けています。彼女は著書や論文の中で「期待すること」の重要性を説いています。私はこの「期待」こそが、情報処理の中で重要な役割を担い、行動を調整する鍵になっていると信じて研究を行なっています。
私が主に用いている強化学習モデルでは、ある行動をして得られると期待される報酬(予測報酬)と、その行動を実行したことで得られた実際の報酬の差(報酬予測誤差)が次の行動に重要な意味を持ちます。
例えば、最近気になる人がいたとして、話しかけてみると期待していたよりも良い反応であれば、その人に話しかける頻度はより増えるでしょう。一方で、期待していたよりも冷たい反応だった場合、その人に話しかける頻度は減るでしょう。つまり、行動選択の背景にある行動の価値が、報酬予測誤差によって変わると考えられています。
しかし、失恋した相手に何度もアプローチしたり、とても確率の低いガチャに課金し続けたりと、良い結果が伴わないにも関わらず同じ行動を繰り返す場合があります。私は期待と実際の差ではなく、行動を選ぶ時に生じる期待そのものが、実際の結果とは無関係に行動の価値を高め、次も同じ行動を選びやすくすると考えています。
期待している状態こそ我々にとって最も幸福な状態ではないでしょうか?必死になって何かを手に入れようとしている時は楽しくありませんか?実際の結果は分からないのに、想像だけで楽しくなりませんか? このような期待することの価値が、不合理に見える行動を生み出すのかもしれません。
この期待に従う情報処理プロセスをどのように計算モデルとして実装できるか、実際の行動をどのくらい説明できるのか、楽しみは尽きません。
Q:ご自身の研究は、今後の社会や経済、文化などにどのようなインパクトを与えうると考えていますか?
「手に入らないものを追い続ける」行動は、依存症やストーカー行為を彷彿させ、一般的にはあまり良くないイメージで捉えられることが多いかもしれません。
しかし私は、傍から見ると「変な行動」が生じる理由を計算論モデリングで紐解くことで、日常生活を破綻させる悪因だけではなく、情熱や忍耐のように本人の利点となる強みといった良い面も見つけ出せると考えています。何度も失敗する中、ひとつのことを周囲から変だと思われるくらい続けるのは、実はかなり難しいことなのです。
私の研究が社会の何に役立つのか、正直想像がつきません。しかし、私は自身の臨床経験もふまえて、あの人の行動は「変だ」「病気だ」という決めつけで終わるのではなく、そこに隠された本人の強みや問題を理解することが重要だと考えています。
行動の背景にある本質的な理由がわかれば、それを上手く活用する方法や、悪化しないように抑える方法を開発できるかもしれません。これらを知ることで、その人にとって質の良い生き方を見つけるお手伝いができれば良いなと思います。
計算モデリングによる研究をきっかけに、行動の裏に隠された本質的な利点と問題点を理解しようという想いが共有されることを願っています。
(編集部補足)菅原さんの研究詳細
以下、菅原さんが執筆した研究詳細です。(強調:編集部)
ストーカーは、相手から良い反応が返ってこないにもかかわらず同じ対象を追い続け、生涯を創作活動に費やした芸術家が評価されるのは死後であることが多い。なぜヒトは結果の価値を無視して、「手に入らないものを追い続ける」のだろうか。この現象を理解するために、1)不合理な行動を続けさせる複数の要因を強化学習モデルの枠組みで分離する方法を確立し、2)「手に入らないものを追い続ける」行動の基盤にある認知計算過程を検証した。
「手に入らないものを追い続ける」行動を、良い結果を滅多に返さない(報酬確率が非常に低い)対象を選び続ける行動と定義した。規範的な行動からの逸脱を強化学習モデルの枠組みで説明するには、二つの計算過程を考えることが重要である。1つは、選択結果から計算される価値更新、もう1つは選択そのものから計算される選択履歴更新である。これら二つの計算過程は、いずれも反復行動を導きうる。したがって、観測される反復行動がどちらの過程の影響を強く受けているか知るには、これらの計算過程を正しく分離する強化学習モデルを実装することが重要である。最初に、計算機シミュレーションを行うことで、選択結果と選択自身の履歴更新過程を含むハイブリッドモデルの有用性を示した。次に、オンライン実験を通じて実際のヒトが行う選択行動データを収集し、反復行動が、選択結果の履歴更新よりも、選択自身に基づく履歴更新の影響をより強く受けることを示した。さらに、公開されているオープンデータに対してハイブリッドモデルを適用し、過去の報告で結果の履歴更新で説明されていた現象が、選択自身の履歴更新によって説明されることを示した。これらの結果から、反復行動の基盤過程を正しく理解するために、ハイブリッドモデルが有益なツールであることを示した (Sugawara & Katahira, Dissociation between asymmetric value updating and perseverance in human reinforcement learning, Scientific Reports, 2021)。
さらに、前述の方法論的検証によって有用性を立証したハイブリッドモデルを用いて、「手に入らないものを追い続ける」行動の基盤にある認知計算過程の解明に取り組んだ。恋愛シミュレーションを模したアバター選択課題を用いて、「手に入らないものを求め続ける行動」を計測し、課題の前後でアバターに対する主観的な価値(魅力度)も調査した。選択課題では、良い反応を頻繁に返す「友好的なアバター」と、良い反応をほとんど返さない「無愛想なアバター」を設定した。148名中68名の参加者は、良い反応が得られないにも関わらず、「無愛想なアバター」を繰り返し選択した(追跡群)。この無愛想なアバターへの追跡行動が、どのような計算過程で表現されるか検討するために計算機シミュレーションを行い、選択自体の履歴更新への重みづけが高い時に無愛想なアバターへの追跡行動が出現することを明らかにした。そして、オンライン実験で得た実際の選択データに対してハイブリッドモデルを適用することで、追跡群の方が非追跡群よりも選択自体の履歴更新を重視する傾向が有意に高いことを示した。さらに、選択課題を行う前は各アバターに対する主観的魅力度は同等であったにもかかわらず、追跡群では選択課題後に「無愛想なアバター」の魅力度が有意に高くなっていた。これらの結果から、過去の選択への偏重が「手に入らない対象を追い続ける行動」を導き、追い続けた対象をより魅力的だと感じさせると結論づけた (Sugawara & Katahira, Choice perseverance underlies pursuing a hard-to-get target in an avatar choice task, Frontiers in Psychology, 2022)。
今後もデサイロでは、「いま私たちはどんな時代を生きているのか?」を読み解く補助線になる人文・社会科学分野の研究をご紹介していきます。本連載シリーズにぜひご注目ください。
(編集部補足)参考リンク:
デサイロでは、ニュースレターやTwitter、Instagramなどを利用して、プロジェクトに関わる情報を継続的に発信中。Discordを用いて研究者の方々が集うコミュニティも運営しています。ご興味のある方はニュースレターの登録や各SNSのフォロー、あるいはDiscordにぜひご参加ください。
■Discord:https://discord.gg/ebvYmtcm5P
■Twitter:https://twitter.com/desilo_jp
■Instagram:https://www.instagram.com/desilo_jp/
■バックナンバー:
“普遍人類学”に向けて──数理シミュレーションで「親族構造」と「家族形態」を解明する|板尾健司
人文・社会科学をめぐる「指標化」の現在地──長い“文系軽視”を超え、「生産的相互作用」の評価へ
【2023年8月刊】フェミニスト現象学、日本文学の計量的読解、捕鯨問題……デサイロが注目したい人文・社会科学の新刊10冊