理性をモデル化する - まとまり日記

スティッチ＆シュタインの議論では、自然選択からヒトが理性を持つことを直接導き出すのは難しいことがわかった。彼らはとくに「〈転ばぬ先の杖〉論法」を用いて、進化の道程において自然選択によって最適にデザインされた認知システムは、理性的なシステムとは限らないと論じた。

しかし、より理性的な認知システムをもっている方が、そうでないよりも適応度が高くより生き延びやすいような状況は容易に想像できる。例えば干ばつのときでも水のかれない泉の場所を知っていれば、知らないよりもそれだけ生き残りの確率は高まるだろうし、「ホメオパシーにプラシーボ以上の効果がない」という知識はときには自身や自分の子孫の生死にも関わる。頭がよければよい程適応度が高くなるかは別にしても、真なる信念を持っている方が誤った信念を持っているよりも生き残りに役立つ（ことがある）というのは直観的な説得力を持つし、だからこそ多くの哲学者が賛成の身振りを示してきたのだろう。

この点はスティッチ＆シュタインの議論と矛盾するわけではない。というのは、以前検討した演繹的論証

自然選択は、うまくデザインされた性質・システムを生み出す。

最適にデザインされた認知システムは、理性的なシステムである。

したがって、自然選択は理性的な認知システムを生み出す。　

は、演繹的論証であるが故に、論証が妥当で前提が真という前提の下では、結論はつねに真ということになる。しかしこの論証がうまくいかないことと「自然選択は理性的な認知システムを生み出すこともある」ことは両立する。

ゴッドフリー＝スミスのモデル

では、どのようなときなら、理性的で真なる信念を生み出すシステムにしたがったほうが適応度が高まるのだろうか。これに答えようとしたのがソーバーやゴッドフリー＝スミスらの理性についてのモデル化である。

例えば、ピーター・ゴッドフリー＝スミスは

Complexity and the Function of Mind in Nature (Cambridge Studies in Philosophy and Biology)

作者: Peter Godfrey-Smith
出版社/メーカー: Cambridge University Press
発売日: 1998/09/28
メディア: ペーパーバック
クリック: 3回
この商品を含むブログ (1件) を見る

の第七章で、そうした理性のモデル化を試みている*1。　ゴッドフリー＝スミスは以下のようなモデルを考える。

	毒あり	毒なし
信念「毒あり」	V11	V12
信念「毒なし」	V21	V22

これは信念と状態の組みにかんする利得表である。たとえば、あるキノコについて「このキノコには毒はある」と考えて、本当に毒があったときの利得はV11である。

また、反応尤度(response likelihood) a1, a2を以下のように考える。

	毒あり	毒なし
信念「毒あり」	a1	1-a2
信念「毒なし」	1-a1	a2

たとえば、1-a1というのは、「実際は毒があるのに誤って「毒なし」と考えてしまう確率」である。記号で書くとa1=Pr(B(A)|A)となる（"B(X)"を「Xを信じる」とする）。

そして、信念「毒あり」「毒なし」の重要度という概念を考える。これは平たくいうと、ある事態Aが成立しているときに、正しく「Aである」と信じるときと、誤って「Aでない」と信じるときの利得の差である。上の例では、「毒あり」の重要度はV11-V21となり、「毒なし」の重要度はV22-V12となる。たとえば本当にキノコに毒があったとき、正しく「毒あり」と信じるのと、誤って「毒なし」と信じるのでは、利得の違いはV11-V21となるからである。

ここで、キノコに毒がある確率をpとすると、最初から「毒あり」と決めつける場合の利得は、pV11+(1-p)V12となる。同様に最初から「毒なし」と決めつける場合の利得は、pV21+(1-p)V22となる。それに対して「毒あり」か「毒なし」を何らかの手がかりに沿って学習して決める場合の利得はp[(V11(a1)+V21(1-a1)]+(1-p)[V12(1-a2)+V22a2]となる。

すると「毒あり」の期待重要度が「毒なし」の期待重要度よりも高い場合、もし最初から「毒あり」「毒なし」と決めつける場合よりも学習によって行動を変えることの利得が高いのは、次のときであり、そのときに限られる。

$\frac{a_2}{1-a_1}>\frac{p(V_{11}-V_{21})}{(1-p)(V_{22}-V_{12})}$

この式から、ゴッドフリー＝スミスは以下の教訓を引き出している。

もし環境内の手がかりにまったく信頼度がなければ、つまり $1-a_1=a_2$ なら、上の式は成り立たない（p(V11-V21)>(1-p)(V22-V12）なので）。

また、この式はStich&Steinの「〈転ばぬ先の杖〉論法」が成り立つことがあることを示している。上の式の右辺は「毒あり」「毒なし」の期待重要度の比になっていることに注意してほしい。もし、「毒あり」の期待重要度が「毒なし」のそれよりも十分高ければ、広範囲な反応尤度の値の組（a1, a2）について上の式は成り立たなくなる。

環境の変異の重要性

もう一つのポイントは、学習が進化するに当たっての環境の変異の重要性である。環境からの刺激によって行動を変えること（学習）が、最初から「毒あり」「毒なし」と決めつける場合よりも有利な条件としてデューイは二つの条件を挙げていた。

環境からの手がかりが信頼できること
環境に変異があること

上のモデルはこの指摘が基本的に正しいことを示している。上で述べたように手がかりに信頼度がなければ、学習は割に合わない。また、「毒あり」「毒なし」の重要度に差がなければ、上の式が成り立つのはa1とa2が大きく、pが0.5に近いときである。そしてpの値が0.5に近いというのは、環境の中で有毒のキノコと無毒のキノコがどちらも同じ割合で存在するときである。逆に環境の中にあるキノコがほとんどすべて有毒（あるいは無毒）なら（つまりpの値が1あるいは0に近いなら）、学習によって行動を変えることの利点は薄くなるのである。

モデルの限界

ということでこうした単純なモデルで色々なことが言えてよいわけだが（ゴッドフリー＝スミスはほかのモデルも検討しているが、ここでは省略する）、モデルの単純さが故に限界がある。これは同様のモデルを検討したエリオット・ソーバーが

From a Biological Point of View: Essays in Evolutionary Philosophy (Cambridge Studies in Philosophy and Biology)

作者: Elliott Sober
出版社/メーカー: Cambridge University Press
発売日: 1994/09/30
メディア: ペーパーバック
クリック: 17回
この商品を含むブログ (3件) を見る

で指摘している。

例えば、こうしたモデルは環境の経年的変化を考慮に入れていない。また、われわれがもつ信念の多くは、進化とは関係ない。さらにこのモデルにおける学習の概念は非常に限定的である。例えば、多くの学習では、ある行動の結果を次の行動の結果にフィードバックしていくことが考えられるわけだが、そうしたことは検討されていない。最後にこのモデルでは、それぞれの信念を別々に扱っているが、多くの場合そうではない。「トラが近くにいる」という信念と「オニユリ(tiger lilies)が近くにある」という信念は関連している（はじめの事柄を認識した人は二番目の事柄を認識する可能性が高い）。

またゴッドフリー＝スミスは、こうしたモデルは信念にかんする内的な適応度（→　ここ）を考慮していないことを認識している。

ということで、このモデルにはいろいろと限界があるが、それでもどういうときに環境の変化に応じて自分の信念を変化させること（学習）が適応度的にペイするかを示唆している。

*1:理性といってもさまざまな側面があるが、ゴッドフリー＝スミスは以下で見るように、「〈転ばぬ先の杖〉論法」に関わる文脈で理性について考察しているように見える。