無料ブログはココログ

最近読んだ本

« 一ノ瀬正樹「確率と曖昧性の哲学」(5) | トップページ | ジャクソン・ポロック展(1) »

2012年3月29日 (木)

一ノ瀬正樹「確率と曖昧性の哲学」(6)

5.ベイジアン・ネットによる因果推論の表示

「ベイズ的確証理論」と「確率的因果」の融合は、「因果的モデル化」という形で、統計学、人工知能論、コンピュータ科学などとの連携のもとで進展を遂げている。なかでも、ジュディア・パールが提示したモデルは「ベイジアン・ネットワーク」と呼ばれている。それは「有向巡回グラフ」と「確率分布」を決定する「確率特定化」との、二つの要素によって成立すると規定される。

このベイジアン・ネットの考え方それ自体は、「ベイズ的条件付け」と「確率的因果」との融合を上手に表現し得る道具として、つまり構造の明確化を目的として、提起されたもので、それによって問題の見通しがクリアにできるようになったことは間違いない。その顕著な現われは、「にせの原因」を除く「ろ過」の働きが、ベイジアン・ネットの構築の最初から条件として組み込まれ、それを矢印の存否によって明瞭にした点が指摘できる。

6.シンプソンのパラドックスの衝撃

こうしたベイジアン・ネットの考え方は、いくら洗練化を施しているとしても、原因は結果の生起する確率を高める、という確率的因果の基本的着想を根底において引き継いでいる。それゆえ、もしこの基本的着想に対する疑念が提起されるのだとしたら、ベイジアン・ネットひいてはベイズ的確証理論そのものが大きな打撃を被ることになるだろう。

そして実際、原因とは結果の生起確率を高めるものだという確率的因果の基本的着想に対しては根本的な疑念がいくつか提出されている。そのうち、根源的でかつ深刻な疑問を投げかけているのが「シンプソンのパラドックス」と呼ばれるパズルである。これはニューヨークとリッチモンドで結核による死亡率の比較に関してのものから始まった。両都市のアフリカ系住民の結核による死亡率を比較すると、ニューヨークの方が高かった。また、白色人種住民の結核による死亡率もニューヨークの方が高かった。すると当然、両都市のアフリカ系住民と白色人種住民の総計における結核による死亡率を比較した時、ニューヨークの方が高いことが予想されるが、実際にはリッチモンドの方が高かった。もう少し分りやすい例で言うと、次のような(1)と(2)という前提から(3)を導く、一見妥当だと思われる推論が妥当でないケースがある。

(1)ある治療を受けて回復する男性患者の確率は、その治療を受けない男性患者が回復する確率よりも大きい。

(2)ある治療を受けて回復する女性患者の確率は、その治療を受けない女性患者が回復する確率よりも大きい。

(3)それゆえ、その治療を受けて回復する(男性及び女性)患者の確率は、その治療を、その治療を受けない(男性及び女性)患者の回復する確率よりも大きい。

直感的に考えると、(1)と(2)が成り立っているとするなら、(3)が成り立つと思われてしまう。しかし、こうした推論が妥当ではなく、男女それぞれではその治療回復が認められるのに、全体では認められないことがあり得るというのである。これはいかにも奇妙な事態である。pを「男性患者がその治療を受ける」、qを「女性患者がその治療を受ける」、rを「その治療を受けることは、その治療を受けないことよりも回復にとって好ましい」とおくと、上記の(1)から(3)までの推論は次のように表わせる。

(1)p⊃r

(2)q⊃r

(3)(p∨q)p⊃r

これは明らかに古典論理的に妥当な推論である。にもかかわらず、実際には成立しないのである。こんなことがありうるならば、この治療と回復との因果関係をどのように推定したらよいのだろうか。ある出来事の確率を高めるならばその出来事の原因となり得る、という確率的因果の原着想は、このシンプソンのパラドックスを前にしたとき、根底から覆されてしまうのではなかろうか。そして、ベイジアン・ネットによる因果推定も絵に描いた餅になってしまうのではなかろうか。

7.母集団に対する相対性

「シンプソンのパラドックス」に対して、最初に生ずるだろう素朴な問題点として、ここで確率といわれているのは単に統計データに過ぎないのであって、ベイジアン・ネットの基礎になると一般に考えられているはずの「信念の度合い」とは異なるのではないかという問題点である。これに対しては、「信念の度合い」を我々は突然に持つに至るのではなく、客観的なデータや専門家の見解などを聞きながら、それを踏まえて、あるいはそれに対する、「信念の度合い」を形成していくのだと。つまり、主観的確率と客観的確率などとしばしば峻別されるが、実は実践的にはそこに明確な差異はなく、むしろ混合しているのである。

一方「シンプソンのパラドックス」には演繹論理に対する疑念さえもが混じり込んでいる。マリナスの指摘によれば、r「その治療を受けることは、その治療を受けないことよりも回復にとって好ましい」という文は、「好ましい」ということに対して数量的に多様な意味を与えることができるので、「一義的解釈を許さない…よって、こうした非形式的な論証の定式化は妥当な論証形式一例にはならない」と診断する。換言するならば、p、q、rを用いて定式化した先の推論形式は、実は「シンプソンのパラドックス」の推論形式なにはなっていないということである。

では「シンプソンのパラドックス」の形式を真に明らかにするには、「数量的に多様な意味」をきちんと識別する手立てを講じることが必要だ。すなわち、確率を算定する時の「母集団」あるいは「参照クラス」が何であるかということを、しっかり考慮に組み入れなければならない。そのことを常に念頭に置きながら、確率の算定、そしてそれに基づく推論を遂行すべきなのである。逆に言えば、「母集団」や「参照クラス」が何であるかを確率の比較をするときに考慮しているならば、実は「シンプソンのパラドックス」はパラドックスでも何でもない。

« 一ノ瀬正樹「確率と曖昧性の哲学」(5) | トップページ | ジャクソン・ポロック展(1) »

書籍・雑誌」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

トラックバック


この記事へのトラックバック一覧です: 一ノ瀬正樹「確率と曖昧性の哲学」(6):

« 一ノ瀬正樹「確率と曖昧性の哲学」(5) | トップページ | ジャクソン・ポロック展(1) »