日常生活を出発点に塾の教育効果を考える

あなたが受験を目前に控えているとしよう。受験前の子をもつ保護者の立場でも構わない。試験では高得点を収め、合格するのが望ましい。高い点を取るには、勉強が必要だ。しかし勉強の仕方がわからないとか、より効率的に勉強したい（させたい）とか、いろいろな思いが交錯する。周囲を見回してみると、成績の良さそうな子の多くは塾に行っているようだ。そこで、塾に行ったら点数が上がるのでは、と考える。

私たちは頭の中で、塾に行った自分と、そうでない自分を想像する。そしてそれぞれの場合について、どんな結果が待っているだろうと考えを巡らせる。塾に行けば、受験テクニックを身につけることができ、点数が飛躍的に向上するのではないかとか、塾に行くには時間や労力というコストがかかるし、塾の授業は学校の授業の焼き直しに過ぎないから、その分自力で勉強した方がマシではないか、などというように。そうして、いずれかの決断を下す。決断の結果は、いずれ明らかになる。

ただし当たり前なことなのだが、経験できるのは実際に自分の下した決断の結果のみであり、もう一方の選択肢の結果は知りようがない。決断の結果が成功すれば、それ以上深く突っ込もうとはしないだろうが、もし失敗に終われば、多くの人はあの時別の決断を下すべきだった、などと後悔するのだ。しかしその別の選択肢が本当に成功を導いたのかどうかは、結局わかりようがないのである。

人間は都合のいいもので、成功すれば過去の経験を正当化しがちであり、失敗すれば自分の経験を否定しがちになる。塾に行って受験に合格すれば塾のおかげだと思う。逆に不合格であれば塾のせいだとか、塾に意味はなかったと考えるだろう。あるいは、塾に行かなくても合格すれば、塾など意味がないと思うだろうし、不合格であればやはり塾に行っておけばよかったと考えるのかもしれない。

こういう思いに駆られることは日常生活において避けられないだろうが、これは必ずしも科学的な思索とは言えない。では、科学的で客観的な教育効果を測定するには、どうすればいいのだろうか。

疑似実験的空間を想像する

もう一度、受験を控えた立場の自分を想像してほしい。仮に自分と同じクローン人間が存在したとして、塾に行った自分と行かない自分の両方を経験させ受験する。そして結果を確かめる。ここでは、もし塾に行った場合に合格し、行かない場合に不合格であれば、塾に行った実質的な効果があったと考える。塾に行こうが行くまいが結果が同じであれば、塾の実質的な意味はなかった（行こうが行くまいが結果は同じ）、と考えることにしよう。

しかし現実にはそんなことは不可能だ。そこで次善策として、育ってきた環境とか性格とか成績が、できるだけ同じような人間を探してきて、一方に塾に行かせて、一方は塾に行かせず経過観察をする。しかし仮に塾による真の教育効果があるのならば、この通塾の有無という振り分けは、その人の将来を決定づける重大な決断になる。

たかが実験、というわけにはいかない。実験が人生を左右するという重大な倫理的な問題を孕む。何より「あなたは塾に行け」「あなたは塾に行くな」などと人為的に振り分ける命令に従わなければならないような実験に参加する人はいないだろう。これも現実味がない。

またこの思考実験は、特定の一人の個人を想定している。しかしある人物は、教師や授業の相性とか、友人関係とか、試験当日の健康状態など、多くの偶発的な要因や出来事に直面する。こうした偶発的な要因も、結果に重大な影響を及ぼす。とはいえこれらを完全に制御するのは不可能だ。

そこで科学的には、多くの個人を集めて、彼らをランダムに振り分けることを考える。ランダムに振り分けた2つの群のうち、一方のみに処置を施す。つまり一方のグループ（実験群）のみが塾に行き、もう一方のグループ（統制群）は塾に行かせない。両群はランダムに分けられているので、性質に実質的な違いはない。そして経過観察をして、試験の合格率に統計的に有意な（偶然とは言えない）差が生じるかを確かめる。

手続き的にこれを完全に再現するわけにはいかないが、既存のデータをもとに実験的環境を疑似的につくり、効果の有無を確かめようとする統計的手法がある。それが傾向スコア・マッチングとよばれる方法である。日本語での詳しい解説は星野（2009）（注1）があるが、ここではその考え方をできるだけ噛み砕いて説明したい。

（注1）星野崇宏，2009，『調査観察データの統計科学－因果推論・選択バイアス・データ融合』岩波書店。



選択バイアスと効果の混同

教育効果の議論は、選択バイアス（selection bias）の問題を抱えていることが多い。このことはアメリカの社会学者リーバーソン（Lieberson, Stanley）が、30年以上前に繰り返し警告している（注2）。

（注2）Lieberson, Stanley, 1985, Making It Count: The Improvement of Social Research and Theory, University of California Press.

教育効果を見るのであれば、実験群と統制群は基本的に同じ性質をもっていなければならない。しかし教育現場で、その前提が満たされることはあまりない。塾に行く子は（行かない子に比べて）、勉強にやる気がある、進学意欲がある、親が教育熱心など、成績を伸ばすのに有利な性質をもともともっている可能性が高い。だから塾に行っている子の進学率が高いのは、塾の教育効果というよりも、通塾群に成績を伸ばす性質を備えた子がもともと多く集まってしまったという選択バイアスが働いているためだ、ということになる。

日本には高校入試がある。その結果、偏差値によって生徒は各高校に振り分けられる現実がある。これを踏まえると、大学合格実績をもとに高校の教育力を評価するのはおかしい、ということは容易に理解できる。もちろん、高校に行って授業を受けていれば、生徒は何らかのポジティブな影響を受けるだろう。生徒の仲間同士で切磋琢磨した影響が出るかもしれない。

それでも、高校の入学偏差値と大学合格実績が比例するのは、高校そのものの教育力の差というより、偏差値の高い（試験の得意な）生徒を高校入試で予め選抜したから、大学入試でも同じような結果が現れたに過ぎない、と考えてもおかしくない。

傾向スコア・マッチングの考え方と手続き

効果の有無を確かめるには、選択バイアスを除けばよい。今回は通塾の効果を見たいが、現実に通塾の有無がランダムに振り分けられているとは考えられない。

ここで使用したのは、東京大学社会科学研究所の若年・壮年パネル調査（「働き方とライフスタイルの変化に関する全国調査」・Japanese Life Course Panel Survey）（注3）であり、対象者は1966～86年生まれの日本全国の男女である。彼らは日本全国からランダムに抽出されており、データには学歴や過去の通塾歴の情報が含まれている。

（注3）http://csrda.iss.u-tokyo.ac.jp/panel/JLPSYM/

日本では、高校の振り分けが大学進学に大きな影響を及ぼすという現実がある。そこで中学時代の通塾経験の有無が、進学率ほぼ100%の高校（進学校）への進学に正の影響を及ぼしたかどうかを検証する。

手続きは以下のようである。まず通塾の有無を推定する二項ロジスティック回帰分析を行う。従属変数は「通塾経験あり（=1）」「通塾経験なし（=0）」のダミー変数であり、出生コーホート（世代）、出身地域、社会経済的要因、家族（きょうだい）構成など、通塾の有無に関係すると思われる要因を説明変数として考慮する。この推定モデルに基づき、各サンプルについて、理論上の通塾確率が計算できる。これが傾向スコアである。

同じ傾向スコアをもつ人は、基本的に二項ロジスティック回帰分析で考慮した説明変数について同じような性質をもっていると仮定して構わないことが証明されている。そこで同程度の傾向スコアをもつ通塾経験のあるサンプルと、通塾経験のないサンプルでペアをつくる。

これは先の「疑似実験空間」をつくる作業に相当する。ペアを多く作成すると、通塾の有無以外は全く同じ性質をもつ個人で構成される通塾群と非通塾群ができるので、両群の間で実際の進学校進学率が比較できる。その結果、統計的に有意に通塾群の進学校進学率が高くなれば、通塾の教育的効果があったと考える。

なお、傾向スコアが小さいのは理論上通塾可能性が低いサンプルで、逆に傾向スコアが大きいのは通塾可能性が高いサンプルであることを意味する。傾向スコアを計算する元になった二項ロジスティック回帰分析により、通塾傾向のある人の性質はわかる。傾向スコアの大きさにより、傾向スコアの高いサンプル、低いサンプルに分け、それぞれについて進学校進学の効果の有無を検討することもできる。

塾の効果は、だれにでも一様に及ぶとは限らない。もともと通塾する傾向のある意識や環境をもつ人は、塾に行こうが行くまいが進学校に進学できた可能性が高いかもしれない（つまり目に見える効果は薄い）が、通塾する傾向のある意識や環境をもたない人は、通塾による効果が覿面に現れる、というようなこともあり得る。そうした検討も、この分析では可能になる。【次ページにつづく】