勤労統計問題の原因は「COBOLプログラムのバグ」

厚生労働省の毎月勤労統計調査についての特別監察委員会の報告書が出され、樋口委員長の記者会見が行われた。疑問も残るが、おおむね事実関係は明らかになった。焦点になっている東京都の大企業の抽出調査については次の通り：

2003年5月22日付の事務連絡に「事業所規模５００人以上の抽出単位においては、今回から全国調査でなく、 東京都の一部の産業で抽出調査 を行うため注意すること」と書かれている。この事務連絡は雇用統計課長の決裁をへて他部局にも公式に伝達されており、隠蔽の事実はない。

を行うため注意すること」と書かれている。この事務連絡は雇用統計課長の決裁をへて他部局にも公式に伝達されており、隠蔽の事実はない。 当時の担当課長は「抽出調査としたことについて、覚えていないが当時自分が決裁したと思われる決裁文書を見たらそのように残っていたのでそうなのだと思う。ただ、抽出していたとしても労働者数に戻す復元を行っていれば問題ない」と供述しているが、この復元が行われた形跡がない。

システム改修を行った担当係によると「外部業者等に委託することなく自前でシステム改修を行うが、毎月勤労統計調査に係るシステムの プログラム言語はCOBOL であり、一般的にシステム担当係で COBOL を扱える者は１人又は２人に過ぎなかった」。このため、ダブルチェックができなかった。

であり、一般的にシステム担当係で COBOL を扱える者は１人又は２人に過ぎなかった」。このため、ダブルチェックができなかった。 職員のヒアリングの中でも「単純なプログラムミスだと思う」、「システム更改のタイミングでオペレーションが漏れたのではないかと思う」といった供述が出ている。事務処理の誤りを生じやすく、そのチェックが適正に行われにくい体制上の問題点は職員の間でも認識されていた。

2004年からのシステム変更については、雇用統計課長から関係部署への連絡が行われたが、そのとき抽出したサンプル数に抽出率逆数をかけるシステム改修を行わなかった。これは東京都の大企業だけの例外処理なので統計の処理プログラムを修正しなければならないが、それを行ったという証言がないので、単に担当者が忘れたのだろう。

毎月すべての企業の賃金を調べる勤労統計は企業や自治体の事務負担が大きく、苦情が出ていた。調査計画を変更しないで担当者の判断で東京都だけ抽出調査にしたことは統計法違反の疑いがあるが、それ自体は大した問題ではない。2004年のシステム変更は、中小企業の抽出率を上げる(*)のと同時に行われたもので、「それだけだと都道府県の負担が増えてしまうので、東京都の大企業を抽出調査とした」という。

毎月勤労統計の調査対象は全国420万社。そのうち東京都の従業員500人以上の企業は1400社で、0.3％にすぎない。圧倒的多数の中小企業の抽出精度を上げる代わりに東京都を抽出調査に変更することは、統計的安定性を改善するはずだったと監察委員会も認めている。正式に総務省に連絡しても承認されただろう。

要するに問題は私が推測したように、2004年に東京都を抽出調査に変えたとき、データに抽出率逆数をかける復元をシステム担当者が忘れたバグに尽きるのだ。これはCOBOLで書かれた特殊なプログラムなので高齢者しか読めず、そのミスがチェックできないので、去年まで誰もが「逆数をかけているもの」と考えて処理していた。

本質的な問題は、こんな些細なミスが14年間も放置されて統計に大きな影響を与え、失業保険などの給付に800億円も誤差が出て、それを修正するには一般会計予算を修正する閣議決定が必要になるという霞ヶ関の事務処理システムの脆弱性である。

情報システムを役所の技官が、COBOLのレガシーシステムで構築するのも間違いのもとだ。歴代の厚労相を国会に証人喚問するなどというスタンドプレーより、まず厚労省のコンピュータをオープンシステムに更新し、事務処理を透明化して、第三者がチェックしやすい体制にすべきだ。

(*)追記：2003年まで中小企業の抽出調査は本来の半分のサンプルで行われていたが、これを2004年から本来の抽出率に戻す修正が行われた。これによって自治体の負担が増えるため東京都を抽出調査に変えたが、全体としての統計的安定性は改善されたという。