trombik さんの日記から、インフラエンジニア討論会に行ってきたけど。

自然言語処理が使える分野でも、企業では手作業で仕事をしたりすることがまだまだ多い(常に機械化したほうがいいわけではないが、ほとんどの場合、全行程を機械化しないまでも、機械的な処理を補助的に使った方が圧倒的に効率がよい)のだが、なかなか「人手神話」を崩すのは難しい。

つい先日計量国語学を研究している人から聞いたのだが、彼女が ChaSen で形態素解析して言語教育系の研究会で報告したところ、「形態素解析の精度はいくらだ」と言われ、次は言われたとおりに精度を書いたのに「そんな研究はうちでは評価できないから、違う分野で発表してほしい」と言われたそうだ。文系の人の気持ちとしては、人手でやったら精度は100%だから、機械で処理して精度が95%でもそんなものは信用できない、というココロなのだろう。

自然言語処理の門を叩いて4年目になる自分としては、そもそも何人かの人手でやっても精度は100%にならないし、ものによっては精度が70%程度にしかならなかったりする(問題自身が難しいこともあるし、不良設定問題で仕様がまともでないから人間でもつけられないこともある)ので、機械処理が100%でないからダメなどというのはおかしいよ、ということは分かるのだが……

とはいえ、自分も日本語話し言葉コーパスのアルバイトをしていたとき、全体の一部(具体的な割合は忘れたが、たとえば10%としよう)だけ人手で形態素解析のタグをつけて、機械学習で人手の形態素解析結果から自動解析器を学習して残りの90%にタグを付与して公開する、という話を聞いてまず思ったのは「なんで全部人手でつけないんだろうか」というものであり、次に思ったのは「人手以外は間違っているかもしれないんだから、公開するのは人手でつけた正解のところだけでいいのでは」ということだったので、人手でつけた結果しか信用しない人の気持ちも分かり、機械的な処理も有用であると言う人の気持ちも分かり、という感じ。

上記 trombik さんのブログからの引用

自分の疑問は「効率化を進めたら、そのぶん人を切るだけなんじゃねーの?」というもの。「今まで5人でしていた仕事を1人でできるようになりました」「そうか、じゃ残りの4人の首を切ろう」とかね。だったら非効率的なやり方を続けた方がましで、効率化するモチベーションなんて上がるはずがない。もしくは効率化した分だけ別の仕事が増えて、効率化したら労働強化につながっただけとか。効率化を進めて人件費を削減しましたとか、効率化を進めて人件費は変わらずに処理できる仕事は増えましたとか、短期的には正しいのかもしれないけど、これじゃシステム管理しようとするひとがいなくなるのも当然で。

自然言語処理のような裏方技術も似たような状況で、「ここに自然言語処理のこの技術を使ったら業務にかかる時間が以前の50%になりました！」とか言っても、営業が「3000万円の案件取ってきました！」と言うのと比べると「フーン」という感じだろうし、あまりに「効率化」してしまうと首を切ろうという話になってしまったりするわけで……。(実際は人を遊ばせておくほどコスト意識が低いところはないだろうから、別の仕事を割り当てるのだろうが)

「楽天はあの規模なのに手作業を続けている」の「楽天」のところに他の大企業名を入れても成り立つ話だと思うが、自然言語処理で効率化という筋で全部バラ色と思うのは小学生まで、ということかなー。

(追記) 楽天で思い出したが楽天も情報爆発していますのコメント、しましまさんが長大な文章を書いてくださって、自分のささやかな文章よりはるかにためになるので、この分野に興味ある人はぜひ目を通してもらいたい。