誰も不幸にしない学習モデルを目指す。数学・統計学で社会課題の解決を目指すMLエンジニアの哲学
「どうやって取得したデータなのか、与えられたデータは本当に正しいのかなど、データを鵜呑みにしない姿勢も大切だと思います。大学時代の先生から『データからわかることは少ない』という主旨の言葉をいただいたことがあり、それを今でも意識しています」
エクサウィザーズで活躍する”ウィザーズたち”を紹介するストーリー。
高校時代には数学に惹かれ、大学・大学院では統計学を専攻。現在はその知見を社会実装へと応用している機械学習エンジニアの小林さんです。「ビジネスとしての努力」と「科学的な妥当性の追求」の両立を目指す小林さんが機械学習エンジニアとして大切にしていることや、技術を生かして今後何を成し遂げたいと思っているかを伺いました。
数学の巨大さと統計学の奥深さを垣間見た学生時代
——小林さんは、大学では数学を専攻していたそうですね。学生時代の数学の素養が機械学習エンジニアの仕事にも生きていると思います。小林さんが数学にハマったきっかけはなんだったのでしょうか。
明確なきっかけがあったわけではないですが、高校の時に読んでいた本の影響は大きいと思います。「フェルマーの最終定理」や「無限論の教室」などに書かれているエピソードが面白いなと。
私は、数学って人類が作り出したものでトップクラスに巨大だと思うんです。それは数学の性質に起因していて、科学の世界ではこれまでの定説が覆されることがありますが、数学はずっと昔に作られた公式が今でも使われていることがあります。
数学は「発見」か「発明」かという議論がなされるのですが、どちらかといえば私は数学は「発明」だと思っています。人が発明したものが何百年も存在する。何人もの人が関わって生み出された結果が、時間のふるいにかかってなお膨大に残っている。そして現在も発展している。その人工的な巨大さが凄まじく感じたんです。
——確かに、普段当たり前に使っている公式が世紀をまたいで使われているというのは面白いですね。大学や大学院では数学の分野でも何を専攻されていたんですか?
学部では数理統計学の研究室に入って、大学院でも統計学を学びました。数学は現実とはある意味で独立した分野ですが、統計学はデータという現実の多様さに対応するために広大な分野になっています。その中でも最尤推定(さいゆうすいてい)やベイズ推定など普遍的な考え方があって、数学とは違った意味での奥深さを感じました。いくつか目移りはしたんですが、修論では「相関」の一般化に関する研究をしていました。相関関係という言葉で使う「相関」ですね。
——相関を研究しようと思ったのは、どんな理由からなのでしょうか。
元々、因果推論の分野に興味があったんです。「因果」って一般的に使われている言葉ですし、その意味も何となくわかっていますが、原因と結果の関係を定式化できることに衝撃を受けました。相関は因果とは別概念ですが、相関係数を拡張した指標がいくつか提案されていて、それらを研究テーマに選びました。最近はレコメンド領域の普及等に伴い、因果推論もホットなトピックにもなっているので、当時勉強していて良かったなと思ってます。
——大学院を出てからは、一社経てエクサウィザーズに入社されていますよね。なぜ入社されたのでしょうか。
転職先は関西で探していたのですが、転職活動をしていた3年半以上前は関西にAIを主軸とした会社がほとんどなく、自然と選択肢はエクサウィザーズになりました。
もちろん、それだけで決めたのではなく、面接をしてくださったエンジニアの方々や社長の石山さんたちと一緒に働けたら楽しそうだ、と思ったのも理由の一つです。
エクサウィザーズで求められる、誰も不幸にしない視点
——エクサウィザーズに入社されてからは、どんな仕事に携わっているのか教えてください。
私の肩書きは機械学習エンジニアですが、データを分析してビジネスの判断につながるレポートなどを提示するデータサイエンティストの役割と、システム内における機械学習部分を構築する機械学習エンジニアの役割、両方を担っています。
エクサウィザーズでは、クライアントの課題解決を起点に新しいサービスの種を見つけるプロジェクトベースの仕事と、その種を実際にサービス化・グロースさせていく仕事の大きく二つに分かれていて、私は主に前者に関わっています。ただ、サービス開発に携わることもあります。
プロジェクトベースの仕事では、クライアントの課題を特定するBizDevメンバーとタッグで取り組んでおり、大企業との案件も多いです。また、プロジェクトによっては長期にわたって関わることもあり、クライアントの課題が次第に明確になっていくところなどは面白く感じます。
——働いていて「エクサウィザーズらしい」と思うのはどんなところですか?
事業も人も多様なところでしょうか。250名規模の会社とは思えないほど複数のプロジェクトが同時並行で動いています。様々な領域の課題解決に取り組むのはいろんな意味でチャレンジングですよね。人の側面だと、例えば京都にいるエンジニアたちはみなさん専門領域が異なります。以前インタビューにも出ていた今中さんの専門領域は数理最適化、アブドゥルさんは画像処理ですが、自分の専門分野以外の人が多いのは刺激になっています。
——エクサウィザーズで働いていて、機械学習エンジニアとしてどんな成長がありましたか?
課題解決力は鍛えられたでしょうか。エクサウィザーズでは、技術ドリブンより課題ドリブンで仕事を進めます。そのためには多種多様な手法を知っておく必要があります。
——それでは、エクサウィザーズの機械学習エンジニアに求められるものはなんでしょうか?
サービスに関わる可能性のある様々な人の立場を考えることです。プロジェクトの始まりは個社ベースの課題を解くところからスタートするので、目の前のクライアントに適したモデル・手法を採用します。ただ、そのモデルを応用して他社にサービス展開する時に、効果が出るクライアントと出ないクライアントがいると思っていて、それをちゃんと認識するのが大事だと思います。なぜならそのサービスの始まりは個社に特化したものだから。
使う人を誰も不幸にしないよう、学習したモデルをいろんな立場で評価する意識が社会普及の観点でも大事だと思います。
大切なのは、データの真偽を問う姿勢
——これまでのご経験を振り返って、機械学習エンジニアとして何を大切にしてきたかを教えてください。
現実をちゃんと見る、ということではないでしょうか。ここでいう現実はデータそのものだけではありません。どうやって取得したデータなのか、与えられたデータは本当に正しいのかなど、鵜呑みにしない姿勢も大切だと思います。大学時代の先生から「データからわかることは少ない」という主旨の言葉をいただいたことがあり、それは今でも思い出します。
——データの真偽を問うために、小林さんが意識されてきたことはありますか?
すごく当たり前のことですけど、勉強と実践の繰り返しです。特に勉強が大切だと個人的に思っています。「何よりも実践が大事だ」と言われる機会が多いですが、機械学習や統計学が対象とするデータ処理などに関していえば、現在までに積み重ねられた議論や手法を無視したアウトプットはあまり意味がないと思っています。知識が足りない状態でアウトプットすると場当たり的になってしまいます。
データの真偽についても、いろいろな事例を知っていると勘所が養われると感じます。自分で経験することも大事ですが、経験できる量はたかが知れているので、人の話を聞いたり、本を読んだりを地道に続けることが大切だと思います。
——インプットしようと思えば情報はいくらでもあると思いますが、インプットの質を高めるために工夫されていることはありますか?
専門家の話を聞きにいくことです。というのも、情報の密度の観点でも聞く価値はありますが、話を聞きにいくと質問できますよね。質問に対して、専門家の解答を知っていたら、自分はその質問に対しては専門家になれるわけです。もちろん咀嚼して理解すること前提ですが。こうしたことを何度も繰り返していくことで、インプットの質が高まっていくのではないでしょうか。
エクサウィザーズでは顧問の先生方が大勢いらっしゃいますが、私はほぼ毎月京都大学の鹿島先生と相談会を社内向けに開いています。実案件について相談することもありますし、機械学習の動向などについてざっくばらんな話をすることもあります。また大阪大学の梅谷先生には昨年の夏から今年の春まで毎月社内向けに数理最適化の講義をお願いしています。
ビジネスが解決の一助になる社会課題に挑戦したい
——今後、小林さんがエクサウィザーズでチャレンジしたいと思っていることについて教えてください。
いろいろありますが、一つ挙げると介護領域です。要支援・要介護となる人が増える一方、それを支える人口が減っている中、現行の制度だけでは補えない部分をビジネスの力で支援できたらと思っています。持続的に介護領域の課題を解決し続けるビジネスモデルは難易度が高いですが、エクサウィザーズでも実際に取り組んでいる領域でもあります。
また、技術面でいうと、基本的に私はテーブルデータをメインに扱っていたので、画像や音声、テキストを扱ったりしたいと思っています。
一つの会社にいながら、こういった多様な業界、データに扱えるのもエクサウィザーズの魅力の一つかもしれません。
——ちなみに、個人として興味のある領域はありますか?
ピーステックと呼ばれている領域をご存知でしょうか。テクノロジーを平和のために使っていく動きのことです。ここ数年、紛争や貧困が起きている地域にもスマートフォンやネットインフラが普及されはじめているので、ソフトウェアの活用機会が増えています。国内だと、児童相談所の職員に対する支援に機械学習を用いる取り組みも生まれています。
大勢の人にリーチできると、そこに市場が生まれビジネスの力で課題解決ができる可能性が生まれきます。戦争や貧困、あるいは児童虐待などの社会課題に対しても機械学習が貢献できる余地が出ていることには注目しています。
介護もピーステックも、これまで持続可能かつ関わる人全員が幸せになるビジネスを成り立たせにくい領域でした。一挙に解決するのは現実的ではないですが、関わる機会を得られれば、少しずつでも前進する一助になれたらなと思います。
文/写真:稲生 雅裕