【サマーインターン体験記】機械学習エンジニア@構造化データ処理
ENGINEER SUMMER 2021 INTERNSHIPの参加者、
市川さんがインターン体験記を書いてくださいました!
***
◆自己紹介
千葉工業大学 情報科学部情報工学科 学士3年の市川 大樹です。
◆インターンに参加しようと思ったきっかけ・決め手
高校3年生頃に機械学習・深層学習に興味を持ち、Pythonを用いて勉強を始めました。基本的に参考書、大学に入ってからは他大学の無料講義などを通じて勉強を進めていました。しかし、それだけではなく実際に業務経験を得ることが重要だと考えていたところでエクサウィザーズのインターンシップを発見。概要を確認したところ、今回参加させていただいた構造化データだけでなく画像処理や自然言語処理、最適化といった様々な分野があり、インターンシップを通じて多分野でも様々なことを知ることができるのではないかと考え、応募させていただきました。またコロナの状況も鑑みて、リモートワークという点も決め手の一つになりました。
◆5週間で取り組んだこと
私は構造化データを扱うチームに配属されました。現在ある複数のテーマの中から自分が興味のある「データの比較」「データから目的変数を予測する」という2つのテーマを担当させていただきました。
5週間の前半ではデータを知るためのEDAと、1つ目のテーマであるデータの比較を中心に進めていました。私はEDAからデータの特徴を見極めることで有効な前処理、モデリングをできるようになるという目標があったため、勤務開始してからはEDAに力を入れていました。その結果、重要なものとしてスパース性が高いデータであることや、データ数に対して特徴量の数が多いこと、その他分布の偏りがあるかどうかなどを見つけ、2つ目のテーマを進めるのに役立ちました。その後にデータの比較を行いました。データの比較ではこれまで深く学んでいなかった検定の知識を必要としたので、自分で調べたり、メンターの井上さんに相談しながら進めていきました。自分ですでに持っている知識で進められるわけではないので、苦労もありましたが、業務に携わりながら新しい知識を得ることもできて非常に楽しい時間でした。
井上さんと話し合いながら、上記の作業にあらかた見切りをつけた後に2つ目のテーマである目的変数の予測を進めていきました。こちらでは予測精度を上げることを目的として、最初のEDAからわかったデータの特徴から有効そうなモデルを用いつつ、自分のやってみたい手法を試してみたりと、かなり自由に進めさせていただきました。結果として初めに作成したベースラインモデルより精度も上がり、このような経験ができたことは井上さんあってのことなので非常に感謝しております。
◆印象に残っていること
井上さんとは朝に何をするのか、夕方に何をしたのかを報告するというように1日に2回会話をする機会を設けていただきました。そこで何か困っていることはないか、今後どのようにプロジェクトを進めていきたいかなど丁寧に対応いただきました。また業務に関することだけでなく雑談もあったり、直近の学会発表について教えていただいたりと業務以外のところでも非常にお世話になりました。
今回のインターンシップでは、メンター以外にも様々な方とお話する機会を設けていただきました。週末に1週間の振り返りをする際に、どのような分野に興味があるのか、知識のある社員の方に聞きたいことがないか聞かれる機会があり、そこで答えた内容によって様々な社員の方々とお話させていただく機会をいただけるといったものがありました。私の場合は研究職や機械学習のコンペティションに興味があるので、社員の方の中でコンペティションに参加している方や、過去にR&Dを経験したことのある社員の方にお時間を作っていただくことができました。このように業務だけでなく、他に自分の興味があることについて様々な方とお話できるというのは、エクサウィザーズのインターンシップ特有のものであり、大きな魅力なのではないかと思います。
◆気づき・学び
これまでずっと独学で学習を進めており、周囲に話が出来る人などもいなかったので、同じ分野に興味がある人と話をすることもできる良い機会でした。また今の自分の実力がどの程度なのかも知ることができ、今後さらに技術・知識をつけていきたいと思えるような影響も受け、今後のモチベーションにつながりました。それと同時に、自分が今までやってきたことが力になっていると実感することもでき、今までよりも自信がつきました。本インターンシップでの体験をもとに今の自分に何が足りないのかを見つめ直し、さらに精進していきたいと考えています。
***
「AI×社会課題」に挑む仲間として加わってくださる方を募集しています!
詳細はこちらから