project member
機械学習のプラットフォームの中で世界最大規模で運営されているのがGoogle社による「Kaggle(カグル)」です。Kaggleが開催するコンペティションに参加するエンジニアはKaggler(カグラー)と呼ばれ、その実績に応じて上から順に「Grandmaster」「Master」「Expert」などの称号が与えられます。
DeNAは以前より、機械学習の先端事例を学び自己研鑽できる場としてKaggleを活用し、業務時間内のコンペ参加や計算資源の使用などを制度化、支援して参りました。2023年10月現在、社内にはグランドマスター4名、マスター11名、エキスパート3名のKaggleランカーが在籍。専門知識を活かして事業の課題解決にあたっております。
トップKagglerはKaggleという場をどう捉え、そこから何を得たのか。そして、働く場としてのDeNAをどう見ているのか。グランドマスターの称号を持つ藤川 和樹と大矢 隆、そしてマスターの称号を持つ新卒1年目・村上 直輝の3名に話を聞きました。
それぞれのKaggleとの出会いと現在地
左から藤川和樹、大矢隆、村上直輝
まずは自己紹介からお願いいたします。
藤川和樹(以下、藤川):
新卒でDeNAに入社して9年目になります。現在はソリューション事業本部データ統括部AI技術開発部マーケティング・コミュニティグループのグループリーダーを担当しています。業務では、企業がマーケティング目的で運営するSNSアカウントの投稿をサポートするAI開発チームのリードや、「Pococha」において、ライバー&リスナーのより良い “コミュニティ” を実現する分析プロジェクトなどに携わっています。
大矢隆(以下、大矢):
ソリューション事業本部データ統括部AI技術開発部ビジョン・スポーツグループに所属しています。現在は新卒2年目で、新感覚vtuberアプリ『IRIAM』におけるフェイストラッキング機能の開発や、横浜DeNAベイスターズにおけるデータ / AIを用いたチーム強化プロジェクトに携わっています。
村上直輝(以下、村上):
今年、DeNAに新卒入社しました。研修を経てソリューション事業本部データ統括部AI技術開発部ライブストリーミンググループに配属され、『Pococha』のリスナーとライバーをどうマッチングさせるか、というレコメンド機能の開発に携わっています。現在取り組んでいるのは、新規リスナーとライバーのマッチングに関する部分です。
では、Kaggleを始めたきっかけについて教えてください。藤川さんはDeNAへの入社後に始めたと伺っていますが……。
藤川:
僕は元々、自然言語処理が専門で、入社後もその専門性を深めたいと考えていました。そんな中で、社内でタスクやドメインを限定せずAIを活用して課題解決をするデータサイエンスのチームが立ち上がり、同時に既にKaggleで実績のあるKagglerの方々が入社されました。
最初はチームも違ったのですが、多種多様な案件で力を発揮している姿を見て、とても刺激を受けたんです。そこで、自己研鑽のためにKaggleを始めてみることにしました。
グランドマスターになるまでの期間はどれくらいかかりましたか?
藤川:
2〜3年くらいです。参加しているコンペは主に自分の専門分野である自然言語処理がまず1つ。あと入社後に製薬会社さんと共同研究をしたことがあり、化合物のデータを扱った経験から化学分野にも挑戦しています。他にも面白そうだなと思えるタスクがあった時は参加しています。
大矢さんもグランドマスターをお持ちですね。
大矢:
僕はKaggleを始めて4年くらいで獲得しました。大学の学部生の時は応用物理学を専攻していたのですが、AI技術にも興味があり、2年生の時に受託系の分析会社でアルバイトを始めたんです。そこで感じたのが、自分が取り組んでいるモデル作成や分析が客観的に見てどれくらいのレベルなのかよくわからない、ということでした。それを測るためにコンペに参加してみようと思い立ち、SIGNATEというコンペサイトに出たら優勝できたんです。ならば折角だし世界レベルの大会にも行ってみようかなと。
それがKaggleを始めるきっかけになったのですね。
大矢:
そうですね。大学3年生ぐらいから本格的にKaggleに参加し、修士2年まで活動していました。そこで金メダルをいくつか獲って、DeNAへの入社前にグランドマスターになりました。
大学院で研究していたのはオーディオビジュアルラーニングという音と画像を組み合わせたマルチモーダルな深層学習の分野でしたが、Kaggleではテーブルデータを主に扱う領域に参加していました。
村上さんはDeNAのKaggle制度が入社の決め手になったとお聞きしました。
村上:
はい。僕はプログラミングを始めたのが大学入学後で、Kaggleには学部2年生の後半から参加し始めました。当時は勉強不足のせいで全然勝てなくて、1〜2回出たあとはコンペへの参加や機械学習の勉強については何もしてなかったんです。4年生になってから再開したのですが、そこから半年ほど経った2021年の修士1年の時、鳥の鳴き声から鳥の種類を判別する、というタスクのコンペにチームで参加したら、なんと優勝しました(笑)。
ただ、そこでなんとなく満足して「Kaggleは一旦いいかな」という気持ちになってしまったんです。また、優勝したことで受託開発の仕事がいくつか舞い込み、その後は依頼も増えて規模も大きくなったことで起業し、多忙になったという事情もありました。
でも、時が経つにつれて自分のAIに関する技術レベルが頭打ちになっているのを感じ始めて、コンペに参加したりなどで自己研鑽したい気持ちが湧くようになったんです。以前からDeNAにKaggle制度があるとは知っており、事業に活かせる環境があるところにも魅力を感じて入社を決めました。今はグランドマスターの1つ手前のKaggleマスターというポジションにいます。
知識を活かし合う。業務とKaggleの両立
DeNAのKaggle制度は業務時間内でのKaggle参加を認めている点が1つの特徴です。通常業務との兼ね合いはどのようになっているのでしょうか。
村上:
自分の場合は業務時間の30%をKaggle工数として付与されています。「この時間枠はKaggleやります」といった感じで、スケジュールをブロックできるんです。実は今まさにKaggleのコンペに参加していて、業務控えめKaggle多めでやらせてもらっている最中です。メンターやグループリーダーの理解もあり、制度を活用しやすいのはとてもありがたいですね。
藤川:
データ統括部では前年度のKaggle実績に応じて、業務時間の20%〜50%までKaggle工数が与えられるんです。
50%はかなり多いですね。
藤川:
50%は獲得条件も厳しく設定されていますが、僕も含めて権利として持っているメンバーはいますし、実際に行使しているメンバーもいます。ただ僕の場合、今はマネージャーのポジションに就いているので、まとまった時間を作るのは難しいですね。始業までの間にプログラムを仕込んでランチタイムやミーティングの合間などに実験の経過を見つつ次の実験を回したり、終業後や土日に手を動かす作業をしたりしてやりくりしています。Kaggleはプログラムを実行してからしばらく待ち時間があるので、その時間を上手く業務時間に当てはめるようにしているんですよ。
データをしっかり見ることで「何かおかしい」に気づける
この制度にはエンジニアの自己研鑽の場としてKaggleへの参加を推奨する面と、事業応用への貢献という期待も込められていますが、Kaggleでの経験が実務に活きた例があれば教えてください。
藤川:
具体例というよりも習慣に近いですが、Kaggleのコンペで勝つためには提供されたデータをかなりしっかりと見ることが求められます。時にはかなり違和感のあるデータもあったりするので、「何かおかしいな」という感覚が大切だったりするんです。事業で扱うデータも、バグなどによってうまく収拾されないケースがあります。データをきちんと見て不審な点に気づくという力はKaggleによって身についた感覚はあります。
大矢:
すごくわかります。Kaggleで一番勝負を分けるのは「データがどれだけ深く見えているか」がポイントだと自分も思います。
あと僕はKaggleをやったことで、設定したタスクが現実的かどうかを見極める勘所が身につきました。現実的に可能な設定をするのって、実は結構難しいんです。「この設定だったらこれくらいの精度が出るよね」「これぐらいデータがないと苦しいよね」といった見通しを精度高く自分の中で判定できるようになったのは、Kaggleの経験がかなり効いてます。仕事への影響という意味で一番大きいのはそこですね。
逆に業務がKaggleに活きた例はありますか?
村上:
Kaggleではないのですが、少し前に atmaCupという国内のコンペに参加しました。その時のタスク内容がレコメンド、推薦系のものだったんです。ちょうど業務で『Pococha』の推薦に取り組んでいた最中で、仕事から得た知識をコンペで使ってみたら性能がアップして、優勝できました。
業務と近しい領域のコンペに出ると結構役立つというか、勝てるレベルまで行けるんだな、というのは実感しましたね。
藤川さんと村上さんは積極的にKaggleに参加されてらっしゃいますが、大矢さんは今、Kaggle活動をお休みされていると聞きました。
大矢:
ええ。学生時代は優勝したくて全力でやっていたのですが、頑張っても優勝できなくて……。グランドマスターにはなれましたが、毎回2位、みたいな(笑)。入社前にグランドマスターになって区切りもよかったのでそこは潔く負けを認めて、仕事や他の勉強に注力することにしました。大学時代はKaggleに全力投球だったので、当時手をつけられなかった部分を現在勉強中です。
Kaggle制度が設けられている環境でグランドマスターがKaggleに参加しない、というのは特に問題はないんですか?
大矢:
基本的には自由意志でやるものなので、特に全く問題はありません(笑)。組織が柔軟なので、何かをやることについて強制されることは一切ないですね。
藤川さんは入社後にKaggleを始めたとのことですが、初年度は制度が適用されない中、業務時間とKaggleの時間の両立はどのようにされていたのでしょうか。会社から何かしらのヘルプやサポートはありましたか?
藤川:
最初にお話しした製薬会社さんとの共同プロジェクトが落ち着き始めた時期だったので、タイミング良く取り組むことができました。プロジェクト側からも「化合物データで1つで実績作るのもいいね」というお話もあって、事業の一環としてプロジェクトの時間も使いながらKaggleに参加する形でした。これはかなりタイミング良く担当事業とKaggleが重なった数少ない事例だと思います。
Kaggle制度以外で、エンジニアの技術研鑽に対して会社がサポートしていることはありますか?
大矢:
GCPやAWSなどの計算資源を一定額まで自由に利用できる環境が用意されています。Kaggleに限らず、例えばAtCoderヒューリスティックコンテストなどをやっている方やLLMや画像生成モデルについて技術を深めているAIエンジニアの方もいます。技術研鑽に関しては、AIに限らずクラウド技術の学習等も含めてかなり手厚いサポート体制が敷かれていて、本当にありがたいです。
Kagglerに限らず、エンジニアが働く環境としてはいかがですか?
村上:
入社1年目ですが本当に整備されていると感じています。
自分としてはKaggle制度が入社にあたって1番の決め手ではありましたが、そこから得た知識や経験を事業へ応用することにも興味を持っていて、事実、今そういった取り組みができています。AIを多様な事業に活かそうという気概のある人にとっては最適な環境だと思いますね。社内に優秀なエンジニアがたくさんいることにも刺激を受けています。
大矢:
DeNAは事業会社なので、事業に深くコミットできる人じゃないと、と思います。研究だけしていたい、事業にはあまり興味がない、というタイプの人にはマッチしないんじゃないかな。エンジニアとしてAIを含めた技術力を高め、それをコアに事業に活かしていきたい、という強い意志が要求される環境ではありますね。
藤川:
2人の話に付け加えると、AI技術はデータとセットで初めて価値を発揮できるわけですが、その環境を持ち合わせているのがDeNAという会社だと思っています。社会課題からエンタメ、スポーツまで多種多様なデータがある状況には可能性の広がりを感じます。
例えばゲーム事業部で従事した後でスポーツドメインに異動するケースもあり、同じ社内であっても違う業界に転職したような経験ができるんです。それがDeNAの唯一無二なところかなと思います。そんな多種多様な課題に対してAI技術で課題解決をしたいと考えている方はぜひDeNAの門を叩いて欲しいですね。
other stories
アセット活用を支えるAI技術。『逆転オセロニア』画像生成PJを支えたチームづくり
- #画像生成
- #音声合成
- #深層学習
対戦AIの性能UPでゲームをよりおもしろく。HandyRLが秘める可能性
- #強化学習
- #HandyRL
- #ゲームAI
技術のアウトプット 現場と一緒に、 球団の未来を描いていく
- #コンピュータービジョン
- #データサイエンス