project member
国立大学法人電気通信大学はAIやビッグデータなどを高度に駆使する人材の育成を目的とした「データアントレプレナーフェロープログラム」を毎年開講しています。1年にわたるカリキュラムの総仕上げとなる「データサイエンティスト特論」では産学連携の取り組みを毎年行っており、2023年度はDeNAが育成の一端に力を添えることとなりました。
その連携のきっかけとなったのが、電気通信大学大学院情報理工学研究科の原田慧教授(以下、原田氏)です。原田氏は2023年3月までデータサイエンティストとしてDeNAに在籍しており、4月より活躍の場をアカデミックへと移しました。
高い専門性を持った人材の不足が叫ばれる中、大学でデータサイエンティストの育成に携わることとなった原田氏。そして要請を受けて講師として参加したDeNAアナリティクス部のグループマネージャーで『逆転オセロニア(※1)』などの分析を担当しているデータアナリストの佐藤直貴(以下、佐藤)に、今回の講義の内容や取り組みの意義、人材育成の重要性などについて話を聞きました。
※1:オセロ・Othelloは登録商標です。TM&© Othello,Co. and MegaHouse© 2016 DeNA Co.,Ltd.
産学連携で「実データ」を扱い実践を学ぶ
左から、DeNA 佐藤直貴、電気通信大学大学院情報理工学研究科 原田慧教授
まず今回の取り組みの概要についてお聞かせください。
原田氏:
そもそもの枠組みからお話すると、文部科学省の科学技術人材の育成を推進するための補助事業(データ関連人材育成プログラム)があり、それを受けて電気通信大学が開講したのが「データアントレプレナーフェロープログラム(以下DEFP)」という1年を通じて行われる講座です。
本学では大学院生と社会人が主な対象で、次世代のデータサイエンティストの育成を目的としています。その講座の総仕上げともいうべき演習カリキュラムが「データサイエンティスト特論」で、企業から実データをご提供いただき、それに対して自由に課題テーマを設定して解決に取り組む、といった内容です。今回は、DeNAに快諾いただき、データのご提供と講師を担っていただきました。
佐藤:
実はDeNAがこの講義に協力するのは2度目なんですよね。前回は2019年で、DeNA在籍中の原田さんが講師で参加したとか。
原田氏:
そうですね。私が前職のDeNAの時にこの講義の講師としてお手伝いに行ったのが前回。その時に使用したのが、オセロニアのデータでした。今回については元々ご担当の先生が体調を崩され、急遽私が引き継ぐことになったという経緯があり、着任1回目の今回、まず念頭にあったのはオセロニアのデータをご提供いただけないか……ということでした。
なぜゲームデータが最高の教材なのか
DeNAではどのようなデータを提供をしたのでしょうか。
佐藤:
個人情報はもちろん、ゲームの規模感(売上、ユーザー数)がわかってしまうような部分をマスキングするなどレギュレーションを守りながらも、できる限り「生データ」に近い状態で抽出したオセロニアのデータを提供いたしました。また、受講生のサポートやデータについての質問などを受けるため、私ともう1人のDeNAのスタッフのどちらかが、講師として毎回講義に参加しました。
他にもいろいろなデータがある中で、なぜオセロニアだったのですか?
原田氏:
まずは無料ゲームであること。実際に受講生も遊ぶことができますし、遊ぶことで自分の取った行動がどんなデータになるのか、イメージがしやすいんです。さらに、この場面でここをクリックした、このアイテムを使用した、バトルして勝った負けた、というような具体的な動きが見えますし、データが単なる数字ではなく、ゲームの中でどういう意味があるのかの解釈もしやすいんです。
佐藤:
データサイエンスの授業では不動産価格の予測データやローンの審査などが典型的な課題としてよく挙げられますが、受講生にとっては全然身近ではないですよね。試しに不動産を買ってみましょう、なんてできませんから(笑)。
それに比べ、ゲームはユーザーの行動がデータになるまでの時間が短いんです。ユーザーが動くたびにデータが生成されるので、分析する側から見るとすごく価値を感じるし、扱いやすくもあります。
DeNAがこのカリキュラムに協力した意図をお聞かせください。
佐藤:
次世代のデータサイエンティストを育成するための材料を提供できる企業は限られていると思うんです。私たちはそれが可能なので積極的にお引き受けするべきかな、という社会的意義が最初にあります。
実は、DeNAとしてもメリットがあるんですよ(笑)。一つのゲームで同じような分析を続けていると、どうしても視点が凝り固まってしまう傾向があるんです。なので、新しく入ってきた人に分析をお任せすることがあるんです。それと同様に、受講生から違うデータ示唆が得られるのではないか、という期待を持っていたというのもありますね。さらに、私たちが考えてることと初めてゲームを体感して分析する人とで目線が合ってるかどうか、何かしら気づきを得られるのではないか、という思惑もありました。
分析から課題抽出、解決への道すじを自分たちでみつける
では、講義の内容を少し具体的に教えてください。授業数は週1で全6回と伺っています。
原田氏:
まずはDeNAから提供されたデータの概要を説明しつつ、例えば集計する際にはPythonでこういうコードを書くといい、といったようなことを簡単に解説しました。その後、受講生をランダムに分け、検証したい課題についてブレストしてもらい、出てきたアイデアを私が整理しました。それらを元に受講生の希望を聞き、各々が希望する課題を基準に、30数人を1グループ5名のグループ分けしました。ここまでが初回。
その先はひたすらグループワークです。前半は課題に対するテーマ設定と仮説を立て中間発表、後半はデータを抽出して仮説の検証や分析をし、最後は分析結果をプレゼン、という流れです。すべての講義はオンラインで行ったので、DeNAのお2人には各グループのオンラインミーティングに入り、サポートしていただきました。
実践が中心なのですね。
原田氏:
そうですね。もちろん、理論や仕組みを理解するための座学も重要なのですが、データサイエンスは実学なので“使ってなんぼ”なところもあるんです。実データを触ってみて初めて理解できることがたくさんある。
ただ、実データがあるだけでもダメです。例えば分析課題の設定段階で受講生からたくさん出てくるアイデアのほとんどが「自分がやりたいこと」になってしまいがちなんです。
なので、実際に現場にいる方に受講生から出てきたアイデアをバシバシ斬っていただく(笑)。実務の課題と結びつかないのでは意味がありませんから、本物のデータと、そこにある課題を理解している人からの視点を理解し、うまく技術と結びつけることがとても重要なんです。
佐藤さんは設定されたテーマの中で印象に残ったものはありますか?
佐藤:
「ヘビーユーザーの離脱を防ぐための方法」を掲げたチームがあったことは興味深かったですね。私たちはこれまで、離脱してしまう人、つまり初日はプレイしたけど次の日はプレイしないユーザーを分析する場合、当日の対戦回数やプレイ時間などの最終的な状態で見ていました。でも今回、勝敗のパターンを基軸に時系列的な視点で分析する受講生がいたんです。
他にも、「勝敗パターンを基軸にした分析」は、長年オセロニアの分析をやってきた私たちが、今まさに取り組もうとしている視点と受講生の目線が同じだった、というのは驚きでした。
また、今回ご提供したのは課金部分をマスキングしたデータだったにもかかわらず、さまざまなデータから課金の有無を仮定し、そこにフラグを立てて「無課金から課金ユーザーへと導くにはどうすればいいのか」を仮説検証するチームがありました。このみなし課金の条件視点がとても面白かったです。
原田氏:
マスクされていたデータをあえて復元するという、かなりトリッキーな視点だったので、もし私がDeNA側からアドバイスする立場だったら「課題を変えよう」と言ってしまうような視点でした。きちんと完結できるのか私も心配していたのですが、それなりに形にまとめられていて、中間報告も本当に面白かったですし、感心しながら見ていました。
佐藤:
私たちも最初の数回は 若干の不安を感じるものが多かったのですが、回を重ねるうちにいい仮説が出てきていた印象ですね。初回の授業は12月初旬に行ったのですが、年明けに多くの受講生から追加データのリクエストがたくさんきました。多分、年末年始にオセロニアを遊び尽くしてくれたんでしょうね。こういったことでも、ゲームのデータを選択できたのはよかったと感じました。
――どのようなデータがリクエストされたのでしょうか。
佐藤:
当初は上級者が遊ぶ、「ユーザーvsユーザー」のデータを中心に渡していたんです。でも、年始に追加リクエストされたデータの中心は、初期のミッション、つまり「人間vsコンピュータ」で戦い方を学ぶフェーズのクリアに関するデータだったんです。確かに初心者の離脱を防ぐためには重要なポイントなんですよね。受講生はいわば初心者プレイヤー。そこで、初心者の離脱に目をつけたんでしょうね。
また、友達がいないと続かないのではないか、という仮説を立てたチームもありました。実際にプレイして脱落しそうになったけれど、グループのメンバー間で教え合えるから続けられたっていう実体験に基づいて仮説を立て、それに関わるデータのリクエストもありました。
オセロニアは現在、「オセロニアン」と言わる“オセロニアを愛する人たち”のコミュニティを基盤としたリアルイベントを開催しているんです。コミュニティづくりがゲームの面白さを加速させると考える現場の思いと、「ゲームを一緒にプレイする友達がいるかどうか」が継続率に関わるのではないかという視点がマッチしていたのが印象的でした。
原田先生は、学生から追加リクエストがどんどん出てくるのは予想していたのですか?
原田氏:
ある程度は予想していましたし、講義の趣旨からすると大変喜ばしいことです。与えられた問題を解くだけでなく、解くべき問題を自分で作ることができるのは、データサイエンティストにとって非常に重要な素養なので。「こういう分析が事業に資すると思います、だからデータをください」という発想が生まれるのは素晴らしいことだと思いますし、生まれるべきだとも思います。
――ここまでが前半の流れですね。後半で印象に残ったエピソードがあればお聞かせください。
佐藤:
データ抽出の授業の時に「こういう集計結果が出たけど、どこかおかしい気がします。どう思いますか?」という質問を受けました。集計してみて自分の感覚と数字に違和感があったんでしょうね。
データを渡す際に、ゲームの仕組みや仕様などを説明してはいましたが、それでも抜け落ちてしまう部分がどうしてもあるので、そういったことが質問という形で補強されるのはすごく嬉しかったです。タイトルをきちんと理解してないと、違和感は生まれないと思うので、分析対象への理解が深まっているのを感じました。
原田氏:
与えられたデータをただ信じるのではなく、違和感があれば確認する。これは実務のデータサイエンティストとしてすごく重要な素養です。もちろん違和感を感じたデータが結果としては正しかったということは多々あります。でも、その違和感を感じたり解決しようとするやり取りを通じ、データができる仕組みやビジネス構造の理解が深まることがあるんです。
なるほど。では、最終プレゼンについても教えてください。
原田氏:
最後1週間の追い上げがすごかった。その前週の経過報告では「終わるのかな?」と感じたチームがいくつかありましたが、みんな最終プレゼンではきっちりまとまっていたし、分析もきちんと終えていました。エネルギーがすごい!というのがまず一番の感想です。
佐藤:
とてもよくわかります。次々回が最終発表という局面においてもまだ作業分担について話し合っているチームがありすごく不安になりましたが、最終発表はどこもまとまっていました。
「友達が多い方が続けやすい」という仮説ですが、検証結果も信頼できるものでしたし、それが他の要素に比べてどのぐらい重要なのかも定量的に出していました。オセロニアンを増やしていく、という現場の方向性を学生の方から後押しされるとは予想していなかったので、嬉しい驚きでした。
DeNAがそもそも行っていた分析や目指すビジョンの方向に対し、さらなる裏付けができたのですね。
佐藤:
ええ。今進めているポイントをバックアップしてくれるデータが受講生から得られたのは、DeNAとしての意義は大きいですね。あと、私たちの手が回らずチェックしきれていなかった、主成分分析やクラスター分析をうまくつかい、DeNAが進めているポイントと分析結果をリンクさせてくれました。
また、LightGBMを使って離脱要因への影響度を出してくれたので、それを1つひとつ見ながら、仮説に対する確信を得ることができました。
先ほどもお話したように、私たちが社内で分析するときは、同じようなデータサイエンティストが似たような視点で行うことが多いので、受講生の視点、つまり普段と違う視点からも、私たちが今取り組もうとしていることに対して、裏付けされた方が私たちとしてはありがたいです。自信を持って推進していける、という感じです。
演習を終えた受講生の方々はどのような感想をお持ちでしたか?
原田氏:
実データに触れ、かつデータの提供元の方と対話したり疑問点を直接ぶつけたりすることができたのは本当に貴重な体験だった、という声が多かったです。特にデータを提供していただくだけでなく、「ビジネスとしてデータの仕様を設計している理由」までお答えいただけたのは価値ある体験だったと思います。
AI技術の急速な進化が進む中、データサイエンティストに期待される役割
今回のように実データを触る機会などを増やすため、原田先生が今後やっていきたいこと、未来に向けて考えていることなどをお聞かせください。
原田氏:
今回のような企業との取り組み事例をどんどん増やしていきたいと考えています。最近では文科省も数理・データサイエンス・AIの教育強化を目指していて、全大学に今回のようなデータ活用の実践を含めた教育を推奨していますが、一緒に推進してくれる企業を探す必要があったり、大学によっては教えられる教員がいなかったりと、課題も大きいのが現実です。私たちも協力してくださる企業を毎年一生懸命探してお願いしています。そういった意味でもDeNAのように、協力的な企業の存在はありがたいです。
また、特定のデータだけでなく、さまざまな企業のご協力のもと、多種多様なデータやそれに付随するさまざまな課題に触れる必要があるとも考えています。そうした実体験を通し、抽象的な課題の解像度を上げたり、新しく出会った人からビジネス課題を引き出したりする能力が身についていくのではないかと思います。
昨今のAI技術の急速な進化を受け、データサイエンティストに期待される役割が増えているのを感じています。 ビジネスを深く理解した上で解くべき課題を設定しエンジニアリングもできる、ハブとなれる人材の重要性は今後ますます高まるでしょう。私たちもビジネス視点を兼ね備えたデータサイエンティストの育成に力を入れていきたいです。
DeNA側としてはいかがですか?
佐藤:
今回のように産学連携から社会貢献につながるような取り組みは、どんどん増やしていくべきだとは考えています。実データに近く分析に向いているデータもご用意できますので、他の大学、学校にもお声がけいただけると嬉しいですね。
DeNAとしては、学生のうちから「実データ」に触れ、ビジネス視点を持ったデータサイエンティストの方々と一緒に事業を強くしていきたい、という思いもあります。ビジネスする上で、データを扱うのはおもしろいと思ってもらえるきっかけになったら嬉しいですね。