2022.07.20
Kaggleコンペティション「Foursquare - Location Matching」で、DeNAのデータサイエンティストである阿部・柳辺を含むチームが1083チーム中2位、坂見を含むチームが12位に入りました
Kaggleコンペティション「Foursquare - Location Matching」で、DeNAのデータサイエンティストである阿部・柳辺を含むチームが1083チーム中2位、坂見を含むチームが12位に入りました。
本コンペティションでは、施設の特徴を記述するデータセットの中から、同一施設を表すものをグルーピングするタスクに取り組みました。実際には同一施設を表すデータ同士でも、それぞれのデータには位置情報のブレや施設名の表記ゆれなど様々なノイズが含まれています。
本コンペティションでは、広く候補を抽出したのちに、後段のモデルによって正確にマッチするものを判定する手法が多く用いられました。解法の一例として、阿部・柳辺を含むチームでは、①緯度経度や施設名の類似性から同一施設を表すと思われるデータのペアを大量に作成し、②深層学習を用いた手法で確度の低い候補ペアをフィルタリングしたのち、③複数のアルゴリズムで同一施設を表すペアかどうかを判定しグルーピングを行いました。
阿部コメント「会社のサポートやチームメイトには感謝の念でいっぱいです。このコンペを通じて得た学びを今後に活かしていきたいです。」
柳辺コメント「チームメイトと力を出し合い、最後まで戦い抜くことができました。これからも頑張ります。」
坂見コメント「なんとか金メダル圏内に残ることができてよかったです。面白いタスクで勉強になりました。」