先日、Kaggle Days Championshipの全ての予選が終了した。 ここ数ヶ月、仕事や旅行をしながらもなんだかんだでほとんどの予選に参加していた。本記事では、このイベントに関する所感などを記載する。
Kaggle Days Championshipとは
Kaggle Days Championshipは、オンラインで開催される全12回の予選と、オンサイトで開催される決勝で構成される機械学習コンペティションのイベントだ。 予選ごとに、画像からヨガのポーズを推定するタスク・天気を予測するタスク・2つの文章の関係性を推定するタスクといったテーマが与えられ、テーマごとに精度を競い合い、各予選で勝ち抜いた上位3チーム(合計36チーム)が10月にバルセロナで開催される決勝大会に参加する権利を獲得する。
予選は12回開催され、予選に複数回参加することも可能である。このため、すでに決勝参加権を獲得しているチームが再び参加して上位に入賞するケースが出てくるが、その場合は下位のチームが繰り上がりで参加権を得る。 通常の機械学習コンペティションは2-3ヶ月程度の長期にわたって開催されることが多いが、Kaggle Days Championship のコンペティションは予選が4時間半、決勝が2日間とどちらも短期間で開催される。
ちなみに、決勝への参加権を獲得した場合はバルセロナまでの旅費が補助される(Travel Grants Program, TGP)と言われていたのだが、数ヶ月前から Details soon と言われ続けていたTGPの詳細が先日ようやく明らかになり、参加者側が期待していた内容と運営が提示した内容に大きく乖離があったため現在絶賛大炎上中である(本記事の趣旨と異なるため、詳細はここでは割愛する)。期待感のコントロールをミスると炎上するというお手本のような事例になってしまっており、示唆深い。
戦績
予選の私の戦績は以下の通りだ。メンバーは敬称を略して記載している。 大会名は世界の各都市の名称になっているが、コンペはオンラインで開催されるため世界中どこからでも参加することができる。ただし、各イベントはその都市の現地時間の16時から開始するため、時差によっては日本からの参加が難しいコンペもいくつかあった。
大会 | 順位 | チームメンバー |
---|---|---|
サンフランシスコ | 7位/82チーム | ソロ |
ムンバイ | 26位/87チーム | ソロ |
北京 | 21位/74チーム | ソロ |
東京 | 8位/82チーム (決勝参加権獲得) |
cfiken, tawara, fugusuki |
ニューヨーク | 8位/50チーム | fugusuki, tawara |
ドバイ | 23位/70チーム | fugusuki, cfiken, tawara |
ロンドン | 20位/56チーム | cfiken |
パリ | 2位/74チーム | fugusuki |
私は全12回中8回のコンペに参加した。 直近はKaggleや機械学習から少し離れていたこともあってそこまでモチベーションが高くなかったため、最初の3回は参加を見送ったのだが、いつも一緒にamong usをプレイしていたKagglerの友人たちが悉く決勝への参加権を獲得していたので、一念発起して4回目に開催されたサンフランシスココンペから予選に参加しはじめた。 サンフランシスココンペで意外と手応えを感じられたのと、久々に機械学習コンペに参加して純粋に楽しかったため、以降はほとんどのコンペに参加している(ベルリンコンペのみ、旅行のフライト時間と被ってしまったため参加できなかった)。
サンフランシスココンペにおいてはソロ参加としてはそこそこ良い順位を取れたものの、以降のムンバイ・北京では結果が奮わなかったため、cfikenさん、fugusukiさん、tawaraさんをお誘いしてチームを組むことにした。
順位については、得意なテーマがきたときは1桁台で、苦手なテーマがくると20位台といった具合になっている。 予選のコンペは、画像、自然言語、構造化データ、時系列データなど様々なドメインで毎回異なるテーマが与えられた。人によって得意な領域が異なるため、様々な参加者にチャンスを与えるために意図的にこのような設計にしているらしい。 私は構造化データ + テキストを扱うテーマが比較的得意らしく、それらのコンペ(サンフランシスコ、ニューヨーク、パリ)では相対的に良い結果を残せた。反対に、ここしばらくは機械学習コンペから離れていたため最先端のNNモデルを扱うことがあまり得意ではなく、そうしたモデルが強いコンペではあまり良い結果を残せていない。ほとんどの予選でコンスタントに上位に入り続けているチームも幾つかあるが、本当に凄いことだと思う。
パリコンペのLB。参加8回目にしてようやく WinnersBoardに掲載される順位を獲得できた。
所感
コンペによっては短期間で取り組むのは厳しいと感じたものもあったが、概ねどのコンペも楽しんで取り組めた。 短期集中で取り組むためにコンペの開催中は毎回フロー状態に入っている感覚があり、これが癖になって何度も参加してしまっている。最後のパリコンペについては、現在(滞在費がべらぼうに高い)アメリカ西海岸にいることもあって元々はあまり参加するつもりがなかったのだが、タスクの内容を見始めたら参加したくなり、なんだかんだで結局最後まで参加してしまった。本当に中毒性が高いイベントだと思う。
2時間だけ、と言っていたのにやり始めたら楽しくなって結局最後まで参加してしまった。○○依存の悪循環を完全に体現している。
私が通常のKaggleのような長期コンペよりも短期間で終わるコンペの方が好きなこともあって、Kaggle Days Championshipはとても良いイベントだと思っている。イベントの運営に改善の余地がないと言えば嘘になるが、それでもこれだけ高頻度で機械学習コンペを開催するのはかなり大変なことで、毎回楽しんで参加させてもらっているので運営には感謝している。TGPの件で決勝の開催には暗雲が立ち込めているが、どうにか無事に開催されることを願うばかりだ。