先日行われたデータサイエンティストの世界大会「Kaggle(カグル)」のコンペに参加したバイタリフィの社員がいます。
バイタリフィアジアのChief Data Scientistこと曽佐 顕(奥列の左側から3番目)とバイタリフィアジアのAIチームのメンバーです。
今回、曽佐は、Kaggleの「Predicting Molecular Properties」のコンペに参加して、結果はなんと2757チーム中10位でGoldを獲得しました!
しかも、日本人としてはトップという快挙!!!
これまでに獲得したSilver2個と合わせて、Kaggle Masterの称号も与えられました。
1.Kaggleに関して
1-1.Kaggleとは
Kaggle は世界最大のデータサイエンスのコンペティションサイトです。参加企業や研究所が課題を設定し、世界中のデータサイエンティストや機械学習エンジニアが解法を競い合います。賞金は多いときには総額 1000万円以上が与えられることもあります。
なお、Kaggle は 2017 年に Google によって買収されています。
1-2.世界中の人々がKaggleのコンペに参加する理由
Kaggle は Google に買収されて以来、名実ともに世界最大のデータサイエンスのプラットフォームとなっています。
主催者、参加者はそれぞれ、以下のようなモチベーションで参加をしています。
主催者のメリット
世界中のデータサイエンティストのプロが自社の問題解決をしてくれる
ブランディングや PR になる
データサイエンティストの採用に繋がる
参加者のメリット
名誉 (称号やメダル)
賞金
ブランディングやPRになる
他の参加者と交流できる
企業の様々な実際のデータに触れられる
1-3.KaggleのGoldとは
Kaggleのコンペにて、上位にランクインするとメダルがもらえます。
コンペのメダルは、Gold、Silver、Bronzeの3種類。
今回のコンペでは2757チーム中15位までがGoldでした。
詳細に関してはこちらをご覧ください。
1-4.Kaggle Masterとは
Kaggle Masterとは、Kaggleのコンペで1つのGoldと2つのSilverを取得した時にもらえる称号です。
コンペの称号は、Grandmaster、master、Expert、Contributor、Noviceの5種類。
日本では Grandmaster が約 10 人、Master が 1000 人ほどいると言われています。
詳細に関して再度こちらをご覧ください。
2.今回のKaggleのコンペに関して
今回のKaggleのコンペのテーマは、「Predicting Molecular Properties」です。
日本だと、通称分子コンペと言われています。
今回のコンペでは、分子の持つ属性のひとつである Scalar Coupling Constant と呼ばれる数値を予測します。
この数値は主に NMR と呼ばれる分析手法の中で利用されます。NMR は化学物質(分子)の構造の特定に用いられます。分子構造から、予め Scalar Coupling Constant を知っておくことで、特に新規物質について高い確度で構造の特定を行うことができるようになります。
Scalar Coupling Constant は量子論からほぼ正確に計算することもできるのですが、膨大な計算時間を要します。これをデータドリブンな手法である機械学習を用いることで、高速にかつ高い精度で予測できるようにしましょう、というのが今回の目的です。
応用分野としては、化学物質の毒性を予測したり、あるいは有用な薬の合成を予測させたり、新規材料や素材の開発に役立てたりと、幅広い分野で大きな発展が期待されています。
3.終わってみて
以下、終わってみての感想を曽佐に伺ってみました。
> かなり専門的なテーマのように感じるのですが、そのあたりは問題なかったのでしょうか?
もともと専攻が化学というのもあったかもしれませんが、特に問題は感じませんでしたね。むしろ好奇心が湧いて、参加・継続するモチベーションになりました。
> コンペの取り組み方、結果に至る過程について教えて下さい。
今回のコンペでは、今までより特に多く論文を読みました。専門的な分野であるためです。この分野を専門にして活動している研究者がいるので、彼らの論文を読むのが最も近道と考えました。最終的には、それらをベースとして、今回の問題に特有な部分をカスタマイズして解法としました。英語になりますが、[解法]を共有しています。
> 今回のコンペで特に印象的だった部分について教えて下さい。
1 ~ 6 位ぐらいの上位の解法ですね。Transformer と呼ばれるアーキテクチャを利用しています。Transformer は特に自然言語分野でよく使われています。ただ、かなり多くの論文を読んだのですが、分子の問題を解く上で Transformer を利用しているものは殆どありません。これが何を意味するかというと、今回のコンペティションでは最先端の革新的な解法が生み出されたということです。今後、これをきっかけに、この分野が変わっていくことになると思います。
その意味で、今回のコンペティションは Kaggle の中でも最も成功したコンペティションの一つであり、如何に Kaggle がデータサイエンスの中で大きな役割を果たしていくのか、確認させられました。
> 最後にバイタリフィアジアの AI チームについて、お話をお願いします。
バイタリフィアジアの AI チームでは、真に才能をもったエンジニア、リサーチャーを集めています。今回は私の結果でしたが、近いうちに同様の結果がベトナム人エンジニアからたくさん見られるようになるはずです。
実際、冒頭の写真に写っている Phuong (手前列の左側から2番目)は、インターンシップ中にソロシルバーを取得しました。初めてのコンペでのソロシルバーなので、非常に立派な成績と言えると思います。
事業のほうでも、歴史はまだ長くないのですが、すでにそのような結果が出てきています。我々は分野は問いません。今回のコンペで示したとおりです。それができる人間を揃えています。
4.Kaggle Masterがいるバイタリフィってどんな会社なの?
バイタリフィはベトナムでのオフショア開発や、iPhone、Androidなどのスマートフォン向けのアプリ開発、AI(人工知能)関連の製品、Webサービスの企画開発、運用を行う会社です。
バイタリフィアジア、バイタリフィジャパンともに、機械学習のスタッフが揃っていて、AIエンジニアが多数在籍おります。
世界最大のコンペでメダルを取りまくっている最強AIチームが在籍する、バイタリフィの事業に興味ありませんか?
※Kaggleのコンペについての過去記事もご覧ください。
ご興味ある方は以下リンクより、是非一度弊社までお問合せください!
モデルデータを無料で作成。
AIアプリを気軽に開発できる新サービス『Mobile AI Lab』のお問合せはこちら
バイタリフィ公式サイトはこちら