ゲンゴ

広くゆるくソフトウェアと機械学習について。

ML論文探しのお助けサイト "Papers With Code"

アカデミアにいない人間が機械学習の論文を探すとき使うのは、 arXiv.org とか Google Scholar が基本でしょうか。

ただ、少なくとも機械学習であれば、論文だけでなく実装も一緒に見たいですよね。

これが簡単にできる「Papers With Code : the latest in machine learning」というサイトがあるようです。

 

paperswithcode.com

 

元々はGithub上で展開していたよう?ですが、素敵なサイトになりました。

いいなあと思ったのは以下。

 1. 論文だけでなくて、実装コードも同じ画面から入手できる

 各論文のページに入ると、アブストの表示の下にFull paperをDLできるボタンと合わせて、コードのGitリポジトリへのリンクが張られています。

arXivのペーパーがGithubリポジトリへのリンクを持っている、もしくはGithubリポジトリarXivペーパーへのリンクが張られていれば、それがペアになってこのサイトに掲載されるようです。

論文著者だけでなくいろんな人が実装していらっしゃると思いますが、それらが(うまくリンクが拾われていれば)1画面にリストされるというのはなかなかステキじゃないでしょうか。

 2. タスク別手法別のスコアがすぐに分かる 

世の中には機械学習手法を評価するための様々なタスクがありますが、各論文で提案されている手法がどのようなタスクでどのようなスコアを出しているのか、または逆に、各タスクに対してどのような手法たちがどんなスコアを出したのかが、すぐに分かります。

「最近このタスクはどんな手法が優位なのか」を知りたいときに、ひとつのサイト上でぱぱっとランキングも見られて論文も見られてコードも見られるのは便利です。

 3. 分野別に論文・タスクがまとまっている 

これはわたしのような初心者・初学者には嬉しいところ。

機械学習の適用分野は広いので、特に勉強し始め+周りに先達もいないような場合は、自分の目的に合った応用系の論文を探すのに一苦労です(心折れます)。

このサイトは論文・タスクを応用分野別に見やすくカテゴリ/サブカテゴリに分けてくれているので、あまり迷うことなく関心に近い論文やタスクを見つけることができます。

例えば自然言語処理なら、以下のような粒度でサブカテゴリが作られています。

  • Machine Translation
  • Question Answering
  • Language Modeling
  • Sentiment Analysis
  • Text Classification
  • Text Generation
  • Natural Language Inference
    …まだまだあります。NLPだけで50以上のサブカテゴリ。

 

 とまあざっくりこんな感じのサイトです。まとめると、

  1. これまでGoogleにて論文・コード・タスクをそれぞれ検索して探していたような方々にとっては無茶苦茶手間が減って便利そう
  2. 初心者を応援する導線

バリバリ機械学習を活用されている先輩方だけでなく、わたしのような孤独な初学者にとってもありがたいサイトだなあと思いました。

(サイト全体がかわいらしく見やすいのも個人的には推しポイントです!)