omuriceman's blog

iOS / AWS / Firebase / JavaScript / Deep Learning を中心とした技術を面白く紹介します!

東大松尾研の「GCIデータサイエンティスト育成講座」を修了しました

データサイエンスやディープラーニングを無料で学習できる講座を運営している東京大学 松尾研究室(略称: 東大松尾研)をご存知でしょうか。公式のURLはこちらです↓。

weblab.t.u-tokyo.ac.jp

その東大松尾研が主催する「GCIデータサイエンティスト育成講座」を先日修了しました。本講座については学生向けと社会人向けのものがあり、私が申し込んだのは2019年12月に募集が開始されたオンライン講座で、今回で4期目になるようです。

gci.t.u-tokyo.ac.jp

私自身、以前に東大松尾研のディープラーニング講座「DL4US」を修了したこともあるのですが今回のGCIデータサイエンティスト育成講座はSlackの導入などもあってサポート体制などさらに向上していると感じました。

omuriceman.hatenablog.com

今回はGCIデータサイエンティスト育成講座の修了までの感想を書き残しておきたいと思います。

受講内容について

「GCIデータサイエンティスト育成講座」では、データサイエンティストになるために必要なデータ解析や分析技術などを学ぶことができます。データ分析や機械学習を行う上でよく使われるプログラミング言語Pythonの基礎から始まり、行列演算のNumpyやデータ加工処理のPandas、データの可視化を行うのに便利なMatplotlibなどの扱い方を学ぶことができます。ツールの扱い方以外にも確率統計の基礎なども学ぶことができます。

ちなみに講座の教材については無償公開されており、下記のリンクからダウンロードが可能です。オンライン講座には含まれていなかったデータベース関連も含まれているようです。

weblab.t.u-tokyo.ac.jp

受講者でない方はiLectは使用できませんので、GoogleColaboratoryなどを利用するといいでしょう。

講座申し込みから修了までの流れ

オンライン試験

DL4USの講座と同様、申込者のスキル確認のため受講前にPython/NumPyを用いて行列演算を行うオンライン試験が行われました。試験問題については「DL4USの時より少しだけ難しい!」といった感じでした。もしかしたら前回と難易度は変わっていなくて、ランダムに出題された問題がたまたま難しかったのかもしれません。全問正解できたはず…なのですがNumPyの機能を知っていればもっとスマートに記述できたのに!と少しだけ心残りでした(この部分についても教材でカバーされていました)。

受講開始

毎週ごとにJupyter Notebook(.ipynb)形式の講義内容が送られてきました。受講者たちはiLectというプラットフォームを利用して学習を行います。各講座毎に理解度を確認するための宿題が与えられました。宿題の難易度は比較的簡単だったので、できるだけたくさんの受講生に修了をさせたかったのではないかと思います。

www.ilect.net

Kaggle形式のコンペ

講中に提出する宿題とは別に、Kaggle形式のコンペが3回ほど開催されました。より精度の良いモデルを作ることができた受講生は、コンペ終了後に紹介されるのですが、それにランクインすることはできませんでした。悔しい。。。

3回目のコンペについては最低限の精度を超えるモデルを作れないと修了できないという内容になっており、締め切り数日前まで目標値クリアできておらず少し焦りました。

最終課題

最終課題は今までの宿題やコンペとはまた違った内容になっていてとても難しい課題でした。とはいえいろんな角度からデータサイエンスを学ぶことができて良い経験になりました。

こんなところがとても良かった

教材もとても良かったのですが、それ以外にも講座を受講したからこそ得られたことがありました。

自己学習にオススメの書籍やサイトなどの紹介

データサイエンス関連の学習にオススメの書籍などがまとまった資料を提供していただきました。これまでの知見がたまったものだと思います。まだまだ持っていない書籍もたくさんあり、購入してブログなどでアウトプットできればと思っています。

動画による講座内容の共有

今回の講座は学生向けのオフライン講座と社会人向けのオンライン講座が合わさったものだったのですが社会人はオフラインの講座には参加することができませんでした。ただいくつかの講座内容については収録したものを共有していただいたので、雰囲気を味わうことができました。本講座以外の授業もオンラインでライブ参加させてもらえました。これがなかなか私好みのコンテンツで面白かったです。

Slackによる学習サポート

最後にSlackを使ってのコミュニケーションのやりとりはとても良かったです。運営と受講生間のやりとりだけでなく、受講生同士がSlackで質問したり励ましあったりしているのを見て私自身もとても時間の無い中でとても励みになりました。

またコンペや最終課題の後には、優秀な結果を残した受講生たちの解法の共有が行われました。私自身、課題に取り組む時間が少なかったものの試行錯誤をした後で他の方の解法や着眼点を知ることで色々な気づきを得ることができました。どれだけ自分毎で取り組めたかが、その後の成長に繋がるものだなと改めて実感しました。

まとめ

無事に修了ができて一安心しました。そしてこのような講座を無料で開催してくれる松尾研究室の皆様には改めて感謝しかありません。

私のように独学でデータサイエンスを学んでいて正しく習得できているのか不安な人にも本講座はとても有益だと思います。社会人向け講座については本ブログ執筆時点では開催未定ですが、再び開催された時に迷っている人がいたら是非応募してみてください。

松尾研究室の社会人向けの講座については不定期な部分もあるので見逃しがちです。できるだけ見逃さないようにするには松尾研究室公式Twitterをフォローしておくのがいいですね。

twitter.com