データサイエンスのクラスでハーバード大学の正しいやり方を学んだ

クラスの大学院生と講師と一緒に写真を撮った

前回のエントリーで触れたデータサイエンスのクラスに加えて、2019年秋に別のデータサイエンス関連のコースに参加しました。

コースコードはGOV1005で、クラス名は「データ」と呼ばれていました。 ハーバード州政府省内で提供されています。 このクラスは私のレーダーの下にありましたが、以前Facebookで働いていた私のMDEクラスメートがこのクラスを推奨しました。 最初の講義に出席した後、すぐに興味をそそられ、このクラスを続けることにしました。

クラスのデザイン

政府省がどのようにしてデータサイエンスに関連するクラスを提供するのか、と質問されるかもしれません。 ただし、このクラスは、世界中の政治問題の多くを分析的に理解するためのスキルを学生に提供するという意味で重要です。 したがって、コースは実践的なものになるように設計されています。

とはいえ、このクラスは、前のエントリで書いたAPCOMP209Aとは大きく異なります。 APCOMP209Aでは、主に使用される言語はpythonで、GOV1005ではRを使用します。学期中に両方が混同されることが多かったため、言うまでもなく、このジレンマに不満を感じていました。

APCOMP209Aでは、授業時間のほとんどが講義でした。 ただし、GOV1005では、クラスの時間の大半がクラス内の演習に使用されていました。 私たちは皆、ノートパソコンを入力して調べていました。 APCOMP209Aは統計とプログラミングを知ることを学生に要求しましたが、GOV1005は何も要求せず、コース全体を通してゼロから必要なスキルを構築しました。

思ったより大変だった

クラスの初めに、プリセプター(クラスで生徒が彼に話しかけた方法)は毎日Rに取り組んでいると述べました。 彼が意味すると思ったのは、私たちは毎日Rを書くように一生懸命働くつもりだということでした。 私は間違っていた。 彼は文字通りRを毎日書くと言ったので、私たちはそうしました。

私は毎日いくつかのコードをコミットしています!

ほとんどの学生はRに慣れていないため、プリセプターはデータキャンプでRについて学ぶように指示しました。宿題は、各学生が1日あたり約1時間Rを使うように設計されました。さらに、いわゆるpset(宿題)がありました。学習したRスキルを適用する必要がありました。

良い月の後に、私はこれらのビジュアルを簡単に作成することができました

同じ学期に別のデータサイエンスコースが登録されているため、このクラスはやりがいがありました。 なんとか乗り越えました。 Rの柔軟性とその独特のコーディング構文を考えると、Rがとても好きになりました。 R Studioが最適です。

私の最後のプロジェクトでは、米国国勢調査局からデータを収集し、米国のクリエイティブを視覚化したウェブサイトを開発しました。

私の最終プロジェクトのウェブサイト

プリセプター

授業自体よりも、教授が素晴らしかったと言いたいです。 デービッド・ケイン博士は教授の名前でした。 しかし、彼は生徒たちに彼をプリセプターと呼ぶように指示したので、私たちは彼をそのように呼びました。

プリセプターは素晴らしい教育者でした。 クラスには80人を超える学生が登録されていましたが、彼はすべての学生の名前を覚えていました。 数え切れないほど、彼は妻が作った自家製スナックも持参しました。これがこのクラスを受講した理由の1つでした。 どれも温かくて美味しかったです。 他の生徒にもう一口食べさせようと思いました。

自家製クッキーの信じられないほどの品質

多くの大学院生がこのクラスに登録しましたが、学部生はクラス人口の半分以上から構成されていました。 彼ら全員が、データサイエンスの世界への第一歩を踏み出そうとしていました。

しかし、私が大学時代に不安を感じたように、若いことには不安が伴います。 特にあなたが両親から離れた別の環境にいるとき、ハーバード大学にやって来る学生は他の人に助けを求めるのが得意でない場合があります。

しかし、このようなクラスは彼らのための場所になることができます。 すべてのクラスで、プリセプターは誰かとペアになるように指示し、私たちは一緒にコーディングに取り組みました。 クラスごとに異なるパートナーが必要でした。 それだけでは不十分で、学生は授業中にしばしばコールドコールされ、彼らの周りに学生の名前を紹介しなければなりませんでした。

Rで自家製のコールドコール関数を使用するプリセプター

学生たちにこのすべてを体験させることで、学生たちは他の学生とつながることを余儀なくされました。 私たちはハーバード大学に留学しているのではなく、ネットワークについても触れています。 実際、学期を終える頃には、この「一体感」が授業を体現していた。 素晴らしい教育学だったと思います。

「あなたはハーバードが間違っています」

ある日、プリセプターはこの思い出に残る仕事について私たちに教えました。

「ラップトップを開いて、ハーバード大学の卒業生のウェブサイトにアクセスしてください。」

言われた通りにしました。 その後、プリセプターはハーバード大学の卒業生を探すことができると私たちに尋ねました。 頭に浮かんだ人物が1人いたため、ハーバード大学の卒業生ディレクトリで彼の名前を検索しました。 ヒットがありました。 よく見ると、彼の連絡先が見つかりました。 本当に? このウェブサイトとは…? 他の有名なハーバード大学の同窓生とこのウェブサイトを検索してみたところ、何度もヒットしました。

少しショックを受けて、プリセプターは続けました:

「有名な卒業生を検索する代わりに、興味のある用語で検索してみてください。」

良い生徒だったので、指示通りにやってみたところ、その分野で活躍している卒業生全員を映した結果が出ました。 同じ興味を持っている人がたくさんいるのに興味をそそられました。 それから、プリセプターは続けて、次のように言いました:

「今すぐその人にメールを送信してください。」

何? 本当に? この人は全然知らない!

生徒たちは必死に質問し始めました。

「はい、今、ここにいます。 TAの電子メールアドレスをBCCに追加します。 これは評価されます。」

びっくりしました。

次のクラスのミーティング中に、プリセプターは誰かが何か返事をもらったかどうか尋ねました。

「私は返事をもらいました!」
「私はこの人に彼の仕事について面接するように呼びます!」
「これは潜在的なインターンシップの機会につながるかもしれません!」

(ちなみに答えはありませんでした…)

学生の目には興奮が見えました。

学生を見て、プリセプターは次のように言いました:

授業料にたくさんのお金を費やしたのに、どうしてここハーバードにいるの? はい、それは勉強についてですが、あなたはまた、この教育機関が提供しなければならないリソースを活用する必要があります。 卒業生を活用することは一つです。 逆に、誰かがすぐにあなたの助けを求めてきたら、喜んで手を差し伸べてくれる人になってください。

「そうでなければ、君たちはハーバードを間違ってやっている!」

プリセプターは正しいと思いました。 ハーバード大学の留学生として、私は勉強に夢中になりすぎる傾向があります。それが私の優先事項です。 それでも、純粋に知識ではない資産の構築にも投資する必要があることは注目に値します。

データサイエンスの実世界での生き方

私は今、焦点をデータサイエンスに戻しています。 学期中、プリセプターがデータサイエンスの分野で働いているゲストを招待する多くの機会がありました。

特に私にとって、データサイエンスについて想像すると、それはFacebook、Google、Amazonで働いている人にのみ関係していると思うようになりました。 クラス内でのこの一連の講演は、私の仮定を正しい方法で反証しています。

話しに来た実際の人々はボストンシティのデータセクションで働いていた誰かでした。 もう一人は、NBAのデータ部門の出身でした。 彼らは普通の人々と日常的に繋がる場所で働いていました。

招待講演者の選出は素晴らしいと思いました。 すべての話を聞いて、実世界のデータの力を活用することが何を意味するのかがはっきりと分かりました。 例とケーススタディを通じて、データがどのように結晶化してインテリジェンスになるかを示しました。 データサイエンスは限られたグループのためだけではなく、多くの人々のために利用されるべきだと強く感じました。

学期は長くも短くも感じましたが、他のデータサイエンスクラスと同じように、このクラスは私に膨大な知識をもたらしました。 このクラスに参加してくれて本当に感謝しています。