by David Venturi
1 年前、私はカナダで最高のコンピュータサイエンスプログラムの 1 つを退学になりました。 私は、オンライン リソースを使用して、自分自身のデータ サイエンス修士プログラムを作成し始めました。 私は、必要なことはすべて、edX、Coursera、Udacityで学べることに気づきました。 そして、より早く、より効率的に、ほんのわずかな費用で学ぶことができるのです。 多くのデータサイエンス関連のコースを受講し、さらに多くのコースの一部を聴講してきました。 そこにある選択肢や、データ アナリストやデータ サイエンティストの役割に備える学習者に必要なスキルはわかっています。 数ヶ月前、私は、データサイエンスの各テーマに最適なコースを推奨するレビュー主導のガイドを作成し始めました。
このシリーズの最初のガイドでは、初心者のデータサイエンティストにいくつかのコーディングクラスを勧めました。
- 次はデータサイエンス入門です。
- How we pick courses to consider
- How we evaluated courses
- データサイエンスのプロセスとは? データサイエンティストとは何をする人なのか? これらは、データサイエンス入門コースが答えるべき基本的な質問の一種です。 ハーバード大学の教授である Joe Blitzstein と Hanspeter Pfister による次のインフォグラフィックは、典型的なデータ サイエンス プロセスの概要を示しており、これらの質問に答える助けになります。 プロセスの特定の側面をあまり深くカバーしたくないので、タイトルの「入門」の部分があります。
- Basic coding, stats, and probability experience required
- 私たちが選ぶ、最高のデータ サイエンス入門コースは…
- A great Python-focused introduction
- An impressive offering with no review data
- The competition
- Wrapping it Up
次はデータサイエンス入門です。
(データサイエンス入門のコースがどんなものかわからなくても心配しないでください。 このガイドでは、2017年1月時点で提供されているすべてのオンライン データサイエンス入門コースを特定し、そのシラバスやレビューから重要な情報を抽出し、その評価をまとめようと10時間以上費やしました。 この作業には、オープンソースの Class Central コミュニティと、何千ものコースの評価とレビューのデータベースを利用しました。
2011 年から、Class Central 創設者の Dhawal Shah は世界中の誰よりもオンライン コースに目を光らせています。
How we pick courses to consider
Each course must fit three criteria:
- it must teach the data science process.
- オンデマンドであるか、数か月ごとに提供されるものであること。 これらは実行可能な学習方法ですが、このガイドではコースに焦点を当てます。
私たちは、上記の基準に適合するすべての注目すべきコースをカバーしたと考えています。 Udemyには数百のコースがあるようですが、その中から最も評価の高いものだけをピックアップしています。 しかし、私たちが何かを見逃している可能性は常にあります。
How we evaluated courses
We compiled average rating and number of reviews from Class Central and other review sites to calculate a weighted average rating for each course.
我々は、以下の2つの要素に基づいて、主観的なシラバスの判定を行いました。 データ サイエンス プロセスのカバレッジ。 コースは、特定の主題を覆い隠したり、飛ばしたりしていないか。 特定のテーマを詳細にカバーしすぎていないか。 このプロセスがどのようなものであるかについては、次のセクションを参照してください。 コースは、PythonやRのような一般的なプログラミング言語を使って教えられていますか?
データサイエンスのプロセスとは? データサイエンティストとは何をする人なのか? これらは、データサイエンス入門コースが答えるべき基本的な質問の一種です。 ハーバード大学の教授である Joe Blitzstein と Hanspeter Pfister による次のインフォグラフィックは、典型的なデータ サイエンス プロセスの概要を示しており、これらの質問に答える助けになります。 プロセスの特定の側面をあまり深くカバーしたくないので、タイトルの「入門」の部分があります。
それぞれの側面について、理想的なコースは、プロセスの枠組みの中で重要な概念を説明し、一般的なツールを紹介し、いくつかの例(できればハンズオン)を提供することです。 したがって、このガイドには、Johns Hopkins University’s Data Science Specialization on Coursera や Udacity’s Data Analyst Nanodegree のような完全な専門科目やプログラムは含まれません。 これらのコースは、本シリーズの目的である、データサイエンス教育を構成する各テーマに最適な個々のコースを見つけるという目的からは外れています。 2631>
Basic coding, stats, and probability experience required
Several courses listed below requires basic programming, statistics, and probability experience.このシリーズの最後の3つのガイドは、データサイエンスのプロセスのそれぞれの側面を詳しく説明します。
この経験は、このデータ サイエンス キャリア ガイドの最初の 2 つの記事 (プログラミング、統計) で推奨している方法で習得できます。
私たちが選ぶ、最高のデータ サイエンス入門コースは…
- Data Science A-Z™ です。 Real-Life Data Science Exercises Included (Kirill Eremenko/Udemy)
Kirill Eremenko’s Data Science A-Z™ on Udemy は、20以上のコースからデータサイエンスのプロセスを網羅する幅と深さにおいて明らかに優勝しています。 このコースは、3,071件のレビューに対する加重平均評価が4.5つ星であり、検討したコースの中で最も評価が高く、レビューも多いコースに入ります。
このコースでは、すべてのプロセスを概説し、実際の例を提供しています。 レビュアーは、講師の話術とコンテンツの構成が気に入っています。
「一般的なデータサイエンス ツールの使用」ボックスにはチェックが入っていませんが、Python/R以外のツールの選択肢(gretl、Tableau、Excel)は、文脈の中で効果的に使用されています。 Eremenko は、gretl の選択 (gretl は統計ソフトウェア パッケージ) を説明する際に次のように言及していますが、これは彼が使用するすべてのツールに当てはまります (強調):gretl では、R や Python と同じようにモデリングを行うことができ、コーディングする必要はないでしょう。 これがここでの大きなポイントです。 皆さんの中には、R をすでによく知っている人もいれば、まったく知らない人もいるでしょう。 私の目標は、堅牢なモデルを構築する方法を示し、あなたが選んだどのツールでも適用できるフレームワークを提供することです。gretl は、コーディングに埋没しないように助けてくれます。
ある著名なレビューアでは、次のように指摘しています:
Kirill は私がオンラインで見つけた中で最高の先生です。 このような場合、「このような場合、どうすればよいのか? また、データサイエンティストになるとはどういうことか、不十分なデータを扱うところから、Cクラスの経営陣に自分の仕事をプレゼンテーションするところまで、多くの洞察を与えてくれます。 初心者の学生から中級のデータアナリストまで、このコースを強くお勧めします!
A great Python-focused introduction
- Intro to Data Analysis (Udacity)
Udacity の Intro to Data Analysis は比較的新しいサービスで、Udacity の人気のデータアナリスト ナノ学位の一部になっているものです。 データサイエンスのプロセスを、Pythonを使って明確に、そしてまとまった形でカバーしていますが、モデリングの面では少し物足りなさがあります。 時間軸の目安は36時間(週6時間×6週間)ですが、私の経験ではもっと短くなります。 2件のレビューの加重平均評価は5つ星です。 2631>
ビデオはよく作られており、講師(Caroline Buckey)は分かりやすく、人柄も良い。 受講生は、NumPyとPandas(これらは人気のあるPythonライブラリです)の新しいスキルや向上したスキルに自信を持ってコースを終えることができます。
An impressive offering with no review data
- Data Science Fundamentals (Big Data University)
Data Science Fundamentals is a four-course series provided by IBM’s Big Data University. データ サイエンス 101、データ サイエンス方法論、オープン ソース ツールによるデータ サイエンス ハンズオン、および R 101 と題されたコースが含まれます。
データ サイエンスのプロセスをすべて網羅し、Python、R、およびその他のオープン ソース ツールをいくつか紹介します。 このコースは、とてつもない生産性を持っています。 このガイドの目的には必要ありませんが、最後にある「R 101」コースを受講するかどうかによって、13~18時間の労力が必要と見積もられています。 残念ながら、この分析に使用した主要なレビューサイトでのレビューデータがないため、まだ上記2つの選択肢よりお勧めすることはできません。 無料です。
The competition
私たちの1位の選択は、3,068件のレビューに対する加重平均評価が、5つ星のうち4.5つでした。 他の選択肢を、評価の高い順に見てみましょう。
- Python for Data Science and Machine Learning Bootcamp (Jose Portilla/Udemy)です。 ツール(Python)に重点を置いた全プロセス網羅型。 プロセスドリブンというより、Pythonの入門書として非常に詳しい。 このガイドの範囲では理想的ではありませんが、素晴らしいコースです。 以下のJoseのRコースと同様に、Python/R入門とデータサイエンス入門の両方を兼ねています。 21.5時間のコンテンツがあります。 1,644件のレビューで4.7つ星の加重平均評価を得ています。 コストは頻繁にあるUdemyの割引によって変動する。
- Data Science and Machine Learning Bootcamp with R (Jose Portilla/Udemy)。 ツールに重点を置いた全プロセス網羅型(R)。 このガイドの範囲には適していませんが、素晴らしいコースです。 このコースは、上記のJoseのPythonコースと同様に、Python/Rの入門とデータサイエンスの入門の両方を兼ねることができます。 18時間のコンテンツ。 847のレビューで4.6星の加重平均評価を得ています。
- Data Science and Machine Learning with Python – Hands On ! (Frank Kane/Udemy)です。 一部プロセス網羅。 統計学と機械学習に重点を置く。 9時間という長さも魅力。 Pythonを使用。 3,104件のレビューの加重平均評価は4.5つ星です。 Udemyの割引によってコストが変わるが、これは頻繁にある。
- データサイエンス入門 (Data Hawk Tech/Udemy)。 データサイエンス入門(Data Hawk Tech/Udemy):データサイエンス入門(Data Hawk Tech/Udemy)。 かなり短い(3時間程度の内容)。 RとPythonの両方を簡単にカバー。 62のレビューで4.4星の加重平均評価を得ています。 Udemyの割引が頻繁にあるため、費用は変動します。
- Applied Data Science: An Introduction (Syracuse University/Open Education by Blackboard)。 均等ではないものの、全プロセスをカバー。 基礎的な統計学とRに重点を置いている。このガイドの目的からすると、応用的すぎてプロセスに焦点が合っていない。 オンラインコースの体験がバラバラな感じがする。 6件のレビューの加重平均評価は4.33星です。 Free.
- Introduction To Data Science (Nina Zumel & John Mount/Udemy)。 データ準備とモデリングの面では良い深さだが、部分的なプロセスカバーのみ。 長さもちょうどいい(6時間分の内容)。 Rを使用。101のレビューで4.3星の加重平均評価を得ている。 Udemyの割引によって費用が変動するが、割引は頻繁にある。
- Applied Data Science with Python (V2 Maestros/Udemy)です。 全プロセスをカバーし、各局面のカバーの深さが良い。 適度な長さ(8.5時間分のコンテンツ)。 Pythonを使用。 92のレビューで4.3星の加重平均評価を得ています。
- Want to be a Data Scientist? (V2 Maestros/Udemy): カバーする深さは限定的だが、全プロセスをカバー。 かなり短い(3時間のコンテンツ)。 ツールは限定的。 レビュー数790件、加重平均評価4.3つ星。
- Data to Insight: an Introduction to Data Analysis (University of Auckland/FutureLearn)(オークランド大学/フューチャーラーン)。 カバーする範囲の広さが不明。 データの探索、発見、可視化に焦点を当てるとしている。 オンデマンドでは提供されていない。 24時間のコンテンツ(週3時間、8週間)。 2件のレビューの加重平均評価は4つ星。 無料、有料証明書あり。
- Data Science Orientation (Microsoft/edX)。 プロセスを部分的にカバーしている(モデリング的な側面が欠けている)。 Excelを使用しますが、Microsoftブランドのコースであることを考えると納得できます。 12~24時間の内容(週2~4時間×6週間)。 40件のレビューの加重平均評価は3.95星。 無料、25ドルでVerified Certificateが利用可能。
- Data Science Essentials (Microsoft/edX)。 全プロセスをカバーし、各アスペクトのカバーの深さが良い。 R、Python、Azure ML(マイクロソフトの機械学習プラットフォーム)をカバー。 ツールの選択(Azure ML)と講師のデリバリーの悪さを指摘する星1つのレビューがいくつかある。 18-24時間のコンテンツ(6週間にわたり週3-4時間)。 67件のレビューで3.81星の加重平均評価を得ている。 無料で検証済み証明書が49ドルで利用可能。
- Applied Data Science with R (V2 Maestros/Udemy). 上記V2 MaestrosのPythonコースのRコンパニオンです。 全プロセスをカバーし、各局面のカバーの深さが良い。 11時間という長さも魅力。 212のレビューで3.8星の加重平均評価を得ています。 Udemyの割引によってコストが変わるが、割引は頻繁に行われている。 データサイエンス入門(Udacity):データサイエンス入門(Udacity):データサイエンス入門(Udacity):プロセスに関する部分的なカバー。 Udacityには探索的データ分析(EDA)に関する素晴らしいフルコースがありますが、探索的な側面が欠けています。 48時間(週6時間、8週間)と謳っていますが、私の経験ではもっと短いです。 上級コンテンツへのセットアップが不足しているというレビューもあります。 散漫な印象がある。 Pythonを使用している。 3を搭載している。18件のレビューに基づく加重平均評価で61星。 無料.
- Pythonで学ぶデータサイエンス入門(ミシガン大学/Coursera): プロセスを部分的にカバー。 モデリングと可視化はありませんが、Applied Data Science with Python Specializationの#2, #3のコースはこれらの側面をカバーしています。 この3つのコースをすべて受講すると、このガイドの目的には深すぎるでしょう。 Pythonを使用します。 4週間のコースです。 15のレビューで3.6星の加重平均評価を得ています。
- Data-driven Decision Making (PwC/Coursera).The University of MichiganはPythonを使用する。 ビジネスにフォーカスした部分的なカバー(モデリングを欠く)。 R、Python、Excel、SAS、Tableauなど、多くのツールを紹介。 期間は4週間。 2件のレビューで3.5星の加重平均評価を得ている。 無料と有料のオプションがある。
- A Crash Course in Data Science (Johns Hopkins University/Coursera) データサイエンスのクラッシュコース。 全プロセスの極めて簡潔な概要。 本シリーズの趣旨からすると簡潔すぎる。 長さは2時間。 19件のレビューの加重平均評価で3.4つ星。 無料と有料のオプションがある。
- The Data Scientist’s Toolbox (Johns Hopkins University/Coursera):データサイエンティストのツールボックス。 全プロセスの極めて簡潔な概要。 ジョンズ・ホプキンス大学のデータサイエンス専門科目のためのセットアップコースのようなもの。 4~16時間の内容(4週間で週1~4時間)とされているが、あるレビュアーは2時間で完了できると述べている。 182件のレビューに対する加重平均評価は3.22スター。 無料と有料のオプションがあります。
- Data Management and Visualization (Wesleyan University/Coursera)。 部分的にプロセスをカバー(モデリングが欠けている)。 4週間の長さ。 制作費も安い。 PythonとSASを使用。 6件のレビューで2.67星の加重平均評価を得ている。 無料と有料のオプションがある。
以下のコースは2017年1月現在レビューがない。
- CS109 Data Science (Harvard University). 全プロセスを深くカバー(この連載の趣旨からすると深すぎるかも)。 12週間のフル学部コース。 オンラインを前提としたコースではないので、コースのナビゲーションは難しい。 実際のハーバード大学の講義は映像化されている。 上記のデータサイエンスプロセスインフォグラフィックは、このコースに由来しています。 Pythonを使用。 レビューデータはありません。 無料。
- Introduction to Data Analytics for Business (University of Colorado Boulder/Coursera)。 ビジネスに特化した部分的なプロセスカバー(モデリングや可視化の側面が欠けている)。 データサイエンスのプロセスは、彼らの講義では「Information-Action Value chain」として偽装されている。 期間は4週間。 いくつかのツールについて説明されているが、SQLのみしか深く扱っていない。 レビューデータはない。 無料と有料のオプションあり。
- データサイエンス入門(Lynda)。 データサイエンス入門(Lynda):深さは限定的だが、プロセスを完全にカバーしている。 かなり短い(3時間のコンテンツ)。 RとPythonの両方が紹介されている。 レビューデータなし。
Wrapping it Up
これは、データサイエンス分野への参入に最適なオンラインコースを取り上げた6部構成のシリーズの3つ目です。 第1回目はプログラミング、第2回目は統計と確率を取り上げました。 このシリーズの残りの部分では、他のデータ サイエンスのコア コンピテンシーである、データの視覚化と機械学習について取り上げます。
データ サイエンスを学びたい場合は、これらのプログラミング クラスの 1 つから始めてください。
データ サイエンス オンライン コースの完全なリストをお探しの場合は、Class Central の Data Science and Big Data subject page で見つけることができます。
これを読んで楽しめたなら、Class Central の他の記事もご覧ください。
今すぐオンラインで無料で受講できるアイビーリーグのコース250はこちら
ブラウン、コロンビア、コーネル、ダートマス、ハーバード、ペン、プリンストン、イェールからの 250 MOOCs です。
データで見る、無料のオンライン大学講座ベスト50
2011年11月にClass Centralを立ち上げたとき、無料のオンライン講座は18ほどありましたが、ほとんどすべて…
私が見逃した講座の提案があれば、回答で教えてください!
If you found this helpful, click the ?so more people will see it here on Medium.
This is a condensed version of my original article published on Class Central, there’ve included further course descriptions, syllabi, and multiple reviews.
This is a condensed version of my original article published on Class Central…
If you find this helpful, if they click the ?