Chaque cours d'apprentissage automatique sur Internet, classé en fonction de vos avis

Il y a un an et demi, j'ai abandonné l'un des meilleurs programmes d'informatique au Canada. J'ai commencé à créer mon propre programme de maîtrise en science des données en utilisant des ressources en ligne. J'ai réalisé que je pouvais apprendre tout ce dont j'avais besoin via edX, Coursera et Udacity à la place. Et je pourrais l'apprendre plus rapidement, plus efficacement et pour une fraction du coût.

J'ai presque fini maintenant. J'ai suivi de nombreux cours liés à la science des données et vérifié des parties de beaucoup d'autres. Je connais les options disponibles et les compétences nécessaires pour les apprenants qui se préparent à un rôle d'analyste de données ou de scientifique de données.J'ai donc commencé à créer un guide axé sur la révision qui recommande les meilleurs cours pour chaque sujet de la science des données.

Pour le premier guide de la série, j'ai recommandé quelques cours de codage pour le data scientist débutant. Ensuite, ce sont les statistiques et les classes de probabilité. Puis introductions à la science des données. Aussi, visualisation des données.

Passons maintenant à l'apprentissage automatique.

Pour ce guide, j'ai passé une douzaine d'heures à essayer d'identifier chaque cours d'apprentissage automatique en ligne proposé à partir de mai 2017, à extraire des informations clés de leurs programmes et critiques, et à compiler leurs notes. Mon objectif final était d'identifier les trois meilleurs cours disponibles et de vous les présenter ci-dessous.

Pour cette tâche, je me suis tourné vers nul autre que la communauté open source Class Central et sa base de données de milliers de notes et de critiques de cours.

Depuis 2011, le fondateur de Class Central, Dhawal Shah, a surveillé de plus près les cours en ligne que quiconque dans le monde. Dhawal m'a personnellement aidé à rassembler cette liste de ressources.

Comment nous avons choisi les cours à considérer

Chaque cours doit répondre à trois critères:

  1. Il doit contenir une quantité importante de contenu d'apprentissage automatique. Idéalement, l'apprentissage automatique est le sujet principal.Notez que les cours d'apprentissage en profondeur uniquement sont exclus. Plus à ce sujet plus tard.
  2. Il doit être à la demande ou offert tous les quelques mois.
  3. Il doit s'agir d'un cours en ligne interactif, donc pas de livres ou de didacticiels en lecture seule . Bien que ce soient des moyens d'apprentissage viables, ce guide se concentre sur les cours. Les cours qui sont strictement des vidéos (c'est-à-dire sans quiz, devoirs, etc.) sont également exclus.

Nous pensons avoir couvert tous les cours notables répondant aux critères ci-dessus. Puisqu'il existe apparemment des centaines de cours sur Udemy, nous avons choisi de ne considérer que les cours les plus évalués et les mieux notés.

Cependant, il y a toujours une chance que nous ayons raté quelque chose. Alors s'il vous plaît laissez-nous savoir dans la section commentaires si nous avons laissé un bon cours.

Comment nous avons évalué les cours

Nous avons compilé les notes moyennes et le nombre d'avis de Class Central et d'autres sites d'évaluation pour calculer une note moyenne pondérée pour chaque cours. Nous avons lu des critiques de texte et avons utilisé ces commentaires pour compléter les évaluations numériques.

Nous avons fait des appels de jugement subjectifs du programme en fonction de trois facteurs:

  1. Explication du workflow de machine learning. Le cours décrit-il les étapes nécessaires pour exécuter un projet ML réussi? Consultez la section suivante pour découvrir ce qu'implique un flux de travail typique.
  2. Couverture des techniques et algorithmes d'apprentissage automatique. Une variété de techniques (par exemple régression, classification, regroupement, etc.) et d'algorithmes (par exemple au sein de la classification: Bayes naïfs, arbres de décision, machines vectorielles de support, etc.) sont-elles couvertes ou seulement quelques-uns? La préférence est donnée aux cours qui couvrent plus sans lésiner sur les détails.
  3. Utilisation d'outils communs de science des données et d'apprentissage automatique. Le cours est-il enseigné à l'aide de langages de programmation courants tels que Python, R et / ou Scala? Qu'en est-il des bibliothèques populaires dans ces langues? Ces cours ne sont pas nécessaires, mais utiles, donc une légère préférence est donnée à ces cours.

Qu'est-ce que l'apprentissage automatique? Qu'est-ce qu'un workflow?

Une définition populaire vient d'Arthur Samuel en 1959: l'apprentissage automatique est un sous-domaine de l'informatique qui donne «aux ordinateurs la capacité d'apprendre sans être explicitement programmés». En pratique, cela signifie développer des programmes informatiques capables de faire des prédictions basées sur des données. Tout comme les humains peuvent apprendre de l'expérience, les ordinateurs le peuvent aussi, où données = expérience.

Un flux de travail d'apprentissage automatique est le processus requis pour mener à bien un projet d'apprentissage automatique. Bien que les projets individuels puissent différer, la plupart des workflows partagent plusieurs tâches communes: évaluation des problèmes, exploration des données, prétraitement des données, formation / test / déploiement de modèles, etc. Vous trouverez ci-dessous une visualisation utile de ces étapes principales:

Le cours idéal présente l'ensemble du processus et fournit des exemples interactifs, des devoirs et / ou des quiz où les étudiants peuvent effectuer chaque tâche eux-mêmes.

Ces cours couvrent-ils l'apprentissage profond?

Tout d'abord, définissons l'apprentissage profond. Voici une description succincte:

«L'apprentissage en profondeur est un sous-domaine de l'apprentissage automatique concerné par des algorithmes inspirés de la structure et de la fonction du cerveau, appelés réseaux de neurones artificiels.» - Jason Brownlee de Machine Learning Mastery

Comme on pouvait s'y attendre, certaines parties de certains cours d'apprentissage automatique contiennent du contenu d'apprentissage en profondeur. Cependant, j'ai choisi de ne pas inclure de cours uniquement d'apprentissage en profondeur. Si vous êtes intéressé par l'apprentissage en profondeur en particulier, nous vous proposons l'article suivant:

Plongez dans le Deep Learning avec 12 cours en ligne gratuits

Chaque jour fait la une des journaux sur la façon dont l'apprentissage profond change le monde qui nous entoure. Quelques exemples: medium.freecodecamp.com

Mes trois principales recommandations de cette liste seraient:

  • Applications créatives du Deep Learning avec TensorFlowpar Kadenze
  • Réseaux de neurones pour l'apprentissage automatique de l'Université de Toronto (enseigné par Geoffrey Hinton) via Coursera
  • Deep Learning AZ ™: Réseaux de neurones artificiels pratiques

    par Kirill Eremenko, Hadelin de Ponteves et l'équipe SuperDataScience via Udemy

Prérequis recommandés

Plusieurs cours énumérés ci-dessous demandent aux étudiants d'avoir une expérience préalable en programmation, calcul, algèbre linéaire et statistique. Ces prérequis sont compréhensibles étant donné que l'apprentissage automatique est une discipline avancée.

Il manque quelques sujets? Bonnes nouvelles! Une partie de cette expérience peut être acquise grâce à nos recommandations dans les deux premiers articles (programmation, statistiques) de ce guide de carrière en science des données. Plusieurs cours parmi les mieux classés ci-dessous proposent également des actualisations de calcul doux et d'algèbre linéaire et mettent en évidence les aspects les plus pertinents pour l'apprentissage automatique pour les moins familiers.

Notre choix pour le meilleur cours d'apprentissage automatique est…

  • Apprentissage automatique (Université de Stanford via Coursera)

L'apprentissage automatique sur Coursera de l'Université de Stanford est clairement le gagnant actuel en termes de notes, de critiques et d'ajustement du programme. Enseigné par le célèbre Andrew Ng, fondateur de Google Brain et ancien scientifique en chef de Baidu, c'est la classe qui a déclenché la fondation de Coursera. Il a une note moyenne pondérée de 4,7 étoiles sur 422 avis.

Sorti en 2011, il couvre tous les aspects du flux de travail d'apprentissage automatique. Bien qu'il ait une portée plus petite que la classe originale de Stanford sur laquelle il est basé, il parvient toujours à couvrir un grand nombre de techniques et d'algorithmes. Le calendrier estimé est de onze semaines, dont deux semaines consacrées aux réseaux de neurones et à l'apprentissage profond. Des options gratuites et payantes sont disponibles.

Ng est un instructeur dynamique mais doux avec une expérience palpable. Il inspire confiance, en particulier lors du partage de conseils pratiques de mise en œuvre et d'avertissements sur les écueils courants. Un rappel d'algèbre linéaire est fourni et Ng met en évidence les aspects du calcul les plus pertinents pour l'apprentissage automatique.

L'évaluation est automatique et se fait via des quiz à choix multiples qui suivent chaque leçon et les devoirs de programmation. Les affectations (il y en a huit) peuvent être effectuées dans MATLAB ou Octave, qui est une version open-source de MATLAB. Ng explique son choix de langue:

Dans le passé, j'ai essayé d'enseigner l'apprentissage automatique en utilisant une grande variété de langages de programmation différents, notamment C ++, Java, Python, NumPy et aussi Octave ... Et ce que j'ai vu après avoir enseigné l'apprentissage automatique pendant près d'une décennie, c'est que vous apprenez beaucoup plus rapidement si vous utilisez Octave comme environnement de programmation.

Bien que Python et R soient probablement des choix plus convaincants en 2017 avec la popularité croissante de ces langages, les critiques notent que cela ne devrait pas vous empêcher de suivre le cours.

Quelques critiques éminents ont noté ce qui suit:

De longue date dans le monde des MOOC, le cours d'apprentissage automatique de Stanford est vraiment l'introduction définitive à ce sujet. Le cours couvre largement tous les principaux domaines de l'apprentissage automatique… Le professeur Ng précède chaque segment avec une discussion et des exemples motivants.

Andrew Ng est un enseignant doué et capable d'expliquer des sujets compliqués de manière très intuitive et claire, y compris les mathématiques derrière tous les concepts. Hautement recommandé.

Le seul problème que je vois avec ce cours est qu'il place la barre des attentes très haut pour les autres cours.

Une nouvelle introduction à l'Ivy League avec un brillant professeur

  • Apprentissage automatique (Université Columbia via edX)

L'apprentissage automatique de l'Université Columbia est une offre relativement nouvelle qui fait partie de leurs MicroMasters d'intelligence artificielle sur edX. Bien qu'il soit plus récent et qu'il n'ait pas un grand nombre d'avis, ceux qu'il possède sont exceptionnellement solides. Le professeur John Paisley est considéré comme brillant, clair et intelligent. Il a une note moyenne pondérée de 4,8 étoiles sur 10 avis.

Le cours couvre également tous les aspects du flux de travail d'apprentissage automatique et plus d'algorithmes que l'offre de Stanford ci-dessus. Columbia est une introduction plus avancée, les évaluateurs notant que les étudiants doivent être à l'aise avec les prérequis recommandés (calcul, algèbre linéaire, statistiques, probabilités et codage).

Des quiz (11), des travaux de programmation (4) et un examen final sont les modes d'évaluation. Les étudiants peuvent utiliser Python, Octave ou MATLAB pour terminer les devoirs. Le calendrier total estimé du cours est de huit à dix heures par semaine sur douze semaines. Il est gratuit avec un certificat vérifié disponible à l'achat.

Voici quelques-unes des critiques étincelantes susmentionnées:

Au cours de toutes mes années [en tant qu'étudiant], j'ai rencontré des professeurs qui ne sont pas brillants, des professeurs qui sont brillants mais qui ne savent pas comment expliquer clairement les choses, et des professeurs qui sont brillants et savent comment expliquer les choses clairement. Le Dr Paisley appartient au troisième groupe.

C'est un super cours… Le langage de l'instructeur est précis et c'est, à mon sens, l'un des points forts du cours. Les conférences sont de haute qualité et les diapositives aussi.

Le Dr Paisley et son superviseur sont… des étudiants de Michael Jordan, le père de l'apprentissage automatique. [Dr. Paisley] est le meilleur professeur de ML à Columbia en raison de sa capacité à expliquer clairement les choses. Jusqu'à 240 étudiants ont choisi son cours ce semestre, le plus grand nombre parmi tous les professeurs [enseignant] l'apprentissage automatique à Columbia.

Une introduction pratique en Python & R par des experts de l'industrie

  • Machine Learning AZ ™: Python pratique et R en science des données (Kirill Eremenko, Hadelin de Ponteves et l'équipe SuperDataScience via Udemy)

Machine Learning AZ ™ sur Udemy est une offre incroyablement détaillée qui fournit des instructions à la fois en Python et en R, ce qui est rare et ne peut être dit pour aucun des autres meilleurs cours. Il a une note moyenne pondérée de 4,5 étoiles sur 8 119 avis, ce qui en fait le cours le plus évalué de ceux considérés.

Il couvre l'ensemble du flux de travail d'apprentissage automatique et un nombre presque ridicule (dans le bon sens) d'algorithmes à travers 40,5 heures de vidéo à la demande. Le cours adopte une approche plus appliquée et est plus léger en mathématiques que les deux cours ci-dessus. Chaque section commence par une vidéo «intuition» d'Eremenko qui résume la théorie sous-jacente du concept enseigné. de Ponteves parcourt ensuite l'implémentation avec des vidéos séparées pour Python et R.

En prime, le cours comprend des modèles de code Python et R que les étudiants peuvent télécharger et utiliser dans leurs propres projets. Il y a des quiz et des défis de devoirs, bien que ce ne soient pas les points forts du cours.

Eremenko et l'équipe SuperDataScience sont vénérés pour leur capacité à «simplifier le complexe». En outre, les prérequis énumérés sont «juste quelques mathématiques du secondaire», donc ce cours pourrait être une meilleure option pour ceux qui sont découragés par les offres de Stanford et de Columbia.

Quelques critiques éminents ont noté ce qui suit:

Le cours est produit par des professionnels, la qualité sonore est excellente et les explications sont claires et concises… C'est une valeur incroyable pour votre investissement financier et en temps.

C'était spectaculaire de pouvoir suivre le cours dans deux langages de programmation différents simultanément.

Kirill est l'un des meilleurs instructeurs absolus sur Udemy (sinon sur Internet) et je recommande de suivre tous les cours qu'il enseigne. … Ce cours a une tonne de contenu, comme une tonne!

La compétition

Notre choix n ° 1 a obtenu une note moyenne pondérée de 4,7 sur 5 étoiles sur 422 avis. Regardons les autres alternatives, triées par note décroissante. Un rappel que les cours d'apprentissage en profondeur uniquement ne sont pas inclus dans ce guide - vous pouvez les trouver ici.

The Analytics Edge (Massachusetts Institute of Technology / edX): Plus axé sur l'analyse en général, bien qu'il couvre plusieurs sujets d'apprentissage automatique. Utilise R. Un récit fort qui tire parti d'exemples familiers du monde réel. Difficile. Dix à quinze heures par semaine pendant douze semaines. Gratuit avec un certificat vérifié disponible à l'achat. Il a une note moyenne pondérée de 4,9 étoiles sur 214 avis.

Python for Data Science and Machine Learning Bootcamp (Jose Portilla / Udemy): contient de gros morceaux de contenu d'apprentissage automatique, mais couvre l'ensemble du processus de science des données. Plus d'une introduction très détaillée à Python. Bien sûr incroyable, mais pas idéal pour la portée de ce guide. 21,5 heures de vidéo à la demande. Le coût varie en fonction des remises Udemy, qui sont fréquentes. Il a une note moyenne pondérée de 4,6 étoiles sur 3316 avis.

Bootcamp sur la science des données et l'apprentissage automatique avec R (Jose Portilla / Udemy): Les commentaires pour le cours ci-dessus de Portilla s'appliquent également ici, sauf pour R. 17,5 heures de vidéo à la demande. Le coût varie en fonction des remises Udemy, qui sont fréquentes. Il a une note moyenne pondérée de 4,6 étoiles sur 1317 avis.

Série d'apprentissage automatique (Lazy Programmer Inc./Udemy): enseigné par un scientifique des données / ingénieur Big Data / ingénieur logiciel full stack avec un CV impressionnant, Lazy Programmer propose actuellement une série de 16 cours axés sur l'apprentissage automatique sur Udemy. Au total, les cours ont plus de 5000 notes et presque tous ont 4,6 étoiles. Un ordre de cours utile est fourni dans la description de chaque cours. Utilise Python. Le coût varie en fonction des remises Udemy, qui sont fréquentes.

Machine Learning (Georgia Tech / Udacity): Une compilation de ce qui était trois cours distincts: apprentissage supervisé, non supervisé et par renforcement. Fait partie de Nanodegree, ingénieur en apprentissage automatique d'Udacity et de la maîtrise en ligne (OMS) de Georgia Tech. Des vidéos de taille bouchée, tout comme le style d'Udacity. Professeurs sympathiques. Délai estimé de quatre mois. Libre. Il a une note moyenne pondérée de 4,56 étoiles sur 9 avis.

Implémentation de l'analyse prédictive avec Spark dans Azure HDInsight (Microsoft / edX): présente les concepts de base de l'apprentissage automatique et une variété d'algorithmes. Exploite plusieurs outils compatibles avec le Big Data, notamment Apache Spark, Scala et Hadoop. Utilise à la fois Python et R. Quatre heures par semaine pendant six semaines. Gratuit avec un certificat vérifié disponible à l'achat. Il a une note moyenne pondérée de 4,5 étoiles sur 6 avis.

Science des données et apprentissage automatique avec Python - Pratique! (Frank Kane / Udemy): utilise Python. Kane a neuf ans d'expérience chez Amazon et IMDb. Neuf heures de vidéo à la demande. Le coût varie en fonction des remises Udemy, qui sont fréquentes. Il a une note moyenne pondérée de 4,5 étoiles sur 4139 avis.

Scala et Spark pour le Big Data et le Machine Learning (Jose Portilla / Udemy): Focus «Big data», en particulier sur l'implémentation dans Scala et Spark. Dix heures de vidéo à la demande. Le coût varie en fonction des remises Udemy, qui sont fréquentes. Il a une note moyenne pondérée de 4,5 étoiles sur 607 avis.

Ingénieur en apprentissage automatique Nanodegree (Udacity): le programme phare d'apprentissage automatique d'Udacity, qui comprend un système de revue de projet et un soutien de carrière de premier ordre. Le programme est une compilation de plusieurs cours Udacity individuels, qui sont gratuits. Co-créé par Kaggle. Délai estimé de six mois. Coûte actuellement 199 USD par mois avec un remboursement de 50% des frais de scolarité disponible pour ceux qui obtiennent leur diplôme dans les 12 mois. Il a une note moyenne pondérée de 4,5 étoiles sur 2 avis.

Learning From Data (Introductory Machine Learning) (California Institute of Technology / edX): L'inscription est actuellement fermée sur edX, mais est également disponible via la plateforme indépendante de CalTech (voir ci-dessous). Il a une note moyenne pondérée de 4,49 étoiles sur 42 avis.

Learning From Data (Introduction à l'apprentissage automatique) (Yaser Abu-Mostafa / California Institute of Technology): «Un vrai cours Caltech, pas une version édulcorée.» Les critiques indiquent qu'il est excellent pour comprendre la théorie de l'apprentissage automatique. Le professeur Yaser Abu-Mostafa est populaire parmi les étudiants et a également écrit le manuel sur lequel ce cours est basé. Les vidéos sont des conférences enregistrées (avec des diapositives d'images dans l'image) téléchargées sur YouTube. Les devoirs sont des fichiers .pdf. L'expérience des cours pour les étudiants en ligne n'est pas aussi raffinée que les trois principales recommandations. Il a une note moyenne pondérée de 4,43 étoiles sur 7 avis.

Mining Massive Datasets (Stanford University): apprentissage automatique axé sur le «big data». Introduit les systèmes de fichiers distribués modernes et MapReduce. Dix heures par semaine pendant sept semaines. Libre. Il a une note moyenne pondérée de 4,4 étoiles sur 30 avis.

AWS Machine Learning: un guide complet avec Python (Chandra Lingam / Udemy): un focus unique sur l'apprentissage automatique basé sur le cloud et plus particulièrement sur Amazon Web Services. Utilise Python. Neuf heures de vidéo à la demande. Le coût varie en fonction des remises Udemy, qui sont fréquentes. Il a une note moyenne pondérée de 4,4 étoiles sur 62 avis.

Introduction à l'apprentissage automatique et à la détection des visages en Python (Holczer Balazs / Udemy): utilise Python. Huit heures de vidéo à la demande. Le coût varie en fonction des remises Udemy, qui sont fréquentes. Il a une note moyenne pondérée de 4,4 étoiles sur 162 avis.

StatLearning: Statistical Learning (Stanford University): Basé sur l'excellent manuel «An Introduction to Statistical Learning, with Applications in R» et enseigné par les professeurs qui l'ont rédigé. Les critiques notent que le MOOC n'est pas aussi bon que le livre, citant des exercices «minces» et des vidéos médiocres. Cinq heures par semaine pendant neuf semaines. Libre. Il a une note moyenne pondérée de 4,35 étoiles sur 84 avis.

Spécialisation en apprentissage automatique (Université de Washington / Coursera): Grands cours, mais les deux derniers cours (y compris le projet de synthèse) ont été annulés. Les critiques notent que cette série est plus digeste (lire: plus facile pour ceux qui n'ont pas de solides connaissances techniques) que d'autres cours d'apprentissage automatique de haut niveau (par exemple, Stanford ou Caltech). Sachez que la série est incomplète avec des systèmes de recommandation, un apprentissage en profondeur et un résumé manquant. Options gratuites et payantes disponibles. Il a une note moyenne pondérée de 4,31 étoiles sur 80 avis.

De 0 à 1: Machine Learning, PNL et Python-Cut to the Chase (Loony Corn / Udemy): "Une approche terre-à-terre, timide mais confiante des techniques d'apprentissage automatique." Enseigné par une équipe de quatre personnes avec des décennies d'expérience dans l'industrie ensemble. Utilise Python. Le coût varie en fonction des remises Udemy, qui sont fréquentes. Il a une note moyenne pondérée de 4,2 étoiles sur 494 avis.

Principes de l'apprentissage automatique (Microsoft / edX): utilise R, Python et Microsoft Azure Machine Learning. Fait partie du certificat du programme professionnel Microsoft en science des données. Trois à quatre heures par semaine pendant six semaines. Gratuit avec un certificat vérifié disponible à l'achat. Il a une note moyenne pondérée de 4,09 étoiles sur 11 avis.

Big Data: Statistical Inference and Machine Learning (Queensland University of Technology / FutureLearn): Un cours de machine learning exploratoire court et agréable axé sur le Big Data. Couvre quelques outils tels que R, H2O Flow et WEKA. Seulement trois semaines, à raison de deux heures par semaine recommandées, mais un examinateur a noté que six heures par semaine seraient plus appropriées. Options gratuites et payantes disponibles. Il a une note moyenne pondérée de 4 étoiles sur 4 avis.

Genomic Data Science and Clustering (Bioinformatics V) (University of California, San Diego / Coursera): Pour ceux qui s'intéressent à l'intersection de l'informatique et de la biologie et à la manière dont elle représente une frontière importante dans la science moderne. Se concentre sur le regroupement et la réduction de la dimensionnalité. Une partie de la spécialisation en bioinformatique de l'UCSD. Options gratuites et payantes disponibles. Il a une note moyenne pondérée de 4 étoiles sur 3 avis.

Introduction à l'apprentissage automatique (Udacity): donne la priorité à l'étendue du sujet et aux outils pratiques (en Python) par rapport à la profondeur et à la théorie. Les instructeurs, Sebastian Thrun et Katie Malone, rendent ce cours si amusant. Se compose de vidéos et de quiz de la taille d'une bouchée, suivis d'un mini-projet pour chaque leçon. Fait actuellement partie de Nanodegree, Data Analyst d'Udacity. Délai estimé de dix semaines. Libre. Il a une note moyenne pondérée de 3,95 étoiles sur 19 avis.

Machine Learning for Data Analysis (Wesleyan University / Coursera): Une brève introduction à l'apprentissage automatique et quelques algorithmes sélectionnés. Couvre les arbres de décision, les forêts aléatoires, la régression lasso et le clustering k-means. Fait partie de la spécialisation en analyse et interprétation des données de Wesleyan. Délai estimé de quatre semaines. Options gratuites et payantes disponibles. Il a une note moyenne pondérée de 3,6 étoiles sur 5 avis.

Programmation avec Python pour la science des données (Microsoft / edX): Produit par Microsoft en partenariat avec Coding Dojo. Utilise Python. Huit heures par semaine pendant six semaines. Options gratuites et payantes disponibles. Il a une note moyenne pondérée de 3,46 étoiles sur 37 avis.

Machine Learning for Trading (Georgia Tech / Udacity): se concentre sur l'application d'approches probabilistes d'apprentissage automatique aux décisions commerciales. Utilise Python. Fait partie de Nanodegree, ingénieur en apprentissage automatique d'Udacity et de la maîtrise en ligne (OMS) de Georgia Tech. Délai estimé de quatre mois. Libre. Il a une note moyenne pondérée de 3,29 étoiles sur 14 avis.

Apprentissage automatique pratique (Université Johns Hopkins / Coursera): une brève introduction pratique à un certain nombre d'algorithmes d'apprentissage automatique. Plusieurs critiques d'une ou deux étoiles exprimant diverses préoccupations. Fait partie de la spécialisation en science des données de JHU. Quatre à neuf heures par semaine pendant quatre semaines. Options gratuites et payantes disponibles. Il a une note moyenne pondérée de 3,11 étoiles sur 37 avis.

Machine Learning for Data Science and Analytics (Columbia University / edX): présente un large éventail de sujets d'apprentissage automatique. Quelques critiques négatives passionnées avec des préoccupations telles que les choix de contenu, un manque d'affectations de programmation et une présentation sans intérêt. Sept à dix heures par semaine pendant cinq semaines. Gratuit avec un certificat vérifié disponible à l'achat. Il a une note moyenne pondérée de 2,74 étoiles sur 36 avis.

Spécialisation des systèmes de recommandation (Université du Minnesota / Coursera): Forte concentration sur un type spécifique d'apprentissage automatique - systèmes de recommandation. Une spécialisation de quatre cours plus un projet de synthèse, qui est une étude de cas. Enseigné à l'aide de LensKit (une boîte à outils open-source pour les systèmes de recommandation). Options gratuites et payantes disponibles. Il a une note moyenne pondérée de 2 étoiles sur 2 avis.

Machine Learning With Big Data (Université de Californie, San Diego / Coursera): critiques terribles qui mettent en évidence une instruction et une évaluation médiocres. Certains ont noté qu'il ne leur a fallu que quelques heures pour terminer l'ensemble du cours. Fait partie de la spécialisation Big Data de l'UCSD. Options gratuites et payantes disponibles. Il a une note moyenne pondérée de 1,86 étoiles sur 14 avis.

Practical Predictive Analytics: Models and Methods (University of Washington / Coursera): une brève introduction aux concepts de base de l'apprentissage automatique. Un évaluateur a noté qu'il y avait un manque de quiz et que les affectations n'étaient pas difficiles. Fait partie de la spécialisation Data Science at Scale de UW. Six à huit heures par semaine pendant quatre semaines. Options gratuites et payantes disponibles. Il a une note moyenne pondérée de 1,75 étoiles sur 4 avis.

Les cours suivants avaient une ou aucune évaluation en mai 2017.

Apprentissage automatique pour les musiciens et les artistes (Goldsmiths, Université de Londres / Kadenze): Unique. Les étudiants apprennent les algorithmes, les outils logiciels et les meilleures pratiques d'apprentissage automatique pour donner un sens aux gestes humains, à l'audio musical et à d'autres données en temps réel. Sept sessions de longueur. Options d'audit (gratuit) et premium (10 USD par mois) disponibles. Il a un avis 5 étoiles.

Apprentissage automatique appliqué en Python (Université du Michigan / Coursera): Enseigné à l'aide de Python et de la boîte à outils scikit learn. Fait partie de la spécialisation Applied Data Science with Python. Prévu pour commencer le 29 mai. Options gratuites et payantes disponibles.

Apprentissage automatique appliqué (Microsoft / edX): Enseigné à l'aide de divers outils, notamment Python, R et Microsoft Azure Machine Learning (note: Microsoft produit le cours). Comprend des laboratoires pratiques pour renforcer le contenu de la conférence. Trois à quatre heures par semaine pendant six semaines. Gratuit avec un certificat vérifié disponible à l'achat.

Machine Learning avec Python (Big Data University): Enseigné en utilisant Python. Destiné aux débutants. Temps de réalisation estimé à quatre heures. La Big Data University est affiliée à IBM. Libre.

Apprentissage automatique avec Apache SystemML (Big Data University): enseigné à l'aide d'Apache SystemML, un langage de style déclaratif conçu pour l'apprentissage automatique à grande échelle. Temps d'achèvement estimé à huit heures. La Big Data University est affiliée à IBM. Libre.

Machine Learning for Data Science (University of California, San Diego / edX): ne sera lancé qu'en janvier 2018. Les exemples de programmation et les affectations sont en Python, à l'aide de blocs-notes Jupyter. Huit heures par semaine pendant dix semaines. Gratuit avec un certificat vérifié disponible à l'achat.

Introduction à la modélisation analytique (Georgia Tech / edX): Le cours présente R comme son principal outil de programmation. Cinq à dix heures par semaine pendant dix semaines. Gratuit avec un certificat vérifié disponible à l'achat.

Predictive Analytics: Gaining Insights from Big Data (Queensland University of Technology / FutureLearn): bref aperçu de quelques algorithmes. Utilise la plateforme Vertica Analytics de Hewlett Packard Enterprise comme outil appliqué. Date de début à être annoncée. Deux heures par semaine pendant quatre semaines. Gratuit avec un certificat de réussite disponible à l'achat.

Introduction à l'apprentissage automatique (Universitas Telefónica / Miríada X): Enseigné en espagnol. Une introduction à l'apprentissage automatique qui couvre l'apprentissage supervisé et non supervisé. Un total de vingt heures estimées sur quatre semaines.

Étape du parcours d'apprentissage automatique (Dataquest): enseigné en Python à l'aide de la plate-forme interactive dans le navigateur de Dataquest. Plusieurs projets guidés et un projet «plus» où vous créez votre propre système d'apprentissage automatique en utilisant vos propres données. Abonnement requis.

Les six cours suivants sont proposés par DataCamp. Le style d'enseignement hybride de DataCamp exploite des instructions vidéo et textuelles avec de nombreux exemples via un éditeur de code intégré au navigateur. Un abonnement est requis pour un accès complet à chaque cours.

Introduction à l'apprentissage automatique (DataCamp): couvre les algorithmes de classification, de régression et de clustering. Utilise R. Quinze vidéos et 81 exercices avec un calendrier estimé à six heures.

Apprentissage supervisé avec scikit-learn (DataCamp): utilise Python et scikit-learn. Couvre les algorithmes de classification et de régression. Dix-sept vidéos et 54 exercices avec un calendrier estimé à quatre heures.

Apprentissage non supervisé en R (DataCamp): Fournit une introduction de base au clustering et à la réduction de dimensionnalité dans R. Seize vidéos et 49 exercices avec un calendrier estimé à quatre heures.

Machine Learning Toolbox (DataCamp): enseigne les «grandes idées» de l'apprentissage automatique. Utilise des vidéos R. 24 et 88 exercices avec un calendrier estimé à quatre heures.

Apprentissage automatique avec les experts: budgets scolaires (DataCamp): étude de cas d'un concours d'apprentissage automatique sur DrivenData. Implique la construction d'un modèle pour classer automatiquement les éléments dans le budget d'une école. «L'apprentissage supervisé avec scikit-learn» de DataCamp est une condition préalable. Quinze vidéos et 51 exercices avec un calendrier estimé à quatre heures.

Apprentissage non supervisé en Python (DataCamp): couvre une variété d'algorithmes d'apprentissage non supervisé utilisant Python, scikit-learn et scipy. Le cours se termine par la construction par les étudiants d'un système de recommandation pour recommander des artistes musicaux populaires. Treize vidéos et 52 exercices avec un calendrier estimé à quatre heures.

Apprentissage automatique (Tom Mitchell / Université Carnegie Mellon): cours d'introduction à l'apprentissage automatique des diplômés de Carnegie Mellon. Une condition préalable à leur deuxième cours de deuxième cycle, «Statistical Machine Learning». Des conférences universitaires enregistrées avec des problèmes de pratique, des devoirs et une mi-session (toutes avec des solutions) publiées en ligne. Une version 2011 du cours existe également. La CMU est l'une des meilleures écoles supérieures pour étudier l'apprentissage automatique et dispose d'un département entier dédié au ML. Libre.

Apprentissage automatique statistique (Larry Wasserman / Université Carnegie Mellon): probablement le cours le plus avancé de ce guide. Un suivi du cours d'apprentissage automatique de Carnegie Mellon. Des conférences universitaires enregistrées avec des problèmes de pratique, des devoirs et une mi-session (toutes avec des solutions) publiées en ligne. Libre.

Apprentissage automatique de premier cycle (Nando de Freitas / Université de la Colombie-Britannique): un cours d'apprentissage automatique de premier cycle. Les conférences sont filmées et mises sur YouTube avec les diapositives publiées sur le site Web du cours. Les devoirs de cours sont également affichés (pas de solution, cependant). de Freitas est maintenant professeur à plein temps à l'Université d'Oxford et reçoit des éloges pour ses capacités d'enseignement dans divers forums. Version diplômée disponible (voir ci-dessous).

Apprentissage automatique (Nando de Freitas / Université de la Colombie-Britannique): un cours d’apprentissage automatique aux cycles supérieurs Les commentaires dans le cours de premier cycle de de Freitas (ci-dessus) s'appliquent également ici.

Emballer

Ceci est le cinquième d'une série de six articles qui couvre les meilleurs cours en ligne pour vous lancer dans le domaine de la science des données. Nous avons couvert la programmation dans le premier article, les statistiques et les probabilités dans le deuxième article, les introductions à la science des données dans le troisième article et la visualisation des données dans le quatrième.

J'ai classé chaque cours d'introduction à la science des données sur Internet, sur la base de milliers de points de données

Il y a un an, j'ai abandonné l'un des meilleurs programmes d'informatique au Canada. J'ai commencé à créer mes propres données…

La dernière pièce sera un résumé de ces articles, ainsi que les meilleurs cours en ligne sur d'autres sujets clés tels que la gestion des données, les bases de données et même le génie logiciel.

Si vous recherchez une liste complète des cours en ligne sur la science des données, vous pouvez les trouver sur la page thématique Science des données et Big Data de Class Central.

Si vous avez aimé lire ceci, consultez quelques-unes des autres pièces de Class Central:

Voici 250 cours de l'Ivy League que vous pouvez suivre gratuitement en ligne dès maintenant

250 MOOC de Brown, Columbia, Cornell, Dartmouth, Harvard, Penn, Princeton et Yale.

Les 50 meilleurs cours universitaires en ligne gratuits selon les données

Lorsque j'ai lancé Class Central en novembre 2011, il y avait environ 18 cours en ligne gratuits, et presque tous…

Si vous avez des suggestions de cours que j'ai manqués, faites-le moi savoir dans les réponses!

Si vous avez trouvé cela utile, cliquez sur le? donc plus de gens le verront ici sur Medium.

Ceci est une version condensée de mon article original publié sur Class Central, où j'ai inclus des programmes de cours détaillés.