Révision: Programme Nanodegree Udacity Data Analyst

Le programme Data Analyst Nanodegree d'Udacity a été l'un des premiers programmes de science des données en ligne de la révolution de l'éducation en ligne. Il vise à «vous assurer de maîtriser les compétences exactes nécessaires pour construire une carrière dans la science des données». At-il atteint son objectif? Est-ce la meilleure option disponible?

J'ai terminé le programme à l'automne 2016. En m'inspirant du modèle de révision open source de Class Central, voici ma critique du programme Data Analyst Nanodegree d'Udacity.

MISE À JOUR: Le programme Data Analyst Nanodegree a été actualisé avec de nouveaux contenus et services aux étudiants en septembre 2017. Détails ici. J'ai également été engagé pour aider à recréer une partie de ce nouveau contenu. La majorité de cet examen est inchangé. Les mises à jour factuelles sont indiquées par une police italique.

Informations d'arrière-plan

Qu'est-ce qui m'a décidé à suivre ce programme?

Début 2016, j'ai commencé à créer mon propre programme de maîtrise en science des données à l'aide de ressources en ligne. (Vous pouvez lire à ce sujet ici.) Je me suis inscrit au programme Data Analyst Nanodegree pour plusieurs raisons:

  • Je voulais un guide pour mon introduction à la science des données.
  • Je voulais un programme cohérent plutôt que des cours individuels de divers fournisseurs.
  • Il a reçu des critiques stellaires.
  • J'avais suivi quelques cours Udacity auparavant et j'étais fan de leur style d'enseignement.

Quels étaient mes objectifs?

Bien que le programme puisse servir de passerelle vers un travail (nous en reparlerons plus tard), je voulais utiliser le programme comme une introduction à du matériel plus avancé. Ce «matériel plus avancé» s'applique à la fois aux sujets qui sont couverts dans le programme et aux sujets qui ne le sont pas.

Qu'est-ce qu'un programme Udacity Nanodegree?

Udacity est l'un des principaux fournisseurs d'éducation en ligne. Sebastian Thrun, ancien professeur de Stanford et fondateur de Google X, a fondé la société et se concentre sur l'innovation chez Udacity en tant que président et président. Vish Makhijani est PDG.

Les programmes Nanodegree sont des informations d'identification en ligne fournies par Udacity. Ce sont des compilations de cours Udacity (certains disponibles gratuitement, d'autres non) auxquels sont attachés des projets, qui sont examinés par les réviseurs de projets rémunérés d'Udacity. Ils viennent également avec un tas de services aux étudiants.

Slack est utilisé comme un outil communautaire, où les étudiants d'Udacity peuvent interagir avec d'autres étudiants ainsi qu'avec les instructeurs de leur programme et d'autres membres du personnel d'Udacity. Dans la plupart des programmes, les étudiants ont assigné des mentors et communiquent avec eux via un canal de discussion privé toujours disponible dans la classe Udacity.

Le programme Data Analyst Nanodegree a été lancé en 2014. Il s'agissait du deuxième programme Nanodegree d'Udacity. Bien qu'il ait subi quelques changements au fil des ans, le cœur du programme est intact.

Qui sont les instructeurs et quels sont leurs parcours?

Parce que le programme Data Analyst Nanodegree est une compilation de cours Udacity (encore une fois, certains gratuits, d'autres non), il existe plusieurs instructeurs. Leurs CV incluent souvent des rôles prestigieux dans de grandes entreprises technologiques et des diplômes des meilleures écoles américaines.

Ce ne sont pas des «instructeurs» en soi, mais les réviseurs de projets, les mentors et le personnel de l'expérience des étudiants d' Udacity (qui surveillent Slack avec les instructeurs) sont parmi les personnes avec lesquelles vous interagissez le plus. Ils sont tellement, tellement utiles. Plus à ce sujet plus tard.

Coût

Le programme est divisé en deux termes. Le premier terme coûte 499 USD. Le deuxième terme coûte 699 $ USD. Si vous avez une bonne compréhension des compétences enseignées au premier trimestre, vous pouvez l'ignorer, terminer le deuxième trimestre uniquement et toujours obtenir le diplôme.

Prérequis recommandés

Pour la session 1, Udacity recommande aux étudiants de se familiariser avec les statistiques descriptives et d'avoir une certaine expérience de travail avec des données dans des feuilles de calcul ou SQL.

Pour le semestre 2, les étudiants doivent avoir une expérience de l'analyse de données à l'aide de Python, ainsi qu'une solide compréhension des statistiques inférentielles et de leurs applications.

Mon parcours / mes compétences en entrant dans le programme

J'ai commencé le programme en mai 2016 alors que j'avais quelques mois d'expérience en programmation, principalement en C et Python. La grande majorité de cette expérience provient du module de transition de mon programme de maîtrise en science des données, où j'ai suivi le programme CS50: Introduction à l'informatique de Harvard et le programme Intro to Programming Nanodegree d'Udacity.

J'avais également terminé mon programme de premier cycle en génie chimique et j'avais 24 mois d'expérience professionnelle liée au quantification. Cela signifiait que j'avais suivi plusieurs cours de statistique et que j'étais à l'aise avec les données.

Le programme

Structure

Le programme Data Analyst Nanodegree est divisé en deux termes. Chaque trimestre comprend trois cours et quatre projets (le projet supplémentaire étant un projet d'introduction qui vous aide à vous habituer à l'environnement d'apprentissage Udacity). Mat Leonard, responsable du programme au moment de la mise à jour, est présent tout au long du programme alors qu'il présente chaque cours, son objectif dans le programme et son ou ses instructeurs.

Le contenu du cours est composé d'une combinaison de vidéos, de texte et de quiz. Les vidéos ont tendance à durer de 30 secondes à cinq minutes, selon le style d'Udacity. Les quiz notés automatiquement suivent souvent ces courtes vidéos. Ces quiz sont généralement des tâches à choix multiples, à remplir dans le vide ou de petites tâches de programmation. Après l'acquisition de CloudLabs, ces tâches de programmation sont désormais effectuées dans Jupyter Notebook et les environnements de codage SQL de la classe Udacity.

Encore une fois, chaque section a un projet noté. Ces projets et les commentaires des réviseurs de projets rémunérés d'Udacity sont les principaux avantages pour les étudiants.

Programme

Mon édition du programme comportait sept parties:

  • P1: Statistiques descriptives et inférentielles
  • P2: Introduction à l'analyse des données (avec NumPy et pandas)
  • P3: Data Wrangling avec MongoDB (ou SQL)
  • P4: Analyse exploratoire des données (avec R)
  • P5: Introduction à l'apprentissage automatique
  • P6: Visualisation des données avec D3.js
  • P7: Concevoir un test A / B

Le premier terme du nouveau programme s'appelle Data Analysis avec Python et SQL . Les cours et projets comprennent:

  • Projet d'introduction: Explorez les tendances météorologiques. SQL et les feuilles de calcul (ou Python / R si vous êtes déjà familier) sont utilisés pour analyser et visualiser les données de température.
  • Cours: Introduction à Python. Projet: Explorez les données US Bikeshare.
  • Cours: Introduction à l'analyse des données, qui comprend le processus d'analyse des données et SQL pour l'analyse des données. Projet: étudier un ensemble de données.
  • Cours: Statistiques pratiques. Projet: Analyser les résultats des tests A / B.

Le deuxième terme est appelé Analyse avancée des données . Les cours et projets comprennent:

  • Projet d'introduction: tester un phénomène perceptif. Calculez des statistiques descriptives et effectuez un test statistique sur un ensemble de données basé sur un phénomène psychologique appelé effet Stroop.
  • Cours: Data Wrangling (avec Python). Projet: Wrangle et Analyze Data. C'est le cours et le projet que j'ai créés. ?
  • Cours: Analyse exploratoire des données (avec R). Projet: Explorer et résumer les données.
  • Cours: Storytelling de données (avec Tableau). Projet: créez une histoire Tableau.

Les grands changements, avec tous les détails décrits dans cet article de blog:

  • Python est maintenant enseigné dans le programme.
  • L'apprentissage automatique et les tests A / B sont désormais inclus en tant que matériel facultatif et ne sont plus nécessaires pour obtenir un diplôme du programme. Raisonnement: «L'objectif de ce programme est de vous préparer aux emplois d'analyste de données. Nos recherches montrent que l'apprentissage automatique n'est pas une exigence pour la grande majorité des postes d'analyste de données. » Les bases des tests A / B sont désormais couvertes dans le nouveau cours de statistiques pratiques, donnant aux étudiants l'exposition dont ils auront besoin au travail.
  • Nouveaux cours et projets. Plus précisément, introduction à l'analyse des données (qui comprend Python pour l'analyse des données et SQL pour l'analyse des données), les statistiques pratiques (enseignées par Sebastian Thrun) et la lutte contre les données.

Notation

Les projets sont notés sur une base de réussite / échec (officiellement, «répond aux spécifications» et «nécessite des modifications») selon une rubrique unique. Votre projet doit satisfaire toutes les sections de la rubrique. Si tous vos projets répondent aux spécifications, vous obtenez votre diplôme. Cela signifie que les quiz notés automatiquement ne comptent pas pour votre note.

Si une soumission de projet nécessite des modifications, votre réviseur de projet vous donnera des commentaires exploitables. Après avoir implémenté ces modifications, vous pouvez soumettre à nouveau. Il n'y a pas de limite de soumission.

Mon expérience

Chronologie

Le calendrier estimé d'Udacity pour le programme Data Analyst Nanodegree était de 378 heures lorsque j'ai commencé, ce qui signifiait que les étudiants prenaient en moyenne 6 à 7 mois pour le terminer. Selon Toggl (une application de suivi du temps), l'ensemble du programme m'a pris 369 heures sur cinq mois. Ce calendrier comprenait consacrer beaucoup de temps à rendre mon portefeuille de projets de qualité, au lieu de produire le minimum pour satisfaire la rubrique réussite / échec.

Le programme a été condensé lors de la mise à jour de l'automne 2017. Le nouveau calendrier estimé est de 260 heures . Chaque trimestre est rythmé à 10 heures par semaine pendant 13 semaines, bien que les étudiants aient 19 semaines pour terminer chaque trimestre.

Comment était le contenu du cours?

Pour mon édition du programme, le contenu du cours de P1 (statistiques), P2 (introduction à l'analyse de données), P4 (analyse de données exploratoire), P5 (apprentissage automatique) et P7 (tests A / B) obtient cinq étoiles sur cinq de moi. P3 (Data Wrangling) et P6 obtiennent trois étoiles et demie.

Le contenu d'analyse exploratoire des données avec les employés de Facebook (P4) était tellement éclairant. Le cours d'introduction à l'apprentissage automatique avec Sebastian Thrun et Katie Malone (P5) a été le plus amusant que j'ai eu dans tous les cours en ligne. Le contenu des tests A / B avec les employés de Google (P7) est tellement unique. Je donnerais à ces trois cours six étoiles si je le pouvais.

Le contenu SQL et Data Wrangling (P3) n'était pas incroyable. Même chose pour le contenu de visualisation de données (P6), bien que ce soit probablement parce que D3.js est très difficile à enseigner aux débutants en JavaScript. Ces opinions ne sont pas rares, selon les critiques de Class Central pour ces cours. Découvrez-les ici et ici.

Ce contenu «pas étonnant» de l'ancien programme a été supprimé lors de la mise à jour de l'automne 2017. Le contenu remanié pour l'introduction à l'analyse des données, SQL, les statistiques, la gestion des données et la visualisation des données est désormais inclus. Le contenu des statistiques pratiques se concentre sur les statistiques inférentielles, les statistiques descriptives étant une condition préalable et enseignées dans le programme Data Foundations Nanodegree. Le cours de visualisation de données est maintenant enseigné avec Tableau au lieu de D3.js.

Comment étaient les projets?

Encore une fois, dans les projets, Udacity se distingue du reste des plates-formes d'éducation en ligne. Ils investissent dans leur processus d'examen de projet et cela est payant. Le programme Data Analyst Nanodegree n'a pas fait exception.

Tous les projets renforcent le contenu que vous avez appris dans les vidéos. Les réviseurs de projets connaissent leur métier. Ils vous indiquent où vous avez réussi et où se trouvent vos erreurs et / ou omissions. Apprentissage supervisé par l'action. Ça marche.

Les forums et les mentors du forum sont particulièrement utiles lorsque vous êtes bloqué. Recherchez dans les forums si votre problème est courant (ils le sont généralement). Pas de chance? Postez vous-même une nouvelle question. Il y a un mentor du forum, Myles Callan, qui semble tout savoir sur tout et répond en quelques heures. Je doute qu'il dorme.

Bien que les forums existent et fonctionnent toujours, Slack et les mentors en classe sont désormais les moyens de soutien recommandés. Les élèves peuvent poster des questions et les réponses sont fournies avec le même niveau d'immédiateté ou plus (en quelques heures et souvent plus tôt). La communauté Slack est supervisée par des instructeurs Udacity ainsi que par leur personnel chargé de l'expérience des étudiants, qui veillent à ce que les questions, commentaires, etc. des étudiants soient traités en temps opportun. Le célèbre Myles Callan est maintenant un mentor.

Si vous êtes curieux de voir à quoi ressemblent ces projets, consultez ce référentiel Github.

A quel point était-ce difficile?

Le contenu des statistiques était facile pour moi car j'avais suivi plusieurs cours de statistiques au premier cycle. Ce serait probablement vrai pour tous les sujets du programme Nanodegree si vous en aviez déjà fait l'expérience.

Je classerais la plupart du programme comme difficulté intermédiaire. Le contenu de la conférence qui ne comporte pas beaucoup de quiz (c'est souvent le cas) peut être un jeu d'enfant, ce qui n'est pas nécessairement une mauvaise chose. Les projets exercent votre cerveau. Chacun vous prendra probablement plus de vingt heures si vous voulez être minutieux.

Le projet d'analyse exploratoire des données a été le plus difficile à réussir. Il m'a fallu 3,5 soumissions. Consultez ce fil Twitter pour plus de détails.

Pouvez-vous postuler à des emplois immédiatement après l'obtention de votre diplôme?

Vous pouvez. Le programme devrait vous doter des compétences requises pour un rôle d'analyste de données d'entrée de gamme si vous le prenez au sérieux. Eli Kastelein en est un parfait exemple. Vous pouvez en savoir plus sur son histoire ci-dessous.

Comment construire une carrière dans la technologie sans diplôme CS

Au printemps 2014, j'étais un nouveau décrochage universitaire dans un bus Greyhound qui ne conduisait nulle part en particulier. medium.com

Vous pouvez également continuer sur des cours plus avancés, à la fois pour les matières couvertes dans le programme et pour d'autres matières. C'est ce que j'ai choisi de faire.

Dernières pensées

Est-ce que je reprendrais le programme en sachant ce que je sais maintenant?

Quelque part vers la fin du programme, j'ai commencé à créer le guide de carrière en science des données de Class Central. Cela impliquait de rechercher chaque cours en ligne proposé pour chaque sujet de la science des données.

Bien que j'aie apprécié la majorité des cours du programme Nanodegree (mise à jour: de nouveaux cours ont remplacé les cours que je n'ai pas appréciés) , il existe des cours d'autres fournisseurs qui reçoivent de meilleures critiques pour certains sujets. Statistiques, par exemple. Si j'avais accès à mon guide lorsque j'ai commencé, j'envisagerais l'itinéraire séparé pour chaque sujet. Les services aux étudiants d'Udacity et le processus d'examen des projets, cependant, sont si efficaces pour l'apprentissage que je prendrais malgré tout le programme Data Analyst Nanodegree.

Si vous êtes le genre de personne qui souhaite une expérience de formation en ligne 100% personnalisée mais qui souhaite profiter des projets et services d'Udacity, recherchez vos cours préférés pour chaque matière (je recommande d'utiliser Class Central), puis inscrivez-vous au programme Nanodegree pour terminer les projets sont quelque chose à considérer.

Les alternatives

Voici les cinq programmes alternatifs que j'envisageais lorsque je me suis inscrit au programme Data Analyst Nanodegree:

  • Spécialisation en science des données de l'Université Johns Hopkins sur Coursera
  • Certificat de programme professionnel de Microsoft en science des données sur edX
  • Spécialisation en analyse et interprétation des données de l'Université Wesleyan sur Coursera
  • Pistes Python et R de DataCamp
  • Parcours Data Analyst et Data Scientist de Dataquest

Remarque: j'ai supprimé mes commentaires sur ces programmes en raison de la politique d'Udacity concernant les commentaires sur d'autres fournisseurs.

Conclusion

Le programme Data Analyst Nanodegree d'Udacity vous donne les compétences de base dont vous avez besoin pour une carrière dans la science des données. Après l'obtention de votre diplôme, vous serez en mesure de cibler vos forces et vos faiblesses et de compléter votre apprentissage si nécessaire. De plus, vous repartirez avec une poignée de projets prêts à l'emploi.

J'ai adoré, tout comme les autres.

★★★★ ¾