Vous avez besoin de ces feuilles de triche si vous vous attaquez aux algorithmes d'apprentissage automatique.

Quand j'ai commencé à apprendre le Machine Learning (ML) il y a deux ans, j'avais de nombreuses questions sur les algorithmes à utiliser, comment les corréler aux ensembles de données, etc. La réponse dépendait de nombreux facteurs tels que la taille des données, la sortie attendue et le calcul disponible. Ressources. J'ai ensuite été présenté aux feuilles de triche ML qui me familiarisaient avec les algorithmes, packages et fonctions fréquemment utilisés.

Cet article contient les trois principales feuilles de triche que je recommanderais à un débutant qui souhaite identifier et appliquer des algorithmes de ML à différents problèmes. Compte tenu de la rapidité avec laquelle ce domaine évolue, les algorithmes de tendance progressent également. Par conséquent, il est important de comprendre les algorithmes qui aident à s'adapter aux domaines d'apprentissage, de classification et de régression supervisés et non supervisés, etc.

Organigramme de l'algorithme SAS

Source: //blogs.sas.com/content/subconsciousmusings/2017/04/12/machine-learning-algorithm-use/

Le blog SAS lui-même est une excellente lecture. Le lien montre comment utiliser la feuille de triche ainsi que des considérations lors du choix d'un algorithme. La feuille de triche montre un organigramme facile à utiliser corrélant les données aux algorithmes.

Feuilles de triche Python et Scikit

La plupart des développeurs travaillent en langage Python ou R pour implémenter les algorithmes ML. Je travaille en Python, donc les deux feuilles de triche suivantes m'ont été très utiles.

Source: //s3.amazonaws.com/assets.datacamp.com/blog_assets/PythonForDataScience.pdf

La feuille de triche Python a été préparée par DataCamp et peut être utilisée comme référence rapide pour vous guider à travers les packages ML Python et les structures de données.

Source: //s3.amazonaws.com/assets.datacamp.com/blog_assets/Scikit_Learn_Cheat_Sheet_Python.pdf

Scikit-learn est une bibliothèque Python open source qui implémente une grande variété de ML, de prétraitement des données et de validation croisée ainsi que la visualisation d'algorithmes. Cette bibliothèque fait partie des incontournables de tous les aspirants data scientist, je recommande donc vivement cette aide-mémoire.

Carte d'apprentissage automatique conviviale

Source: //scikit-learn.org/stable/tutorial/machine_learning_map/

Cette feuille de triche est disponible sur les didacticiels scikit-learn et est l'un des organigrammes les plus faciles à comprendre et à utiliser. Au lien ci-dessus, vous avez le flux complet pour résoudre un problème de ML, et vous pouvez également cliquer sur n'importe quel algorithme sur la carte pour comprendre son implémentation.

Partagez et apprenez! Ajoutez votre feuille de triche préférée dans les commentaires ci-dessous.