15 pasos para ser un Científico de Datos
- Feb 10, 2016
- 3 min read
Data Scientist, Científico de Datos, Ingeniero de Datos ...
Has escuchado estas pablaras últimamente? espero que sí porque en los próximos años sera la ocupación o carrera mas HOT en el mundo de la computación.

A continuación presento 15 pasos para comenzar la carrera de "Data Scientist". Digo comenzar porque, al igual que en cualquier otro campo, es la experiencia y 10.000 (diez mil) horas de prática lo que hace a un individuo bueno en algo.
El internet es infinito, y fuentes de información sobre este campo son innumerables. Unas fuentes mejores que otras obviamente, pero sin lugar a dudas son demasiadas. Por tal razón, he recopilado en este blog post, lo que considero es un buen plan de estudios que te dará una excelente base para comenzar tu carrera en este fabuloso mundo de la Ciencia de Datos y Big Data.
Antes que nada déjenme advertirles que esto no es para cualquiera. Lo primero que deben tener es un título universitario en: Computación, Ingeniería o Matemática. Y lo segundo y no menos importante, deben saber ingles muy bien.
Si no tienen ambos de estos requisitos, les recomiendo de todo corazón, no perder su tiempo y dedicarse a otra cosa :).
Ok, no mas preámbulos, este es el plan de estudios:
1) Leer este libro: Data Science from Scratch
2) Completar los siguientes cursos en linea:
3) Lecturas para entender RNN (Recurrent Neural Networks):
4) Estudiar estas Librerias y herramientas para Machine learning
- Azure ML
5) Hacer el siguiente entrenamiento sobre Spark:
- Leer Libro: Learning Spark
6) Databricks: Software para gerenciar Spark clusters
- Completar el curso en EDX: Distributed Machine Learning with Spark
- Abrir una cuenta "Comunity Edition" en Databricks y hacer los ejemplos
7) Entrenamiento en H2O.ai:
8) Databricks + Spark + H2O.ai:
9) Entrenamiento en Keras y Lasagne sobre Theano:
10) Entrenamiento en TensorFlow:
11) Entrenamiento en Manipulación de Data, Formatos y Visualización:
12) Consejos y Trucos:
13) Imprimir estas gráficas:
- Image – Machine Learning Algorithms
- Image – SciKit-Learn Cheat Sheet
- Image - Azure ML Algorithm Cheat Sheet
- Image – Road to Data Scientist
- Image – Machine Learning Process
- Image – Azure ML Studio diagram
- Image – Learning Paradigms and Algorithms
- Image – Data Visualization in Python Cheat Sheet
14) Entrenamiento en Kaggle:
16) Hacer competencias en Kaggle y Cortana Intelligence hasta quedar en el top 10













Comments