Data science con SciPy

By Rodolfo Ferro

Elevator Pitch

En esta charla se ilustrará una técnica de ciencia de datos para estimar distribuciones probabilísticas de datos y con ello poder simular nuevos datos que sean válidos, aleatorios y se distribuyan de igual manera que los datos originales. Todo ello con el poder de SciPy.

Description

En esta charla se ilustrará una técnica de ciencia de datos para estimar distribuciones probabilísticas de datos y con ello poder simular nuevos datos que sean válidos, aleatorios y se distribuyan de igual manera que los datos originales. Todo ello con el poder de SciPy.

La idea es que a partir de una muestra de datos (variables aleatorias) utilicemos scipy.stats para estimar la distribución de probabilidad, así como los parámetros de dicha distribución y con ello utilizar el Teorema de la Transformada Inversa para generar nuevas variables aleatorias con dicha distribución. De esta manera se generan nuevos datos aleatorios pertenecientes a la misma familia que los datos originales.

Para este taller necesitas conocimientos básicos sobre programación en Python. Parte de los objetivos es que posterior a la charla se cuente con una nueva técnica para generación de datos aleatorios bien distribuidos; con Python, obviamente.

Notes

  • Es una charla básicamente impartida con slides/Jupyter Notebook.
  • Está pensada para que si alguien quisiera sacar su máquina al momento y seguirla con código, se pueda.
  • No hace falta tener tanto conocimiento técnico o bases matemáticas súper sólidas, sino que la plática es autocontenida.
  • Si se seguirá la charla con código, se utilizará Python 3.6, SciPy, matplotlib y Pandas.