Principal

Campus virtual:

La mayoría de las actualizaciones y contenidos extra serán compartidos en el campus virtual (campus.exactas.uba.ar). Además habrá foros de consultas. Recomendamos visitar frecuentemente el campus virtual de la materia.

 

Filosofía de la materia:

El Laboratorio de Datos se presenta como una instancia temprana para interactuar con datos, adquirir intuiciones, trabajar con herramientas específicas, y familiarizarse con el ciclo fundamental de la ciencia de datos: plantear una pregunta, obtener y procesar los datos para responderla, generar un reporte usando distintas herramientas, y comunicarlo para responder la pregunta planteada.

El curso de Laboratorio de Datos es aplicado. Nuestro objetivo no es demostrar matemáticamente la validez de toda afirmación, pero sí profundizar en la heurística de por qué funcionan las cosas, cuales son las hipótesis necesarias, y en qué caso las cosas pueden dejar de funcionar.

El objeto fundamental que usamos para la materia son los notebooks de Jupyter (por defecto usaremos Google Colab), con combinación de texto, figuras y código. Cada clase estará acompañada de un notebook donde se presentará el código con los ejemplos correspondientes. La ejercitación individual también se entregará mediante un notebook. Esperamos que los notebooks adquiridos en la materia acompañen al alumno más allá de la misma y le sirvan como una plataforma inicial para encarar futuros proyectos académicos y profesionales.

El curso es teórico-práctico y por lo tanto no hay una distinción entre teóricas y prácticas. Al comienzo de cada clase vamos a mostrar una breve presentación con los contenidos de la clase y luego pasaremos a analizar juntos los notebooks.

 

Objetivos:

- Adquirir herramientas para el análisis exploratorio de datos, incluyendo preprocesamiento de datos, estadística descriptiva, y visualización
- Familiarizarse con modelos básicos de regresión
- Familiarizarse con modelos básicos de clasificación, introducción a conceptos básicos de machine learning (ML)
- Familiarizarse con algoritmos básicos de reducción de la dimensionalidad y clustering
- Métodos para adquirir datos desde Internet, por ejemplo, uso de APIs y scrapeo de páginas web.
- Familiarizarse con datos no-numéricos, principalmente texto (limpiar datos de texto, presentación numérica matricial, detección de tópicos, clasificación de documentos)
- Adquirir un panorama general de qué es la ciencia de datos y qué significa ser científico de datos en distintos ámbitos
- Ser capaces de plantear una pregunta y responderla con datos utilizando las herramientas provistas en la materia (trabajo final).

 

Docentes:

Enzo Tagliazucchi (tagliazucchi.enzo@googlemail.com)

Sebastián Pinto

Tomás Cicchini

Ariel Berardino

 

Horarios y aulas:

La materia se dictará todos los Martes y Viernes de 17 a 20 hs.

El aula de Zoom de la materia se comunicará pronto.

Todas las clases de la materia serán grabadas en video y subidas al canal del departamento de Física.

Print Friendly, PDF & Email