Talleres de ciencia de datos y aprendizaje automático. Sesión 3: árboles de decisión, procesamiento de texto y caso práctico de detección de spam ABIERTA

Autor
Publicado por
i02gupep

Probablemente te sonarán términos como aprendizaje automático (machine learning), inteligencia artificial, Big Data, Deep Learning… La ciencia de datos es un conjunto de técnicas enfocadas a la extracción de conocimiento a partir de datos ya sea para explicarlos, descubrir relaciones entre ellos, predecir valores o clasificar patrones. Dentro encontramos técnicas que se han hecho muy populares como el aprendizaje automático, o machine learning, que se resume como la habilidad de un programa para aprender de los datos.

¿A quién va dirigido?

A estudiantes de tercer o cuarto curso de ingeniería informática que estén interesados en acercarse al mundo del aprendizaje automático y a la resolución de problemas enfocados desde una perspectiva práctica. O aquellos que, habiendo asistido a los talleres previos de iniciación, mantengan el entusiamo por aprender, que a fin de cuentas es lo único necesario para realizar esta serie de talleres.

No son necesarios muchos conocimientos previos, no obstante se recomienda echar un vistazo a las diapositivas empleadas en la parte teórica del taller.

No es necesario llevar ordenador portátil, se podrán usar los ordenadores del aula. Es de hecho es la opción más recomendable.

¿Qué contenidos se darán en este taller?

En este caso, nos centraremos en uno de los modelos de aprendizaje automático que más se aplican en problemas reales. También abordaremos el tratamiento de texto y un caso de estudio sobre detección de spam.

  1. Árboles de decisión y bosques aleatorios.
  2. Extracción de características de un texto mediante Bag-of-Words.
  3. Caso de estudio: clasificación de texto para detección de spam.

¿Cuándo y dónde?

El próximo jueves 3 de mayo de 2018. De 16.00h a 18.30h en el aula S1 del edificio Ramón y Cajal del Campus de Rabanales.

¿Por qué se hacen estos talleres?

Este taller se engloba en el marco del proyecto de innovación docente "Uso de la plataforma de simulaciones predictivas Kaggle para la adquisición de competencia relacionadas con el perfil profesional Científico de Datos en asignaturas del grado en ingeniería informática".

Este es el tercero y último de una serie de talleres donde se pretenden enseñar de forma muy personalizada las destrezas y competencias necesarias para afrontar un problema real o de competición del mundo de la Ciencia de Datos.

Plazas ilimitadas

Aula de Software Libre

TBA
TBA
TBA