Introducción al Big Data: extrayendo conocimiento de los datos

A19020236

Ficha
Impartición:
-
Horas teóricas presencial:
12
Horas lectivas:
12
Horas trabajo autónomo del alumnado:
13
ECTS:
1
Plazas disponibles:
7
Aula:
Casa Rosada (Ctra. las Nieves, 5C), Santa Cruz de La Palma
Categoría:
Curso de Extensión ULL
Más información:
https://www.ull.es/portal/cursosextension/universidad-de-verano-de-la-palma/
Descripción
Objetivos
- Identificar los peligros y las implicaciones éticas y morales que tiene la recopilación y análisis de datos.
- Valorar la importancia que tienen las técnicas de análisis de datos para la extracción de conocimiento útil.
- Reconocer las principales tareas de extracción de conocimiento.
- Capacitar a los alumnos para poner en práctica técnicas de extracción de conocimiento desde datos.
- Fomentar la actitud crítica de los alumnos ante las conclusiones que se extraen de los datos.
Horario:
  • Lunes 16:00 20:00
  • Martes 16:00 20:00
  • Miércoles 16:00 20:00
Profesorado:
  • Christopher Juan Expósito Izquierdo
  • Airam Expósito Márquez
  • José Marcos Moreno Vega
Metodología docente
La metodología alterna clases teóricas, en las que se describen técnicas y sistemas para el análisis de datos, con sesiones prácticas, en las que los alumnos analizan datos de supuestos prácticos para extraer conocimiento. En las sesiones prácticas, los alumnos usarán las técnicas y sistemas descritos en las clases teóricas. Se presta mayor importancia a las sesiones prácticas, ya que en la aplicación de las técnicas se resaltan las ventajas de las mismas. Además, se propondrán foros en los que debatir sobre las implicaciones éticas y morales de la recopilación y análisis de datos.
Programa
  • Introducción al Big Data

    Esta sesión inicial tiene como objetivo fundamental constituir un primer punto de encuentro entre profesorado y alumnado bajo el marco común del big data. Para ello, se contextualizará el campo a tratar y se describirá la estructura, contenidos y plan de trabajo del curso. Al mismo tiempo se describirán las competencias adquiridas por el alumno tras la realización del curso, se presenta al profesorado y se detallan los objetivos a desarrollar. Durante esta primera sesión también se describirá el concepto de big de data, sus aplicaciones e importancia.

  • El proceso de extracción de conocimiento

    Esta sesión introducirá al alumno al proceso de extracción de conocimiento y las diferentes fases que implica. La primera fase a explorar en el curso integración y recopilación de datos es la fase en la que la organización hacen acopia de los datos a explotar. La siguiente fase es la selección, limpieza y transformación, que lidera la transformación de los datos con el objetivo de adquirir la calidad suficiente para ser tratados. En la fase de minería de datos se obtiene nuevo conocimiento a partir de los datos ya tratados. Las dos últimas fases que se incorporan en este módulo son de evaluación e interpretación y de difusión y uso del conocimiento extraído.

  • Tecnologías para big data

    Existe un amplio conjunto de tecnologías, definiciones, conceptos y tecnicismos, que rodean a los profesionales del big data y su sector. Este módulo pretende dar una visión general y ordenada de las diferentes tecnologías existentes en el sector con una amplia perspectiva. Entre estas encontraremos tecnologías de almacenamiento, virtualización, integración, preparación, calidad y visualización de datos.

  • Clasificación

    La tarea de clasificación de datos engloba algunas de las técnicas más relevantes de aplicación en el contexto del análisis de datos. A modo general consisten en la asignación de una clase o tipo a un objeto determinado del cual conocemos una serie de características, algunas aplicaciones clásicas pueden ser la clasificación de un email como SPAM o no, la concesión de créditos bancarios o la detección de objetos en imágenes/vídeo. En este módulo se estudian las principales técnicas de clasificación basadas en árboles de decisión y clasificadores bayesianos, así como evaluar el resultado de los mismos.

  • Clustering

    Agrupar elementos de un conjunto de datos en grupos o clusters de elementos que tengan características similares es otra de las tareas con mayor impacto en el análisis de datos. El campo de aplicación del clustering comprende una amplia gama de campos y tareas como por ejemplo la clasifición animales y plantas, la identificación de enfermedades, identificación de personas con hábitos de compras similares, y un largo de etc. de problemas. A lo largo de este módulo se estudian las principales técnicas de clustering divididas en dos grandes bloques, clustering basado en prototipos y clustering jerárquico.

  • Reglas de asociación

    El último gran grupo de técnicas de análisis de datos que se estudia a lo largo de la propuesta formativa es el relativo a las reglas de asociación. Estas técnicas están diseñadas para identificar asociaciones de interés en un conjunto de datos. Una de las aplicaciones clásicas es el product placement o la ubicación de productos en las estanterías de un supermercado en base a la compra conjunto de diferentes artículos. En este módulo se estudian las principales técnicas y algoritmos para detección de patrones frecuentes a través de reglas de asociación.

  • Aplicaciones y casos de éxito

    Las aplicaciones del big data y análisis de datos se han convertido en un elemento crucial que se debe dominar para aumentar el rendimiento y productividad de cualquier organización que genere grandes volúmenes de datos. Sus aplicaciones se extienden en prácticamente todos los sectores o industrias productivas como por ejemplo el ámbito de la salud, educación, turismo, retail, banca, etc. A pesar de ello y con independencia del sector de aplicación, éstas se pueden categorizar en una serie de análisis específicos según el tipo de información analizada y técnicas o aplicación llevadas a cabo. A lo largo de este módulo se dará una visión general de las principales aplicaciones del big data y casos de éxito reales.

  • Implicaciones éticas y morales

    En big data, las operaciones de recoger, almacenar, gestionar y utilizar datos de forma masiva, en multitud de casos con fines lucrativos, plantea problemas relacionados con la privacidad, la propiedad, la identidad, la intimidad y la confianza. La ética debe estar implícita en todo el ciclo de vida del big data, desde la recolección de los datos, la aplicación de técnicas, hasta la interpretación de resultados de las mismas. En este módulo se pretende exponer los problemas e implicaciones éticas y morales que se deducen del big data y sus aplicaciones.

Criterios de evaluación
Teniendo en cuenta la metodología propuesta para el curso la evaluación será continua. Evaluada a través de la participación en las sesiones formativas por parte del alumno, la participación activa y entrega de supuestos en el aula virtual del curso, la calidad de las actuaciones prácticas realizadas durante las sesiones formativas y finalmente la entrega del informe de resultados de los supuestos prácticos a lo largo del curso.
Observaciones
Curso de Extensión Universitaria organizado por el Vicerrectorado de Cultura, Participación Social y Campus Ofra y La Palma junto con la Fundación General de la ULL. Financia: Cabildo Insular de La Palma.
Tipos de Inscripción
No existen tipos de inscripción vigentes. Para cualquier duda contacte con la Secretaría de la Fundación.