Actividades
Curso 2018-2019
Durante este primer año de actividad de la Cátedra SGAE-ETSIT_UPM se han desarrollado tanto actividades académicas como de formación e investigación.
Actividades académicas:
Presentación a estudiantes de la ETSIT-UPM de las actividades y función social de la Sociedad General de Autores y Editores (SGAE) , así como de los objetivos y finalidad específicos de la Cátedra SGAE-ETSIT_UPM :
- Estudiantes del Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación(CUARTO CURSO – ITINERARIO EN SISTEMAS AUDIOVISUALES)
- Estudiantes del Máster Universitario en Ingeniería de Telecomunicación (SEGUNDO CURSO – ITINERARIO MACHINE LEARNING AND MULTIMEDIA DATA SCIENCE)
- Estudiantes del Master of Science in Signal Theory and Communications (TRACK – SIGNAL PROCESSING AND MACHINE LEARNING FOR BIG DATA)
Actividades de investigación:
En colaboración con SGAE se han definido tres actividades de prospección tecnológica e investigación en cada una de las líneas de investigación de la Cátedra : Fingerprinting audio, Contenidos de vídeo y TV e Identificación de Metadatos.
Para cada una de las líneas de investigación, en septiembre 2018, se publicitó y ofertó una beca dirigida a estudiantes de Grado y Máster de la ETSIT-UPM. En el proceso de selección las becas fueron asignadas a: una estudiante de cuarto curso de Grado para Fingerprinting audio, una estudiate de segundo año de Máster para Contenidos de vídeo y TV, y un estudiante de cuarto curso de Grado para Identificacion de Metadatos.
Cada uno de los estudiantes seleccionados fueron asignados a un tutor, profesor de la ETSIT-UPM, especializado en el ámbito de investigación correspondiente.
En la formación de los estudiantes y seguimiento de las actividades de investigación está participando activamente personal especializado de la SGAE que mantienen reuniones de seguimiento periódicas (cada dos semanas) con estudiantes y tutores.
Los principales resultados obtenidos hasta la fecha pueden resumirse en:
- Fingerprinting audio:
Se ha completado una primera prospección tecnológica de principales tecnologías y
aplicaciones de fingerprinting y los servicios que ofrecen.
También se ha realizado un estudio experimental sobre dos tecnologías de fingerprinting para evaluar su robustez frente a modificaiones en los registros de audio: cambio de escala temporal y frecuencial, desplazamiento temporal y frecuencial, ruido (blanco, coloreado, conformado), trémolo, vibrato, reverberacion y alteración de la frecuencia de muestreo.
Se está iniciando una actividad sobre el estudio y evaluación de técnicas de separación de fuentes de audio.
- Contenidos de vídeo y TV
En esta línea se han estudiado y se están desarrollando y evaluando las tecnologías más avanzadas de Inteligencia Artificial y Machine Learning, concretamente las denominadas Redes Neuronales Profundas (Deep Learning), para la detección de contenidos en audio.
Se ha definido una metodología de trabajo y se han realizado pruebas iniciales. Sin embaro, dada la dificultad de esta actividad, el esfuerzo se está concentrado en el acceso a grandes bases de datos y al desarrollo de entornos que permitant evaluar diferentes arquitecturas y modelos de Deep Learning.
- Identificación de Metadatos
Se ha realizado una primera prospección de las principales fuentes de metadatos de contenidos musicales existentes y de los recursos tecnológicos disponibles para acceder a ellas.
Se están llevando a cabo, formación, estudio y evaluación de procedimientos de búsqueda inteligente de metadatos utilizando diferentes tecnologías y entornos de código abierto basados en Procesamiento de Lenguaje Natural (NLP, Natural Language Processing).