¿Cómo se aplica la ciencia de datos para saber qué series de tv nos podrían gustar?
Detalle BN6
- Inicio
- ¿Cómo se aplica la ciencia de datos para saber qué series de tv nos podrían gustar?
¿Cómo se aplica la ciencia de datos para saber qué series de tv nos podrían gustar?
El ITESO estrena en Otoño la carrera de Ingeniería y Ciencia de Datos, la cual dará herramientas para identificar información relevante e interpretarla para solucionar problemas y necesidades de diferentes áreas, como la determinación de perfiles de usuarios en plataformas de streaming.
Édgar Velasco
Cuando alguien termina de ver una película en Netflix automáticamente aparecen sugerencias. Como por arte de magia, la plataforma le ofrece al usuario películas y series con tanta precisión que hasta parece que lee la mente del espectador. Pero no es magia ni telepatía. Lo que en realidad ocurre es que los ingenieros han creado un algoritmo que permite crear sugerencias para el usuario a partir de las series y películas que ha visto y que ha calificado. La recopilación, análisis y uso de los datos que los usuarios van otorgando a los diferentes proveedores es muy valiosa cuando se sabe utilizar, y por eso el ITESO está listo para ampliar su oferta educativa con la nueva carrera de Ingeniería y Ciencia de Datos.
Con la intención de dar a conocer la propuesta de la universidad, Riemann Ruiz Cruz, coordinador de la licenciatura, ofreció una charla para que los interesados en esta área profesional pudieran conocer grosso modo las habilidades que podrán desarrollar si optan por esta carrera.
Ruiz explicó que el uso de los datos surgió cuando los biólogos comenzaron a clasificar especies y se preguntaron cómo podían establecer si, por ejemplo, una planta era una nueva especie o formaba parte de otras. Así crearon el llamado Índice de Similitud que, como su nombre lo indica, registra los elementos en común y las diferencias.
"Esto luego se aplicó a las actividades y a las características humanas, como los gustos y las preferencias. El Índice de Similitud generalmente se basa en un conteo de características comunes y no comunes entre dos muestras o datos", explicó.
El coordinador de Ingeniería y Ciencia de Datos puso algunos ejemplos de cómo se aplica el Índice de Similitud con una tabla sencilla y añadió que hay diferentes índices que se aplican según la información que se quiere recabar.
"El Índice de Similitud se complejiza cuando hay grandes cantidades de datos", señaló y, como ejemplo para dimensionar la magnitud de los datos que maneja una plataforma como Netflix, explicó que en México 63 por ciento de la población mayor de seis años de edad es usuaria de internet, y de ese total 72 por ciento tiene una cuenta de Netflix.
"La plataforma encuentra las similitudes de millones de usuarios entre miles de películas", dijo Ruiz y luego mostró un ejemplo de cómo podían encontrarse las similitudes entre diez usuarios diferentes.
Durante la sesión de preguntas y respuestas, el coordinador fue cuestionado sobre la diferencia entre big data y la ciencia de datos. "Big data es sólo información o un conjunto de datos a escala masiva, mientras que la segunda es una herramienta para procesar dichos datos y convertirlos en información útil".
Al hablar del campo laboral, el académico señaló que a escala mundial las empresas han comenzado a utilizar la ciencia de datos y que en México todavía estamos en etapas tempranas en la materia. "Las empresas están buscando personas que puedan procesar la información para sacarle provecho. También hay emprendimientos que ofrecen el servicio".
Para concluir, el coordinador invitó a todos los interesados a pedir informes sobre la carrera y la beca fundadores, a la que pueden aspirar los integrantes de la primera generación de Ingeniería y Ciencia de Datos.
Para más información sobre la carrera se puede visitar el sitio https://carreras.iteso.mx/ingenieria-ciencia-datos.
Noticia
ingeniería y ciencia de datos