Algoritmos y data mining para resolver los desafíos de datos de la Web

El inmenso caudal de datos que deben administrar hoy las empresas, contemplando las múltiples ofertas de comunicación con el cliente, lo que se llama omnicanal, presenta el desafío de lidiar con un elevado tráfico de datos. Hasta las tareas más simples, como contar con visitantes únicos, se vuelve compleja cuando pensamos en millones de usuarios y cientos de miles de recursos; en ese contexto es necesario recurrir a una nueva algoritmia para resolver estos desafíos.

Bajo el título “Tópicos de Estadística y Data Mining en Big Data”, Ernesto Mislej, Director de 7Puentes, dictó un taller en el que presentó una recopilación de técnicas, algoritmos y problemas para resolver los desafíos anteriormente planteados. Allí se puso énfasis en Big Data, focalizándose en problemas derivados de la web.

“Los algoritmos y métodos de minería de datos tradicionales, son revisitados para poder tratar las características que nos desafía Big Data ¿Qué pasa cuando los volúmenes de datos son tan grandes que no pueden ser alojados en un único disco rígido? ¿Cómo podemos medir el impacto de una campaña cuando nuestra audiencia es tan volátil que, cuando nos disponemos a observarla, ya se esfumó? ¿Es posible utilizar la totalidad de la información disponible, o debemos escoger una muestra?Y en ese caso, ¿cómo lo hacemos?”, fueron los puntos tratados por Mislej junto a los asistentes al workshop.

Este taller se dictó en el marco del workshop de verano: “Extracción eficientes de datos semánticos”, dictado en Santiago de Chile los días 16 y 17 de enero de 2017 y organizado por el Centro de Investigación Semántica de la Web. El propósito del CIWS (por sus siglas en inglés) es el de investigar cuál es la forma más eficiente de extraer datos semánticos de la Web y desarrollar herramientas básicas para hacer que esa extracción sea aún más efectiva. Esta iniciativa congrega a docentes, investigadores y estudiantes de distintas universidades de Chile.