Ciencia de Datos | Las organizaciones recurren a la Inteligencia Artificial y a las técnicas de Machine Learning para:
– Desarrollar nuevos procesos u optimizar los existentes.
– Reducir el costo laboral o aumentar el valor de sus recursos humanos.
– Reducir costos y aumentar ingresos.
– Crear nuevos negocios.
En este sentido, como científicos de datos que somos, nos enfrentamos a una multiplicidad y diversidad de proyectos y necesidades específicas. Cada proyecto de datos es diferente, dependiendo de los datos con los que se vaya a trabajar; de qué tipo de empresa e industria se trate; si cuenta con un equipo que encare el proyecto internamente o si se recurrirá a un proveedor externo (como 7Puentes, por ejemplo, que ayuda a las organizaciones con sus iniciativas y proyectos de Ciencia de Datos aportando su expertise en distintas industrias y técnicas).
Más allá de las especificidades detalladas (que pueden ser muchas más, claro está), el primer paso para que cualquier proyecto de datos llegue a buen puerto es realizar una búsqueda de concepto para saber si los datos con los que se cuenta serán realmente valiosos (si se les podrá “sacar el jugo”), esto es, si buscan validar una nueva tecnología; si pueden predecir un determinado comportamiento de los usuarios o clientes; si de esos datos podrá desprenderse algún modelo inteligente que ayude al negocio, etc.
Si queremos llevar a cabo un proyecto de datos exitoso (como reza el título de este post), al momento de encararlo debemos considerar una serie de cuestiones que nos permitirán lograr los resultados esperados:
¿Con qué equipo se cuenta internamente? ¿El equipo tiene experiencia en este tipo de proyectos o no?
Cuando es un equipo interno el que encarará el proyecto de datos, será fundamental saber qué nivel de motivación tiene: si estos profesionales solo tienen ganas de aprender o curiosear con nuevas tareas o tecnologías, o si realmente lo que quieren es resolver el problema que se le plantea al negocio.
El riesgo de la primera opción es que, en el afán investigativo, el equipo opte por técnicas más complejas o que requieran más tiempo de desarrollo, dejando de lado el principal objetivo, que es el de llegar a una solución lo más rápido posible y de la mejor manera.
Para evitar esos riesgos, recurrir al soporte de un equipo externo como el de 7Puentes es una alternativa inteligente, no solo para encarar el proyecto unilateralmente sino también para guiar al equipo interno y que éste avance por los caminos más ágiles, ofreciéndoles las tecnologías más eficientes.
¿Están los datos disponibles?
Por “disponibles” nos referimos a tener acceso a los datos en forma inmediata (una buena métrica sería contar con ellos en menos de una semana, por ejemplo). Si para acceder a los datos el profesional deberá estar, por ejemplo, tres semanas preparando la información, solicitando permisos o consultando abogados, el proceso se volverá engorroso e ineficiente.
Además de la variable temporal, los datos deben estar “disponibles”:
– Técnicamente.
– Legalmente (superando las barreras de confidencialidad).
– En un formato adecuado.
– “Limpios”: depurados (sin errores groseros), normalizados (esto supone que los datos categóricos estén bien curados), que no haya problemas de encoding (algo que suele pasar).
Disponer de una buena métrica para evaluar
Será fundamental para cerrar un proyecto exitoso contar con métricas objetivas que estén bien calculadas y que puedan ser evaluadas y probadas antes de poner el modelo de datos en marcha.
Contar con el compromiso del management para manejar la incerteza o el liability
Ningún modelo de datos tiene la verdad absoluta; tampoco puede adjudicársele al consultor que hizo la red neuronal el hecho de que las conclusiones a las que se arribe no puedan constatarse en la realidad. El management deberá poder convivir con cierto nivel de incertidumbre y dicho cambio de cultura será importante.
Si tenemos en cuenta todas estas cuestiones, cualquier proyecto de datos será exitoso finalmente. El uso de las técnicas de machine learning e inteligencia artificial serán, en ese sentido, la alternativa más innovadora para la creación de valor en la organización.