Machine Learning: Casos de negocios

Table of Contents

Machine Learning | El principal propósito de tecnologías como Machine Learning es poner la innovación al servicio de las organizaciones y ser la punta de lanza para su transformación digital.

A través del desarrollo de sistemas que aprenden de forma automática e identifican patrones complejos en millones de datos, se predicen comportamientos futuros y se vuelve más eficiente el funcionamiento del negocio.

En este sentido, y entendiendo como expertos en procesamiento inteligente de datos e Inteligencia Artificial la relevancia de que las empresas incorporen técnicas de Machine Learning, es que realizamos el primer meetup en nuestras oficinas, semanas atrás. Fue un enorme éxito y los asistentes (profesionales de la industria, clientes potenciales y actuales) escucharon atentamente las presentaciones de nuestros profesionales, todas ellas con un hilo conductor: la aplicación de técnicas de Machine Learning a casos concretos de negocios.

A continuación, queremos compartir una breve síntesis de los casos presentados. El enfoque metodológico fue similar en los tres casos: plantear una problemática, describir el proceso llevado adelante y arribar a una serie de conclusiones.

¡Qué lo disfruten!

Detección de fraude en compras online con tarjetas de crédito

Dada la gran cantidad de fraudes realizados con este medio de pago, hemos tenido clientes que nos plantearon la necesidad de detectar potenciales fraudes en sus órdenes de compra.

Más allá de que para dar forma a este modelo se aplicó una red neuronal, el foco estuvo puesto en la selección de ciertos atributos para permitir que la red funcionara mejor. Luego de evaluar distintas técnicas de feature selection decidimos abordar el problema con la técnica de feature importance.

¿Qué nos dejó esta problemática?

– A priori podríamos pensar que a más atributos, mejor performance del modelo elegido. Sin embargo, podemos ver que, con una buena selección de atributos y haciendo pruebas, se pueden eliminar atributos para mejorar el modelo.
– Por otro lado, es importante tener claras las reglas del negocio para el que se está trabajando, con el objetivo de poder entender mejor la problemática y analizar desde otro punto de vista el correcto uso de los datos.

Matching de productos

En el mundo del e-commerce es una práctica habitual que las empresas recurran a la comparación de precios con sus inmediatos competidores. A través de técnicas de Machine Learning pudimos desarrollar un modelo que permita determinar en forma automática quién tiene el mejor precio para un determinado producto.

Para llevarlo a cabo, y luego de concentrarnos en un conjunto reducido de datos (celulares, por ejemplo), vimos que los datos de una de las fuentes utilizadas estaba muy mal estructurado, dejando al título como único campo apto para usar. Recurriendo a TF-IDF para ponderar las palabras y a Random Forest como clasificador, logramos una precisión del 90% de clasificación.

Finalmente, el match consistió en identificar aquellos productos que fueron clasificados con el mismo label. Las conclusiones arribadas fueron las siguientes:

– La complejidad del matching de productos está altamente condicionada por la integridad y la consistencia de los datos. Si se parte de un conjunto homogéneo, se vuelve una problemática de mayor simplicidad.

– No siempre la solución más novedosa es la más adecuada. En múltiples situaciones los enfoques tradicionales nos permiten obtener resultados satisfactorios.

– Es importante interpretar los patrones aprendidos por los modelos.

– Es más provechoso tener un enfoque incremental de desarrollo que nos permita acercarnos al objetivo, que intentar atacarlo por completo desde el primer momento.

Inferencia de comportamiento

Es frecuente encontrarse con organizaciones que cuentan con equipos de agentes de call centers que son evaluados a través de distintas métricas. El desafío consistió en desarrollar un modelo que permita encontrar aquellos agentes que se comportan de manera fraudulenta.

Para resolver este problema entrenamos un clasificador multiclase y luego lo combinamos con un AutoEncoder para reducir dimensiones.

De este modo, logramos inferir el perfilamiento de cualquier agente de esta organización, basándonos en sus métricas y evitando los métodos manuales que se utilizan actualmente

Estos 3 casos (detección de fraude, matching de productos e inferencia de comportamiento) son problemáticas reales de empresas reales que podemos resolver desde 7Puentes gracias a nuestro sólido conocimiento en Inteligencia Artificial.