Ciencia de Datos | Estamos transitando una época en la cual tenemos más acceso a los datos que nunca antes en la historia. La Ciencia de Datos se ha vuelto una temática prioritaria y para nosotros, conocedores de la materia, es vital que distintas voces autorizadas puedan reflexionar sobre la actualidad de dicha disciplina.
Para ello, invitamos a dos científicos renombrados: Laura Ación y Walter Sosa Escudero. Laura es Doctora en Bioestadística, Investigadora Adjunta del CONICET del Instituto del Cálculo (UBA) y consultora del Programa de Ciencia de Datos de Fundación Sadosky.
Por su parte, Walter es Doctor en Economía, Profesor de la Universidad de San Andrés, Investigador Principal del CONICET y miembro de número de la Academia Nacional de Ciencias Económicas.
Junto a ellos, nos preguntamos qué rol ocupa en nuestra vida cotidiana la Ciencia de Datos; qué incidencia tienen o deberían tener los científicos de datos como analistas de la realidad y, last but not least, qué tan representadas están las minorías (sexuales, raciales, socioeconómicas, etc) no sólo en los algoritmos, sino también en la Ciencia de Datos como ámbito profesional/laboral.
7Puentes: ¿La proliferación de los datos nos cambia la vida?
Walter: Mientras no ocurran cambios a nivel educativo, dudo que suceda. La percepción de los datos es “anecdótica” si no los percibimos como un estadístico, que separa la señal del ruido.
Es una oportunidad histórica porque “llueven” datos pero no creo que la sociedad haya capitalizado adecuadamente estos datos para que le cambie la vida. No estamos preparados culturalmente porque no podemos tolerar la información incompleta que los datos nos brindan. Porque, por definición, los datos nunca darán la información completa y requerirán de un trabajo posterior para “completarla”, por así decirlo.
Laura: Coincido con Walter en el rol de la educación para que haya una cambio sustancial en nuestra vida a partir de los datos. Creo que la sociedad se beneficiaría de tener una buena alfabetización de datos. Más y más algoritmos se basan en análisis de datos y toman decisiones por nosotres. Entender un poco de dónde salen esas decisiones puede ser importante para decidir si confiamos o no en ellas.
Asimismo, cada vez más fuentes de información tratan de incluir datos para parecer más objetivas. Eso está bueno, pero mucho mejor es contar con la habilidad de saber si uno podrá guiarse por esas fuentes o si nos están tratando de vender un “buzón” lleno de datos. Por ejemplo, sobran ejemplos de gráficos mal hechos en los medios de comunicación que venden historias que no son. Si no tenés el ojo formado para leerlos, te creés la historia que el medio quiere que creas. En mi opinión, saber de datos ya es tan importante como leer y escribir.
7Puentes: ¿Qué rol tienen o deberían tener los científicos de datos como analistas de la actualidad?
Laura: Me parece que la gente formada en ciencia tiene mucho para aportar a los medios de comunicación masiva, desde la forma de pensar y de abordar las problemáticas. Digo esto porque hacer ciencia es un estado de descubrimiento, de aprendizaje y de ir haciendo el mapa mientras nos vamos moviendo. En función de lo que ya se sabe, tratamos de completar la parte del rompecabezas que aún no conocemos. Eso requiere una forma de abordar cada proyecto que no es común en los noticieros o en la vida cotidiana de alguien que no está en ciencia.
Es posible que sea optimista, pero creo que incluyendo más personas formadas en carreras científicas en los medios, se acabarían un poco las opiniones sin fundamentos. Analizar la realidad sin saber de qué se está hablando suma mucho ruido a lo que sucede.
Walter: Nora Baar, una reconocidísima periodista de ciencia, me decía días atrás que pasamos de una época en la que los científicos no hablaban absolutamente con nadie a que todos quieran decir algo, y que todos los programas quieren a un científico al aire. Eso yo no lo veo como un triunfo de la ciencia, sino más bien como una oportunidad.
Es interesante que los científicos aparezcan haciendo ciencia, a pesar de que la ciencia es mucho más aburrida y mucho más conjetural y dubitativa de lo que la gente espera. La duda honesta, propia de la ciencia, es el gran aporte que puede hacer la ciencia. La contribución que trae un científico no es tanto temática, sino metodológica. Hay cierta ética que el científico tiene que llevar a todos lados, incluso a los medios de comunicación: una cuestión es la duda sana y otra, el principio de paciencia, de prudencia.
7Puentes: ¿Qué nivel de inclusión de la diversidad perciben en la ciencia de datos?
Laura: Empiezan a reproducirse espacios académicos en los que les grupes minoritaries van teniendo voz y en los cuales su opinión vale. Son valioses y es un gran logro, pero todavía falta un largo camino por recorrer.
Asimismo, la Inteligencia Artificial empieza a darse cuenta que si no hay diversidad a la hora de construir el algoritmo, se está dejando afuera a buena parte de la humanidad y, por ende, los algoritmos empiezan a tomar decisiones totalmente sesgadas. Entonces, se empieza a necesitar gente en los equipos de Inteligencia Artificial/Ciencia de Datos que puedan modelar los algoritmos con las distintas aristas que se requieren.
7Puentes: Y que esos profesionales tengan esa empatía con la diversidad, no solo con la que representan, sino también con otros grupos minoritarios que no están siendo considerados.
Walter: A mi lo que me gusta es que la cuestión del sesgo es un problema que la estadística ya había detectado, no es un problema nuevo. Big Data surge cuando los sesgos de la estadística aún no estaban resueltos. Afortunadamente, una de las grandes contribuciones que hace Big Data es que nos permite revelar que ciertas cuestiones que nos parecían homogéneas, no lo son en realidad. Nos revela heterogeneidades que antes no podíamos ver.
Laura: Y, al mismo tiempo, hay un incentivo económico en la industria de la Ciencia de Datos o en la industria de la Inteligencia Artificial, en el sentido de que si vos dejas a un montón de la población afuera, no vas a poder hacer plata con toda esa porción de la sociedad. Empieza a haber cierta retroalimentación. Aquellos que quedaban afuera, empiezan a ser monetizables y, por ende, empiezan a interesar.
7Puentes: Cuanto más diverso, mayor multiplicidad de perspectiva, más rica se vuelve la disciplina.
Walter: Absolutamente. La Ciencia de Datos es un ejercicio multidisciplinario. Creo que los que se desempeñan bien en esta disciplina son aquellos que tienen una formación formal, pero a la vez saben comunicar y son empáticos. Lo que realmente funciona en la ciencia de datos es un muy buen par de orejas, activas. Que no estés tratando de contestar la pregunta, sino ayudando a formularla. Todo eso requiere un monton de formación que tiene cosas duras y cosas blandas.
Laura: Sin embargo, disciplinas como la estadística y la computación están mayormente copadas por “hombre cis”. Entonces el mundo de la Ciencia de Datos o de la Inteligencia Artificial está representado por señores. Afortunadamente, nos despertamos y empezamos a darnos cuenta de que la diversidad es necesaria, en el diseño de los algoritmos y entre quienes los diseñan.