Inteligencia artificial es un concepto muy amplio. Incluye desde robótica, hasta aprendizaje automático –machine learning, en inglés–, como se denomina al estudio de metodologías que tienen como finalidad que una computadora "aprenda" a reconocer patrones o comportamientos complejos, sin decirle explícitamente cómo.
Entre los ejemplos más conocidos están los algoritmos de Google, capaces de "saber" qué publicidad mostrar a cada usuario, o los de Netflix, que "aprenden" los gustos cinematográficos de sus suscriptores para luego sugerirles películas o series.
La Dirección General de Rentas (DGR) de la provincia de Córdoba le planteó a la Oficina de Vinculación Tecnológica de la FaMAF una necesidad concreta: detectar, entre sus contribuyentes, quiénes podrían estar interesados en pagar con débito automático los impuestos inmobiliario y automotor, de manera de facilitar el pago al usuario y mejorar la recaudación.
En la Facultad de Matemática, Astronomía, Física y Computación (FaMAF) de la UNC, un equipo de investigación dirigido por Martín Domínguez aplica diferentes técnicas de aprendizaje y análisis computacional con el propósito de inferir comportamientos o realizar predicciones sobre redes semánticas y sociales.
Tras el requerimiento a la Oficina de Vinculación Tecnológica, se conformó un equipo interdisciplinario integrado por investigadores de la FaMAF junto a directivos y programadores de la DGR. El dato distintivo es que una vez finalizado este proyecto, Rentas tendrá el conocimiento necesario para poder evaluar otros patrones de comportamiento a través de metodologías de inteligencia artificial.
Algoritmos supervisados, la herramienta clave
“Dentro del aprendizaje específico –conocido como machine learning– podemos operar con algoritmos supervisados o no supervisados. Esos algoritmos son los que se utilizaron en la transferencia que se hizo entre la UNC y la DGR”, explica Martín Domínguez.
Un algoritmo supervisado es capaz de detectar, por ejemplo, si un mail es spam. Para ello incorpora parámetros dentro de sus modelos matemáticos relacionados con determinadas características del asunto, la longitud o las imágenes dentro del cuerpo del correo. Así construye un nuevo modelo nuevo capaz de reaccionar ante un correo electrónico que todavía no ha visto para reconocer si es, o no, spam.
Desde la DGR se plantearon una serie de desafíos, cada uno de los cuales debía ser cumplido en el transcurso de un mes con el uso de metodologías ágiles. El primero fue identificar potenciales interesados en usar débito automático a fin de ampliar alcance con este medio de pago.
“Se nos pidió que identificáramos cuál es la mejor forma de interactuar con el ciudadano para mejorar la experiencia en los pagos. Advertimos que la mayoría considera al débito automático como algo positivo, que les posibilita pagar los impuestos y a nosotros nos facilita la cobranza. Por lo cual se analizó una estrategia", describe Ezequiel Romano, director de Gobierno Electrónico de la Secretaría de Ingresos Públicos de la provincia de Córdoba.
Según explica, desde Famaf se plantearon distintas alternativas. Se optó por un proceso basado en identificar a quienes ya estaban empleando el débito automático, reconocer sus patrones de comportamiento e identificar, en la misma base de casi tres millones de contribuyentes, a quienes todavía no lo están usando pero tienen un comportamiento similar.
La primera etapa del trabajo consistió en un asesoramiento para el adecuado análisis de la base de datos de la Dirección General de Rentas y la clasificación de los sujetos tributarios. El análisis y la preparación inicial de los datos arrojó estos resultados: de los 828.961 contribuyentes del impuesto automotor, un 8,7% (72 mil) está adherido al débito automático; y de los 1.911.476 contribuyentes del impuesto inmobiliario, el 6,8% (129 mil) también optó por esa forma de pago.
Para cada una de las variables bajo estudio, visualmente se intentó detectar si su comportamiento variaba dependiendo de si el objeto estaba adherido a débito o no. “Los datos que se extrajeron estaban divididos en dos categorías (por objetos): automotores e inmuebles. Y para cada categoría se le enseñaron a la computadora más de 100 variables. Entre las más importantes estaban la edad, si abonó la cuota única y lo hizo en término, si pagó en cuotas y cada una dentro del término, si tiene débito en la otra categoría o si la paga en término, el lugar donde está radicado el objeto, entre otras”, describe Domínguez.
Del análisis surge que del total de contribuyentes del impuesto automotor, un 6,6% (54.711) tienen alta probabilidad de incorporarse al débito automático. Y lo mismo sucede con un 5,5% de quienes abonan el impuesto de Rentas provincial.
“A esos casi 200 mil registros los llevamos internamente a nuestros sistemas y empezamos campañas de comunicación para invitarlos a adherirse, a mejorar sus descuentos, a partir de los descuentos que otorga Rentas por el uso del débito automático. Es importante aclarar que se trata de una prueba de concepto en un período de tiempo y en un contexto económico pre eleccionario que hoy cambió, y por esa razón el comportamiento/respuesta de la gente ante una campaña de comunicación puede no ser el esperado", explica Romano.
Uno de los aspectos que pone el valor el funcionario es la capacitación que realiza actualmente un equipo de la DGR en la diplomatura de FaMAF en ciencia de datos, así como en otros trayectos formativos. El objetivo es conformar equipos con capacidad para aplicar inteligencia artificial a procesos de mejora dentro del Estado, la DGR o la Secretaría de Ingresos Públicos.
Lo que sigue
A futuro, la idea es aplicar estas capacidades a clasificación de encuestas, es decir, explotar de una manera más analítica e integrada los comentarios y el resto de la información que aportan las encuestas de experiencia ciudadana. También buscarán propiciar actividades dirigidas a la difusión de conocimientos, experiencias y habilidades con el fin de facilitar el uso, la aplicación y la explotación de lo surgido en el proyecto.
Finalmente, apuntan a incorporar técnicas de ciencias de datos y aprendizaje automático para un adecuado análisis de la base de datos y la clasificación de sujetos.