Metodología

Funes es un algoritmo que identifica situaciones de riesgo de corrupción en las contrataciones públicas del Perú. El proyecto de investigación comenzó a gestarse en febrero del 2018 y su desarrolló se inició en septiembre del mismo año. Durante 15 meses un equipo multidisciplinario -integrado por programadores, estadísticos y periodistas- discutió, analizó, construyó bases de datos, verificó la información y modeló este algoritmo al que denominamos Funes, como el memorioso personaje del escritor argentino Jorge Luis Borges.

La corrupción que Funes busca es la que se conoce como colusión: cuando un funcionario público está vinculado a una empresa y usa su influencia para hacerla ganar un concurso público. Este tipo de corrupción presenta determinados indicios que incrementan los riesgos en el proceso de contratación. Por ejemplo, si la empresa contratista fue fundada un mes antes de la convocatoria, si al concurso se presentó un único postor, o si el funcionario y el contratista comparten algún vínculo político con alguna organización. Funes define a estas características sospechosas como “banderas rojas” o indicadores de riesgo.

En otros países, se han desarrollado herramientas que aprovechan las bases de datos públicas y disponibles para calcular estos indicadores, y alertar situaciones de riesgo. Esos son los casos de Arachne y Digiwhist de la Unión Europea; Red Flags de Transparencia Internacional; y herramientas de la sociedad civil como Groucho, de la ONG mexicana Poder.

En el caso de Funes, la herramienta usa una familia de algoritmos denominados modelos lineales para combinar la información de 20 indicadores de riesgo, que fueron calculados a partir de 4 bases de datos. Un modelo lineal tiene la forma de un promedio ponderado:

\(peso_1indicador_1 + peso_2indicador_2 + ... + peso_nindicador_n = riesgo de corrupción\)

Para aprender estos pesos usualmente se utiliza un esquema de regresión, que consiste en intentar predecir la respuesta -que en este caso, sería la corrupción- a partir de variables relacionadas -como llamaremos a los indicadores de riesgo-. De esta manera, los pesos aprendidos para cada indicador son los que mejor ayudan a predecir la respuesta para todos los contratos analizados.

Sin embargo, Funes usa una variante de este esquema porque la corrupción en contrataciones públicas -denominada nuestra variable respuesta- es un fenómeno no observable: tenemos seguridad de que los contratos que han sido descubiertos por los fiscalizadores fueron corruptos; pero los que no, no sabemos si están absolutamente limpios o aún no son descubiertos, porque pueden responder a sofisticados y esquemas de corrupción más complejos como sucede, por ejemplo, con el caso Odebrecht y Lava Jato.

El método de Funes parte de un esquema de proxies de corrupción, propuesto por Mihaly Fazekas, investigador de la Universidad de Cambridge. Un proxy es una variable estrechamente relacionada a la variable no observable. Funes usa dos proxies: 1) que un contrato haya tenido un único postor; 2) la proporción de concentración del presupuesto de una entidad que tiene cada contratista.

Entonces, Funes es una combinación de dos modelos lineales, una regresión logística para el único postor y una regresión beta para la proporción de concentración. El resultado de este proceso es un índice de riesgo de corrupción para cada contrato: a más alto, mayor riesgo.

¿Qué identifica Funes como riesgoso? Lo que más le llama la atención son procesos de contratación donde el contratista gana de forma recurrente en la misma oficina de una misma entidad, siendo único postor en la mayoría de sus procesos.

Estas son las bases de datos que Funes combina y analiza:

Indicadores de riesgo que Funes analiza:

Indicador de riesgo Fuente
Edad (años) de la empresa postora al momento de la convocatoria SUNAT
Número total de empresas representadas por representantes legales del postor SUNAT
Número de empresas registradas en el mismo domicilio fiscal del postor SUNAT
Edad (años) promedio del postor o sus representantes legales Fuentes propias
Contratista ha sido sancionado previamente por el Tribunal de Contrataciones OSCE
Se presenta un único postor a la convocatoria OSCE
Proporción de concentración de gasto de entidad contratante del postor OSCE
Tiempo de convocatoria (días útiles) desde el anuncio hasta el fin de recepción de ofertas OSCE
Tiempo de decisión (días útiles) de elegir al postor ganador OSCE
Tipo de proceso de contratación (ejemplo: contratación directa) OSCE
El proceso de contratación ha sido reiniciado OSCE
Logaritmo del monto del contrato OSCE
Monto acumulado de relación recurrente entre postor y funcionario involucrado en selección* OSCE
Número de contratos de relación recurrente entre postor y funcionario involucrado en selección* OSCE
Tiempo (días) de relación recurrente entre postor y funcionario involucrado en selección* OSCE
Número de entidades en relación recurrente entre postor y funcionario involucrado en selección* OSCE
Proporción del monto/contratos/tiempo de relación recurrente y monto/contratos/tiempo acumulado del postor* OSCE
Proporción del monto/contratos/tiempo de relación recurrente y monto/contratos/tiempo acumulado del funcionario* OSCE
Proporción de procesos ganados sobre postulados del postor en esa entidad * OSCE
Proporción de dependencia del postor con esa entidad OSCE
Conexión política del postor con altos funcionarios de entidad INFOGOB - ONPE - OSCE - SUNAT
Conexión política del postor con Usuario Seace INFOGOB - ONPE - OSCE - SUNAT
Conexión política del postor con integrantes del comité de selección INFOGOB - ONPE - OSCE - SUNAT

Precisiones sobre los datos utilizados por el algoritmo

  • Para un mejor análisis los montos de las monedas extranjeras se cambiaron usando el tipo de cambio promedio mensual publicado por el BCR, a la fecha de la convocatoria del proceso.
  • El procesamiento y análisis de datos se hizo en el lenguaje de programación R. Para ajustar las regresiones, se usaron los paquetes betareg y rms.
  • Para entender mejor el elevado número de contrataciones sin competencia, reagrupamos los datos de los procesos en base al número de postores que se presentan.
Grupo Nombre del grupo Definición
Grupo 1 Procesos sin competencia Todos los contratos que tienen un único postor, más allá de su modalidad (todos).
Grupo 2 Procesos con competencia Agrupa todas las licitaciones y concursos públicos, subastas inversas con más de un postor
Grupo 3 Procesos simplificados con competencia Procesos de contratación con varios postores, denominados adjudicación simplificada que tienen varios postores y adjudicación de menor cuantía con más de un postor.
Grupo 4 Procesos poco competitivos Todos los contratos contemplados en las adjudicaciones directas o selectivas con más de un postor, exoneraciones, contrataciones directas, comparación de precios con invitación
Grupo 5 Los contratos de PetroPerú Todos los contratos de compra que realiza esta empresa pública a través de sus régimen especial de contratación.
Grupo 6 Contratos en el extranjero Contrataciones internacionales fuera del marco normativo local
Grupo 7 Regímenes especiales Otros: convenio, procedimiento especial de contratación, régimen especial