Datos sintéticos y hasta "gemelos digitales": cómo la IA irrumpe en el mercado de encuestas e incluso en el Censo
¿Puede la IA reemplazar a los humanos encuestados? Podría, y ya lo hace. Por ahora, esta herramienta se usa mayormente para mejorar la eficiencia y optimizar los procesos en investigación de mercado, aunque ya se ve en la elaboración del Índice de Remuneraciones del INE y el IPC. Eso sí, supone riesgos por sesgos, dilemas éticos, e incluso un "riesgo reputacional", reconocen las consultoras, además de un cambio menos visible en el mercado laboral. Guillermo V. Acevedo
Las encuestas, durante décadas construidas a papel y lápiz, llamadas, tablas Excel y largas horas de terreno, hoy atraviesan un cambio de época. La inteligencia artificial permite crear cuestionarios, procesar millones de datos en segundos e incluso generar "gemelos digitales" de los encuestados.
Son avances que ya están en uso, aunque el desafío ahora, coinciden los expertos, no es tecnológico, sino ético: ¿puede la IA reemplazar la opinión real de las personas? Sí puede -concuerdan contactados-, y ya se está implementando, aunque discrepan sobre la validez de estos resultados.
Una de las aplicaciones de esta transformación digital se ve "en el reemplazo de los respondentes, y en cómo podemos predecir lo que el encuestado va a decir sin necesidad de preguntarle sobre eso", comenta Nicolás Fritis, CEO de Ipsos Chile.
Se trata de los "gemelos digitales", réplicas virtuales de personas reales, construidas a partir de sus respuestas, atributos y patrones de comportamiento, que pueden ser reutilizadas en escenarios simulados de investigación.
Empresas como Ipsos ya están implementando estas tecnologías, y dentro de los beneficios de su uso se cuentan el realizar focus groups, testeo de productos o simulaciones predictivas sin necesidad de contactar nuevamente al individuo original, optimizando tiempo y costos. Sirve cuando "tienes poblaciones pequeñas, que son difíciles de encontrar y que te contesten", explica Fritis, y agrega que suma eficiencia, puesto que ir a estos "sectores geográficamente alejados, con pocas personas, o aislados, es caro".
Pero en general las empresas encuestadoras mantienen la cautela frente al avance de la IA. Por ejemplo, para validar los resultados, es necesario comparar la data sintética con la data original para verificar si conserva las propiedades estadísticas esenciales, comentan desde la multinacional Ipsos.
Adolfo Munizaga, líder del área de Investigación y Desarrollo de la empresa de opinión pública Cadem, afirma que "está en juego, por sobre todo, la calidad del estudio y la información que se traspasa. Más allá de si es un estudio público o privado, los resultados se usan para la toma de decisiones; entonces, debe ser igual de ético, transparente y bien hecho".
Sí ayuda a la agilidad del manejo de la información, aclara, pero "si confiamos en la automatización (de las respuestas), corremos el riesgo de quedarnos en la descripción del problema, y no llegar a lo explicativo, al fondo del tema".
En Cadem partieron hace dos años creando un corpus de datos que "contiene más de 1.200 estudios de Cadem que los complementamos con información que consideramos relevante". Con todo este corpus de datos crearon un chatbot de uso interno para poder generar, por ejemplo, los cuestionarios.
Ahora bien, para aprovechar lo mejor de ambos mundos -dicen-, debiese tener un uso híbrido. "Toda esta data interna que generamos la complementamos con la escucha social. (...) El modelo de IA no sabe el porqué de las cosas, el humano sabe el porqué, por eso nuestra visión es que debe ser complementario", agrega Munizaga.
Desde la consultora de investigación de opinión pública Criteria, el gerente general Cristián Anguita coincide en que abocarse a la IA "implica un riesgo reputacional muy grande".
Al interior de la empresa crearon un comité enfocado en temas de desarrollo e implementación de la IA, para diagnosticar cómo se está usando e incorporarla para la optimización de procesos. Por ahora, son cautelosos, y es que "al reemplazar la escucha social con la encuesta a muestras creadas por la IA se corre el riesgo de perder los cambios de las dinámicas sociales", dice.
Las muestras sintéticas "tienen legitimidad desde el sentido matemático, porque con toda esa información de un segmento le enseñas a pensar", comenta Anguita, pero aún estamos lejos de probar la validez de las muestras sintéticas; además, "genera dudas desde la parte ética".
Lo mismo en menos tiempo y con menos personal
"En un plazo no muy largo, las empresas no necesitarán agencias que llamen a clientes, pues son procesos que se pueden automatizar y habrá agentes de IA que harán ese trabajo", explica Cristián Anguita.
En el caso de Criteria, "efectivamente ha servido para la optimización de procesos, pues hace lo mismo con menos esfuerzo de tiempo y de personal". Y aunque "aún no ha reemplazado a nadie, en algún minuto la atención se va a orientar hacia allá", sostiene.
Y es que el tema laboral es también una preocupación. Desde Ipsos, Nicolás Fritis comenta que hay una transformación en la búsqueda de profesionales en esta industria.
"Ya no tenemos solamente sociólogos, tenemos ingenieros, cientistas de datos, periodistas o profesiones orientadas al storytelling , para mostrar los datos". E impacta a los perfiles jóvenes, comenta, ya que son cada vez menos necesarios los profesionales que antes hacían el trabajo inicial de "picar piedra", de encuestar en la calle o hacer entrevistas en profundidad, y desde ahí iban subiendo a ser directores de cuentas; ahora se enfocan en buscar gente que ya tenga competencias en investigación de mercado.
Y el sector público también ha sido pionero de la transformación. Leonardo González, subdirector técnico del Instituto Nacional de Estadísticas (INE), asegura que "en el pasado teníamos equipos grandes de clasificación o codificación, con la implementación de modelos basados en técnicas de machine learning , vinculadas a la IA; lo que hacemos es generar procesos de codificación automatizada, que tiene bondades como la eficiencia".
Como consecuencia, "ya no son requeridos estos grandes equipos de codificación, por ejemplo, en la Encuesta de Empleo; entonces, nos significó poder reducir personal dedicado a estas tareas y procesos más eficientes en tiempo, además elimina inconsistencias que se pueden generar entre personas con criterios distintos".
"Antes había equipos permanentes en la Encuesta de Empleo, un equipo de codificación de más de 20 personas", dice. Si bien no es que el equipo fue despedido, González aclara que debieron ser reubicados y hoy se dedican a otras cosas.
Y desde esta experiencia que partió con la Encuesta de Empleo, se ha ido ampliando y hoy es utilizado incluso en el Censo (2024). Este solía ser un proceso "muchísimo más intensivo en cantidad de personas" que en la Encuesta Empleo, afirma, "era mucha gente y esta vez fue más eficiente aplicando modelos de inteligencia artificial".
IA en el Censo y políticas públicas
La IA entró de lleno en la investigación de mercado, pero cuando una encuesta tiene influencia en la toma de decisiones para políticas públicas, la manera en la que se realice y sus resultados no son inocuos, dicen en la industria.
Y es que "una de las grandes desventajas de la IA es que nunca te dice 'no sé'. De hecho, muchas veces las alucinaciones (de la IA) se generan porque la respuesta no puede ser un no sé, y esa aproximación no necesariamente es mejor que la respuesta humana", subraya Alejandro Inzunza, cofundador de Pharu Analytics, que implementa modelos analíticos o de IA en empresas.
Explica que en Chile ya han visto varios casos de IA aplicados a estudios y al diseño de encuestas. Ahora bien, nota riesgos en su uso, "eliminar la opinión y la presencia humana al 100% no sería confiable, porque las máquinas también tienen sesgos que uno mismo le imprime". Sobre el reemplazo de los encuestados, comenta que "si bien la tecnología lo permite, no estamos en un nivel en que podamos confiar de que realmente eso sucede. (...) El experimento hoy debería ser realizar una misma encuesta con ambas modalidades y ver cuál se acerca más".
El subdirector técnico del INE comenta que para las preguntas de glosas abiertas en el Censo de Población y Vivienda, u ocupación o actividad económica, era un proceso que ocupaba grandes equipos y meses de trabajo, y ahora con la IA fue posible procesar las millones de respuestas en plazos "significativamente" más cortos y con mayores niveles de precisión.
Otras áreas donde se implementarán estas tecnologías son el Índice de Remuneraciones y Costos Laborales que realiza el INE cada cinco años. Ahora las respuestas provendrán de los registros administrativos del Estado, que serán usados con un fin de producción estadística y no hará falta una encuesta de la manera convencional, lo que va a significar un importante ahorro que el INE estima de unos $600 millones.
También están generando análisis de imágenes satelitales a través de algoritmos de machine learning e IA para poder interpretar los contenidos de las imágenes y así "distinguir y clasificar con precisión áreas agrícolas, pastizales, bosques u otros usos de suelos que son relevantes para las estadísticas agropecuarias", señala.
Además, para el Índice de Precios al Consumidor (IPC), los encuestadores de precios antes iban a los supermercados y al comercio a recolectar precios que se incorporaban en el cálculo del índice. Hoy el INE cuenta con los registros administrativos que las cadenas les envían, y el proceso se elabora más rápido e incluso de modo más confiable, y hoy "el 30% de los datos provienen de fuentes que no están vinculadas a un encuestador en la calle", sostiene.
Y el mismo INE utiliza esta especie de "gemelos sintéticos", explica González, aunque para la imputación de datos en encuestas -estimar datos faltantes o inconsistentes en conjuntos de datos-, no para reemplazar humanos. Lo relevante, sostiene, es respetar las características de la muestra, es decir, que en la duplicación no haya un sesgo en los resultados. "A veces existe un fetiche de decir 'estamos usando IA para todo', pero somos cuidadosos de tener las distintas pruebas para generar esa expansión y técnicas sofisticadas".