Comprender a los encuestados sintéticos en la investigación de mercados
Imagínese: su equipo acaba de aprovechar un gran modelo lingüístico (LLM) para desarrollar algunos conceptos nuevos e interesantes sobre snacks. Pero ahora se enfrenta a un nuevo reto: ¿qué ideas merecen la pena, cuáles necesitan algunos retoques y cuáles deben descartarse?
Para la mayoría de los innovadores, el siguiente paso es seleccionar de la larga lista de ideas. Para ello, a veces se recurre a grupos focales, pero lo más frecuente es seleccionar las favoritas del equipo antes de pasar a las pruebas con consumidores, es decir, iniciar el ciclo de innovación con un juego de azar.
Afortunadamente, la última tecnología de IA Generativa (GenAI), que ya ha demostrado ser muy prometedora para los innovadores de productos, también tiene una respuesta para esto.
Los encuestados sintéticos son personas artificiales generadas por modelos de aprendizaje automático para imitar las respuestas humanas en los estudios de mercado. Pueden representar mercados objetivo, grupos demográficos específicos o incluso perfiles de consumo.
Basados en un conjunto diverso de fuentes de datos, estos “consumidores suplentes” pueden generar comentarios sobre cualquier número de temas, pero para la innovación de productos, su aplicación más útil (por ahora) es evaluar y optimizar rápidamente nuevos conceptos.
Esta comprobación en fases tempranas tiene potencial para clasificar ideas y acelerar los ciclos de innovación, al tiempo que se ahorra tiempo y recursos para cuestiones de investigación que requieren la opinión de consumidores humanos reales.
Pero para aprovechar esta tecnología en una solución eficaz hace falta algo más que acoplar una interfaz brillante a un LLM. El afán de los proveedores de investigación por lanzar de la noche a la mañana soluciones no optimizadas con audaces afirmaciones sobre sus capacidades ha llevado a muchos -nosotros incluidos- a mostrarse escépticos.
El problema radica en la capacidad de los actuales LLM para producir resultados que parezcan convincentes. Incluso cuando estos modelos de rápida comercialización carecen de acceso a las herramientas o los datos adecuados para ser precisos, pueden generar resultados que, a primera vista, aparentan solidez.
Producir respuestas convincentes es diferente de proporcionar respuestas precisas, especialmente cuando se trata de tomar decisiones de negocio que dependen de la integridad de los datos. Esta discrepancia es también la razón por la que aún puede dudar en sustituir a su abogado por ChatGPT.
Si le intriga la promesa de GenAI pero está evaluando sus capacidades con cautela, puede que se pregunte si los modelos sintéticos son una propuesta realista. ¿Puede una persona sintética transmitir realmente las preferencias y opiniones de los consumidores humanos? ¿Existen características de las mejores herramientas que las diferencien de las demás? ¿Cómo podemos garantizar que estas soluciones ofrezcan precisión y valor empresarial real?
Con estas preguntas en mente, nos propusimos encontrar respuestas a través de nuestra propia y rigurosa experimentación.
Creación del modelo sintético definitivo
Nuestra experimentación en la construcción de modelos sintéticos comenzó hace años, utilizando nuestros datos transaccionales en el mercado para la previsión volumétrica y la detección de tendencias. Con más de 20 años de experiencia en la creación de soluciones patentadas de IA y aprendizaje automático e IA para empresas -por no hablar de nuestra enorme base de datos de panel de consumidores-, siempre hemos estado en una posición ideal para introducir una herramienta de este tipo en el mercado.
Pero incluso cuando la reciente aparición de GenAI ha impulsado nuevas posibilidades, nuestro enfoque experimental ha seguido siendo deliberado, priorizando el valor para el cliente por encima del ruido del mercado. Por encima de todo, nos hemos centrado en garantizar la precisión de los resultados mediante pruebas y validaciones, y no estamos dispuestos a comprometer la calidad por encima de la velocidad de comercialización. Esta estrategia se ha confirmado una y otra vez, no sólo a través de nuestros resultados, sino también en conversaciones con clientes que han observado que la tecnología que adoptaron al principio no cumplía lo prometido.
Aunque son muchas las complejidades que intervienen en la creación de la solución definitiva de respuesta sintética, hemos identificado tres principios sencillos y no propietarios que distinguen a los mejores modelos de sus contrapartes. No es de extrañar que cada uno de ellos comience y termine con datos reales de consumidores proporcionados por humanos.
Los mejores modelos sintéticos deben probar, calibrar y validar la precisión de las respuestas en todas las categorías
“Cuando se trata de aprovechar la IA Generativa en la investigación de mercados, no hay atajos para proteger la calidad de los datos. Como líderes de confianza en esta industria, nuestros clientes esperan que establezcamos el punto de referencia de lo que constituye la “calidad”, y han participado con entusiasmo en este recorrido.”
– Mark Flynn, vicepresidente senior de liderazgo de producto, NIQ BASES
El sueño de todo equipo de desarrollo de productos es “lift and shit“, es decir, crear mecanismos escalables que impulsen resultados eficaces en todas las categorías, mercados y circunstancias. De hecho, esta pretendida simplicidad de uso es a menudo lo que hace tan atractivos muchos de los primeros modelos sintéticos del mercado: ¿a quién no le gustaría tener la posibilidad de digitar unos cuantos datos demográficos y las preferencias de los consumidores y generar retroalimentación conceptual para categorías como cuidado de la piel, soluciones de limpieza o comida para perros?
Pero, ¿puede este enfoque generar resultados que reflejen fielmente la toma de decisiones humana?
Sabemos que los consumidores son previsiblemente irracionales a la hora de tomar decisiones y que los impulsores del valor suelen estar determinados por el contexto. Lo que un consumidor quiere en el empaque de los cereales será diferente de sus preferencias para el cuidado de la piel; su sensibilidad al precio de los productos para blanquear los dientes será diferente de la de los chicles.
Las personas sintéticas también muestran preferencias variadas entre categorías, pero de forma distinta a los humanos. Los sesgos de los modelos también pueden manifestarse en distintos papeles según las categorías; por ejemplo, en nuestro experimento, observamos que los encuestados sintéticos parecían preocuparse más por la salud humana que los humanos reales.
El control de estos factores requiere un ajuste continuo de la metodología, las instrucciones e incluso el orden de los mensajes para obtener respuestas auténticas. Aprendiendo sobre la marcha, hemos adaptado nuestros procedimientos de prueba en consecuencia y, lo que es más importante, hemos validado los resultados con las opiniones de consumidores humanos reales, aprovechando nuestra amplia experiencia en calibrar las puntuaciones de los paneles de consumidores con las ventas en el mercado a partir de los datos de ventas minoristas.
Y lo que es más importante, también hemos trabajado para garantizar que nuestra metodología dé prioridad a la protección de la propiedad intelectual de nuestros clientes, lo que significa que sus contenidos o datos patentados nunca se utilizarán para entrenar modelos. Aunque nuestro proceso pueda parecer tedioso para algunos, hemos descubierto que no hay atajos para proteger la calidad de los datos o la información competitiva de nuestros clientes. Estas mejoras continuas y la capacidad de aprovechar nuestros activos de datos para la entrada y validación nos dan confianza en la precisión y utilidad de nuestros resultados, lo que se traduce en los resultados de negocio que nuestros clientes esperan de nosotros.
Los mejores modelos sintéticos deben aprovechar los datos granulares más recientes para aumentar la precisión
“Las preferencias de los consumidores nunca son estáticas. Factores dinámicos como la economía, los acontecimientos mundiales o incluso la última tendencia de TikTok les dan forma, se reconfiguran o se invierten continuamente. Incorporar preferencias recientes y relevantes es fundamental para predecir la aceptación de los consumidores, tanto si trabajas con datos humanos como sintéticos.”
-Ramon Melgarejo, Presidente de Strategic Analytics and Insights
Piense en la primavera de 2020. Hasta entonces, ¿necesitaba paquetes múltiples de toallitas desinfectantes? ¿Había planificado alguna vez su suministro de papel higiénico más allá de esperar invitados en casa o encontrar su marca favorita en oferta? La pandemia es quizá un ejemplo dramático pero relevante de lo rápido que puede cambiar el comportamiento de los consumidores. Incluso un movimiento sutil en las tendencias a lo largo del tiempo puede dar lugar a variaciones en la retroalimentación, que es la razón por la que hemos dado prioridad a impulsar modelos con los últimos datos de comportamiento en el mercado en lugar de entrenarlos en las preferencias históricas.
Pero no todos los datos de consumo son iguales. Llevamos décadas seleccionando nuestros conjuntos de datos para asegurarnos de que están controlados y calibrados para reflejar con precisión lo que les interesa a los consumidores -y lo que compran realmente- hoy en día. El uso de estos datos de comportamiento en nuestras sugerencias garantiza que los comentarios sintéticos sean predictivos de las tendencias actuales y emergentes, en lugar de reflejar las preferencias de hace 5 o 10 años. Desde el punto de vista del tiempo y los recursos, este enfoque también alivia la necesidad de reciclar constantemente los modelos a medida que se actualiza la información y evolucionan las capacidades técnicas, lo que garantiza que nuestra plataforma utilice siempre los datos y la tecnología más recientes y avanzados.
Si va a invertir en estudios de mercado para limitar las ideas conceptuales, es esencial que esos datos le orienten en la dirección correcta; de lo contrario, no tendrá más remedio que limitarse a elegir al “favorito del equipo”. Al aprovechar nuestro amplia y exclusiva gama de datos de mercado recientes, para elaborar nuestros modelos sintéticos, encontramos una clara divergencia en la calidad de los resultados, lo que valida nuestra metodología y ofrece garantías sobre la capacidad de nuestros modelos para resistir el paso del tiempo.
Los mejores modelos sintéticos deben contextualizar los datos para orientar los pasos siguientes
“Aunque la información sintética generada por la IA puede ofrecer información valiosa, es fundamental contextualizar los resultados con los datos del mundo real. Sin ese equilibrio, se corre el riesgo de actuar sobre patrones que pueden carecer de relevancia o pasar por alto los matices necesarios para la toma de decisiones informadas.”
– ChatGPT [aporte cuidadosamente indicado a través de un prompt por nuestros autores]
Ha introducido el prompt o la instrucción/consulta, lo ha ejecutado, ha generado el resultado… ¿y ahora qué?
En la mayoría de los modelos sintéticos que existen actualmente en el mercado, la funcionalidad termina una vez generado el resultado. Por desgracia, esto suele dejar a los usuarios sin saber qué hacer a continuación. ¿Qué tan bueno es un “buen” concepto? ¿Una idea “mala” puede optimizarse con algunos retoques o debe descartarse? ¿Cuál es la siguiente fase del desarrollo de una idea y cómo puede elevarse hasta su lanzamiento?
Como expertos en la conservación de conjuntos de datos únicos, estamos creando nuestra propia base de datos de encuestados sintéticos. Este repositorio no sólo indicará exactamente qué tan bien le va a un concepto, sino que también situará ese desempeño en un contexto comparativo con otras ideas de los innovadores. Al eliminar estas conjeturas, los innovadores pueden determinar qué iniciativa es una mejor apuesta, o precisar las mejoras en lugar de volver a empezar de cero.
El desarrollo y el lanzamiento de una innovación exitosa es un proceso largo que va mucho más allá de la evaluación de ideas. Independientemente de que los comentarios de los consumidores sean sintéticos o humanos, proporcionar esa información en contexto para orientar los siguientes pasos es crucial y, en nuestra opinión, es lo que diferencia a la mejor herramienta de su clase de el promedio. La capacidad de evaluar su idea en fase inicial con The Full View™ de los insights de NIQ, puede marcar la diferencia entre un producto que simplemente se lanza y uno que finalmente prospera.
Navegando juntos por la revolución de la IA
Los encuestados sintéticos no son un sustituto de los consumidores humanos en la investigación de mercado; son un complemento a su proceso de ideación cuando el tiempo es esencial. Por mucho que su potencial cambie las reglas del juego, estos modelos requieren conjuntos de datos únicos, estímulos y una calibración continua para generar de forma coherente resultados fundamentados y procesables. Sólo se debe confiar en la información sintética cuando el proveedor tiene acceso a datos que validan su exactitud. Afortunadamente, las empresas que deseen explorar esta tecnología emergente para la investigación de mercados pueden evitar el agotamiento y el escepticismo en el futuro formulando preguntas clave a sus proveedores.
La revolución de la IA sigue generando disrupción, con oportunidades sin precedentes y riesgos significativos. En NIQ, nuestro compromiso con la innovación va acompañado de nuestra dedicación rigurosa a la validación y el perfeccionamiento. Le invitamos a unirse a nosotros en la navegación de esta era transformadora, asegurando que juntos, podemos aprovechar el verdadero poder de GenAI para el futuro de los insights del consumidor.

¿Desea obtener más información?
¿Está preparado para llevar sus innovaciones al siguiente nivel con la IA Generativa?
Contáctenos para conocer más sobre las pruebas beta de encuestados sintéticos en NIQ BASES.
La promesa de la IA en Consumer Insights
En NIQ, creemos firmemente en el poder transformador de la IA en nuestra industria y su impacto en el retorno de la innovación de nuestros clientes. Nos entusiasma liderar esta transformación.
Hemos estado a la vanguardia de la innovación en IA en la industria, con múltiples patentes científicas relacionadas con la IA desde 2015, una contribución que supera con creces a la de la mayoría de las empresas que afirman tener la fórmulapara el éxito de la IA. Esta búsqueda de la innovación impulsada por la IA nos ha traído grandes resultados en NIQ BASES, ya que llevamos décadas aprovechando una combinación de modelos de IA para guiar a nuestros clientes hacia nuevos productos más exitosos.
Ahora, estos aprendizajes pasados son fundamentales a la hora de desarrollar la próxima generación de herramientas impulsadas por IA.

Martin Levanti
Martin Levanti es Vicepresidente de Analytics Commercialization en NIQ BASES, donde desempeña un papel fundamental en la creación de capacidades basadas en IA que mejoran las herramientas de investigación y ofrecen información valiosa a clientes de todo el mundo.
Courtenay Verret
Courtenay Verret es Vicepresidenta de Global Thought Leadership en NIQ, donde traduce la inteligencia del consumidor en información procesable a través de la narración de historias.
