Mutua Ventures

  1. INICIO
  2. >
  3. TENDENCIAS
  4. >
  5. Los datos sintéticos abren paso a...

Los datos sintéticos abren paso a modelos más avanzados de IA

Portada datos sintéticos Mutua

CLAVES DEL ANÁLISIS

  • España será el principal impulsor de inteligencia artificial en el continente europeo, pues el país contará con el mayor centro de inteligencia artificial de toda la región. 
  • Para 2024, el 60% de los datos utilizados para el desarrollo de inteligencia artificial y proyectos de análisis provendrá de información generada sintéticamente.
  • Los datos sintéticos permiten dar solución a los problemas de precio e indisponibilidad en área de seguros de auto, permitiendo desarrollar acciones dentro de la empresa de manera rápida y con menores costes.

La inteligencia artificial se ha convertido en una de las principales aliadas de las empresas. Este avance tecnológico permite alcanzar grandes resultados que años atrás resultaban inimaginables. Mediante la combinación de algoritmos, se logra desarrollar sistemas computacionales capaces de realizar tareas que anteriormente eran llevadas a cabo por seres humanos como la toma de decisiones, la resolución de problemas y el aprendizaje. Para garantizar su eficiencia y rendimiento, se requiere de dotarlos con amplios sets de datos, lo que les permite desarrollar sus funciones de emulación del pensamiento lógico-racional. La calidad de los datos determinará en gran medida el éxito del sistema de inteligencia artificial, por lo que esto resulta un factor clave al momento de generar una solución basada en esta tendencia.

Por su parte, España será el principal impulsor de inteligencia artificial en el continente europeo, pues el país contará con el mayor centro de inteligencia artificial de toda la región. A nivel internacional, la inversión en inteligencia artificial ha ido aumentando en los últimos años por los beneficios que esta trae consigo. El mercado global de inteligencia artificial alcanzó los 327.500 millones de dólares en 2021, 46.100 millones de dólares más que en 2020. Asimismo, se proyecta que para 2024 su valor sobrepase los 554.300 millones de dólares.

LA REVOLUCIÓN DE LOS DATOS SINTÉTICOS


Ahora bien, en muchas ocasiones existen barreras para acceder a datos, bien sea por cuestiones legales (como por ejemplo, las leyes de protección de datos), económicas o simplemente debido a que no se encuentran disponibles. En estos casos, los modelos estadísticos y otras técnicas de simulación sustentadas en ordenadores suelen ayudar a generar datos que se adaptan a la realidad, aunque estos no hayan sido obtenidos directamente de la misma. A esta modalidad de datos se les conoce como datos sintéticos. Entonces, al momento de desarrollar modelos que requieran de datos, pueden emplearse datos reales, sintéticos o mixtos (datos reales complementados por sintéticos).

Las dos estrategias más comunes que existen para construir datos sintéticos son:

1. Extracción de números de distribuciones estadísticas reales. Para luego reproducir datos en base a la información recopilada.

2. Modelado basado en agentes. Se crea un modelo que explica un comportamiento observado y luego reproduce datos aleatorios.


Los datos sintéticos se crean de forma algorítmica, y pueden utilizarse, entre otras cosas, para validar modelos matemáticos y entrenar sistemas de machine learning. Para 2024, el 60% de los datos utilizados para el desarrollo de inteligencia artificial y proyectos de análisis provendrá de información generada sintéticamenteAdemás, para 2030 la mayor parte de los datos usados en sistemas de inteligencia artificial serán fabricados mediante reglas, modelos estadísticos, simulaciones y otras técnicas similares.


BENEFICIOS Y APLICACIONES DE LOS DATOS SINTÉTICOS


Entre las principales ventajas que aporta el uso de datos sintéticos resaltan:

  • Evitar limitaciones y restricciones de uso de datos reales.
  • Hacer frente a problemas estadísticos comunes como la falta de datos, patrones de omisión y demás restricciones lógicas.
  • Simular situaciones reales que no se han originado.
  • Construir modelos de inteligencia artificial y aprendizaje automatizado más eficientes.


Por el otro lado, también existen ciertos desafíos que deben ser considerados al momento de implementar datos sintéticos. Entre estas se encuentran:

  • Falta de valores atípicos. Al no ser una réplica exacta de los modelos basados en datos reales, no disponen de datos atípicos, que en algunas ocasiones resultan relevantes y necesarios.
  • Desconfianza del usuario. Aunque su uso trae consigo muchos beneficios, al ser una práctica reciente y poco institucionalizada, trae consigo cierta reticencia en el usuario en cuanto a confianza se refiere.
  • Calidad de los datos. Que dependerá directamente de la calidad de los datos de entrada y del modelo de generación de datos implementado. En este sentido, se precisa prestar mucha atención a estos dos elementos para evitar niveles de calidad no óptimos.


LOS DATOS SINTÉTICOS EN EL SECTOR ASEGURADOR


Por su parte, el sector asegurador debe sacar provecho al uso de datos sintéticosPara poder mejorar significativamente los modelos de inteligencia artificial que están siendo implementados en diferentes procesos y ámbitos dentro de las compañías aseguradoras (suscripción de pólizas, procesamiento de reclamaciones, consultas, procesos internos de la compañía, entre otros), los datos sintéticos son la solución. Aunque no se tenga constancia de que el sector de seguros esté impulsando la adopción de este tipo de datos, resultaría beneficioso la inversión en esta tendencia emergente.

En el área de auto, los datos sintéticos resultan aún más beneficiosos. No es un secreto que la recopilación de información y datos de los clientes sobre cuestiones relacionadas con la conducción y los autos resulta costoso. Asimismo, determinar rangos para las primas de las coberturas de nuevos productos dentro del ámbito suele ser complicado debido a la insuficiencia de datos. Por su parte, los datos sintéticos permiten dar solución a los problemas de precio e indisponibilidad en área de seguros de auto, permitiendo desarrollar acciones dentro de la empresa de manera rápida y con menores costes. A continuación, se muestra una comparación entre un modelo de primas de seguros de auto basada en datos reales frente a uno elaborado a partir de datos sintéticos. 

                                                                              Fuente: Richardson, S.

CASOS DE ÉXITO

En la actualidad, son muchas las soluciones de inteligencia artificial ofrecidas por proveedores que hacen uso de datos sintéticos para la construcción de sus modelos. En el área de seguros de auto existen varias alternativas, entre estas destacan:

  • GENPACT. La firma estadounidense dispone de un software de inteligencia artificial para el procesamiento automatizado de reclamaciones en seguros de auto. Este se encuentra entrenado con datos sintéticos e imágenes. Entre los daños que puede detectar destacan rayones, abolladuras, hendiduras, piezas faltantes, desalineaciones y roturas. Su solución promete reducir los tiempos de espera del procesamiento de reclamaciones de 10 días a tan solo horas.

  • ANYVERSE. Es una startup española que ofrece datos sintéticos para la industria de la percepción avanzada, especialmente en el área de autos y drones. Con ello buscan hacer esta industria más ágil y eficiente con soluciones económicamente mejores. Permiten al cliente definir el tipo de datos que necesitan, replicando condiciones que pueden darse en el mundo real. Asimismo, permiten definir la variabilidad en factores como las escenas, el clima, la luz o el momento del día, para asegurar una multiplicidad de datos que se adapten a las necesidades reales de cada cliente.

  • STATICE. La empresa alemana dispone de un modelo que produce datos sintéticos en base a datos reales, conservando las propiedades, características y estructura de estos últimos. Los modelos de proyección de Statice se centran en datos que están protegidos por leyes de protección, para así poder anonimizarlos y obtener datos sintéticos que puedan ser usados sin problema alguno. Actualmente, Statice trabaja con la aseguradora suiza La Mobiliére para establecer un sistema que prediga el abandono de clientes de la empresa.