INOVAÇÃO | 22.04.2024
Modelos generativos e seu papel na geração de dados sintéticos
Os modelos generativos são algoritmos de IA projetados para aprender padrões; os dados sintéticos, um subconjunto da IA Generativa de grande importância estratégica para as empresas. São vários os modelos generativos mais destacados, que são empregados em função das necessidades de cada projeto. A MAPFRE Insurance está utilizando Conditional Tabular Generative Adversarial Networks (CTGAN, em sua sigla) para combater a fraude com IA e dados sintéticos.
Os dados sintéticos se consolidaram como uma ferramenta-chave para o desenvolvimento tecnológico e a inovação empresarial, permitindo a simulação de cenários complexos e a melhoria de modelos de Inteligência Artificial (IA) sem comprometer a privacidade de dados pessoais.
Ao replicar os perfis estatísticos dos dados reais, oferecem uma alternativa ética e jurídica diante das restrições impostas por regulamentações como o RGPD, permitindo a experimentação e a análise da informação. Sua capacidade para gerar conjuntos de dados diversificados e controlados fomenta a inovação e melhora a precisão e robustez dos sistemas que dependem deles para seu funcionamento.
Modelos generativos, um elemento-chave
Os modelos generativos são algoritmos de IA criados para aprender padrões a partir de extensos conjuntos de dados e gerar novas instâncias que conservam a coerência estatística com os dados originais. Diferentemente de outros modelos de IA, que se concentram na classificação ou previsão de dados com base em entradas específicas, os modelos generativos aspiram a captar e replicar a distribuição dos dados estruturados e desestruturados para criar algo novo.
Por exemplo, depois de examinar milhares de imagens de rostos, um modelo generativo poderia sintetizar imagens de pessoas inexistentes que, no entanto, pareceriam fotografias reais. Este processo é realizado mediante técnicas baseadas em modelos de redes neurais artificiais, como as Generative Adversarial Networks (Redes Generativas Adversativas ou GANs em sua sigla em inglês), e Autoencoder Models (ou modelos autocodificadores em português), utilizados para aprender representações eficientes de dados (aprendizagem automática).
As GANs, compostas por duas redes neuronais – o gerador e o discriminador – ilustram o funcionamento dos modelos generativos. Enquanto o gerador fabrica dados novos, o discriminador os avalia em comparação a um conjunto real, aprendendo a diferenciá-los. Durante o treinamento, o gerador melhora sua habilidade para criar dados cada vez mais convincentes, tentando enganar o discriminador, que, por sua vez, se esforça para reconhecer as imitações.
O que diferencia os modelos generativos é sua faculdade para conceber e criar, concedendo-lhes um valor especial em áreas onde a criatividade e a geração de ideias são essenciais. Oferecem um enfoque mais flexível e amplo para explorar soluções, superando as limitações dos métodos convencionais de IA.
Tipos de modelos generativos e seus aplicativos
Entre os modelos generativos mais destacados estão as Generative Adversarial Networks (GANs), os Conditional Tabular Generative Adversarial Networks (CTGAN), os Autoregressive Models (AR) e os Autoencoder Models. Em que consiste cada um?
- Generative Adversarial Networks (GANs): criam imagens, vídeos e áudios surpreendentemente realistas. Um exemplo prático é a criação de rostos de pessoas que não existem, utilizados na indústria do entretenimento para criar personagens de videogames ou filmes.
- Conditional Tabular Generative Adversarial Networks (CTGAN): geram dados tabulares sintéticos, preservando sempre a privacidade. Por exemplo, no setor financeiro, podem simular dados de transações bancárias para testar algoritmos sem expor informação sensível do cliente.
- Autoregressive Models (Modelos Autorregressivos, em português, ou AR): são modelos baseados em séries temporais que preveem o próximo elemento em uma sequência, fundamentais em ferramentas de previsão de texto ou na geração automática de música, onde cada nota se baseia nas anteriores.
- Autoencoder Models: são modelos projetados para comprimir ou codificar os dados de entrada para reduzi-los à sua máxima expressão, reconstruindo ou decodificando depois a informação original a partir da representação comprimida. São treinados a partir de Machine Learning não supervisionado. Um exemplo destes modelos são os Variational Autoencoder (VAEs), aplicados na criação de imagens.
MAPFRE Insurance: inovando na aplicação e uso dos dados sintéticos
A MAPFRE está inovando em suas operações no mundo todo e, especificamente nos EUA. através da MAPFRE Insurance, está empregando este tipo de modelos generativos.
Com a ajuda de sistemas de IA que aplicam machine learning e análise de gráficos, as equipes de Advanced Analytics e Technical Claims desenvolveram um projeto com o qual é possível identificar padrões de fraude nos sinistros, inicialmente em Automóveis e posteriormente em Lar. Este enfoque alcança uma gestão mais eficiente da tramitação de sinistros e a detecção de fraude, o que representa um avanço significativo na luta contra as perdas econômicas anuais provocadas por fraudes no setor.
O modelo generativo empregado foi o CTGAN. Ao declarar uma parte de Lar, o modelo avalia sua probabilidade de fraude, derivando casos suspeitos para uma investigação posterior mais detalhada.
Para este trabalho, a MAPFRE Insurance utiliza dados sintéticos no treinamento do modelo de IA. Esta estratégia permite superar o desequilíbrio e a escassez de sinistros fraudulentos históricos, melhorando a capacidade do algoritmo para identificar padrões de fraude de uma maneira mais precisa. Gerando um conjunto de dados mais equilibrado, a companhia consegue que seus modelos de detecção de fraude em seguros Residenciais sejam muito mais precisos.
A adoção de modelos generativos e dados sintéticos está transformando o setor empresarial, especialmente no que diz respeito à análise de dados complexos e à proteção de informação sensível. Essa transformação está se tornando tangível na melhoria da eficiência, da produtividade ou no uso ideal dos recursos disponíveis.
Estas tecnologias inovadoras permitem simular cenários realistas sem comprometer dados reais, permitindo uma tomada de decisões mais precisa e facilitando o desenvolvimento de produtos e serviços mais adaptados às necessidades concretas do mercado. Ao facilitar uma análise de dados mais profunda e livre de preconceitos, as empresas podem antecipar tendências de mercado, otimizar operações e explorar novas oportunidades de crescimento.
ARTIGOS RELACIONADOS: