Análise da Propagação de Estereótipos Brasileiros em Ferramentas de Geração de Imagens por Texto
Este trabalho investiga a propagação de estereótipos brasileiros em ferramentas de geração de imagens por texto, com foco nos modelos DALL·E 3, Imagen 3 e Stable Diffusion 3.5. A pesquisa analisa como estereótipos culturais, sociais e regionais do Brasil são perpetuados em imagens geradas, mesmo a partir de prompts neutros. Utilizando 17 prompts baseados em representações estereotipadas e contextos neutros, foram geradas 340 imagens para cada modelo, que foram submetidas a análises qualitativas e quantitativas.
Para a avaliação quantitativa foram adotadas duas abordagens, uma pesquisa com participantes que julgou o grau de estereótipo das imagens e uma análise experimental de similaridade entre embeddings visuais extraídos pelo modelo CLIP. Os resultados da pesquisa indicam que os modelos DALL·E 3 e Stable Diffusion 3.5 foram avaliados como mais estereotipados enquanto o Imagen 3 apresentou um desempenho relativamente mais neutro. Já a análise baseada em CLIP revelou discrepâncias em relação à avaliação humana, sugerindo que essa métrica pode não capturar integralmente as nuances dos estereótipos presentes nas imagens.
O estudo discute os impactos sociais desses vieses, como o fortalecimento de preconceitos e a redução de grupos a representações simplistas, além de propor reflexões sobre o desenvolvimento de tecnologias de geração de imagens mais inclusivas e éticas. Adicionalmente, aponta para a necessidade de métodos complementares e mais específicos para a análise quantitativa dos vieses em modelos generativos.
2025/1 - MSI2
Orientador: Fabrício Benevenuto de Souza
Palavras-chave: Estereótipos brasileiros, Geração de imagens por IA, Modelos generativos, DALL·E 3, Imagen 3, Stable Diffusion, Vieses algorítmicos
Link para vídeo
PDF Disponível