MODELAGEM DE PAREAMENTO DE DADOS E ANÁLISE DESCRITIVA ENTRE DADOS DO SISTEMA PÚBLICO DE SAÚDE E DO SISTEMA PRIVADO DE SAÚDE DE BELO HORIZONTE, BRASIL

Fábio César Marra Filho

Este trabalho apresenta uma abordagem para vinculação de registros com o foco na área de saúde em relação a bases de dado do setor público e privado de saúde brasileiro, em especial da cidade de Belo Horizonte. Um dos focos principais da abordagem é na estimação automatizada dos parâmetros probabilísticos m e u do modelo de FellegiSunter. Para isso, foi desenvolvido o cPareia MU Estimator, um algoritmo iterativo que ajusta esses parâmetros com base na proporção esperada de correspondências entre registros, utilizando um limiar dinâmico derivado dos pesos logarítmicos. Foram conduzidos experimentos com bases sintéticas representando características reais de dados de saúde e suas possíveis variações e erros, testando o desempenho do estimador proposto em comparação com ferramentas consolidadas como Splink e RecordLinkage Toolkit. Os resultados mostram que o estimador desenvolvido apresenta desempenho competitivo, especialmente em bases maiores, e representa uma alternativa viável em contextos sem dados rotulados. O estudo também destaca a importância do record linkage para a integração de dados em saúde no Brasil e propõe aprimoramentos futuros no uso de blocagem híbrida e na aplicação em bases reais.


2025/1 - MSI2

Orientador: Wagner Meira Júnior, Ramon Gonçalves Pereira

Palavras-chave: record linkage, m e u, Fellegi-Sunter, dados de saúde, cPareia.

Link para vídeo

PDF Disponível