Implementação e validação de modelos de aprendizado não supervisionado na plataforma LEMONADE

Luiz Henrique da Silva Gonçalves

O projeto concluído teve como proposito consolidar e validar as tarefas de aprendizado não supervisionado na plataforma LEMONADE. Os esforços do trabalho, foram centrados na implementação de algoritmos de clustering e na melhoria da interface de resultados da plataforma no módulo de Construção de Modelos chamado MODEL BUILDER, com adição de componentes que auxiliam os usuários na validação dos experimentos. Foi feito um amplo estudo de viabilidade em relação a quais elementos e algoritmos poderiam ser adicionados a plataforma, com proposito de tornar o processo de treinamentos de modelos mais eficiente e intuitivo. A finalidade do projeto foi contribuir de forma ativa na construção de um interface versátil e funcional para usuários com diferentes níveis de conhecimento em programação e aprendizado de máquina. No processo de implementação, foi feito uma analise dos modelos de aprendizado não supervisionado compatíveis com o pipeline do LEMONADE e também avaliando as limitações do framework utilizado. Testes abrangentes e correções foram realizados, visando garantir robustez na execução do treinamento dos modelos. Foram adicionados quatro algoritmos de clustering, K-means, Gaussian mixture, Latent Dirichlet allocation (LDA), Bisecting k-means. Além disso, foi feito uma analise de quais componentes poderiam ser incorporados na interface dos resultados, para ajudar na interpretação dos experimentos para a tarefa de agrupamento. Por fim, foi realizado uma serie de experimentos práticos para consolidação do funcionamento dos algoritmos e componentes implementados. O projeto fortaleceu o LEMONADE, proporcionando um ambiente mais poderoso e acessível para a construção eficaz de modelos de aprendizado de máquina em diferentes contextos.


2024/1 - POC2

Orientador: Adriano Cesar Machado Pereira

Palavras-chave: Aprendizado de Máquina, Clustering, LEMONADE, Computação Distribuída, Modelos de Aprendizado, Visualização de Dados

Link para vídeo

PDF Disponível