Algoritmo de classificação para identificação do público para averiguação Cadastral

Criação de um algoritmo usando técnicas de Machine Learning para identificação automática do público de averiguação cadastral do Cadastro Único para Programas Sociais

Esse projeto foi realizado de forma colaborativa no âmbito do Bootcamp em Machine Learning ofertado pela Escola Nacional de Administração Pública (ENAP) em 2024. A Mariana Resende foi a líder e quem teve a ideia. Além de mim, Grinaldo Oliveira, Michela Camboim e Renata Guanaes fizeram parte da equipe.

Conforme o READ.ME do projeto:

O Cadastro Único para Programas Sociais é o principal instrumento do Estado brasileiro para a caracterização socioeconômica das famílias de baixa renda que residem no território nacional, para permitir a seleção e a inclusão dessas famílias em programas federais, sendo usado para a concessão dos benefícios do Programa Bolsa Família, do Pé de Meia, da Tarifa Social de Energia Elétrica, do Auxílio Gás, do Programa Minha Casa Minha Vida, entre outros.

Para reduzir erros de inclusão, constantemente é feito um processo de qualificação cadastral. Neste ano, por exemplo, até o momento foram convocadas 3,3 milhões de famílias para averiguação do cadastro, o qual consiste em verificar as famílias que apresentam algum indício de inconsistência, seja de renda, de declaração de vínculo empregatício, ou de composição familiar.

Considerando a referência de setembro/2024, existem mais de 40 milhões de famílias incluídas no Cadastro Único, e 93 milhões de pessoas. Para uma melhor focalização das políticas públicas sociais usuárias deste cadastro para seleção dos beneficiários é preciso automatizar o processo de averiguação cadastral.

Para tanto, a proposta do presente projeto é propor um algoritmo que, a partir das características das família, seja possível classificar cada família em uma faixa de renda mais provável. Destaca-se que, considerando que as bases utilizadas são de 2018, os valores utilizados para a definição das faixas de renda serão as vigentes em 2018, conforme segue abaixo:

  • Pobreza: de 0 a 178,00, considerando a faixa de pobreza do Programa Bolsa Família em 2018;
  • Baixa renda: de 178,01 a 1/2 salário-mínimo vigente em 2018, ou seja 477,00 considerando o salário-mínimo de 954,00;
  • Acima de 1/2 salário-mínimo, ou seja, acima de 477,00.

Você confere aqui todas as informações do projeto, desde as bases utilizadas, os cadernos para limpeza e tratamento, quais modelos, resultados de acurácia e o próprio modelo sugerido para uso.


O ícone utilizado na capa deste projeto foi criado por Nhor Phai - Flaticon.