Classificação dos Serviços de Saneamento Básico para Valoração de Ativos Utilizando Random Forest

Abstract
No processo de revisão tarifária de uma agência reguladora a consistência dos dados é de fundamental importância para uma melhor assertividade. Para esta análise, grande parte dos dados de suma relevância não são informados, o que leva a um processo manual dos analistas responsáveis pela revisão. Visando auxiliar o trabalho, foi realizado um estudo de caso com abordagem qualitativa e quantitativa dos dados visando a extração de informações relevantes a partir de uma base disponibilizada com ativos de esgoto e de abastecimento hídrico, algoritmos de classificação baseado em Aprendizado de Máquina foram implementados e validados. Como resultado, um modelo de Random Forest capaz de classificar o tipo de serviço no qual os ativos estão inseridos foi desenvolvido, atingindo uma acurácia de aproximadamente 80%. Deste modo, o presente trabalho viabiliza predizer parte das informações faltantes nas revisões, o que diminuirá o tempo de análise dos agentes, além de reduzir os possíveis erros humanos no processo como um todo.