AvaliaGeo: Sistema para Validação de Topônimos em Notícias

Abstract
Soluções para problemas de extração de informação geográfica de textos e documentos precisam, muitas vezes, de bases de dados rotuladas para realização de experimentos ou para validação de algoritmos. Entretanto, muitas dessas bases não são gratuitas ou não são deixadas disponíveis. Este trabalho tem por objetivo facilitar a geração de bases de dados rotuladas geograficamente, com o uso de contribuições voluntárias para a desambiguação dos topônimos presentes nas notícias. Para validar as contribuições é proposto o uso do coeficiente Alfa de Cronbach, considerando cada notícia um questionário e cada candidato à topônimo um item desse questionário. Experimentos preliminares alcançaram 70% de confiabilidade na desambiguação dos topônimos para geração de bases de dados.