Abstract
Resumo: O presente trabalho tem como objetivo descrever os procedimentos metodológicos da pesquisa intitulada “ToGatherUp: um protótipo de ferramenta para a construção de corpora” que verificou o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, discorremos sobre como os autores da pesquisa desenvolveram um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serviram de base para a realização de um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizar o ToGatherUp e o outro não. O resultado do experimento demonstrou uma redução média de 7,47% no ETP do projeto em que o ToGatherUp foi incorporado em relação ao ETP do projeto em que a ferramenta não foi utilizada, o que corroborou a hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora. Palavras-chave: Linguística de Corpus; construção manual de corpus; métricas de medição de esforço; ToGatherUp. Abstract: The present work aims to describe the methodological procedures of the research entitled “ToGatherUp: a prototype of a tool for corpora construction” that verified the effect of incorporating ToGatherUp in necessary time and effort invested in manual construction of Corpus of Computing in English (CoCLI). To this end, we discuss how the research authors developed a set of metrics for measuring effort – Activity Effort (EA), Total Effort for Text Collection (ETCT) and Total Project Effort (ETP) – which served as the basis for conducting a comparative statistical experiment between the manual elaboration of two identical versions of the CoCLI: which differ from each other by one of them using the ToGatherUp and the other one not using it. The experiment shows an average reduction of 7.47% in the ETP when using ToGatherUp compared to the ETP when not using the tool. This result corroborates the hypothesis that the tool reduces the time and effort spent by the researcher on manual elaboration projects of corpora. Keywords: Corpus Linguistics; manual construction of corpus; effort measurement metrics; ToGatherUp.

This publication has 2 references indexed in Scilit: