Refine Search

New Search

Results in Journal REVISTA DE ESTUDOS DA LINGUAGEM: 759

(searched for: journal_id:(253566))
Page of 16
Articles per Page
by
Show export options
  Select all
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 2041-2078; doi:10.17851/2237-2083.29.3.2041-2078

Abstract:
Resumo: O objetivo deste texto é relatar uma experiência de trabalho com um corpus colaborativo, desenvolvida nos últimos 10 anos (2010-2020) com alunos de diversas turmas de graduação, pós-graduação e alunos de Iniciação Científica na Universidade Federal de Uberlândia (já parcialmente descrita por Fromm, 2013, e Fromm e Yamamoto, 2013). O trabalho parte da metodologia de elaboração do corpus (incluindo seu histórico) como um passo para um tipo de pesquisa específica (terminográfica), passa por uma análise para indicar e solucionar problemas de compilação e termina na sua adequação e padronização para reuso. O resultado é um corpus robusto, bem balanceado, bilíngue (inglês/português) e que poderá ser usado em inúmeras outras pesquisas na área de Linguística.Palavras-chave: Linguística; Linguística de Corpus; Corpus colaborativo; Árvore de Domínio; Terminografia. This text describes a work experience with a collaborative corpus, developed during the last 10 years (2010-2020) with students in several undergraduate and graduate classes and students working on scientific undergraduate research projects at Universidade Federal de Uberlândia (already partially described by Fromm, 2013, and Fromm and Yamamoto, 2013). The work starts from the corpus elaboration methodology (including its history) as a step towards a specific type of research (terminographic), goes through an analysis to point out and solve compilation problems and ends in its adequacy and standardization for reuse. The result is a robust, well-balanced, bilingual (English/Portuguese) corpus that can be used in numerous other studies in the area of Linguistics.Keywords: Linguistics; Corpus Linguistics; Collaborative corpus; Domain Tree; Terminography.
, Amanda Macedo Balduino
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 2011-2040; doi:10.17851/2237-2083.29.3.2011-2040

Abstract:
Resumo: O objetivo deste artigo é analisar o apagamento do rótico em coda no português de São Tomé (PST), uma variedade do português falada em São Tomé e Príncipe. Para análise desse processo, nos pautamos na Sociolinguística Variacionista e a análise quantitativa foi realizada nos softwares RStudio e Rbrul. Consideramos variáveis sociais (Sexo, Faixa Etária e Grau de Escolaridade) e linguísticas (Classe Gramatical, Tonicidade, Posição do Segmento e Contexto Fonológico Precedente) que poderiam favorecer ou desfavorecer o fenômeno. Examinando as 1523 ocorrências de rótico em coda, verificamos o apagamento do rótico em 56,53% dos dados. A variável mais significativa foi a Posição do Segmento com o maior índice de apagamento constatado quando o rótico estava em posição final (P.R. .71). A amostra foi, portanto, dividida em duas amostras menores analisadas separadamente: 712 ocorrências do rótico em coda medial e 811 em coda final. Na análise do fenômeno em coda medial, o índice de apagamento foi de 32,6% e os maiores índices de apagamento foram verificados entre os informantes do ensino fundamental (P.R. .62) e do sexo feminino (P.R. .59). Já em coda final, o índice de apagamentos foi de 77,5% e os falantes com ensino fundamental (P.R. .75) e mais jovens (P.R. .76) foram mais propensos ao apagamento, ademais, a classe verbal favoreceu o apagamento (P.R. .62). Os resultados são cojetados com trabalhos prévios (BOUCHARD, 2017; BRANDÃO, 2018; BRANDÃO; DE PAULA, 2018; BRANDÃO et al., 2017) e com resultados de estudos sobre variedades do PB e do PE.Palavras-chave: português santomense; apagamento do rótico em coda; variáveis sociais e linguísticas; contato linguístico. The goal of this paper is to analyze rhotic deletion in coda in Santomean Portuguese (PST), a Portuguese variety spoken in Sao Tome and Principe. This process was analyzed based on Variationist Sociolinguistics. Quantitative analyses have been carried out by softwares RStudio and Rbrul. Thus, we consider social (sex, age and education level) and linguistic (grammatical class, syllable stress, position in morphological word and quality of preceding vowels) variables that might favor or not the phenomenon. By examining 1523 rhotic occurrences in coda, we verified r-deletion in 56,53% of the data. The most significant variable is Segmental Position with the highest rate of r-deletion in word-final syllables (P. R. 71). Then, the sample was divided into two samples separately analyzed: 712 occurrences in word-medial coda and 811 occurrences in word-final coda. In word-medial coda, 32,6% of rhotics are deleted . The highest rates of loss are associated to elementary school (P.R. .62) and women (P.R. .59). In word-final coda, 77.5% of rhotics are deleted, Speakers with elementary school (P.R. .75) and younger speakers (P.R. .76) are more likely to delete the rhotic in coda. Considering Grammatical Class, r-deletion is favored in verbs (P.R. .62). These outcomes are compared with previous studies (BOUCHARD, 2017; BRANDÃO, 2018; BRANDÃO; DE PAULA, 2018; BRANDÃO et al., 2017) and with studies on PB and PE.Keywords: Santomean Portuguese; deletion of rhotic in coda; social and linguistic variables; linguistic contact.
, Maximiano Antonio Pereira
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1685-1716; doi:10.17851/2237-2083.29.3.1685-1716

Abstract:
Resumo: Especialmente a partir dos fundamentos filosóficos sobre a linguagem pensados por Bakhtin e o Círculo russo (Volóchinov e Medviédev), propõe-se analisar os sentidos do discurso coaching financeiro no enunciado vídeo publicitário,“Meu nome é Bettina”, publicado em março de 2019 no canal da Empiricus, no Youtube, e viralizado nas redes sociais. A hipótese de pesquisa é que o discurso coaching financeiro presente no enunciado vídeo “Meu nome é Bettina” ancora-se no diálogo com os discursos de autoajuda e neoliberal, para a realização da comunicação discursiva. No enunciado vídeo “Meu nome é Bettina” observa-se que, por meio do discurso coaching financeiro, o enunciado vídeo faz circular o enriquecimento fácil do e autocentrado no indivíduo, apresentando ser constituído de relações dialógicas com discursos produzidos pelo capitalismo, com ênfase no individualismo, como os discursos de autoajuda e neoliberal. Destaca-se, ainda, o cotejo de outros enunciados que circularam no Twitter que respondem ao enunciado vídeo “Meu nome é Bettina”, de modo a ilustrar a característica da responsividade do enunciado na esfera midiática.Palavras-chave: enunciado; discurso coaching financeiro; discurso de autoajuda; discurso neoliberal; “Meu nome é Bettina”. Especially based on the philosophical foundations about language thought by Bakhtin and the Russian Circle (Volóchinov and Medviédev), it is proposed to analyze the senses of the financial coaching discourse in the utterance advertising video, “My name is Bettina”, published in March 2019 on the Empiricus channel, in Youtube, and viralized on social networks. The research hypothesis is that the financial coaching discourse present in the video utterance “My name is Bettina” is anchored in the dialogue with the self-help and neoliberal discourses, for the realization of discursive communication. In the video utterance “My name is Bettina” it is observed that through the financial coaching discourse, the video utterance circulates the easy enrichment of the self-centered in the individual, presenting being constituted of dialogical relations with discourses produced by capitalism, with an emphasis on individualism, such as self-help and neoliberal discourses. It is also worth mentioning the collation of other utterance that circulated on Twitter that respond to the video utterance “My name is Bettina”, in order to illustrate the characteristic of the responsivity of the utterance in the media sphere.Keywords: utterance; financial coaching discourse; self-help discourse; neoliberal discourse; “Meu nome é Bettina”.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1873-1900; doi:10.17851/2237-2083.29.3.1873-1900

Abstract:
Resumo: Moreira (2005, 2008) e Moreira e Alkmim (2013) observam que a forma senhor e suas variantes de gênero e número são frequentemente utilizadas como vocativo em construções extraídas de peças teatrais escritas por autores mineiros nos séculos XIX e XX. Considerando os trabalhos citados, a nossa hipótese é a de que a incidência do uso da forma senhor como vocativo em posição final resultou em um processo de gramaticalização, que originou as formas reduzidas desse item: sinhô, seu, siô, sôr e sô. Neste artigo, a partir de dados de intuição e da avaliação de falantes nativos, objetiva-se descrever e analisar as construções em que o item sô se realiza. Seguimos Hill (2007, 2014) que situa o vocativo na estrutura sintática, considerando a função pragmática que este item desempenha. Como resultado, tem-se as configurações arbóreas correspondentes às construções em que o item sô se realiza e considerações sobre o vocativo na estrutura sintática do dialeto mineiro.Palavras-chave: senhor; sô; vocativo; estrutura sintática; função pragmática. Moreira (2005, 2008) and Moreira and Alkmim (2013) observe that the form senhor and number and gender and number variants are frequently used as a vocative in constructions taken from plays written by authors from Minas Gerais in the 19th and 20th centuries. Considering the works cited above, our hypothesis is that the incidence of the use of the form senhor as a vocative in final position resulted in a process of grammaticalization that originated the reduced forms of this item: sinhô, seu, siô, sôr e sô. In this article, based on intuition and evaluation data from native speakers, we aim to describe and analyze the constructions in which the item sô is realized. We follow Hill (2007, 2014), who places the vocative in the syntactic structure, considering the pragmatic function that this item performs. As a result, we present tree configurations corresponding to the constructions in which the item sô is realized, as well as considerations about the vocative in the syntactic structure of the dialect of Minas Gerais.Keywords: senhor; sô; vocative; syntactic structure; pragmatic function.
Felipe Morais de Melo
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1901-1942; doi:10.17851/2237-2083.29.3.1901-1942

Abstract:
Resumo: São bastante estreitas e profícuas as relações entre a Linguística Histórica e a Linguística de Corpus, sobretudo a partir da década de 90, quando a primeira ganha fôlego renovador no Brasil, tendo na edição de corpora diacrônicos uma das motrizes basilares para seu progressivo desenvolvimento. Sob o signo desse entrelaçamento entre as duas áreas, este trabalho, através da análise de conteúdo, apresenta um caso de reedição de corpus diacrônico, as cartas oficiais norte-rio-grandenses (1713-1950), e, por meio de pesquisa bibliográfica, propõe algumas reflexões acerca do contato entre esses dois campos de estudo no Brasil e dos impactos, positivos e negativos, do meio digital nessa conexão. O artigo revela como alterações nas orientações de uma investigação podem justificar um processo frutífero de reedição e evidencia tanto riscos éticos quanto aprimoramentos funcionais a que esses corpora estão sujeitos devido a fatores como a tecnologia e a internet, propondo, ao final, que haja maior visibilidade das questões levantadas no estudo.Palavras-chave: reedição; cartas oficiais; corpus diacrônico; linguística histórica. The relations between Historical Linguistics and Corpus Linguistics are quite close and fruitful, especially from the 90’s, when the former gains renewed breath in Brazil, having in the edition of diachronic corpora one of the basic drivers for its progressive development. Under the sign of this intertwining between the two areas, this work, through content analysis, presents a case of reedition of a diachronic corpus, the Rio Grande do Norte official letters (1713-1950), and, through bibliographic research, proposes some reflections about the contact between these two fields of study in Brazil and the impacts, positive and negative, of the digital medium in this connection. The paper reveals how changes in research guidelines can justify a fruitful process of reedition and highlights both ethical risks and functional improvements to which these corpora are subject due to factors such as technology and the internet, proposing, in the end, a greater visibility of the issues raised in the study.Keywords: re-edition; official letters; diachronic corpus; historical linguistics.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1943-1977; doi:10.17851/2237-2083.29.3.1943-1977

Abstract:
Resumo: O presente artigo examina e compara, à luz da Análise do Discurso Francesa (ADF), quatro narrativas de vida – coletadas por meio de entrevistas – de migrantes brasileiros que vivem em situação irregular na França ou na Inglaterra. O principal objetivo é apreender as representações discursivas de si, dos outros, do mundo que tais sujeitos constroem nas ditas narrativas e, ao mesmo tempo, verificar se e como a situação de irregularidade afeta seu cotidiano no novo país. Para analisar e cotejar essas quatro histórias, foram utilizadas categorias que integram a Semântica Global de Maingueneau (2005): temas, vocabulário, dêixis enunciativa e modo de enunciação. Se os resultados obtidos revelam diferenças na forma de contar e avaliar a experiência migratória, eles permitem também apreender aspectos comuns, tais como a motivação prioritariamente econômica para a migração, as dificuldades (culturais, linguísticas etc.) enfrentadas, sobretudo por ocasião da chegada ao país de destino, e as condições precárias de trabalho a que os migrantes brasileiros se submetem por estarem em situação irregular. Embora dois dos sujeitos entrevistados tenham preferido silenciar sobre essa questão, suas opiniões podem ser recuperadas nas entrelinhas do discurso.Palavras-chave: migração; brasileiros; Europa; situação irregular; narrativas de vida. This paper examines and compares, in the light of French Discourse Analysis, four life stories – collected through interviews – that were produced by Brazilian migrants that live illegally in France or in England. The main objective is to find out the discursive representations (of themselves, of the others, of the world) constructed by such individuals in their narratives and, at the same time, verify if and how their irregular situation interferes with their routine in the new country. In order to analyze and compare the four stories, some categories that integrate Maingueneau’s Global Semantics (2005) were used: themes, vocabulary, enunciative deixis and enunciation mode. If the results reveal differences in the way of telling and evaluating the migratory experience, they also allow us to apprehend similarities, such as the primarily economic motivation to migrate, the difficulties (cultural, linguistic etc.) faced especially when arriving in the destination country and the precarious working conditions to which Brazilian migrants are submitted due to being in an irregular situation. Even though two of the interviewed subjetcts have preferred to be silent on this issue, their opinions can be implicitly identified.Keywords: migration; Brazilians; Europe; irregular situation; life stories.
Noelia Ayelén Stetie
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 2117-1262; doi:10.17851/2237-2083.29.3.2117-1262

Abstract:
Resumen: Comprender cómo se procesa el lenguaje ha sido interés central de la psicolingüística hace varias décadas ya que entender los procesos involucrados aporta al estudio del lenguaje, pero, también, al estudio y comprensión de la mente. En este artículo se presenta una revisión de los modelos de procesamiento sintáctico y sus aportes a la comprensión acerca del funcionamiento del lenguaje y de la cognición. En primer lugar, se retoman algunas de las discusiones clásicas acerca del procesamiento del lenguaje y los procesos cognitivos en general. En segunda instancia, se realiza una revisión de distintos modelos de procesamiento sintáctico propuestos en las últimas décadas, sus características y supuestos acerca de la facultad del lenguaje. Por último, se comparan las diferentes propuestas en función de los debates clásicos presentados y su posición acerca de la universalidad de ciertos procesos cognitivos.Palabras-clave: procesos cognitivos; comprensión del lenguaje; procesamiento sintáctico; adjunción. Understanding how language is processed has been a theme of an utmost interest for psycholinguistics for several decades, since fully acknowledging the processes involved contributes not only to the study of language, but also to both the study and understanding of the mind. This article presents a review of syntactic parsing models and their contributions to the comprehension of the functioning of language and cognition. First of all, some of the classical discussions about language processing and cognitive processes in general are analyzed. Secondly, different models of syntactic parsing proposed in the last decades as well as their characteristics and assumptions about the language faculty are reviewed. Finally, the different proposals are compared in terms of the classical debates presented and their position on the universality of certain cognitive processes.Keywords: cognitive processes; language comprehension; syntactic parsing; attachment.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1717-1777; doi:10.17851/2237-2083.29.3.1717-1777

Abstract:
Resumo: A disponibilidade de recursos para o processamento computacional constitui um dos fatores de sobrevivência de uma língua. O objetivo deste trabalho foi implementar um fragmento do nheengatu no formalismo Grammatical Framework, especialmente projetado para o desenvolvimento de aplicações multilíngues. Outrora mais falado que o português na Amazônia, o nheengatu está ameaçado de extinção, embora ainda conte com estimados 14000 falantes. O fragmento restringe-se a orações que expressam estados contingentes e não-contingentes, mas inclui fenômenos gramaticais estruturalmente complexos típicos da família tupi-guarani, os quais contrastam fortemente com as construções equivalentes em português e inglês. Constitui um dos módulos da GrammYEP, uma gramática computacional multilíngue que integra módulos análogos do inglês e do português. A implementação tomou como ponto de partida as descrições gramaticais não formalizadas de Navarro (2011) e Cruz (2011). A formalização revelou lacunas e inconsistências nessas abordagens, em parte sanados por meio de uma reanálise dos dados. A GrammYEP alcançou resultados bastantes satisfatórios na tradução do e para o nheengatu. Traduziu para o português e o inglês a totalidade de um conjunto-teste de 142 sentenças dessa língua. Inversamente, verteu para o nheengatu 98,18% e 84,11% dos conjuntos-teste correspondentes em português e inglês. Por outro lado, analisou apenas dois exemplos de um conjunto-teste negativo com 171 construções agramaticais em nheengatu. Desta avaliação resultou um treebank com 243 sentenças do nheengatu, emparelhadas com as sentenças equivalentes em português e inglês.Palavras-chave: língua geral amazônica (LGA); tupi moderno; predicação qualificativa; construção possessiva; tradução automática; linguística computacional; processamento de linguagem natural. The availability of resources for computational processing is one of the survival factors of a language. The goal of this work was to implement a fragment of Nheengatu in the Grammatical Framework formalism, specially designed for the development of multilingual applications. Once more widely spoken than Portuguese in the Amazon region, Nheengatu is threatened with extinction, although it still has an estimated number of 14,000 speakers. The fragment is restricted to sentences that express contingent and non-contingent states, but includes structurally complex grammatical phenomena typical of the Tupí-Guaraní family, which strongly contrast with the equivalent constructions in Portuguese and English. It constitutes one of the modules of GrammYEP, a multilingual computational grammar comprising equivalent English and Portuguese modules. The starting point of the implementation was the non-formalized grammatical descriptions of Navarro (2011) and Cruz (2011). The formalization revealed gaps and inconsistencies in these approaches, which were partly remedied through a reanalysis of the data. GrammYEP achieved quite satisfactory results in the translation from and to Nheengatu. It translated into Portuguese and English all examples from a test set with 142 Nheengatu sentences. Conversely, 98.18% and 84.11% of the corresponding Portuguese and English test sets were rendered into Nheengatu. On the other hand, it parsed only two examples from a negative test set with 171 ungrammatical constructions in Nheengatu. This evaluation resulted in a treebank with 243 Nheengatu sentences, paired with the equivalent sentences in Portuguese and English.Keywords: Amazonian Lingua Franca; Modern Tupí; qualifying predication; possessive construction; machine translation; computational linguistics; natural language processing.
Matheus Pinto,
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1813-1872; doi:10.17851/2237-2083.29.3.1813-1872

Abstract:
Resumo: O estudo ora apresentado presta-se a descrever a trajetória da família lexical de usura (constituída pelas formas usura, usurar, usurário, usureiro, usurável, usurento, usuroso, usurador, zura, zuraco e usurariamente) no percurso histórico da língua portuguesa. Para a constituição de seu corpus de análise e como embasamento para a explicação dos processos de empréstimo e neologia em abordagem histórico-diacrônica e histórico-comparativa, fincou-se na integração de dados dialetais e de publicações da web com uma grande variedade de bancos de dados em diversas línguas românicas e em inglês. Faz o exame etimológico desse grupo vocabular pela análise gradual das transformações semânticas e morfológicas de cada unidade que o constitui, fornecendo evidência textual dos fenômenos discutidos. Definindo-se em um eixo interfacial entre Morfologia, Semântica e Léxico, o trabalho incorpora ao quadro descritivo resultante considerações sobre formação de palavras, sinonímia corradical, sinmorfismo e variação e mudança morfolexicais.Palavras-chave: família lexical; etimologia; morfologia histórica; semântica histórica. This study is dedicated to describing the historical development of the word family of usura (which is constituted by usura, usurar, usurário, usureiro, usurável, usurento, usuroso, usurador, zura, zuraco e usurariamente) in the Portuguese language. It takes as a basis for its diachronic and comparative approach the integration of dialectal data and online posts with a variety of other data sources in several Romance languages and in the English language. These sources constitute its corpus and the foundation which underpins the elucidation of borrowing and neology processes. It examines the etymology of this lexical family via the gradual analysis of semantic and morphological changes in each word, which is supported by textual evidence for such phenomena. Being defined from an interfacial standpoint to Morphology, Semantics, and the Lexicon, it incorporates into the resultant etymological description the discussion of themes such as word formation, the synonymy of co-radical words, affix synonymy, and morpho-lexical variation and change.Keywords: lexical family; etymology; historical morphology; historical semantics.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 2079-2115; doi:10.17851/2237-2083.29.3.2079-2115

Abstract:
In this paper, we analyze the perfective progressive periphrasis (PPP) in Brazilian Portuguese (BrP) and Argentinian Spanish (AS) in a comparative way. Based on different linguistic tests, we make two statements regarding the PPP in comparison with the imperfective progressive periphrasis (IPP). Firstly, we claim that the PPP has a progressive and perfective meaning. Secondly, we claim that the PPP allows iterative readings when combined with telic events (i.e., achievements in BrP and AS and accomplishments just in AS). We propose a syntactic and semantic analysis which accounts for these observations in a compositional way: while the gerund form expresses a progressive meaning (present in both periphrases), the auxiliary on the PPP expresses a perfective meaning which allows the iterative readings observed in this periphrasis.Keywords: verbal aspect; actionality; periphrasis; semantics; syntax.Resumo: Neste artigo, analisamos a perífrase perfectiva progressiva (PPP) no português brasileiro (PB) e no espanhol argentino (EA), de modo comparativo. Baseado em testes linguísticos, fazemos duas afirmações sobre a PPP em comparação com a perífrase imperfectiva progressiva. Em primeiro lugar, afirmamos que a PPP tem significado progressivo e perfectivo. Em segundo lugar, afirmamos que a PPP permite leituras iterativas quando combinada com eventos télicos (achievements no PB e no EA e accomplishments somente no EA). Propomos uma análise sintático-semântica que dá conta dessas observações de um modo composicional: ao passo que a forma do gerúndio expressa o significado progressivo (presente em ambas as perífrases), o auxiliar na PPP expressão um significado perfectivo que permite a leitura iterativa observada nessa perífrase.Palavras-chave: aspecto verbal; acionalidade; perífrase; semântica; sintaxe.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1779-1812; doi:10.17851/2237-2083.29.3.1779-1812

Abstract:
Resumo: Com este artigo, que se ancora na Análise de Discurso materialista na sua relação com a História das Ideias Linguísticas, partimos de um conjunto de notas produzidas por Alencar para os romances Iracema e O Guarani as quais tinham como característica comum a referenciação explicitada de suas fontes. Nossa proposta foi a de ir em busca de um horizonte de retrospecção projetado nas notas, a fim de refletir sobre a (re)produção e a circulação do conhecimento a partir das notas. Para a análise das relações entre as notas e suas fontes, lançamos mão ainda do aparato teórico-analítico de Authier-Revuz, o que nos permitiu observar o jogo que aí se tece entre o que se atribui a si e ao outro em suas diferentes formas e funcionamentos. O percurso de análise empreendido nos permitiu observar os gestos de autoria do escritor sobre a língua.Palavras-chave: notas de José de Alencar; horizonte de retrospecção; autoria; História das Ideias Linguísticas; Análise de Discurso materialista. With this article, which is anchored in the Analysis of Materialist Discourse and in its relation with the History of Linguistic Ideas, we started from a set of notes produced by Alencar for the novels Iracema and O Guarani which had as their common characteristic the explicit referencing of their sources. Our proposal was to go in search of a retrospection horizon projected in the notes in order to reflect on the (re) production and circulation of knowledge by the notes. For the analysis of the relationships between the notes and their sources, we also used Authier-Revuz’s theoretical-analytical apparatus, which allowed us to observe the dynamic that is woven between what is attributed to you and the other in its different forms and functions. The analysis path undertaken allowed us to observe the author’s gestures about the language.Keywords: notes by José de Alencar; horizon of retrospection; authorship; History of Linguistic Ideas; Materialist Discourse Analysis.
, Katiuscia Custódio
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1979-2009; doi:10.17851/2237-2083.29.3.1979-2009

Abstract:
Resumo: A Doença de Alzheimer é uma patologia neurodegenerativa que afeta, dentre outras funções cognitivas, a linguagem, causando dificuldades de acesso lexical, articulação fonológica, organização sintática e alterações de elementos pragmáticos da conversação que prejudicam as interações cotidianas. Tendo em vista esse contexto, o presente artigo analisa a interação face a face de uma pessoa acometida pela DA na fase moderada, com um pesquisador em uma situação de entrevista narrativa. A partir do pressuposto de que usar a linguagem é engajar-se em uma ação colaborativa, especificamente a produção de uma narrativa autobiográfica, o presente trabalho fundamenta-se no aparato teórico da Análise da Conversação, dos Estudos das Narrativas Orais e da Linguística Textual. A narrativa autobiográfica que tomaremos em análise no presente artigo integra um corpus de interações gravadas com uma participante acometida pela DA. As análises demonstram que a participante mantém uma atitude colaborativa durante toda a interação, coconstruindo referentes com o interlocutor, inclusive quando surgem déficits ocasionados pela patologia. Além disso, a performance narrativa da participante caracteriza-se por uma narrativa autobiográfica que emerge no contexto discursivo-interacional exercendo o papel de ressignificar sua experiência de vida frente à doença.Palavras-chave: Doença de Alzheimer; narrativa autobiográfica; referenciação. Alzheimer’s disease is a neurodegenerative pathology that affects, among other cognitive functions, language, causing difficulties in lexical access, phonological articulation, syntactic organization and changes in pragmatic elements of conversation that impair daily interactions. In view of this context, the present article analyzes the face-to-face interaction of a person affected by AD in the moderate phase, with a researcher in a situation of narrative interview. Based on the assumption that using language is to engage in a collaborative action, specifically the production of an autobiographical narrative, the present work is based on the theoretical apparatus of Conversation Analysis, Oral Narrative Studies and Textual Linguistics. The autobiographical narrative that we will analyze in this article includes a corpus of interactions recorded with a participant affected by AD. The analyzes show that the participant maintains a collaborative attitude throughout the interaction, co-building referents with the interlocutor, even when deficits caused by the pathology arise. In addition, the participant’s narrative performance is characterized by an autobiographical narrative that emerges in the discursive-interactional context playing the role of reframing her life experience in the face of the disease.Keywords: Alzheimer’s disease; autobiographical narrative; reference.
Ronan Pereira
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1651-1684; doi:10.17851/2237-2083.29.3.1651-1684

Abstract:
Resumo: Na variedade do português falado no estado do Rio Grande do Sul, o pronome de segunda pessoa do singular “tu” ocorre com maior frequência do que o pronome inovador “você”, sendo o “tu” considerado marca da identidade local. No entanto, vem geralmente acompanhado de verbos com a flexão de terceira pessoa, tendo sido sugerido que a utilização da flexão canónica está reservada a momentos de maior formalidade. Este estudo propôs-se a obter dados empíricos acerca da perceção de formalidade dos diferentes pronomes de segunda pessoa do português gaúcho pelos seus falantes nativos, além de estabelecer se consideram o pronome “tu” parte do seu jeito de falar. Uma tarefa de seleção de vocábulos, além de uma tarefa de julgamento de formalidade com uma escala de cinco pontos foram realizadas com 233 participantes. Os resultados confirmam a visão de que o pronome “tu” faz parte da identidade dos falantes e sugerem um sistema triádico, composto, em ordem de formalidade por “tu”, “você” e “o senhor”, acompanhados de morfologia flexional de terceira pessoa, enquanto “tu” com a flexão canónica compete com “você” pela posição intermédia. Dentre os fatores sociolinguísticos que influenciam os julgamentos, somente a idade foi relevante, com os participantes acima de 50 anos de idade tendendo a considerar as frases com “tu” mais informais, independentemente da flexão a ele associada.Palavras-chave: pronomes de segunda pessoa; formalidade; português brasileiro; português gaúcho; sociolinguística. In the variety of Portuguese spoken in the Brazilian state of Rio Grande do Sul, the second person singular pronoun “tu” occurs more frequently than the innovative pronoun “você, being “tu” considered a mark of local identity. It is, however, usually followed by verbs conjugated in the third person, having been suggested that the usage of the canonical inflection is reserved to moments of a higher formality level. This study aimed to bring empirical data regarding how formal the different second person pronouns are interpreted by native speakers, as well as data confirming if they consider “tu” as part of their identity. A word selection task and a 5-point scale formality judgement task were conducted with 233 participants. The results confirm the idea that “tu” is part of the speakers’ identity and they also suggest a triadic system, composed, in order of formality by “tu”, “você”, and “o senhor”, all of them followed by a third person inflectional morphology, whereas“tu” followed by the canonical inflection competes with “você” for the intermediate position. Among the sociolinguistic factors that influence such judgments, only age was relevant, since participants who were 50 years old or older tended to consider sentences with “tu” more informal, regardless of the inflection associated to it.Keywords: second person pronouns, formality, Brazilian Portuguese; Gaucho Portuguese, sociolinguistics.
Ana Rachel Salgado, , Gabriele Honsha Gomes, Letícia Presotto
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1253-1288; doi:10.17851/2237-2083.29.2.1253-1288

Abstract:
Resumo: O objetivo deste trabalho é investigar como a emergência de metáforas conceptuais revela as experiências subjetivas nas narrativas de pacientes que desenvolveram e tratam o câncer de mama e suas estratégias de coping. Para tanto, é proposta uma adaptação de método, baseado em Linguística de Corpus, para a identificação dessas metáforas encontradas no discurso dessas mulheres com base na identificação e na extração de termos candidatos a possíveis domínios conceptuais. Foram coletados textos de 31 blogs de livre acesso sobre a temática em estudo, constituindo um corpus de 2036 textos. Elegeu-se um dos blogs, constituído por 23 postagens, como referência para avaliar se a ferramenta escolhida e a metodologia adaptada seriam adequadas ao estudo. A partir disso, foi criada uma keyword list para extrair termos candidatos a domínios conceptuais, constituindo-se uma lista de referência para a análise dos demais textos. Dentre os domínios conceptuais mais frequentes, emergiram os seguintes: entidade, força da natureza, jogo, container, viagem, valor monetário e guerra. Também, em menor medida, elementos ligados à religião e à espiritualidade acabaram surgindo. A partir da análise empreendida, destaca-se que a realização de metáforas nas narrativas atua como estratégias de coping, haja vista que elas são indícios da elaboração conceitual dessas experiências.Palavras-chave: metáfora conceptual; linguística de corpus; coping; câncer de mama. The aim of this paper is to investigate how the emergence of conceptual metaphors reveals subjective experiences in the narratives of patients who developed and treat breast cancer and their coping strategies. Therefore, an adaptation of a method, based on Corpus Linguistics, is proposed to identify these metaphors found in these women’s discourse based on the identification and in the extraction of candidate terms for possible conceptual domains. Texts were collected from 31 freely accessible blogs on the subject under study, constituting a corpus of 2036 texts. One of the blogs, consisting of 23 posts, was chosen as a reference to assess whether the chosen tool and the adapted methodology combined with the study. Based on this, a list of keywords was created to extract candidate terms for conceptual domains, constituting a reference list for the analysis of the other texts. Among the most frequent conceptual domains, the following emerged: entity, strength of nature, game, container, travel, monetary value and war. Also, to a lesser extent, elements linked to religion and spirituality eventually emerged. From the analysis undertaken, it is highlighted that the realization of metaphors in the narratives act as coping strategies, given that they are evidence of the conceptual elaboration of these experiences.Keywords: conceptual metaphor; corpus linguistics; coping; breast cancer.
Jackson Wilke Da Cruz Souza
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1059-1087; doi:10.17851/2237-2083.29.2.1059-1087

Abstract:
Resumo: Em subáreas do Processamento Automático de Línguas Naturais (PLN), como a Sumarização Automática Multidocumento (SAM), é necessário compreender o comportamento linguístico de determinados fenômenos, especialmente os de natureza semântica. A Cross-document Structure Theory (CST) é bastante utilizada em estudos do PLN por proporcionar um conjunto de relações semânticas que organizam a informação entre unidades de análise (comumente, pares de sentenças), agrupadas entre conteúdo (a saber, redundância, complementaridade e contradição) e apresentação (a saber, fonte/autoria e estilo). Até então, a caracterização das relações CST baseava-se em atributos genéricos (como a quantidade de palavras em comum entre as sentenças de um par) e específicos (como a presença de advérbios temporais) para as relações de Redundância e Complementaridade. Entretanto, percebe-se que a delimitação de tais atributos ainda é incipiente, pois não inclui atributos semânticos e pragmáticos, níveis linguísticos que são possíveis de recuperar manualmente entre as unidades de análise da CST. Nesse sentido, objetiva-se, neste artigo, reconstruir o percurso metodológico de Souza (2019) ao que se refere ao estudo em corpus das relações CST em textos jornalísticos do Português, já que o conjunto de atributos disponíveis, até o momento, ainda produzia equívocos na identificação dos subtipos de complementaridade multidocumento, a saber temporal e atemporal. Partindo do corpus CSTNews, organizou-se um subconjunto de estudo com os 10 primeiros clusters, o que contabilizou 204 pares de sentenças. Como resultado, foram obtidas a descrição detalhada da complementaridade CST e a criação de uma tipologia de sinalizadores das relações que traduzem esse fenômeno, além da proposição de uma metodologia específica para o estudo de relações CST.Palavras-chave: Complementaridade informacional multidocumento; Processamento Automático de Línguas Naturais; Corpus de estudo. In sub-areas of Natural Language Processing (NLP), such as Automatic Multidocument Summarization (AMS), it is necessary to understand the linguistic behavior of certain phenomena, especially those of a semantic nature. Cross-document Structure Theory (CST) is widely used in NLP studies because it provides a set of semantic relations that organize information between units of analysis (commonly, pairs of sentences) organized between content (namely, redundancy, complementarity and contradiction) and presentation (namely, source/authorship and style). Until then, the characterization of CST relationships was based on generic attributes (such as the number of words in common between sentences of a pair) and specific attributes (such as the presence of temporal adverbs) for the relationships of Redundancy and Complementarity. However, the delimitation of such attributes is still incipient, as they do not include semantic and pragmatic attributes, linguistic levels that are possible to recover between the CST units of analysis. In this sense, the aim of this paper is to reconstruct the methodological path of Souza (2019) with regard to the study in corpus of CST relations in Portuguese journalistic texts, since the set of available attributes, until then, still produced mistakes in the identification of multi-document complementarity subtypes, namely temporal and timeless. Based on the CSTNews corpus, a subset of studies was organized with the first 10 clusters, that are represented by 204 pairs of sentences. As a result, a detailed description of CST complementarity was obtained, as well as the creation of a typology of signaling relationships that translate this phenomenon, in addition to proposing a specific methodology for the study of CST relations.Keywords: Multi-document informational Complementarity; Processing of Natural Languages; Study corpus.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 673-709; doi:10.17851/2237-2083.29.2.673-709

Abstract:
Resumo: Este artigo propõe-se a relatar uma experiência de pesquisa com corpora complexos, a fim de compartilhar o processo e procedimentos de elaboração de um banco de dados instituído precipuamente para pesquisa doutoral, empreendida na Université Lumière Lyon II/França, no laboratório ICAR, cuja especialidade é, justamente, o trabalho com a análise de corpora em diversos níveis de extensão e complexidade. A partir de uma perspectiva etnometodológica (MONDADA, 2008; OCHS, SCHEGLOFF, THOMPSON, 1996; SCHEGLOFF, 1999; TRAVERS, 2001; TRAVERSO, 2007), numa imersão em território jurídico (CORNU, 2005; DUPRET, 2006; LATOUR, 2004), a pesquisa ora relatada buscou descrever e analisar como os magistrados realizam a gestão do desacordo, em situações, muitas vezes, acentuadamente erísticas. Sem nos distanciarmos dos estudos teóricos acerca dos preceitos de metodologia de trabalhos acadêmicos em geral (GIL, 2002; MOTTA-ROTH; HENDGES, 2010; SALOMON, 2014), constituímos um banco de dados balizados pela noção de situação argumentativa, uma noção da retórica antiga retomada por Plantin (1993, 1995, 1996, 2016), a qual põe em destaque situações de conflito de opiniões, em contextos argumentativos vários. A partir da exaustiva e intricada transcrição dupla dos dados (BAUDE, 2006; BLANCHE-BENVENISTE, 2008; KERBRAT-ORECCHIONI, 2006), a pesquisa culminou na confirmação de que o discurso jurídico está longe de ser frio e asséptico e que as interações argumentativas naquele contexto se analisadas no calor das deliberações têm muito a nos ensinar sobre o argumentar em contexto institucional. Isso pode ser conferido em quatro capítulos analíticos cujo planejamento e execução ora trazemos a lume, a partir do estudo do direito em ação, isto é, em situação de interação, por meio de deliberações de magistrados em processos de danos morais, num tribunal brasileiro de Segunda Instância.Palavras-chave: etnometodologia; corpora; argumentação; tribunal; transcrição de dados orais. This article proposes to report a research experience with complex corpora, on the aim of sharing the backstage of elaborating a database instituted mainly for doctoral research, undertaken at the Université Lumière Lyon II/France, in the ICAR laboratory, whose specialty is precisely work with corpora analysis at different levels of extension and complexity. From an ethnomethodological perspective (MONDADA, 2008; OCHS, SCHEGLOFF, THOMPSON, 1996; SCHEGLOFF, 1999; TRAVERS, 2001; TRAVERSO, 2007), in an immersion in legal territory (CORNU, 2005; DUPRET, 2006; LATOUR, 2004) , the research reported here sought to describe and analyze how magistrates manage disagreement, in situations that are often eristic. Without distancing ourselves from theoretical studies about the precepts of methodology of academic works in general (GIL, 2002; MOTTA-ROTH; HENDGES, 2010; SALOMON, 2014), we formed a database based on the notion of argumentative situation, a rhetorical notion retaken up by Plantin (1993, 1995, 1996, 2016), which highlights situations of conflict of opinion, in various argumentative contexts. From the exhaustive and intricate double transcription of the data (BAUDE, 2006; BLANCHE-BENVENISTE, 2008; KERBRAT-ORECCHIONI, 2006). The research culminated in the confirmation that the legal discourse is far from being cold and aseptic and that argumentative interactions in that context, if analyzed in the heat of deliberations, have much to teach us about arguing in an institutional context. This can be seen in four analytical chapters whose planning and execution now we bring to light, from the study of law in action, that is, in a concrete situation, from the deliberations of magistrates in moral damages cases, in a Brazilian court of Second Instance.Keywords: ethnomethodology; corpora; argumentation; court; transcription of oral data.
Marina Leivas Waquil
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 739-770; doi:10.17851/2237-2083.29.2.739-770

Abstract:
Resumo: Este trabalho apresenta um importante recorte de uma pesquisa que tem como objetivo contribuir com os estudos terminológicos, tradutológicos e sobre corpus ao analisar as unidades que representam e transmitem conhecimento especializado de uma área em crescente evolução acadêmica no Brasil e que discute demandas sociais urgentes, os Estudos de Gênero. Para isso, neste artigo, será exposta a etapa fundamental de qualquer pesquisa com corpus: a definição da área a ser analisada e a compilação de textos com base em critérios confiáveis e que deem conta de representar a área em questão. Assim, o objetivo central deste artigo é mostrar por quê, como e para quê se propôs relacionar a Linguística de Corpus com os Estudos de Gênero a partir de um corpus, apresentando, para tal, um histórico da área selecionada que justifica a análise proposta e sua caracterização como campo especializado. Além disso, destaca-se o referencial teórico que sustenta o trabalho e o corpus de estudo, compilado com base em critérios da Linguística de Corpus e composto pelos dois principais periódicos da área de Estudos de Gênero no Brasil, a Revista Estudos Feministas e a Cadernos Pagu. Conclui-se defendendo a importância de produzir pesquisas linguísticas e terminológicas que dialoguem com demandas sociais contemporâneas e urgentes.Palavras-chave: Estudos de Gênero; Linguística de Corpus; Terminologia; Revista Estudos Feministas; Cadernos Pagu. This work presents an important part of a research that aims to contribute to terminological and translational studies as well as corpus studies, upon analyzing the units that represent and transmit specialized knowledge in a field of soaring academic evolution in Brazil and that discusses urgent social demands, Gender Studies. To do so, this article will expose a fundamental stage of any research regarding corpus: the definition of the field to be analyzed and the clipping of texts based on reliable criteria that are able to represent such targeted field of study. Accordingly, the main intent of this article is to convey why, how and for what purpose it was proposed to relate Corpus Linguistics with Gender Studies from the compilation of a corpus, introducing therefore a history of the selected field that justifies the analysis proposed and its characterization as a specialized field. In addition, the theoretical references supporting the work and the analyzed corpus stands out, compiled based on the criteria of Corpus Linguistics and composed by the two main journals in the field of Gender Studies in Brazil, the Revista Estudos Feministas and Cadernos Pagu. In conclusion, it defends the importance of producing linguistic and terminological researches that converse with contemporary and urgent social demands.Keywords: Gender Studies; Corpus Linguistics; Terminology; Revista Estudos Feministas; Cadernos Pagu.
, Alexandre Melo de Sousa
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 805-828; doi:10.17851/2237-2083.29.2.805-828

Abstract:
This paper draws on the theoretical methodological proposal of a Brazilian Sign Language (Libras) corpus to be developed under the scope of the Brazilian Sign Language (Libras) Inventory in the region of Rio Branco municipality, in the State of Acre project. First, we address some issues regarding corpus definitions and characteristics, some aspects of Libras, and documentation of sign languages. Second, we address the methodology used in gathering, transcription and analysis of data from Brazilian Sign Language Inventory focusing on the Region of Rio Branco – Acre, shedding light on the contributions of the gathered data to identification, recognition, valuing, and documentation of the Brazilian Sign Language in use in the State of Acre.Keywords: Inventory; Brazilian Sign Language (Libras); Rio Branco; Acre.Resumo: Este artigo se baseia na proposta teórico-metodológica de um corpus de Língua Brasileira de Sinais (Libras) a ser desenvolvido no âmbito do projeto Inventário de Língua Brasileira de Sinais na Região do município de Rio Branco, no estado do Acre. Em primeiro lugar, abordamos algumas questões relativas às definições e às características do corpus, alguns aspectos da Libras e documentação das línguas de sinais. Em segundo lugar, abordamos a metodologia utilizada na coleta, transcrição e análise de dados do Inventário Brasileiro de Língua de Sinais com foco na Região de Rio Branco – Acre, destacando as contribuições dos dados coletados para identificação, reconhecimento, valorização e documentação da Língua Brasileira de Sinais em uso no Estado do Acre.Palavras-chave: Inventário; Língua Brasileira de Sinais (Libras); Rio Branco; Acre.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1325-1379; doi:10.17851/2237-2083.29.2.1325-1379

Abstract:
Resumo: Objetivo: Sob a perspectiva do trabalho de Pearson (1998) e utilizando as ferramentas da linguística de corpus disponíveis para o português brasileiro, a pesquisa apresentada neste artigo busca verificar em que medida a coextensividade entre termo técnico, grupo nominal e item lexical pode ser considerada válida para o português brasileiro. Método: Para a verificação desta coextensividade, um corpus de artigos acadêmicos sobre o domínio experiencial do autocuidado em Diabetes Mellitus foi compilado eletronicamente. Esse corpus foi inserido no software concordanciador AntConc (ANTHONY, 2019) e três palavras-chave foram extraídas com base no corpus de referência CALIBRA (FIGUEREDO; PAGANO; FERREGUETTI, 2014). O contexto de cada uma dessas palavras foi analisado por meio da ferramenta clusters/n-grams do AntConc, considerando os clusters/n-grams com o número mínimo de dez ocorrências. Resultados: A investigação desses clusters/n-grams formados à direita e à esquerda de cada uma das palavras-chave selecionadas mostrou que a coextensividade entre termo técnico, grupo nominal e item lexical nem sempre pode ser identificada, embora a utilização da ferramenta de cluster/n-grams pode ser considerada eficaz para buscar por itens lexicais que estão em coextensividade à ordem do grupo nominal, em razão da existência de pelo menos um grupo nominal em cada cluster/n-gram analisado. Conclusão: Ainda que os programas utilizados em Pearson (1998) não estejam totalmente difundidos para o português brasileiro, a abordagem sistêmico-funcional para o grupo nominal e para o item lexical em conjunto com as ferramentas do software concordanciador utilizado se mostraram eficientes para a análise proposta neste artigo.Palavras-chave: item lexical; grupo nominal; termo técnico; linguística de corpus; sistêmico-funcional; co-extensividade. Objective: Drawing on Pearson (1998) and using corpus linguistics tools available for Brazilian Portuguese, we report on a study aimed at exploring to what extent the concepts of technical term, nominal group and lexical item are coextensive in Brazilian Portuguese. Method: A corpus of academic articles on the experiential domain of Diabetes Mellitus self-care was compiled and queried in AntConc, a concordancing software (ANTHONY, 2019). Using as a reference corpus CALIBRA (FIGUEREDO; PAGANO; FERREGUETTI, 2014), three keywords were extracted analysed with AntConc tool clusters/n-grams, considering clusters/n-grams with a minimum number of ten occurrences. Results: Analysis of clusters/n-grams to the right and left of each of the selected keywords showed that technical term, nominal group and lexical item cannot always coextensive. The use of cluster/n-grams tool can be considered effective to search for lexical items that are coextensive to the order of the nominal group, due to the existence of at least one nominal group in each cluster/n-gram analyzed. Conclusion: Although the programs used by Pearson (1998) are not fully available to Brazilian Portuguese, a systemic-functional approach to nominal group and lexical item together with the tools of the concordancing software used in this paper proved to be efficient for the analysis herein proposed.Keywords: lexical item; nominal group; technical term; corpus linguistics; systemic functional theory; coextensiveness.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 999-1032; doi:10.17851/2237-2083.29.2.999-1032

Abstract:
Resumo: Este texto descreve algumas propriedades linguísticas recorrentes em textos nota 1000 do Enem. Parte-se do princípio de que o gênero redação do Enem tem características próprias, como a exposição aliada à argumentação, e que elementos como repertório e amplo uso de conectivos e modalizadores podem contribuir para a caracterização do texto. Nesta pesquisa, levando em conta o rigoroso processo de avaliação pelo qual passam, consideram-se as redações nota 1000 como exemplares prototípicos do gênero, ou seja, cumprem todos os requisitos exigidos pela banca. O corpus é constituído de 95 redações que alcançaram a nota máxima nos anos de 2014, 2018 e 2019, analisadas por meio do software Tropes, uma ferramenta computacional de análise lexical que verifica as recorrências de categorias e repertório. Os resultados mostraram que tais redações apresentam uma estrutura muito próxima àquela que se verifica na literatura sobre o tema, em especial o predomínio da estrutura impessoal (terceira pessoa), a amplitude do repertório (universo de referência), a variedade e alta frequência de conectivos e modalizadores, além da recorrência de verbos estativos, como ser. Com isso, conclui-se tanto que a ferramenta contribui para a descrição do gênero em questão quanto que os resultados fomentam um debate em torno da padronização da estrutura do texto do Enem.Palavras-chave: gênero textual; ferramenta computacional; redação do Enem; propriedades linguísticas. This paper aims to describe some linguistic properties found in Enem essays graded to 1000 points, the maximal score. It considers that this genre has its own characteristics, such as the relation between exposition and argumentative types, a wide repertoire, as well as a large use of connectives and modal elements, all of them contribute to characterize this genre. In this research, by considering the strict evaluation process, it has been considered that these essays graded to 1000 points prototypically represent the genre, once that they meet the criteria required by the evaluation panel. The corpus consists of 95 essays that got 1000 points in 2014, 2018 and 2019 exams. It has been analyzed by means of Tropes, a computational tool that verifies the frequency of lexical items group them in categories and repertoire. The results show that such essays follow what the literature proposed by the genre, especially, the impersonality (third person only), the vast repertoire extension (universe of reference), the range of connectives and modal elements, besides the recurrence of stative verbs, such as ser (‘to be’). Consequently, one concludes that both the tool contributes to the genre description, and the results put forward the debate around the standardization of the Enem essay structure.Keywords: textual genre; computational tool; Enem essay; linguistic properties.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1381-1414; doi:10.17851/2237-2083.29.2.1381-1414

Abstract:
The ICAO Language Proficiency Rating Scale offers parameters for aeronautical English teaching and assessment focused on oral skills. It assists governments worldwide in assessing pilots and air traffic controllers’ English proficiency, licensing them for international operations. This paper addresses two of the six linguistic areas listed in the Rating Scale, namely fluency and interaction, to understand what conversational elements are present in pilot-controller communications with a view to informing pedagogical material. The analysis is based on a corpus of pilot-controller radio communications in abnormal situations, revealing a more spontaneous code as opposed to the documented Standard Phraseology mandated for routine situations. Corpus Linguistics is the methodology chosen for this investigation, concentrated on the top frequent three-word clusters extracted from the corpus. Investigation of these clusters reveals that fluency and interaction are interconnected and should be considered in a broader perspective that takes into account language in use. To illustrate, ‘we’d like’ and ‘if you can’ are commonly employed as requests in this specific register. The paper concludes by suggesting that learners’ awareness of pragmatic aspects of language is pivotal in the aviation English classroom.Keywords: Plain Aviation English; fluency; interaction; Corpus Linguistics; Pragmatics.Resumo: A Escala de Proficiência Linguística da ICAO oferece parâmetros para o ensino e a avaliação do inglês aeronáutico focado nas habilidades orais. Serve para os governos em todo o mundo avaliarem a proficiência em inglês de pilotos e controladores de tráfego aéreo, licenciando-os para operações internacionais. Este estudo aborda duas das seis áreas linguísticas elencadas na Escala, quais sejam, fluência e interação, para compreender quais elementos conversacionais estão presentes nas comunicações entre pilotos e controladores com o objetivo de subsidiar materiais pedagógicos. A análise se baseia em um corpus de comunicações via rádio entre pilotos e controladores em situações anormais, revelando um código mais espontâneo, diferentemente da Fraseologia Padrão oficial mandatória nas situações rotineiras. A Linguística de Corpus é a metodologia utilizada nesta investigação, concentrada nos mais frequentes blocos de linguagem de três palavras evidenciados no corpus de estudo. A investigação desses blocos de linguagem revela que fluência e interação são interconectadas e deveriam ser consideradas a partir da perspectiva da língua em uso. Para ilustrar, ‘we’d like’ e ‘if you can’ são normalmente empregados como solicitações. Conclui-se sugerindo que a conscientização dos aprendizes sobre aspectos pragmáticos da língua é fundamental na sala de aula do inglês aeronáutico.Palavras-chave: Plain Aviation English; fluência; interação; Linguística de Corpus; Pragmática.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1529-1638; doi:10.17851/2237-2083.29.2.1529-1638

Abstract:
Resumo: Nas últimas décadas, um grande número de instituições de ensino superior (IES) buscou a internacionalização de suas atividades. Sendo o inglês a língua franca da academia (AMMON, 2011; JENKINS, 2009; TARDY, 2004), publicar nesse idioma facilita a disseminação do conhecimento científico produzido no país e aumenta as chances de citação e de colaboração (BOCORNY et al., no prelo; MENEGHINI; PACKER, 2007 apud BAUMVOL, 2018). Tendo em vista o contexto descrito, este estudo objetiva propor princípios para a elaboração de tarefas pedagógicas (TPs) com a utilização de dados linguísticos extraídos de um corpus especializado e relativos à linguagem convencionalmente usada em artigos de pesquisa. Desse objetivo geral, derivam dois objetivos específicos. O primeiro, de ordem analítica, busca extrair, categorizar e classificar expressões multipalavra a partir de um corpus especializado de textos da seção introdução de artigos de pesquisa recentes (2003-2019) publicados em inglês em periódicos internacionais da área da Física. O segundo, de ordem pedagógica, visa usar os dados linguísticos coletados para informar a construção de TPs para o ensino e a aprendizagem de Inglês para Fins Acadêmicos (IFA). As TPs resultantes deste estudo estão disponibilizadas on-line e de forma gratuita no Ambiente Virtual de Aprendizagem LÚMINA Idiomas (BOCORNY, 2017).Palavras-chave: tarefas de acesso aberto; Linguística de Corpus; gêneros acadêmicos; expressões multipalavra; Inglês para Fins Acadêmicos. In the last decades, a large number of higher education institutions (HEIs) sought to internationalize their activities. Since English is the lingua franca of the academy (AMMON, 2011; JENKINS, 2009; TARDY, 2004), publishing in that language facilitates the dissemination of scientific knowledge produced in the country and increases the chances of citation and collaboration (BOCORNY et al., in press; MENEGHINI; PACKER, 2007 apud BAUMVOL, 2018). In view of the described context, this study aims to propose principles for the elaboration of pedagogical tasks (PTs) with the use of linguistic data extracted from a specialized corpus related to the language conventionally used in research articles. From this general objective, two specific objectives are derived. The first, of an analytical nature, seeks to extract, categorize and classify multi-word expressions from a specialized corpus of texts in the introduction section of recent research articles (2003-2019) published in English in international physics journals. The second, of a pedagogical nature, aims to use the collected linguistic data to inform the construction of PTs for teaching and learning English for Academic Purposes (EAP). The PTs resulting from this study are available online and free of charge in the Virtual Learning Environment LÚMINA Idiomas (BOCORNY, 2017).Keywords: open access tasks; Corpus Linguistics; academic genres; multi-word expressions; English for Academic Purposes.
, Patrícia Tosqui-Lucks
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1443-1484; doi:10.17851/2237-2083.29.2.1443-1484

Abstract:
Weather events affect air traffic control (ATC) in many ways, for there are many situations that need to be reported in pilot-controller communication. This paper attempts to analyze the language used to express the impact of meteorological phenomena to air traffic operations, particularly in regard to aeronautical English, that is, the communication used during radiotelephony by air traffic controllers in training situations. For that, two types of analyses will be carried out: one regarding the formulaic structure of lexical units using 11 Aeronautical Meteorology terms within the ATC context (phase 1); and another one concerning the use of these terms by students in three ATC courses (for TWR, ACC and APP facilities) and how it affects their performance during communication activities in a learning environment (phase 2). These analyses will be based on rationales of lexical semantics for terminology; corpus linguistics (CL), comprising English for Specific Purposes (ESP) and learner corpora; and considerations about vocabulary assessment on aeronautical English exams. Results suggest that terminological patterns discussed in this paper show how meaning is dependent on context, and how lexical semantic analysis of terms may contribute to reveal nuances of language used in a specialized context. In this way, it indicates courses have been efficient in teaching and practicing the use of the main meteorological terms related to aeronautical English and that, despite some mistakes students make, evidence points out that they are able to report weather conditions to pilots and to understand pilots’ requests in a proficient level concerning vocabulary.Keywords: meteorology; aeronautical English; terminology; learner corpus; language assessment.Resumo: Eventos meteorológicos afetam o controle de tráfego aéreo (ATC) de diversas formas, dado que muitas situações precisam ser reportadas na comunicação entre piloto e controlador. Este artigo pretende analisar a linguagem utilizada para expressar o impacto de fenômenos meteorológicos para operações ATC, particularmente quanto ao uso de inglês aeronáutico, ou seja, a comunicação utilizada durante a radiotelefonia, por controladores em situações de aprendizagem. Para isso, duas análises foram realizadas: em relação à estrutura formulaica de unidades lexicais contendo 11 termos de Meteorologia Aeronáutica no contexto ATC (fase 1); e quanto ao uso desses termos por alunos de três cursos ATC (para os órgãos operacionais TWR, ACC e APP) e como isso afeta seu desempenho durante as atividades de comunicação em um ambiente de aprendizagem (fase 2). Essas análises serão fundamentadas nas teorias de semântica lexical para terminologia; linguística de corpus (LC), compreendendo Inglês para Fins Específicos (ESP) e corpora de aprendizes; e considerações sobre avaliação de vocabulário em exames de proficiência de inglês aeronáutico. Os resultados sugerem que os padrões terminológicos discutidos mostram como os significados dependem do contexto, e como a análise léxico-semântica de termos pode contribuir para revelar nuances da linguagem utilizada em contexto especializado. Desta forma, demonstrou-se que os cursos foram eficientes no ensino e na prática do uso dos principais termos meteorológicos e que, apesar de alguns erros cometidos, as evidências apontam que os estudantes foram capazes de reportar condições meteorológicas e compreender as solicitações dos pilotos com nível de proficiência adequado em relação a vocabulário.Palavras-chave: meteorologia; inglês aeronáutico; terminologia; corpus de aprendizes; avaliação de línguas.
Débora Borsatti,
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 829-858; doi:10.17851/2237-2083.29.2.829-858

Abstract:
This paper presents a proposal for pedagogical use of MT in English for Specific Purpose (ESP) courses, aiming at investigating the efficiency of this technology as a support for reading scientific texts in English as a FL. The theoretical approach is on ESP, reading and comprehension and a proposal to use MT in ESP courses, aiming to understand the processing of MT and how this knowledge can raise benefits on reading comprehension for academic purposes. In addition, we discussed corpus linguistics and its relation to language teaching as well as its role in MT. The analysis shows that, due to the hybrid system that utilizes the rule-based system and the corpus-based system, Google Translate produces relatively understandable and readable texts. Despite its evident limitations, the tool can provide linguistic awareness when pedagogically explored by ESP teachers in academic context.Keywords: Machine Translation; pedagogical tool; reading; English for Specific Purposes.Resumo: Este artigo apresenta uma proposta de uso pedagógico de tradução pela Máquina (MT) em cursos de inglês para fins específicos (ESP), com o objetivo de investigar a eficiência dessa tecnologia como suporte para a leitura de textos científicos em inglês como L2/ LE. A abordagem teórica é sobre ESP, leitura e compreensão e uma proposta de uso de MT em cursos de ESP, com o objetivo de entender o processamento da MT e como esse conhecimento pode trazer benefícios na compreensão da leitura para fins acadêmicos. Também, discute-se a linguística de corpus e sua relação tanto com o ensino de línguas quanto seu papel na MT. Por fim, a partir da análise que se faz, devido ao sistema híbrido que utiliza o sistema baseado em regras com o sistema baseado em corpus, o Google Translate produz textos relativamente compreensíveis e legíveis. Apesar de suas limitações evidentes, essa tecnologia pode fornecer consciência linguística quando explorada pedagogicamente pelos professores de ESP no contexto acadêmicoPalavras-chave: Tradutor Automático; ferramenta pedagógica; leitura; Inglês para Propósitos Específicos.
Cláudia Freitas, Elvis De Souza
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1033-1058; doi:10.17851/2237-2083.29.2.1033-1058

Abstract:
Resumo: Neste trabalho, apresentamos estudos descritivos e computacionais relacionados ao sujeito oculto. Em um primeiro momento, realizamos uma descrição de cunho quantitativo, tomando por base três corpora dos gêneros jornalístico, literário e enciclopédico. Especificamente, quantificamos o sujeito oculto em cada um dos corpora, e encontramos sujeitos omitidos em 24%, 41% e 46% das orações, respectivamente. Em um segundo momento, por meio de uma estratégia baseada em regras, reconstituímos esses sujeitos e os devolvemos aos corpora, com o objetivo de avaliar o quanto a omissão do sujeito é capaz de impactar o aprendizado automático de dependências sintáticas. Os resultados indicam que a reconstituição formal do sujeito pode melhorar a aprendizagem das dependências sintáticas em até 2% quando consideramos a métrica CLAS, evidenciando o papel relevante da modelagem linguística no aprendizado automático.Palavras-chave: descrição linguística; sujeito oculto; omissão de sujeito; dependências sintáticas; linguística computacional; aprendizado de máquina; linguística de corpus. In this paper, we present descriptive and computational studies related to omitted subjects. Firstly, we develop a quantitative descriptive study based on three corpora, which consist of journalistic, literary and encyclopedic genres. Specifically, we quantify the omitted subjects in sentences for each of these corpora; omitted subjects were found in 24%, 41% and 46% of their sentences, respectively. Secondly, applying rule-based strategies, we reconstitute those subjects and place them back to the corpora, with the goal of evaluating how much the omission of subjects can impact the automatic learning of syntactic dependencies. The results indicate that the formal subject reconstitution can enhance the learning of syntactic dependencies in up to 2% according to the CLAS metric, highlighting the relevant role of linguistic modeling in the automatic learning process.Keywords: linguistic description; omitted subject; syntactic dependencies; computational linguistics; machine learning; corpus linguistics.
Ariel Novodvorski, Cleci Regina Bevilacqua
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1191-1228; doi:10.17851/2237-2083.29.2.1191-1228

Abstract:
Resumo: Este artigo apresenta uma análise de termos e unidades fraseológicas especializadas, do âmbito do futebol, em processos de metaforização com o domínio alvo da política. A pesquisa utiliza um corpus jornalístico monolíngue em espanhol rio-platense, da coluna Humor Político do jornal argentino Clarín. A utilização de programas computacionais para análises lexicais característicos da pesquisa com a Linguística de Corpus viabilizou a identificação e extração de termos e fraseologias especializadas presentes no corpus. A análise das unidades em contexto apontou para a construção metafórica do campo mais abstrato da política por meio de figuras mais concretas do meio futebolístico. A consulta a corpora disponíveis on-line corroborou as premissas e os achados no corpus de estudo.Palavras-chave: terminologia; unidades fraseológicas especializadas; metáfora; linguística de corpus; corpus jornalístico. The following paper provides an analysis of soccer terms and specialized phraseological units in metaphorization processes with the target area of politics. The research uses a monolingual journalistic corpus in Spanish rio-platense, from the politics section Humor Político of the Argentinean newspaper Clarín. The use of computer programs for lexical analysis typical of Corpus Linguistics research has made it possible to identify and extract terms and specialized phrases found in the corpus. The analysis of units in context pointed to the metaphorical construction of the most abstract field of politics by means of more concrete figures of the soccer environment. The corpora consultation available online corroborated the premises and findings in the corpus of study. Keywords: terminology; specialized phraseological units; metaphor; corpus linguistics; journalistic corpus.
, Lu Lu
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1485-1527; doi:10.17851/2237-2083.29.2.1485-1527

Abstract:
Previous studies on the application of corpus linguistics (CL) to education have primarily examined language-related contexts where students are pursuing a formal degree (e.g. undergraduate and Master’s programs). Little do we know about the informal learning of CL especially by (but not limited to) academics/professionals who are not educated and/or do not work in language-oriented fields. The present study addresses these research gaps by examining the perspective of participants in a non-credit-bearing continuous professional development (CPD) project aimed at academics/professionals in a range of disciplines, who did not need to have any prior knowledge of CL. More specifically, we administered a questionnaire to 28 participants of a UK-based CPD project on CL with a view to researching four main aspects: (i) these participants’ CL background; (ii) their motivations to participate in this type of project; (iii) the advantages and barriers of employing CL in their teaching practice; and (iv) their appraisal of corpus analysis integration in their research practice. The results point out to the role of CPD projects in democratizing access to CL education both to language-oriented and non-language oriented academics/professionals and in potentially raising their interest in CL learning. Lack of knowledge is perceived to be the main barrier in embedding corpus approaches to teaching and research, thus reinforcing the relevance of developing formal and informal CL learning opportunities for academics/professionals in different fields.Keywords: corpus linguistics; continuous professional development; educational corpus integration; evaluation of corpus use in professional practices; corpus application to teaching and research; language teacher education; translator education; interdisciplinarity.Resumo: Estudos sobre a aplicação da linguística de corpus (LC) à educação examinaram uma série de contextos diferentes – principalmente aqueles em que os alunos recebem um diploma de colação de grau (por exemplo, cursos de graduação e mestrado). No entanto, pouco se sabe a respeito da aprendizagem informal da LC, especialmente por (mas não se limitando a) acadêmicos/profissionais que não tem uma formação educacional e/ou não trabalham em áreas relacionadas aos estudos da linguagem. A presente pesquisa preenche essas lacunas, examinando a perspectiva dos participantes de um projeto de formação profissional contínua destinado a acadêmicos/profissionais de várias disciplinas, que não precisavam ter conhecimento prévio de LC. Mais especificamente, administramos um questionário a 28 participantes de um projeto de formação profissional contínua na área de LC realizado no Reino Unido com o objetivo de pesquisar quatro aspectos principais: (i) a formação educacional em LC dos participantes; (ii) suas motivações para participar desse tipo de projeto; (iii) as vantagens e barreiras de empregar a LC em suas práticas pedagógicas; e (iv) suas avaliações sobre a integração da análise de corpus em suas práticas de pesquisa. Os resultados apontam para o papel dos projetos de formação profissional contínua na democratização do acesso à educação em LC para profissionais tanto da área de estudos da linguagem quanto de outras áreas e no potencial aumento do interesse desses profissionais na aprendizagem de LC. A falta de conhecimento é percebida como a principal barreira para a incorporação de abordagens de corpus para o ensino e a pesquisa, reforçando assim a relevância do desenvolvimento de oportunidades de aprendizagem formal e informal para acadêmicos/profissionais em diferentes áreas.Palavras-chave: línguística de corpus; formação profissional contínua; integração educacional de corpora; avaliação do uso de corpora em práticas profissionais; aplicação de corpora no ensino e na pesquisa; formação de professores de línguas; formação de tradutores; interdisciplinaridade.
, Pedro Eugênio Gaggiola,
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1289-1324; doi:10.17851/2237-2083.29.2.1289-1324

Abstract:
Resumo: Neste texto aborda-se a frequência e a distribuição de formas de plural irregular do português brasileiro, no âmbito da palavra, numa perspectiva descritiva. Os dados provêm do Corpus Brasileiro e estão divididos em duas amostras: Amostra L, nomes pluralizados terminados ortograficamente em vogal+is (ex. papéis), vogal+us (ex. chapéus) e is (ex. funis), e Amostra N, os terminados por ões (ex. vilões), ãos (ex. irmãos) e ães (ex. pães). O exame das variáveis fonético-fonológicas e léxico-morfológicas – número de sílabas, acento, contexto fonológico, afiliação morfológica e frequência lexical – permitiu contextualizar o comportamento das alternantes minoritárias de cada amostra, em oposição às alternantes prevalentes, vogal+is e ões, respectivamente.Palavras-chave: plural; alomorfia; morfologia; morfofonologia; Corpus Brasileiro. This paper addresses the frequency and distribution of Brazilian Portuguese irregular plurals, within the scope of the word, in a descriptive approach. The data come from the Corpus Brasileiro and are divided into two samples: (i) pluralized nouns ending, in spelling, with vowel+is (eg papéis ‘papers’), vowel+us (eg chapéus ‘hats’), and is (eg funis ‘funnels’), and (ii) those ending with ões (eg vilões ‘villains’), ãos (eg irmãos ‘brothers’), and ães (eg cães ‘dogs’). The phonological and lexical-morphological variables analyzed – number of syllables, stress, phonological context, morphological affiliation and lexical frequency – allowed to define the main contexts for the minority alternants of each sample, in opposition to the prevalent ones, vowel+is and ões, respectively.Keywords: plural; allomorphy; morphology; morphophonology; Corpus Brasileiro.
Stella Esther Ortweiller Tagnin, ,
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 661-671; doi:10.17851/2237-2083.29.2.661-671

Yuli Souza Carvalho, Rozane Rodrigues Rebechi
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 959-998; doi:10.17851/2237-2083.29.2.959-998

Abstract:
Resumo: O objetivo desta pesquisa é cotejar dados indicativos de inteligibilidade e convencionalidade em textos de divulgação da área médica em português para verificar sua adequação ao público brasileiro. Para tanto, apoiamo-nos nos pressupostos da Linguística de Corpus para a compilação e o processamento de um corpus paralelo, formado por textos escritos originalmente em inglês e suas traduções para o português, e um corpus comparável, composto pelos textos traduzidos em português e por textos originalmente escritos nesse idioma. A metodologia do estudo combina análises quantitativas – para levantamento de inteligibilidade, chavicidade e colocação – e qualitativas – para análise das palavras em contexto. Em relação à inteligibilidade, as ferramentas apontaram que os textos escritos em português são ‘difíceis’ para o leitor médio brasileiro, com grau de instrução inferior ao Ensino Médio. Já os textos traduzidos foram considerados ‘razoavelmente difíceis’, de acordo com esse mesmo critério de avaliação, que classificou os originais em inglês como ‘razoavelmente fáceis’, considerando-se seu público alvo, ou seja, o leitor médio estadunidense. A análise qualitativa apontou que os textos traduzidos apresentam quebras de convencionalidade, demonstrando preferência por equivalentes prima facie, nem sempre condizentes com os padrões observados nos textos de mesmo gênero escritos originalmente em português. Apesar de a ferramenta de acessibilidade textual indicar que tanto os textos escritos originalmente em português quanto aqueles traduzidos não se mostram totalmente adequados para o leitor-alvo brasileiro de textos de divulgação médica, acreditamos que a quebra da convencionalidade, identificada nos textos traduzidos, pode dificultar ainda mais a compreensão do leitor médio de resultados de pesquisas científicas da área da saúde.Palavras-chave: textos de divulgação; tradução; convencionalidade; inteligibilidade. The aim of this research is to collate data from intelligibility and conventionality in health-related expository texts in Portuguese to investigate their appropriateness to Brazilians. To this end, we rely on Corpus Linguistics for the compilation and processing of a parallel corpus, comprising texts originally written in English and their translations into Portuguese, and a comparable corpus, composed of texts translated into Portuguese and texts originally written in that language. Our methodology combines quantitative analysis – to assess readability, keyness, and collocation – and qualitative analysis – to investigate words in context. Regarding readability, the tools pointed out that texts written in Portuguese are ‘difficult’ for the average Brazilian reader, with a level of education lower than High School. The translated texts were considered ‘fairly difficult’, according to this same evaluation criterion, which classified the originals in English as ‘fairly easy’, considering its target audience, that is, the average American reader. The qualitative analysis pointed out that the translated texts may compromise conventionality, revealing a preference for prima facie equivalents, not always consistent with the patterns observed in original Brazilian Portuguese counterparts. Although the accessibility evaluation tool indicates that both the texts originally written in Portuguese and those translated into Portuguese do not prove to be entirely suitable for the Brazilian target reader of medical expository texts, we believe that, by breaking conventionality, the translated texts may hinder even more the average reader’s comprehension of results of scientific research.Keywords: expository texts; translation; conventionality; readability.
, Diva Cardoso de Camargo, , Luciano Franco da Silva
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1229-1252; doi:10.17851/2237-2083.29.2.1229-1252

Abstract:
Authors from different countries have published their papers in English, aiming to promote their research results widely and to become internationally known by their peers. It is also true that, although they are aware of the English terminology used in their respective field, some authors still struggle with some features of academic writing such as collocations. Thus, this paper presents a discussion on the underuse and overuse traces of academic collocations by Brazilian authors who had their articles published in English on an open electronic library of scientific journals. In order to analyse the collocations used by these researchers, we compiled a 906,035-word corpus from eight different academic areas. The collocations observed were statistically compared to those from an academic corpus of English writings which contains texts produced by English-speaking authors. Results showed that there are more collocations underused than overused by the authors. The analysis proved that the collocation repertoire of researchers could be broadened by being pointed out during academic writing workshops.Keywords: academic collocations; research paper writing; corpus linguistics.Resumo: Autores de vários países têm publicado seus artigos científicos em inglês com o intuito de promover amplamente os resultados de suas pesquisas dentre a comunidade científica internacional. É verdade que, embora estejam cientes da terminologia utilizada no respectivo campo de pesquisa, alguns autores ainda apresentam dificuldade em lidar com certas características da escrita acadêmica, como o uso das colocações. Este artigo apresenta uma discussão sobre traços de sobreuso e subuso de colocações acadêmicas utilizadas por autores brasileiros que têm seus artigos publicados em inglês numa plataforma eletrônica aberta de artigos científicos. Para analisar as colocações utilizadas por estes pesquisadores, compilamos um corpus de 906.000 palavras a partir de oito áreas científicas. As colocações analisadas foram comparadas estatisticamente com as colocações de um corpus acadêmico de inglês que contém textos escritos por autores anglófonos. Os resultados mostraram que há mais traços de subuso que sobreuso de colocações acadêmicas utilizadas pelos pesquisadores e este repertório poderia ser ampliado se fossem destacadas durante cursos de escrita acadêmica em língua inglesa.Palavras-chave: colocações acadêmicas; escrita de artigos científicos; linguística de corpus.
Aline Nardes dos Santos,
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1137-1189; doi:10.17851/2237-2083.29.2.1137-1189

Abstract:
Resumo: Este artigo vincula-se a uma tese doutoral cujo objetivo foi compreender, por meio da identificação de diferentes instanciações de frames semânticos, as redes de significado que (re)enquadram os direitos humanos e reprodutivos das mulheres no contexto das audiências públicas que debateram a Sugestão Legislativa (SUG) nº 15/2014 – tal proposta visou a regular o aborto nas primeiras doze semanas de gestação (SANTOS, 2020). Especificamente, o texto trata de alguns desdobramentos analíticos possibilitados pela integração da ferramenta de análise qualitativa NVivo ao recurso Sketch Engine, tendo em vista a necessidade de segmentação do corpus em unidades temáticas para posterior processamento dos dados no concordanciador. De modo a abordar tal percurso, o artigo discute a identificação de frames no discurso dos defensores da proposta da SUG nº 15, cujas escolhas lexicais refletem a conceptualização do abortamento como questão de saúde pública e de justiça social. Como resultados, o artigo destaca que o uso integrado de diferentes ferramentas de análise empírica permite uma descrição baseada em corpus que evidencia a dimensão multifacetada do frame semântico – uma estrutura sociocognitiva que se constrói nos entrelaçamentos entre léxico, discurso e cognição.Palavras-chave: Linguística de Corpus; Semântica de Frames; Sugestão Legislativa n.º 15/2014; direitos reprodutivos. This article relates to a Ph.D. thesis which aimed at comprehending, throughout the identification of different semantic frame instantiations, the meaning networks that (re)frame women’s human and reproductive rights in the context of the public hearings that discussed the SUG no. 15/2014 – such a proposal intended to regulate abortion in the first twelve weeks of pregnancy, in Brazil (SANTOS, 2020). Specifically, the text presents some analytical developments made available by the integration of the qualitative analysis tool NVivo to the Sketch Engine tool, considering the need of a corpus segmentation into thematic units for a later processing of these data in a concordancer. In order to discuss this process, the article describes the identification of frames within the discourse of the ones that advocate for the SUG proposal, whose lexical choices reflect the conceptualization of abortion as a public heath matter, as well as a social justice one. Concerning the results, the article emphasizes that the integrated usage of different tools devoted to empirical analysis allows a corpus-based description that reveals the multifaceted dimension of a semantic frame – a socio-cognitive structure that is built in the interconnections between lexicon, discourse and cognition.Keywords: Corpus Linguistics; Frame Semantics; SUG no. 15/2014; reproductive rights.
Paulo Jeferson Pilar Araújo
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 771-803; doi:10.17851/2237-2083.29.2.771-803

Abstract:
Resumo: Discute-se neste artigo as possibilidades para a construção de corpora bilíngues quimbundo-português-quimbundo para o estudo de fenômenos de contato linguístico entre essas duas línguas. Faz-se uma aproximação entre as áreas da Linguística de Corpus e da Linguística Africana, enfatizando-se o caso dos contatos linguísticos presentes nos corpora em vista. Defende-se que o quimbundo e o português têm uma relação histórica que permite a elaboração de um corpus escrito a partir de sua tradição descritiva iniciada no século XVII e de um corpus de fala decorrente de projetos de pesquisa recentes que se ocupam de variedades vernaculares do português e sua relação com a língua africana deste estudo. Para tanto, buscou-se fazer um estudo do estado da arte da descrição do quimbundo e do português angolano com o objetivo de demonstrar a necessidade e viabilidade da produção de corpora bilíngues escrito e de fala quimbundo-português-quimbundo. Espera-se que a produção de corpora bilíngues quimbundo-português-quimbundo possa contribuir para o conhecimento da situação de contato visualizado entre as duas línguas, pautando-se em material empírico necessário para o entendimento da real situação de contato entre essas línguas de Angola além de embasar com dados empíricos hipóteses como a de um continuum afro-brasileiro de português.Palavras-chave: corpora bilíngues; quimbundo; português; contato linguístico; Angola. This article discusses the possibilities for building Kimbundu-Portuguese-Kimbundu bilingual corpora in order to studying language contact phenomena between these two languages. An approximation is made between the areas of Corpus Linguistics and African Linguistics, emphasizing the case of linguistic contact in the corpora in sight. It is argued that Kimbundu and Portuguese have a historical relation that allows the elaboration of written corpus based on the documents of its descriptive tradition that started in the 17th century and a spoken corpus resulting from recent research projects that deal with vernacular varieties of Portuguese and its relation to the African language of this study. To this end, we sought to study the state of the art of the description of Kimbundu and Portuguese in Angola in order to demonstrate the need and feasibility of building bilingual written and spoken Kimbundu-Portuguese-Kimbundu corpora. It is hoped that the production of these bilingual corpora may contribute to the knowledge of the situation of contact between both Angolan languages under study, based on empirical material necessary to understand the real situation of contact between these languages of Angola besides to support hypothesis about an Afro-Brazilian continuum of Portuguese.Keywords: bilingual corpora; Kimbundu; Portuguese; Language contact; Angola.
Fernando Paulino de Oliveira
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 909-958; doi:10.17851/2237-2083.29.2.909-958

Abstract:
Resumo: O presente trabalho tem como objetivo descrever os procedimentos metodológicos da pesquisa intitulada “ToGatherUp: um protótipo de ferramenta para a construção de corpora” que verificou o efeito da incorporação da ferramenta ToGatherUp no tempo e no esforço necessários para a construção manual de um corpus que elaboramos: o Corpus da Computação da Língua Inglesa (CoCLI). Para tanto, discorremos sobre como os autores da pesquisa desenvolveram um conjunto de métricas de medição de esforço – Esforço da Atividade (EA), Esforço Total de Coleta do Texto (ETCT) e Esforço Total do Projeto (ETP) – que serviram de base para a realização de um experimento estatístico comparativo entre os projetos de elaboração manual de duas versões idênticas do CoCLI que se diferenciam por em um deles utilizar o ToGatherUp e o outro não. O resultado do experimento demonstrou uma redução média de 7,47% no ETP do projeto em que o ToGatherUp foi incorporado em relação ao ETP do projeto em que a ferramenta não foi utilizada, o que corroborou a hipótese de que ela reduz o tempo e o esforço despendidos pelo pesquisador em projetos de elaboração manual de corpora.Palavras-chave: Linguística de Corpus; construção manual de corpus; métricas de medição de esforço; ToGatherUp. The present work aims to describe the methodological procedures of the research entitled “ToGatherUp: a prototype of a tool for corpora construction” that verified the effect of incorporating ToGatherUp in necessary time and effort invested in manual construction of Corpus of Computing in English (CoCLI). To this end, we discuss how the research authors developed a set of metrics for measuring effort – Activity Effort (EA), Total Effort for Text Collection (ETCT) and Total Project Effort (ETP) – which served as the basis for conducting a comparative statistical experiment between the manual elaboration of two identical versions of the CoCLI: which differ from each other by one of them using the ToGatherUp and the other one not using it. The experiment shows an average reduction of 7.47% in the ETP when using ToGatherUp compared to the ETP when not using the tool. This result corroborates the hypothesis that the tool reduces the time and effort spent by the researcher on manual elaboration projects of corpora.Keywords: Corpus Linguistics; manual construction of corpus; effort measurement metrics; ToGatherUp.
Nicolás Arellano
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 711-737; doi:10.17851/2237-2083.29.2.711-737

Abstract:
Resumen: Este artículo busca analizar las ventajas de una aproximación a los datos lingüísticos históricos a partir de la confección de corpus específicamente diseñados. Para ello, en primer lugar, se presentan las principales limitaciones de los corpus generales de referencia, particularmente del corde (rae) y Corpus del Español (byu), no solamente en cuanto al acceso de sus motores de búsqueda, sino también a la disponibilidad de los textos que los componen. En segundo lugar, se hace uso de un caso en específico, el del origen y desarrollo de las construcciones con clítico femenino, para ilustrar la propuesta. A continuación, se contrasta esta propuesta de abordaje de datos con otras investigaciones que utilizan corpus generales. Se evidencia, así, que este modo de acceso a las emisiones lingüísticas históricas favorece el estudio de procesos gramaticales novedosos de interfaz que se circunscriben a ámbitos informales, populares, orales y diatópicamente marginales.Palabras clave: locuciones idiomáticas; clítico femenino; corpus generales; corpus históricos; español rioplatense. The aim of this article is to analyze the advantages of an approach to historical linguistic data based on the creation of specifically designed corpora. For this, the main limitations of general reference corpora are presented in the first place; particularly of CORDE (RAE) and Corpus del Español (BYU). The limitations are not only presented with regard to the access on their search engines, but also to the availability of texts that are part of said corpora. Secondly, a particular case is utilized, which shows the origin and development of the constructions with the feminine clitic, so as to exemplify the proposal. Next, the mentioned proposal on the approach of data is contrasted to other research that use general corpora. Thus, it is demonstrated that this way of accessing historical linguistic utterances benefits the study of novel grammatical interface processes that deal exclusively with informal, popular, oral, and dialectically peripheral fields.Keywords: idioms; feminine clitic; general corpora; historical corpora; Río de la Plata Spanish.
Aline Pacheco
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1415-1442; doi:10.17851/2237-2083.29.2.1415-1442

Abstract:
This article aims to analyze the use of personal pronouns in aeronautical communications based on CORPAC, a specialized corpus. Pronouns can play an important role in multitasking communicative scenarios such as the one featured in aviation and therefore it is of paramount importance that identities be clearly set in operations. In light of Neville’s (2004) study about cockpit’s identities, this investigation addresses the frequency and patterns of usage of personal pronouns – especially I, we and you, using corpus linguistic tools. The corpus exploration provides evidence that such pronouns are indeed very frequently used, despite official orientations that do not recommend their use in order to avoid problems such as ambiguity. The examination reveals consistent and interpretable patterns associated to Neville’s (2004) assumptions and has significant implications for training and testing purposes in the field of Aeronautical English.Keywords: aeronautical communications; personal pronouns; corpus linguistics.Resumo: Este artigo tem como objetivo analisar o uso de pronomes pessoais na comunicação aeronáutica a partir do CORPAC, um corpus especializado. Pronomes podem desempenhar um papel de destaque em cenários comunicativos multitarefa, tais como observados na aviação. Nesse sentido, faz-se importante que as identidades sejam claramente definidas nas operações. À luz do estudo de Neville (2004) sobre identidades no cockpit, esta investigação aborda a frequência e os padrões de uso de pronomes pessoais – especialmente “I”, “we” e “you”, por meio do uso de ferramentas linguísticas de corpus. A exploração do corpus fornece evidências de que tais pronomes são de fato usados com muita frequência, apesar de orientações oficiais que não recomendam seu uso, a fim de evitar problemas como a ambiguidade. A análise revela padrões consistentes e interpretáveis associados às suposições de Neville (2004) e tem implicações significativas para fins de treinamento e teste na área de Inglês Aeronáutico.Palavras-chave: comunicação aeronáutica; pronomes pessoais; linguística de corpus.
Márcio De Souza Dias, Ariani Di Felippo, Amanda Pontes Rassi, Paula Cristina Figueira Cardoso, Fernando Antônio Asevedo Nóbrega, Thiago Alexandre Salgueiro Pardo
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 859-907; doi:10.17851/2237-2083.29.2.859-907

Abstract:
Automatic summaries commonly present diverse linguistic problems that affect textual quality and thus their understanding by users. Few studies have tried to characterize such problems and their relation with the performance of the summarization systems. In this paper, we investigated the problems in multi-document extracts (i.e., summaries produced by concatenating several sentences taken exactly as they appear in the source texts) generated by systems for Brazilian Portuguese that have different approaches (i.e., superficial and deep) and performances (i.e., baseline and state-of-the art methods). For that, we first reviewed the main characterization studies, resulting in a typology of linguistic problems more suitable for multi-document summarization. Then, we manually annotated a corpus of automatic multi-document extracts in Portuguese based on the typology, which showed that some of linguistic problems are significantly more recurrent than others. Thus, this corpus annotation may support research on linguistic problems detection and correction for summary improvement, allowing the production of automatic summaries that are not only informative (i.e., they convey the content of the source material), but also linguistically well structured.Keywords: automatic summarization; multi-document summary; linguistic problem; corpus annotation.Resumo: Sumários automáticos geralmente apresentam vários problemas linguísticos que afetam a sua qualidade textual e, consequentemente, sua compreensão pelos usuários. Alguns trabalhos caracterizam tais problemas e os relacionam ao desempenho dos sistemas de sumarização. Neste artigo, investigaram-se os problemas em extratos (isto é, sumários produzidos pela concatenação de sentenças extraídas na íntegra dos textos-fonte) multidocumento em Português do Brasil gerados por sistemas que apresentam diferentes abordagens (isto é, superficial e profunda) e desempenho (isto é, métodos baseline e do estado-da-arte). Para tanto, as principais caracterizações dos problemas linguísticos em sumários automáticos foram investigadas, resultando em uma tipologia mais adequada à sumarização multidocumento. Em seguida, anotou-se manualmente um corpus de extratos com base na tipologia, evidenciando que alguns tipos de problemas são significativamente mais recorrentes que outros. Assim, essa anotação gera subsídios para as tarefas automáticas de detecção e correção de problemas linguísticos com vistas à produção de sumários automáticos não só mais informativos (isto é, que cobrem o conteúdo do material de origem), como também linguisticamente bem-estruturados.Palavras-chave: sumarização automática; sumário multidocumento; problema linguístico; anotação de corpus.
, Mateus Miranda
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 1089-1135; doi:10.17851/2237-2083.29.2.1089-1135

Abstract:
Resumo: Este trabalho objetiva apresentar um novo campo que emergiu a partir da intersecção entre a Linguística de Corpus e a Pragmática: a Pragmática de Corpus. Para tanto, através de uma revisão da literatura como ponto de partida, traçamos um panorama que abarca a origem, os aspectos teórico-metodológicos, e os desafios da nova área. Ademais, introduzimos as abordagens forma-função e função-forma, dois modelos investigativos que integram a disciplina. Finalmente, por meio de um estudo de caso, a fim de ilustrar um dos possíveis percursos de análise, investigamos o marcador pragmático kind of por meio da filtragem, método que compõe a abordagem forma-função, no discurso oral de brasileiros universitários. Os subcorpora que subsidiam a pesquisa são o Spoken Corpus of Brazilian Portuguese and L2-English (SCoPE²) e o Brazilian Spoken English Learner Corpus (BraSEL). Os resultados apontam que quando usado pragmaticamente, mesmo em contextos linguísticos distintos, kind of ocorre em seus três domínios funcionais (atitudinal, interpessoal, textual) e como parte constituinte de marcadores de linguagem vaga.Palavras-chave: pragmática de corpus; forma-função; função-forma; kind of. This work aims to present a new field which has emerged from the intersection between Corpus Linguistics and Pragmatics: Corpus Pragmatics. To do so, through a literature review as a starting point, we offer an overview that encompasses the origin, the theoretical and methodological aspects, and the challenges of the new field. In addition, we introduce the form-to-function and function-to-form approaches, two investigative models which integrate the discipline. Finally, by means of a case study in order to illustrate one of the possible analytical routes, we investigate the pragmatic marker kind of by employing sifting, a method which comprises the form-to-function approach, in the oral discourse of Brazilian university students. The subcorpora which support the research are the Spoken Corpus of Brazilian Portuguese and L2-English (SCoPE²) and the Brazilian Spoken English Learner Corpus (BraSEL). The results show that when used pragmatically, even in different linguistic contexts, kind of occurs in its three functional domains (attitudinal, interpersonal, textual) and as a constituent part of vague language markers.Keywords: corpus pragmatics; form-to-function; function to form; kind of.
Mara Passos Guimarães
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 215-258; doi:10.17851/2237-2083.29.1.215-258

Abstract:
This study investigated the influence of experience with L2 English in the processing of passives in L1 Brazilian Portuguese (BP) by high-proficiency bilinguals and BP monolinguals. Based on the premise that high L2 proficiency is indicative of widespread representational sharing (BERNOLET; HARTSUIKER; PICKERING, 2013) and on the observation that the passive is significantly more productive in English than in BP (GUIMARÃES; SOUZA, 2016), bilinguals’ processing of the construction is expected to be facilitated by L2 exposure. Subjects performed an acceptability judgment task and two sentence elicitation tasks. Both groups considered the passive as acceptable as the active, with no significant differences between the two groups’ judgments of the passive. Differences were found in the oral production of passives between bilinguals and monolinguals, but not in written production: task type influenced the production of monolinguals in that passive productivity fell significantly from the written to the oral task. The difference in productivity levels of the passive between bilinguals and monolinguals is attributed to bilinguals’ exposure to the construction’s distributional properties in the L2, supporting models of bilingual shared representations (HARTSUIKER; PICKERING; VELTKAMP, 2004).Keywords: bilingualism; frequency effects; L2 proficiency; passive construction; acceptability judgment; written production; oral production.Resumo: Este estudo investigou a influência da experiência com L2 inglês no processamento de passivas em L1 português brasileiro (PB) por bilíngues de alta proficiência e monolíngues do PB. Baseando-se na premissa de que alta proficiência em L2 é indicativa de compartilhamento generalizado de representações (BERNOLET; HARTSUIKER; PICKERING, 2013) e na observação de que a passiva é significativamente mais produtiva em inglês do que no PB (GUIMARÃES; SOUZA, 2016)propomos uma visão construcional da construção, na qual ela é tomada como entidade teórica independente. Apesar de sintaticamente congruente no português brasileiro (PB, espera-se que o processamento da construção por bilíngues seja facilitado pela exposição à L2. A compreensão da construção foi observada através de uma tarefa de julgamento de aceitabilidade de sentenças, enquanto a produção foi observada a partir de duas tarefas de descrição de imagens (uma escrita e outra oral). Tanto bilíngues quando monolíngues julgaram a passiva tão aceitável quanto a ativa, sem diferença significativa nos julgamentos entre os dois perfis linguísticos. Apesar de as passivas terem sido menos frequentes do que as ativas nas tarefas de produção, o tipo de tarefa influenciou o número de ocorrências de passivas dentre os monolíngues: sua produção foi similar à dos bilíngues na tarefa escrita, mas significativamente menor na tarefa oral. A diferença nos níveis de produtividade de passivas entre bilíngues e monolíngues é atribuída à exposição dos bilíngues às propriedades distribucionais da construção na L2, corroborando modelos de compartilhamento representacional bilíngue (HARTSUIKER; PICKERING; VELTKAMP, 2004).Palavras-chave: bilinguismo; efeitos de frequência; proficiência em L2; construção passiva; julgamento de aceitabilidade; produção escrita; produção oral.
Daniel Do Nascimento E Silva, Anabella Machado Rocha, Alvaro Monteiro Carvalho Arcanjo,
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 289-329; doi:10.17851/2237-2083.29.1.289-329

Abstract:
Resumo: Este artigo tem como objetivo discutir dimensões da violência em três contextos empíricos em que as facetas física e simbólica da violência diferentemente se manifestaram: um relato de uma mulher vítima de violência sobre sua tentativa de realizar um boletim de ocorrência sobre ameaças sofridas pelo então marido; as declarações de um executivo sobre o pouco valor da vida de favelados no contexto da pandemia de Covid-19; uma capa jornalística em que a cabeça da ex-presidenta Dilma Rousseff aparece em chamas. O artigo invoca os conceitos de escala, comunicabilidade e indexicalidade para produzir sentido sobre como a violência foi percebida e enquadrada no primeiro contexto, sobre como ela circulou viralmente no segundo e sobre como ela participou da semiotização e contextualização de uma imagem no terceiro. Metodologicamente, o artigo combina abordagens etnográficas e documentais, diferentemente empregadas em cada contexto empírico. Além de promover uma discussão situada dessas três manifestações da violência, apontamos para formas de resistência à violência, algumas delas inscritas na própria produção da atividade reflexiva sobre a manifestação e os efeitos da violência.Palavras-chave: escalas; comunicabilidade; indexicalidade; violência empírica; violência simbólica. This article aims at discussing dimensions of violence in three empirical scenarios in which physical and symbolic violence differently surfaced: an account of a female victim of violence about her attempt to press charges about threats made by her then husband; the comments by a businessman about the lack of value of the lives of favela residents in the context of the Covid-19 pandemics; a newspaper cover displaying the head of the former Brazilian president Dilma Rousseff on fire. The article builds on the concepts of scales, communicability and indexicality in order to render intelligible the ways in which violence was perceived and framed in the first context; in addition to how it virally spread in the second, and to how it participated in the semiotization and contextualization of an image in the third. Methodologically, the paper combines ethnographic and documental approaches, and applies them differently in each empirical context. In addition to providing a situated discussion of these three manifestations of violence, we point to modes of resistance to violence, some of which are inscribed in the very production of reflexive activity about the manifestation and effects of violence.Keywords: scales; communicability; indexicality; empirical violence; symbolic violence.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 533-588; doi:10.17851/2237-2083.29.1.533-588

Abstract:
Resumo: Este artigo tem como proposta a identificação de possíveis normas lexicais gerais e regionais a partir da descrição e da análise da variação espacial para o popularmente denominado “pão francês”, em uma perspectiva geolinguística e léxico-semântica. Para tanto, adota-se a visão da norma linguística, com base em Coseriu (1979), somada às contribuições de Camara Junior (1964), Rona (1969), Cunha (1987), dentre outros. A diversidade de nomeações para esse alimento foi documentada por meio da questão 186 do Questionário Semântico-Lexical (QSL) dos Questionários (COMITÊ NACIONAL DO PROJETO ALiB, 2001) aplicada pelas equipes que compõem o Projeto Atlas Linguístico do Brasil (ALiB), em 250 localidades brasileiras (interior e capitais). Na composição do corpus desta análise, foram selecionados 1000 informantes com o perfil fundamental de escolaridade, contemplando as dimensões diassexual e diageracional. Com base na cartografação linguística e cotejo da disseminação das variantes lexicais obtidas e na consulta a obras lexicográficas, foram identificadas as formas de uso geral e regional, além de traços de influência interétnica e de fluxos migratórios internos e externos. Ainda, constatou-se a polimorfia de designações, por efeito da presença do referente no cotidiano brasileiro, atestando a relevância desse alimento, consumido desde os primórdios da história da civilização.Palavras-chave: Geolinguística; Projeto ALiB; normas lexicais; regionalismos; pão francês. this article aims to identify possible general and regional lexical norms from the description and analyse of spatial variation to the popularly denominated “french bread”, on a geolinguistic and lexical and semantic perspective. For that, the adoption of the view of linguistic norm, based on Coseriu (1979), added to Camara Junior (1964), Rona (1969), Cunha (1987) contributions, among others. The diversity of nomination for this food has been documented throught 186 question from Semantic-Lexical Questionnaire (SLQ) of Questionários (COMITÊ NACIONAL DO PROJETO ALiB, 2001) applied by crews that compose the Project Linguistic Atlas of Brazil (ALiB), on 250 Brazilian localities (countryside and capitals). On this analysis, they were selected 1000 informants with Primary education, diassexual and diageracional dimensions. Based on linguistic cartography and comparation of lexicals variants dissemination and the consultation to varied dictionaries, they were identified general and regional forms, in addiction to interethnic influences and migratory moviments traces. Furthermore, the observation of the polymorphy of designations, result of presence of the referring in Brazilian daily, certifying the relevance of this aliment, consumed since the beginning of the history of civilization.Keywords: Geolinguistics; ALiB Project; lexical norms; regionalisms; French bread.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 49-76; doi:10.17851/2237-2083.29.1.49-76

Abstract:
Resumo: O estudo exploratório apresentado ao longo deste artigo foca a antroponímia cristã, isto é, o conjunto de nomes próprios de pessoas que apresentam significado etimológico cristão e/ou estão relacionados à história do cristianismo e às religiões cristãs. Objetiva-se apresentar uma investigação preliminar sobre a existência, a constituição, a caracterização etimológica de repertório de nomes cristãos e o conhecimento onomástico acerca deles por parte de falantes do oeste do Paraná, especificamente, de alunos e professores de um curso de graduação ofertado por uma universidade pública da região. A análise do repertório antroponímico dos prenomes dos respondentes mostrou que quase a metade desses nomes está relacionada ao cristinanismo.Este resultado confirma a importância cultural e histórica da análise diacrônica dos prenomes.Outro resultado foi alcançado mediante análise das informações fornecidas por portadores desses nomes e de quem os atribuiu a seus filhos: eles sabem a motivação que resultou na escolha de seus nomes, porém. Verificou-se, contudo, que há pouca convergência entre o significado e a motivação para a escolha dos nomes religiosos, tendo em vista que apenas um em cada quatro prenomes religiosos foi escolhido por motivação religiosa.Palavras-chave: onomástica; antroponomástica; significado etimológico; conhecimento onomástico. The exploratory study presented throughout this article focuses on Christian anthroponomy, that is, the set of proper names of people who have Christian etymological significance and/or are related to the history of Christianity and Christian religions. The objective is to present a preliminary investigation into the existence, the constitution and etymological characterization of repertoire of Christian names and the onomastic knowledge about them by speakers from western Paraná, specifically, of students and teachers from a undergraduate course offered by a public university in the region. The analysis of the anthroponomic repertoire of respondents first names showed that almost half of these names is names related to Christianism. This result confirms the cultural and historical importance of diachronic analysis of the first names. Other result was obtained by analysis of the information provided by bearers of these names and who attributed them to their children: they are aware of the religious meaning of the names of the repertoire and know the motivation that resulted in the choice of their names. About the relation between meaning and motivation for the choice of religious names, though, there is little convergence between meaning and motivation for the choice of religious names, considering that only one in four religious prenames was chosen by religious motivation.Keywords: onomastics; anthroponomastics; etymological significance; onomastic knowledge.
Mohammed Boughaba
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 99-119; doi:10.17851/2237-2083.29.1.99-119

Abstract:
Resumen: El uso de marcas diafásicas y diastráticas tiene una tradición muy arraigada en la lexicografía española. De hecho, es posible, ya en las primeras versiones del Diccionario de la lengua española (REAL ACADEMIA ESPAÑOLA, 2014), localizar varias etiquetas que se refieren al nivel y al estilo de lengua. No obstante, la consulta de los distintos diccionarios muestra que el interés por el establecimiento de tales marcas no ha sido respaldado por bases teóricas y procedimientos sistemáticos. Los escollos aumentan más cuando las unidades objeto de descripción son combinaciones pluriverbales, caracterizadas por la fijación y la idiomaticidad: las locuciones. La presente contribución trata de averiguar cómo está descrita la marcación diafásica y diastrática aplicada a las locuciones. El objetivo del trabajo es examinar diversos diccionarios, generales y fraseológicos, para comprobar una serie de cuestiones, como la presentación de estas marcas en el prólogo de las obras estudiadas, la pluralidad de denominaciones usadas para referirse a los distintos microsistemas de marcación diafásica y diastrática, la subjetividad en su aplicación, etc. Al final, se presentan algunas propuestas para resolver los escollos descritos en el trabajo.Palabras clave: diccionario; registros de uso; marca diafásica; marca diastrática; locuciones. The use of diaphasic and diastratic marks has a deep-rooted tradition in Spanish lexicography. In fact, it is possible, already in the first versions of the Dictionary of the Spanish language (REAL ACADEMIA ESPAÑOLA, 2014), to locate several labels that refer to the level and style of the language. However, the consultation of the different dictionaries shows that the interest in the establishment of such marks has not been supported by theoretical bases and systematic procedures. The problems derived from the description of these marks increase more when it comes to the idioms, units characterized by their fixation and idiomaticity. The present contribution tries to find out how diaphasic and diastratic marking applied to idioms is treated. The objective of this work is to examine various dictionaries, general and phraseological, to find out a series of questions, such as the description of these marks in the prologue of the works studied, the plurality of names used to refer to the different diaphasic and diastratic marking microsystems, subjectivity in its application, etc. At the end, some proposals will be presented to resolve the pitfalls described in the work.Keywords: dictionary; registers of language; diaphasic marks; diastratic marks; idioms.
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 331-361; doi:10.17851/2237-2083.29.1.331-361

Abstract:
Resumo: O presente trabalho compara aspectos fonológicos das variedades modernas do guineense, do kabuverdianu e do papiamentu (os crioulos autóctones da Alta Guiné) com o objetivo de encontrar suas similaridades e diferenças. Para o guineense, recorreu-se aos dados e descrições de Chapouto (2014) e Costa (2014); já para o kabuverdianu e o papiamentu, foi utilizado o estudo de Freitas (2016). No que tange ao sistema vocálico, as três línguas têm as cinco vogais /i e a o u/; contudo o guineense não apresenta a distinção entre médias-altas e médias-baixas e o papiamentu possui vogais anteriores arredondadas. Com relação ao sistema consonantal, as três línguas não fazem distinção entre dois róticos e possivelmente não tinham /v z/ nos estágios iniciais. A partir dos dados, percebe-se que as três línguas, apesar de sua origem comum, seguiram caminhos diversos de desenvolvimento, com estratégias autônomas e recebendo influências das línguas com as quais estão em contato.Palavras-chave: Crioulos portugueses da Alta Guiné; quadros fonológicos; aspectos convergentes e divergentes; origem comum; desenvolvimentos próprios. This research compares the phonological aspects of the modern varieties of Guinea-Bissau Creole, Cape Verdean Creole and Papiamentu (the Upper Guinea Portuguese Creoles) in order to find their similarities and differences. For the Guinea-Bissau Creole, we used data and descriptions of Chapouto (2014) and Costa (2014); for the Cape Verdean Creole and the Papiamentu, in turn, the study of Freitas (2016) was used. As far as the vowel system is concerned, the three languages have the five vowels /i e a o u/; however, the Guinea-Bissau Creole does not present the distinction between close-mid vowels and open-mid vowels and Papiamentu has front rounded vowels. Regarding the consonantal system, the three languages do not distinguish between two rhotic consonants and possibly did not have /v z/ in the initial stages. From the analysis, we can see that the three languages, despite their common origin, followed different paths of development, with their own strategies and receiving influences from the languages which they are in contact with.Keywords: Upper Guinea Portuguese Creoles; phonological inventories; convergent and divergent aspects; common origin; own developments.
Mercia Regina Santana Flannery
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 363-386; doi:10.17851/2237-2083.29.1.363-386

Abstract:
This paper exemplifies the use of aggression as impoliteness in computer-mediated, or digital communication in Brazilian Portuguese, while looking into the performance of such linguistic actions in the context of a discussion about class discrimination. Specifically, it investigates the relationship between linguistic aggression as impoliteness, and identity as observed in a Facebook campaign page about a Brazilian university. The page under consideration was devised as an open platform to disseminate and call attention to examples of discriminatory behaviors experienced by students from peripheric communities attending an elite university in Rio de Janeiro. These students were at the center of a controversy, as they were supposedly brought to this institution through social programs promoted by the previous, leftist oriented governments. This paper examines the use of linguistic aggression as impoliteness, such as name calling and overt disagreement (Lorenzo-Dus; Blitvich; Bou-Franch, 2011), to communicate different opinions about, or argue against, the perceived instances of discrimination supplied by the students in the campaign and subsequently discussed by the participants in their posts. These impoliteness strategies ratify identities in the context of the discussion, marking in and outside group members, as the participants 1) align against, or 2) justify, the described behaviors.Keywords: aggression; impoliteness; identity; narrative; discrimination; Facebook; digital communication.Resumo: Este artigo exemplifica o emprego de agressão como descortesia na comunicação mediada, ou digital, no português brasileiro, observando-se o desempenho de tais ações linguísticas no contexto de uma discussão sobre discriminação de classe. Especificamente, investiga-se a relação entre agressão linguística como descortesia e identidade tal como observada em uma campanha em uma página do Facebook sobre uma universidade brasileira. A página sob consideração foi projetada como uma plataforma aberta para disseminar e chamar a atenção para exemplos de comportamentos discriminatórios vivenciados pelos estudantes de comunidades periféricas frequentando uma universidade de elite no Rio de Janeiro. Os membros desta comunidade estudantil estavam no centro de uma controvérsia, por supostamente terem sido admitidos na instituição por meio de programas sociais promovidos por governos anteriores, de tendência esquerdista. Este artigo examina o uso de agressão linguística como descortesia, tais como chamar nomes, i.e., dirigir-se a alguém empregando termos insultuosos, e discordar diretamente (Lorenzo-Dus; Blitvich; Bou-Franch, 2011), para comunicar diferentes opiniões sobre, ou argumentar contra, as percebidas instâncias de discriminação supridas pelos estudantes na campanha e subsequentemente discutidas pelos participantes nas suas postagens. Estas estratégias de descortesia ratificam as identidades no contexto da discussão, marcando membros e não-membros do grupo, na medida em que os participantes 1) alinham-se contra, ou 2) justificam os comportamentos descritos.Palavras-chave: agressão; descortesia; identidade; narrativas; discriminação; Facebook; comunicação digital.
Geovana Soncin, Tainan Garcia Carvalho
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 487-532; doi:10.17851/2237-2083.29.1.487-532

Abstract:
Resumo: Este trabalho adota a pontuação enquanto objeto de investigação com o objetivo de explorar dizeres institucionalizados sobre o tema em diferentes espaços de circulação social e, ainda, de investigar em que medida esses dizeres têm implicações para o ensino da pontuação no contexto escolar. Para tanto, realiza-se uma revisão teórica dos trabalhos em linguística que tratam da questão, a fim de demonstrar como a complexidade envolvida na pontuação enquanto fenômeno de linguagem, a qual é decorrente de sua constituição histórica, resulta em cenário no qual competem várias perspectivas linguísticas para o seu tratamento. Dentre essas, destacam-se as perspectivas que veem a pontuação como recurso gráfico, prosódico, para fins de legibilidade e como marca enunciativa. À luz dessa discussão teórica, exploram-se materiais diversos – documentos oficiais sobre ensino de Língua Portuguesa, materiais didáticos e matérias de internet – com vistas a identificar resquícios dessas perspectivas no tratamento dispensado à pontuação. Como resultado, observa-se a emergência de ideias conflitantes sobre o papel dos sinais de pontuação nos materiais investigados e propõe-se uma reflexão sobre os desafios dessa instabilidade para o ensino de pontuação. Finalmente, argumenta-se em favor da perspectiva enunciativa enquanto abordagem que considera a complexidade do objeto sob análise.Palavras-chave: pontuação; dizeres institucionalizados; ensino de língua portuguesa. This work considers punctuation as an object of investigation with the aim of exploring institutionalized discourses about the theme in different spaces of social circulation. This work also aims to investigate in what extent these discourses have implications for the teaching of punctuation in the school context. To explore these points, it is carried out a theoretical review of linguistic studies that addresses the issue. This review demonstrates how the complexity involved in punctuation as a language phenomenon, which is relate to its own historical constitution, results in a scenario in which the way of approaching punctation is a reflex of several linguistic perspectives competing. Among these perspectives, it is emphasized four of them, which conceives the punctuation as a graphic mechanism, as a prosodic resource, as a mechanism of legibility and as an enunciative mark. Considering this theoretical discussion, several materials are explored – as official documents on Portuguese language teaching, didactic materials, and internet texts about the theme – to identify how remnants of these perspectives can be noticed by the way punctuation is approached by each material. As a result, it is seen the emergence of conflicting ideas about the role of punctuation marks in the analyzed material. Due to the instability of approaches related to punctuation, it is proposed a discussion about how challenging teaching punctation can be. Finally, it is argued in favor of an enunciative perspective as an approach that considers the complexity involved in punctuation.Keywords: punctuation; institutionalized discourses; Portuguese language teaching.
Ana Carolina Teixeira Peres, Erotilde Goreti Pezatti
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 77-98; doi:10.17851/2237-2083.29.1.77-98

Abstract:
Resumo: O artigo tem como objetivo analisar a ordenação dos Operadores e Modificadores de Subatos do Nível Interpessoal, tomando como suporte teórico a proposta de Pezatti (2014), que, por sua vez, se baseia nos princípios da Gramática Discursivo-Funcional, desenvolvida por Hengeveld e Mackenzie (2008). O objetivo principal consiste em investigar a ordenação de marcadores interpessoais (gramaticais e lexicais) dentro do sintagma. Para tanto, toma-se como universo de pesquisa o corpus do Projeto para a História do Português Brasileiro (https://sites.google.com/site/corporaphpb), mais especificamente cartas manuscritas particulares, cartas de leitor e de redator dos séculos XIX e XX. Os dados analisados revelam que, dentro do sintagma, quando se trata dos operadores, os de Mitigação, de Contraste (restritivo e expansivo), de Exemplificação e de Ênfase se colocam em PI; o de Ênfase é que coloca-se sempre em PF do sintagma; o de Contraste apenas ocupa geralmente a posição PI do sintagma, exceto em ocorrências do século XX. Já os marcadores lexicais de Exemplificação, de Ênfase, de Atitudes e de Contraste (restritivo e seletivo) vêm, na maioria dos casos, em PI do sintagma, com exceção do de Exemplificação por exemplo que se coloca em PI ou PF.Palavras-chave: gramática funcional; ordem de palavras; sintagma. Taking as theoretical support the proposal of Pezatti (2014), which, in turn, is based on the principles of Functional Discourse Grammar, developed by Hengeveld and Mackenzie (2008), this paper aims at analyzing the ordering of interpersonal markers (grammatical and lexical) within the phrase. To this end, the corpus of the Project for the History of the Brazilian Portuguese (https://sites.google.com/site/corporaphpb) is taken as database, but more specifically private handwritten letters, reader’s letters and editor’s letters from the 19th and 20th centuries. The analyzed data reveal that, within the phrase, Operators of Mitigation, Contrast (restrictive and expansive), Exemplification and Emphasis are placed in PI; the Operator of Emphasis é que is always placed in PF and the one of Contrast apenas is usually inserted into the PI position, except in the 20th century. The lexical markers of Exemplification, Emphasis, Attitudes and Contrast (restrictive and selective) are placed into PI in most cases, with the exception the Modifiers of Exemplification for example, that is placed into PI or PF.Keywords: functional grammar; constituent ordering; phrase.
Verónica Nercesian, Mónica Amarilla
REVISTA DE ESTUDOS DA LINGUAGEM, Volume 29, pp 259-288; doi:10.17851/2237-2083.29.1.259-288

Abstract:
Resumen: En este trabajo se analiza la variación dialectal en el léxico wichi/weenhayek (familia mataguaya). Se distinguen, por un lado, diferencias que son correlato de la variación en la fonología y la morfología. Las primeras tienen consecuencias en la representación fonémica o pronunciación de los ítems léxicos, y las segundas, en su configuración morfológica (palabras complejas). Por otro lado, se distinguen las diferencias que atañen exclusivamente al léxico, es decir, la alternancia de palabras para un mismo concepto según las zonas geográficas. Asimismo, se analiza el recorrido histórico de la variación de los términos que designan ‘agua’, en tanto aporta pistas para la comprensión del cambio y la difusión léxica en el territorio wichi/weenhayek. Los datos utilizados en este estudio provienen de fuentes primarias (un diccionario bilingüe de creación colectiva con participación de hablantes nativos de distintas zonas geográficas) y fuentes secundarias (gramáticas descriptivas y vocabularios). El resultado del análisis aquí presentado arroja nuevos elementos que fortalecen la división en dos complejos dialectales, pilcomayeño y bermejeño, identificados en estudios previos sobre la base de rasgos fonológicos y gramaticales, y que se especula tienen mayor tiempo de divergencia. Al mismo tiempo, abre nuevos interrogantes respecto del comportamiento del léxico y la configuración de los complejos dialectales en relación con las redes sociales e históricas.Palabras clave: variación dialectal; léxico; fonología; morfología; wichi/weenhayek. This paper analyzes the dialectal variation in the Wichi/Weenhayek language (Mataguayan). On the one hand, we distinguish differences that result from phonological and morphological variations. The phonological variation impacts on the phonemic representation or pronunciation of the lexical items, and the morphological variation impacts on the morphological configuration of the words (complex words). On the other hand, we distinguish differences that have exclusively to do with the lexicon, that is, the alternate words for the same concept distributed in different geographical areas. In addition, we analyze the historical variation of the words for ‘water’, since it gives us hints for the understanding of lexical change and diffusion through the Wichi/Weenhayk territory. The data analyzed in this study come from primary sources (a bilingual Wichi/Weenhayek-Spanish dictionary created collectively together with Wichi native speakers from different geographical areas) and from secondary sources (descriptive grammars and vocabularies). The results of this study contribute new elements to the division into two dialectal groups, Pilcomayeño and Bermejeño, identified previously on the basis of phonological and morphological features, which are speculated as having the longest time of divergence. At the same time, it opens new questions about the behavior of the lexicon and the setting of the two dialectal groups in relation to the historical and social nets.Keywords: dialectal variation; lexicon; phonology; morphology; Wichi/Weenhayek.
Page of 16
Articles per Page
by
Show export options
  Select all
Back to Top Top