Acessibilidade / Reportar erro

Proposta de dicionário das ciências do léxico com base nas publicações dos membros do gtlex/anpoll

Lexicon sciences dictionary based on gtlex/anpoll members’ publications

RESUMO

Nos estudos linguísticos, é comum chamar de “Ciências do Léxico” o conjunto de disciplinas (notadamente Lexicologia, Lexicografia e Terminologia) que se ocupam do estudo das unidades lexicais da língua. Com o objetivo de organizar a terminologia dessa área do conhecimento, este artigo apresenta uma proposta de construção de um Dicionário das Ciências do Léxico. A pesquisa foi baseada na Linguística de Corpus (Berber Sardinha, 2004Berber Sardinha, T. (2004). Lingüística de Corpus. Manole.) e nos postulados da Teoria Comunicativa da Terminologia (Cabré, 1999Cabré, M. T. (1999). La Terminologia: representación y comunicación. Elementos para una teoría de base comunicativa y otros artículos. Universitat Pompeu Fabra.). O corpus foi constituído pela produção (artigos, livros, teses e dissertações) dos 50 membros efetivos do GTLex da ANPOLL, publicada entre os anos de 2000 e 2018 e disponível on-line. Ao final do levantamento, com um corpus constituído de 580 arquivos (com mais de sete milhões de tokens, contendo 526 artigos, 27 livros, 19 teses, 5 dissertações e 3 dossiês de periódicos), chegou-se a uma nomenclatura provisória de 717 termos. A nomenclatura apresentou cerca de 60% de termos complexos, confirmando a tendência da formação sintagmática nas terminologias por conta da especificação cada vez maior do conhecimento.

Palavras-chave:
ciências do léxico; terminologia; dicionário; gtlex

ABSTRACT

In linguistic studies, it is common to call “Lexicon Sciences” the disciplines (especially Lexicology, Lexicography, and Terminology) that study the lexical units of the language. This article presents a proposal for a Lexicon Sciences Dictionary, to organize the terminology of this area of knowledge. The research was based on Corpus Linguistics (Berber Sardinha, 2004Berber Sardinha, T. (2004). Lingüística de Corpus. Manole.) and on the principles of Communicative Theory of Terminology (Cabré, 1999Cabré, M. T. (1999). La Terminologia: representación y comunicación. Elementos para una teoría de base comunicativa y otros artículos. Universitat Pompeu Fabra.). The corpus is composed by the production (articles, books, theses, and dissertations) of the 50 permanent members of GTLex (ANPOLL), published between 2000 and 2018 and available online. After analyzing a corpus of 580 files (more than 7 million tokens), a provisional nomenclature of 717 terms was elaborated. About 60% of the nomenclature is composed of complex terms, confirming the tendency of syntagmatic formation in terminologies because of the specification of knowledge.

Keywords:
lexicon sciences; terminology; dictionary; gtlex

1. Introdução

Conforme afirma Krieger (2016Krieger, M. G. Entrevista. (2016). In M.G. Krieger, & A. Adelstein. Estudos do léxico em diferentes perspectivas. Calidoscópio, 14(3), 557-560. http://revistas.unisinos.br/index.php/calidoscopio/article/view/cld.2016.143.19 (acesso 09 de novembro, 2021).
http://revistas.unisinos.br/index.php/ca...
, p. 557-8), nos estudos do léxico “consolidou-se uma tradição de considerar a Lexicologia, a Lexicografia e a Terminologia como um tripé que sustenta o que se passou a denominar de Ciências do Léxico”. Em linhas gerais, a Lexicologia investiga vários fenômenos: unidades mono e polilexicais, formação de palavras, neologismos, empréstimos linguísticos, topônimos e antropônimos. A Lexicografia se preocupa com os parâmetros para o registro de tais unidades num produto final (dicionário, glossário, banco de dados, etc.), com a elaboração desses produtos e também com a análise deles. A Terminologia, por fim, estuda as linguagens especializadas e elabora produtos terminográficos.

Essa tripartição das Ciências do Léxico é ratificada, por exemplo, na nomeação dos grupos de trabalho da ANPOLL (GTLex: GT de Lexicologia, Lexicografia e Terminologia) e no título da coleção organizada por Isquerdo et al3 3 A coleção já conta com oito volumes: Oliveira e Isquerdo (2001); Isquerdo e Krieger (2004); Isquerdo e Alves (2007); Isquerdo e Finatto (2010); Isquerdo e Barros (2010); Isquerdo e Seabra (2012); Isquerdo e Dal Corno (2014, 2018). que se tornou referência na área: “As Ciências do Léxico: lexicologia, lexicografia, terminologia”.

Além dessa forma tripartida, poderíamos pensar as Ciências do Léxico de maneira multipartida: Lexicologia, Onomástica, Lexicografia, Fraseologia, Fraseografia, Idiomatologia, Paremiologia, Terminologia, Terminografia.

Diante do exposto, o objetivo deste artigo é apresentar uma proposta de Dicionário das Ciências do Léxico4 4 Trata-se de uma iniciativa que visa a sistematizar o conhecimento conforme se apresenta no cenário brasileiro, pois no exterior a designação “Ciências do Léxico” é algo contestado. destinado a estudantes de graduação ou de pós-graduação em Letras como instrumento introdutório e didático aos estudos do léxico.

O dicionário serve para organizar a terminologia de uma área do conhecimento, condição necessária a qualquer domínio. Mas há nesse objetivo um problema nevrálgico: a profusão terminológica. Sobretudo quando se trata de áreas que se ocupam de uma preocupação designativa e terminológica, a tarefa é ainda mais desafiadora para a elaboração de um produto terminográfico. A falta de uma terminologia consensual redunda numa abundância de termos, com variantes de todos os tipos: morfológica (truncação / truncamento), ortográfica (taxionomia/taxonomia), lexical ou denominativa (verbete / artigo lexicográfico), sintática (candidato a termo / termo candidato), semântica ou conceitual (macroestrutura: apenas nomenclatura ou também os textos externos dos dicionários?).

Nos estudos fraseológicos, por exemplo, há, genericamente (sem diferenciar os tipos de unidades fraseológicas: expressão idiomática, parêmia, locução, colocação, etc.), dezenas de hiperônimos para as unidades, como combinatória lexical, composto sintagmático, enunciado fraseológico, expressão pluriverbal, formação sintagmática, frasema, sintagma fraseológico, unidade fraseológica, etc.

Particularmente na Fraseologia, o problema da profusão terminológica é sintomático, atestado por vários autores. Sabino (2011Sabino, M. A. (2011). O campo árido dos fraseologismos. Revista Signótica, 23(2), 385-401. http://hdl.handle.net/11449/122304 (acesso 09 de novembro, 2021).
http://hdl.handle.net/11449/122304...
, p. 385) observa que as profusões terminológica e classificatória dos estudos fraseológicos, sendo até mesmo contraditórias, não só atrapalham os avanços nesse domínio como também sinalizam que ainda resta muito a ser feito. Monteiro-Plantin (2014Monteiro-Plantin, R. S. (2014). Fraseologia: era uma vez um patinho feio no ensino de língua materna. Imprensa Universitária., p. 115) apresenta como desafio à Fraseologia a consolidação de uma nomenclatura que permita o diálogo entre diferentes perspectivas de investigação. Para Mejri (2012Mejri, S. (2012). Délimitation des unités phraséologiques. In M.L.O. Alvarez (Ed.), Tendências atuais na pesquisa descritiva e aplicada em fraseologia e paremiologia (pp. 139-156). Pontes., p. 140), não existe uma terminologia comum nos estudos fraseológicos, aceita e empregada por todos os pesquisadores. Por fim, Corpas Pastor (2017Corpas Pastor, G. Entrevista. (2017). In Alvarez, M. L. O., Fraseologia e Paremiologia: uma entrevista com Gloria Corpas Pastor. Tradução Ana Carolina Spinelli. Revisão técnica Gabriel de Ávila Othero. ReVEL, 15(29), 261-270., p. 265-6), quando questionada sobre os desafios da Fraseologia, diz que a profusão terminológica (em grande medida, desnecessária), muitas vezes é o que nos impede de avançar nos estudos.

A pletora terminológica e a falta de consenso entre estudiosos do léxico mostram, entretanto, que a variação, tanto denominativa como conceitual, faz parte das linguagens especializadas, como defendem as novas teorias terminológicas, sendo difícil uma normatização. Homogeneizar essa terminologia é uma utopia, mas organizá-la é necessário. Por isso, para a construção do dicionário, cumpre descrever a variação existente e indicar, entre as diferentes variantes, quais são mais usadas pelos especialistas e quais seus matizes de sentido.

Por que um dicionário?

Em primeiro lugar, como observa Abbagnano (2012Abbagnano, N. (2012). Dicionário de Filosofia. WMF Martins Fontes., p. 1123), “o objetivo do dicionário é possibilitar a verificação indireta da hipótese”, ou seja, o Dicionário das Ciências do Léxico aqui proposto é um esforço para estabelecer o estudo do léxico como campo de conhecimento, dando-lhe a forma de uma ciência, já que a terminologia (com inicial minúscula, como conjunto de termos) legitima um campo do saber.

Sendo a terminologia uma condição necessária a qualquer ciência, afinal, “a construção da ciência é indissociável da construção de sua metalinguagem” (Barbosa, 2004Barbosa, M. (2004). A terminologia e o ensino da metalinguagem técnico-científica. In A.N. Isquerdo, & M.G. Krieger (Eds.), As ciências do léxico: lexicologia, lexicografia, terminologia. (pp. 311-325). Editora UFMS., p. 315), pretendemos contribuir à elaboração de uma metalinguagem própria das Ciências do Léxico. Não se trata de lexicologizar noções morfológicas, semânticas, etc. Tampouco de criar um lexicologuês para uma comunidade de pesquisadores do léxico. É, antes, uma proposta para identificar, numa perspectiva descritiva, os principais termos efetivamente em uso nos textos especializados e representá-los num produto terminográfico, indicando as variações denominativa e conceitual.

Em segundo lugar, com todo o desenvolvimento dos estudos do léxico, com suas inflexões e desdobramentos, talvez tenha chegado o momento de compatibilizá-los, homologá-los, avaliá-los5 5 Retomamos aqui as palavras de Greimas e Courtés (2008, p. 11) contidas no prólogo do Dicionário de Semiótica, justificando a obra: “É sabido que o projeto semiótico ensejou, nos últimos anos, desdobramentos diversos, orientados, parece, em todas as direções; talvez tenha chegado o momento de compatibilizá-los, homologá-los, avaliá-los”. . Ainda que o dicionário seja julgado pelo que contém e pelo que ignora, ainda que, como afirma Fiorin (2008Fiorin, J. L. (2008). Prefácio. In A. J. Greimas, & J. Courtés. Dicionário de semiótica (pp. 7-10). Contexto. , p. 9), reverbere “seu direito e seu avesso: o que afirma e o que recusa”, o dicionário pode representar uma “introspecção”, uma meta-análise (ou metanálise6 6 Metanálise: “met(a)-” (além) + “análise”. Como em “metátese”: “meta” (além, depois) + “tese” (posição, colocação) = deslocamento de segmento na palavra (do.brar > dro.bar) ) dos estudos do léxico.

Por fim, como terceira justificativa, porque ainda não há - ou pelo menos o desconhecemos - um empreendimento que sistematize a terminologia das Ciências do Léxico, com suas subáreas. Há dicionários que focam parte dessa ciência, como Martínez de Souza (1995Martínez de Souza, J. (1995). Diccionario de lexicografía práctica. Biblograf.), Hartmann e James (2001Hartmann, R. R. K., & James, G. (2001). Dictionary of Lexicography. Routledge.) e a proposta de Costa (2015Costa, L. A. C. (2015). Reflexões sobre a variação terminológica na lexicografia corrente no Brasil e a construção das bases teórico-metodológicas para o dicionário de lexicografia brasileira. [Tese de doutorado] Universidade Estadual Paulista. https://repositorio.unesp.br/handle/11449/127683 (acesso 09 de novembro, 2021).
https://repositorio.unesp.br/handle/1144...
), todos contemplando essencialmente a Lexicografia. O protótipo aqui apresentado é inovador não só na abrangência (abarca várias disciplinas dos estudos do léxico), mas no desenho, de caráter multifacetado: terminográfico; vieses semasiológico e onomasiológico; de frequência.

Para construção desse dicionário, adotamos os princípios da Linguística de Corpus (Berber Sardinha, 2004Berber Sardinha, T. (2004). Lingüística de Corpus. Manole.) e os postulados da Teoria Comunicativa da Terminologia (Cabré, 1999Cabré, M. T. (1999). La Terminologia: representación y comunicación. Elementos para una teoría de base comunicativa y otros artículos. Universitat Pompeu Fabra.), observando os termos no ambiente de ocorrência (textos especializados) com apoio da informática para análise de grande quantidade de material. Para coleta dos termos, constituímos um corpus textual com a produção dos 50 membros efetivos do GTLex da ANPOLL, conforme descreveremos na seção 2. Como se trata de um projeto em andamento7 7 Este artigo relata a pesquisa em andamento de estágio pós-doutoral junto ao Programa de Pós-Graduação em Letras da UFRGS (Universidade Federal do Rio Grande do Sul), contando com o apoio do CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico) por meio da bolsa de Pós-Doutorado Sênior (Processo 102106/2019-3). , a partir dos critérios adotados, chegamos a uma nomenclatura provisória de 717 termos para compor o dicionário. Apresentaremos neste artigo duas etapas desse projeto: a constituição do corpus e a seleção dos termos.

2. Constituição do corpus

Com base na LC e na Teoria Comunicativa da Terminologia (Cabré, 1999Cabré, M. T. (1999). La Terminologia: representación y comunicación. Elementos para una teoría de base comunicativa y otros artículos. Universitat Pompeu Fabra.), a constituição do corpus seguiu alguns princípios: os textos especializados são o ambiente natural de ocorrência dos termos; a variação de gêneros textuais é fundamental para compor o corpus, que deve ser autêntico, representativo, em formato eletrônico e sistematizado.

Para contemplar esses princípios, sobretudo a representatividade, decidimos tomar textos de pesquisadores reconhecidos da área, compilando o corpus com a produção publicada entre os anos de 2000 e 2018, disponível on-line, dos 50 membros efetivos do GTLEX da ANPOLL. Com isso, tomamos textos de diversos gêneros (artigos, livros, teses e dissertações) para verificar a ocorrência de termos em diferentes contextos, de autores mais representativos da área, formando uma amostra significativa de corpus.

O GTLEX (Grupo de Trabalho de Lexicologia, Lexicografia e Terminologia) foi iniciado em 1986 sob coordenação da Profa. Maria Aparecida Barbosa. Sua composição sofreu alterações ao longo de nossa pesquisa. Alguns membros foram substituídos. Mas a maioria permaneceu. Por isso, adotamos o critério de não incluir os novos nomes, considerando apenas aqueles que eram efetivos quando do início da pesquisa8 8 Para conferir a relação atualizada de membros, consultar página do GTLEX: http://anpoll.org.br/gt/lexicologia-lexicografia-e-terminologia/ .

Após a definição dos autores, o próximo passo foi pesquisar a sua produção. Para isso, foram consultados os currículos de cada membro do GTLEX na Plataforma Lattes do CNPq9 9 Disponível em: http://lattes.cnpq.br/ , identificando os títulos dos trabalhos publicados entre 2000 e 2018, contemplando artigos, teses, dissertações e livros. Com a relação dos títulos, foi feito o download das publicações disponíveis na internet. Após a busca, os arquivos (em .pdf) foram convertidos à extensão .txt10 10 A extensão .txt é uma forma universal dos textos de computadores, pois qualquer software pode processar esses arquivos. Para análise de corpus, os arquivos são convertidos em txt. , formato digital de texto sem formatação (sem página nem imagens) para ser processado por software. As ações de busca e de conversão contaram com o apoio de dois bolsistas de iniciação científica11 11 Rafael de Mattos Medeiros e João Antonio Scaleão Britto (bolsistas da Fundação Araucária). , sob nossa orientação, do curso de Sistemas de Informação, do Centro de Ciências Tecnológicas, campus Luiz Meneghel em Bandeirantes-PR, da Universidade Estadual do Norte do Paraná.

Ao final, o corpus, com 165.554 types e 7.071.737 tokens12 12 Enquanto tokens se referem ao número total de palavras num corpus, types se referem às palavras diferentes. , ficou constituído de um total de 580 arquivos: 526 artigos, 27 livros, 19 teses, 5 dissertações e 3 dossiês de periódicos, conforme podemos observar na Tabela 1.

Tabela 1
Composição geral do corpus

É um corpus médio-grande, considerando a proposta de classificação de Berber Sardinha (2002Berber Sardinha, T. (2002). Tamanho de corpus. The Especialist, 23(2), 103-122., p. 119) em relação ao tamanho de corpus13 13 A classificação é baseada nos corpora usados nos trabalhos apresentados nas conferências mais importantes de Linguística de Corpus entre os anos de 1995 e 1998. : (i) pequeno: menos de 80 mil palavras; (ii) pequeno-médio: de 80 a 250 mil; (iii) médio: de 250 mil a 1 milhão; (iv) médio-grande: 1 a 10 milhões; (v) grande: 10 milhões ou mais.

3. Seleção dos termos

Com o corpus de estudo constituído, partimos para a seleção dos termos e a análise dos dados coletados. Para isso, adotamos dois critérios gerais: quantitativo e qualitativo. Valendo-se de instrumentos computacionais, nosso ponto de partida para selecionar os termos foi realizar um levantamento estatístico das ocorrências no corpus por meio do software AntConc (versão 3.5.8, 201914 14 Disponível em: https://www.laurenceanthony.net/software/antconc/ ).

O primeiro desafio foi definir valor de corte. Não há na literatura valores definidos para processamento, pois os critérios, sejam quantitativos, sejam qualitativos, dependem de vários fatores, como tipo de dicionário (geral ou especializado), público-alvo e função da obra. Para um vocabulário básico do português, Biderman (1996Biderman, M. T. C. (1996). Léxico e Vocabulário Fundamental. Alfa, 40, 27-46. https://periodicos.fclar.unesp.br/alfa/article/view/3994 (acesso 09 de novembro, 2021).
https://periodicos.fclar.unesp.br/alfa/a...
, p. 39) estabeleceu frequência 40 às unidades. Kasama (2009Kasama, D. Y. (2009). Estruturação do conhecimento e relações semânticas: uma ontologia para o domínio da nanociência e nanotecnologia. [Dissertação de mestrado]. Universidade Estadual Paulista. https://repositorio.unesp.br/handle/11449/86567.
https://repositorio.unesp.br/handle/1144...
, p. 61-62) propôs os seguintes critérios para valor de corte: (i) para corpus com mais de cem mil ocorrências, exclusão de dezenas, centenas, milhares e dezenas de milhares, sendo o número restante o valor de corte (exemplo: para um corpus com 1.846.763 ocorrências, o valor mínimo de frequência é 18); (ii) para corpus com menos de cem mil ocorrências, o autor considera até mesmo os hapax legomena como valor de ocorrência aceitável para candidatos a termo. Segundo Maciel (2001Maciel, A. M. B. (2001). Para o reconhecimento da especificidade do termo jurídico. [Dissertação de mestrado]. Universidade Federal do Rio Grande do Sul. https://www.lume.ufrgs.br/handle/10183/1649.
https://www.lume.ufrgs.br/handle/10183/1...
, p. 163), o critério de frequência é importante para a Lexicografia; já à Terminografia, o critério da funcionalidade se sobrepõe à estatística numérica.

Para seleção inicial dos termos em nosso corpus, estabelecemos frequência 10 (número de ocorrências) e range 5 (quantidade de textos), com extensão de n-grama máxima de 6 palavras. O n-grama (palavra ou sequência de palavras extraída de corpus) pode ter diversas extensões: n-grama de 1 item é denominado unigrama; de 2, bigrama; de 3, trigrama; de 4, tetragrama; de 5, pentagrama; de 6, hexagrama, etc. Esses valores geraram uma lista de 198.110 n-gramas para análise de possíveis candidatos a termo.

A partir dessa lista de n-gramas (unigramas a hexagramas), excluímos verbos, adjetivos e n-gramas sem valor terminológico (“a sustentabilidade do”, “considerada como uma”, “emergência de”, “ligações entre os”, “as relações que se estabelecem”). Dessa seleção, chegamos a uma lista provisória de cerca de 3.000 termos candidatos.

Embora as ferramentas estatísticas permitam um resultado mais real e objetivo, não é uma solução pronta. Como ressaltam Finatto et al. (2014Finatto, M. J. B. (2014). Vocabulário controlado e redação de definições em dicionários de português para estrangeiros: ensaios para uma léxico-estatística textual. Revista Trama, 10 (20), 53-68. https://doi.org/10.48075/rt.v10i20.10345.
https://doi.org/10.48075/rt.v10i20.10345...
, p. 55), o enfoque quantitativo serve como um auxílio para embasar a análise, não como um fim em si mesmo ou como uma medida absoluta que cerceie escolhas. Por isso, cumprida a etapa quantitativa, partimos para a análise dos dados.

Essa é uma etapa que exige reconhecer uma terminologia, selecionando unidades terminológicas, o que não é uma tarefa simples. O principal fator que dificulta esse reconhecimento é a ausência de diferenças formais entre as unidades da linguagem comum e a especializada. O que distingue termo (unidade da língua de especialidade) e palavra (unidade da língua comum) não é o aspecto formal ou morfológico, mas o valor especializado que o termo adquire no seu contexto de uso. A unidade rede pode ser um termo da tecelagem (peça de tecido para dormir), da Comunicação (grupo de emissoras), dos esportes (armação na quadra de tênis, nas traves do gol), da informática (internet ou interação de computadores), da Biologia (entrelaçamento de estruturas anatômicas). Além disso, há outros fatores envolvidos, como fundamentação teórica adotada, definição do público-alvo e função da obra.

Por conta isso, é necessário estabelecer critérios qualitativos que orientem o reconhecimento de termos para a construção de uma terminologia. Neste trabalho, adotamos três critérios para seleção e análise, os quais explicaremos na sequência:

  1. estar presente nos textos especializados;

  2. pertencer à categoria gramatical dos substantivos (mono ou polilexicais);

  3. ser representativo na área.

O primeiro desses critérios é o que norteia as novas teorias terminológicas, influenciadas pela Linguística. Se o princípio da observação in vitro dos termos é substituído pela observação in vivo, os termos devem ser observados no seu ambiente natural de ocorrência, ou seja, nos textos especializados. Isso significa que o primeiro requisito a um termo é estar presente nos textos da área como unidade de valor terminológico.

Com base no segundo critério, selecionamos apenas unidades pertencentes à categoria gramatical dos substantivos, seja na forma simples (minidicionário, onomasiologia, etc.), seja na forma sintagmática (intervalo lemático, lexicografia discursiva, etc.), pois a categoria substantiva exerce a função de nomear os conceitos de um campo especializado. Assim, diante de formas que apresentam as funções de substantivo e de adjetivo, registramos apenas o emprego de substantivo. O termo “equivalente”, por exemplo, pode exercer a função de adjetivo (formas equivalentes) e de substantivo (quais os equivalentes em inglês e em espanhol?). A única exceção a essa regra foi a inclusão da locução adverbial sub voce, usada na forma abreviada “s.v.” para indicar num dicionário, vocabulário ou glossário a entrada da qual se fala, como, por exemplo: segundo o dicionário Michaelis (1998, s.v. botânica).

O terceiro critério para escolha dos termos é a representatividade, um conceito que exige a expertise de um perito da área para avaliar a especificidade e a importância das unidades caracterizadoras de uma ciência. Os termos discurso, categorização, dêitico, fonema, semiologia, por exemplo, são fundamentais e muito recorrentes nas ciências da linguagem, mas não caracterizam o estudo do léxico. Por outro lado, anglicismo, antropônimo, colocação especializada, competência lexical, dicionário, empréstimo lexical, expressão idiomática, glossário, hiperônimo, lexicalização, linguagem especializada, microestrutura, onomástica, parêmia, vocabulário, unidade fraseológica, para citar alguns, constroem nessa cadeia uma isotopia temática15 15 O conceito semiótico de isotopia (termo originalmente físico-químico) se refere à recorrência ou à redundância de traços semânticos numa sequência (ao menos duas unidades). dos estudos do léxico. Ser representativo é poder representar uma área. De acordo com Maciel (2001Maciel, A. M. B. (2001). Para o reconhecimento da especificidade do termo jurídico. [Dissertação de mestrado]. Universidade Federal do Rio Grande do Sul. https://www.lume.ufrgs.br/handle/10183/1649.
https://www.lume.ufrgs.br/handle/10183/1...
, p. 88), a representatividade se traduz no entrelaçamento de aspectos temáticos e pragmáticos do termo, permitindo-lhe especificar pelo significado e pela funcionalidade uma área do conhecimento.

Na proposta do dicionário, concebemos as Ciências do Léxico como um campo transdisciplinar. Na multidisciplinaridade (multi- “numeroso, grande quantidade”: multiforme, multiplano), há colaboração de várias disciplinas para estudo de um fenômeno, sem que cada uma delas seja modificada ou enriquecida. Assim, cada disciplina elabora uma resposta ao problema. Na interdisciplinaridade (inter- “no interior de, entre”: internacional, intercâmbio), ocorre a mesma colaboração de várias disciplinas para estudo de um fenômeno, mas numa relação direta entre elas. Com isso, todas elaboram uma única resposta para o mesmo problema. Na transdisciplinaridade (trans- “além de, para lá, mudança”: transportar, transatlântico, transformar), por seu turno, pensamos num conhecimento amplo e profundo para estudo de um fenômeno, sem delineamento de fronteiras entre as disciplinas mobilizadas. A Figura 1 ilustra tais processos.

Figura 1
Ilustração dos processos multi, inter e transdisciplinares

Com base nessa concepção transdisciplinar de ciência, definimos as Ciências do Léxico como uma totalidade inclusiva constituída de outras totalidades (Neologia, Onomástica, Fraseologia, Fraseografia, Terminologia, Terminografia e Lexicografia). Portanto, um complexo constituído de complexos.

Consequentemente, para debruçar-se sobre a complexidade do léxico, as Ciências do Léxico convocam fundamentos de outras áreas, apropriando-se de termos da Publicidade (slogan), da Antropologia (culturema, estereótipo, ditado, provérbio), da Onomatologia (hidronímia, hodonímia), da Geografia (acidente geográfico, mesorregião, microrregião, topônimo), da Morfologia (afixo, categoria gramatical, composição, morfema, radical), da Semântica (ambiguidade, antonímia, campo semântico, conotação, frame, hiperonímia, monossemia, semasiologia), da Estilística (antonomásia, arcaísmo, metáfora, metonímia), da Sociolinguística (atlas linguístico, bilinguismo, dialeto, gíria, regionalismo, socioleto, variação), da Informática (banco de dados, base de dados, software), da Linguística de Corpus (chavicidade, cluster, concord, frequência, gerador de n-gramas, linha de concordância, wordlist), etc. Embora pertencentes originalmente a outros domínios, selecionamos esses termos, entre outros, porque foram incorporados ao estudo do léxico, tornando-se usuais e representativos na área.

Além desses critérios, consideramos também na seleção o público-alvo (estudantes de Letras) e a função da obra, pensada como instrumento introdutório e didático ao estudo do léxico. Pensando nisso, selecionamos unidades que a priori não seriam contempladas num dicionário terminológico:

  1. nome de ferramentas computacionais, por serem muito usadas no tratamento de corpus (concord, gerador de n-gramas, keyword, wordlist);

  2. teorias terminológicas (Socioterminologia, Teoria Comunicativa da Terminologia, Teoria Geral da Terminologia, Teoria Sociocognitiva da Terminologia);

  3. categorias toponímicas propostas pela Profa. Maria Vicentina de Paula do Amaral Dick (USP), com 27 taxes de naturezas física e antropocultural (astrotopônimo, cronotopônimo, historiotopônimo, etc.);

  4. três entradas flexionadas em número (corpora, subcorpora, thesauri), além das formas no singular (corpus, subcorpus, thesaurus).

Para ajudar no esclarecimento de alguns termos, fizemos uso ainda de quatro figuras inseridas nos verbetes cluster, linha de concordância, mapa conceitual e wordlist. Pensando também no público-alvo, julgamos necessária a inclusão de alguns termos que não atingiram os valores de corte (frequência 10/ range 5; vide Tabela 2), mas que são pertinentes para a compreensão mais ampla da área.

Tabela 2
Termos acrescentados à terminologia

Após a análise das listas, com consultas aos textos, leitura de concordâncias, exclusões e inclusões de termos, análise de acepções, chegamos a uma nomenclatura provisória de 717 termos16 16 A título de curiosidade, seguem alguns números de dicionários terminológicos no âmbito da Linguística: Dictionary of Lexicography (Hartmann & James, 2001), com 1993 verbetes; Dicionário de Linguística (Dubois et al, 2007), 1911; Dicionário de ciências da linguagem (Neveu, 2008), 986; Dicionário de linguística e gramática (Câmara Júnior, 1996), 786; Dicionário de Fonética e Fonologia (Silva, 2017), 728; Dicionário de gêneros textuais (Costa, 2014), 647; Dicionário de Semiótica (Greimas & Courtés, 2008), 645; Dicionário crítico de Sociolinguística (Bagno, 2017), 426; Dicionário de linguística da enunciação (Flores et al., 2009), cerca de 400; Dicionário de linguagem e linguística (Trask, 2015), 299. para compor o Dicionário das Ciências do Léxico. O Quadro 1 traz a lista dos termos selecionados.

Quadro 1
Nomenclatura provisória do Dicionário das Ciências do Léxico

No que diz respeito à estrutura morfológica dos termos selecionados, houve um predomínio de formas polilexicais (421 termos complexos), com 58,7%, contra 41,3% de formas monolexicais (296 termos simples17 17 Consideramos termos simples as seguintes estruturas: substantivo simples (anglicismo), estrangeirismo simples (cluster), substantivo composto (palavra-ônibus) e abreviatura (s.v.). ). A estrutura mais numerosa, com 324 termos (45,2%), é formada de substantivo + adjetivo (definição sinonímica, prática lexicográfica). As formas mais comuns foram:

  1. substantivo + adjetivo (ex.: definição sinonímica): 324 termos (45,2%);

  2. substantivo simples (ex.: anglicismo): 268 termos (37,4%);

  3. substantivo + preposição + substantivo (ex.: marca de uso): 48 termos (6,7%).

Essa presença de termos complexos confirma a tendência da formação sintagmática nas terminologias por conta da especificação cada vez maior do conhecimento. Com a evolução e o dinamismo da sociedade, os termos necessitam de complementos nominativos para atender a essas especificidades, daí a razão pela qual a formação sintagmática está mais e mais presente.

4. Considerações finais

Embora a Linguística de Corpus não seja exclusiva das Ciências do Léxico, mas empregada por várias correntes linguísticas para vários objetivos (ensino de línguas, construções pronominais, formações sufixais e prefixais, tradução, metáforas, construções sintáticas e topicalização, uso de verbos, uso de gerúndios, etc.), a Lexicografia e a Terminografia são áreas que grandemente se beneficiam dela, aprimorando, por meio do avanço tecnológico proporcionado pela informática, a produção de dicionários.

Seguindo essa tendência, a proposta aqui apresentada de construir um Dicionário das Ciências do Léxico, por se tratar de um projeto em andamento, se restringiu a apresentar duas etapas desse trabalho: a constituição do corpus e a seleção dos termos. Com isso, numa construção baseada em critérios quantitativos e qualitativos, selecionamos provisoriamente 717 termos para compor nosso dicionário.

A partir da análise dos termos, também foi possível identificar as estruturas constitutivas mais frequentes, o que também auxilia a caracterizar a terminologia da área. Com predomínio de formas polilexicais (421 termos complexos), com 58,7%, sendo a estrutura mais numerosa, com 324 termos (45,2%), formada de substantivo + adjetivo (prática lexicográfica), ratifica-se a tendência da formação sintagmática nas terminologias para atender à especificação cada vez maior do conhecimento.

O resultado a que chegamos até o presente momento, é, pois, um ponto de vista provisório da terminologia empregada nos estudos do léxico. Esperamos, ao final da pesquisa, poder apresentar o conjunto final de termos selecionados. Igualmente, esperamos poder apresentar, em trabalhos futuros, as fichas de registro desses termos, mostrando a complexidade da estrutura de remissivas para dar conta da representação das variações denominativa e conceitual, pensando sobretudo no público-alvo da obra, os estudantes de graduação e pós-graduação em Letras.

Agradecimentos

O presente trabalho foi realizado com apoio do CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico) por meio da bolsa de Pós-Doutorado Sênior (Processo 102106/2019-3), com estágio pós-doutoral realizado junto ao Programa de Pós-Graduação em Letras da UFRGS (Universidade Federal do Rio Grande do Sul.

Referências

  • Abbagnano, N. (2012). Dicionário de Filosofia. WMF Martins Fontes.
  • Bagno, M. (2017). Dicionário crítico de Sociolinguística. Parábola Editorial.
  • Barbosa, M. (2004). A terminologia e o ensino da metalinguagem técnico-científica. In A.N. Isquerdo, & M.G. Krieger (Eds.), As ciências do léxico: lexicologia, lexicografia, terminologia. (pp. 311-325). Editora UFMS.
  • Berber Sardinha, T. (2002). Tamanho de corpus. The Especialist, 23(2), 103-122.
  • Berber Sardinha, T. (2004). Lingüística de Corpus. Manole.
  • Biderman, M. T. C. (1996). Léxico e Vocabulário Fundamental. Alfa, 40, 27-46. https://periodicos.fclar.unesp.br/alfa/article/view/3994 (acesso 09 de novembro, 2021).
    » https://periodicos.fclar.unesp.br/alfa/article/view/3994
  • Cabré, M. T. (1999). La Terminologia: representación y comunicación. Elementos para una teoría de base comunicativa y otros artículos. Universitat Pompeu Fabra.
  • Câmara Júnior, J. M. (1996). Dicionário de linguística e gramática: referente à língua portuguesa. Vozes.
  • Corpas Pastor, G. Entrevista. (2017). In Alvarez, M. L. O., Fraseologia e Paremiologia: uma entrevista com Gloria Corpas Pastor. Tradução Ana Carolina Spinelli. Revisão técnica Gabriel de Ávila Othero. ReVEL, 15(29), 261-270.
  • Costa, L. A. C. (2015). Reflexões sobre a variação terminológica na lexicografia corrente no Brasil e a construção das bases teórico-metodológicas para o dicionário de lexicografia brasileira. [Tese de doutorado] Universidade Estadual Paulista. https://repositorio.unesp.br/handle/11449/127683 (acesso 09 de novembro, 2021).
    » https://repositorio.unesp.br/handle/11449/127683
  • Costa, S. R. (2014). Dicionário de gêneros textuais. Autêntica.
  • Dubois, J. (2007). Dicionário de Linguística. Tradução Frederico Pessoa de Barros. Cultrix.
  • Finatto, M. J. B. (2014). Vocabulário controlado e redação de definições em dicionários de português para estrangeiros: ensaios para uma léxico-estatística textual. Revista Trama, 10 (20), 53-68. https://doi.org/10.48075/rt.v10i20.10345
    » https://doi.org/10.48075/rt.v10i20.10345
  • Fiorin, J. L. (2008). Prefácio. In A. J. Greimas, & J. Courtés. Dicionário de semiótica (pp. 7-10). Contexto.
  • Flores, V. N (2009). Dicionário de linguística da enunciação. Contexto.
  • Greimas, A. J., & Courtés, J. (2008). Dicionário de semiótica. Tradução Alceu Dias Lima. Contexto.
  • Hartmann, R. R. K., & James, G. (2001). Dictionary of Lexicography. Routledge.
  • Isquerdo, A. N., & Krieger, M. G. (orgs.). (2004). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.
  • Isquerdo, A. N., & Alves, I. M. (orgs.). (2007). As ciências do léxico: lexicologia, lexicografia, terminologia. Editoras UFMS e Humanitas.
  • Isquerdo, A. N., & Finatto, M. J. B. (orgs.). (2010). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.
  • Isquerdo, A. N., & Barros, L. A. (orgs.). (2010). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.
  • Isquerdo, A. N., & Seabra, M. C. T. C. (orgs.). (2012). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.
  • Isquerdo, A. N., & Dal Corno, G. O. M. (orgs.). (2014). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.
  • Isquerdo, A. N., & Dal Corno, G. O. M. (orgs.). (2018). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.
  • Kasama, D. Y. (2009). Estruturação do conhecimento e relações semânticas: uma ontologia para o domínio da nanociência e nanotecnologia. [Dissertação de mestrado]. Universidade Estadual Paulista. https://repositorio.unesp.br/handle/11449/86567
    » https://repositorio.unesp.br/handle/11449/86567
  • Krieger, M. G. Entrevista. (2016). In M.G. Krieger, & A. Adelstein. Estudos do léxico em diferentes perspectivas. Calidoscópio, 14(3), 557-560. http://revistas.unisinos.br/index.php/calidoscopio/article/view/cld.2016.143.19 (acesso 09 de novembro, 2021).
    » http://revistas.unisinos.br/index.php/calidoscopio/article/view/cld.2016.143.19
  • Maciel, A. M. B. (2001). Para o reconhecimento da especificidade do termo jurídico. [Dissertação de mestrado]. Universidade Federal do Rio Grande do Sul. https://www.lume.ufrgs.br/handle/10183/1649
    » https://www.lume.ufrgs.br/handle/10183/1649
  • Maia, J. S. S. (2018). A questão da interdisciplinaridade. In Semana de Matemática. Palestra. Universidade Estadual do Norte do Paraná.
  • Martínez de Souza, J. (1995). Diccionario de lexicografía práctica. Biblograf.
  • Mejri, S. (2012). Délimitation des unités phraséologiques. In M.L.O. Alvarez (Ed.), Tendências atuais na pesquisa descritiva e aplicada em fraseologia e paremiologia (pp. 139-156). Pontes.
  • Monteiro-Plantin, R. S. (2014). Fraseologia: era uma vez um patinho feio no ensino de língua materna. Imprensa Universitária.
  • Neveu, F. (2008). Dicionário de ciências da linguagem. Tradução Albertina Cunha, & José Antônio Nunes. Vozes.
  • Oliveira, A. M. P. P., & Isquerdo, A. N. (2001). Apresentação. In A.M.P.P. Oliveira, & A.N. Isquerdo (Eds.), As ciências do léxico: lexicologia, lexicografia, terminologia (pp. 9-11). Editora UFMS.
  • Sabino, M. A. (2011). O campo árido dos fraseologismos. Revista Signótica, 23(2), 385-401. http://hdl.handle.net/11449/122304 (acesso 09 de novembro, 2021).
    » http://hdl.handle.net/11449/122304
  • Silva, T. C. (2017). Dicionário de Fonética e Fonologia. Contexto.
  • Trask, R. L. (2015). Dicionário de linguagem e linguística. Contexto.
  • 3
    A coleção já conta com oito volumes: Oliveira e Isquerdo (2001Oliveira, A. M. P. P., & Isquerdo, A. N. (2001). Apresentação. In A.M.P.P. Oliveira, & A.N. Isquerdo (Eds.), As ciências do léxico: lexicologia, lexicografia, terminologia (pp. 9-11). Editora UFMS.); Isquerdo e Krieger (2004Isquerdo, A. N., & Krieger, M. G. (orgs.). (2004). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.); Isquerdo e Alves (2007Isquerdo, A. N., & Alves, I. M. (orgs.). (2007). As ciências do léxico: lexicologia, lexicografia, terminologia. Editoras UFMS e Humanitas.); Isquerdo e Finatto (2010Isquerdo, A. N., & Finatto, M. J. B. (orgs.). (2010). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.); Isquerdo e Barros (2010Isquerdo, A. N., & Barros, L. A. (orgs.). (2010). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.); Isquerdo e Seabra (2012Isquerdo, A. N., & Seabra, M. C. T. C. (orgs.). (2012). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.); Isquerdo e Dal Corno (2014Isquerdo, A. N., & Dal Corno, G. O. M. (orgs.). (2014). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS., 2018Isquerdo, A. N., & Dal Corno, G. O. M. (orgs.). (2018). As ciências do léxico: lexicologia, lexicografia, terminologia. Editora UFMS.).
  • 4
    Trata-se de uma iniciativa que visa a sistematizar o conhecimento conforme se apresenta no cenário brasileiro, pois no exterior a designação “Ciências do Léxico” é algo contestado.
  • 5
    Retomamos aqui as palavras de Greimas e Courtés (2008Greimas, A. J., & Courtés, J. (2008). Dicionário de semiótica. Tradução Alceu Dias Lima. Contexto., p. 11) contidas no prólogo do Dicionário de Semiótica, justificando a obra: “É sabido que o projeto semiótico ensejou, nos últimos anos, desdobramentos diversos, orientados, parece, em todas as direções; talvez tenha chegado o momento de compatibilizá-los, homologá-los, avaliá-los”.
  • 6
    Metanálise: “met(a)-” (além) + “análise”. Como em “metátese”: “meta” (além, depois) + “tese” (posição, colocação) = deslocamento de segmento na palavra (do.brar > dro.bar)
  • 7
    Este artigo relata a pesquisa em andamento de estágio pós-doutoral junto ao Programa de Pós-Graduação em Letras da UFRGS (Universidade Federal do Rio Grande do Sul), contando com o apoio do CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico) por meio da bolsa de Pós-Doutorado Sênior (Processo 102106/2019-3).
  • 8
    Para conferir a relação atualizada de membros, consultar página do GTLEX: http://anpoll.org.br/gt/lexicologia-lexicografia-e-terminologia/
  • 9
    Disponível em: http://lattes.cnpq.br/
  • 10
    A extensão .txt é uma forma universal dos textos de computadores, pois qualquer software pode processar esses arquivos. Para análise de corpus, os arquivos são convertidos em txt.
  • 11
    Rafael de Mattos Medeiros e João Antonio Scaleão Britto (bolsistas da Fundação Araucária).
  • 12
    Enquanto tokens se referem ao número total de palavras num corpus, types se referem às palavras diferentes.
  • 13
    A classificação é baseada nos corpora usados nos trabalhos apresentados nas conferências mais importantes de Linguística de Corpus entre os anos de 1995 e 1998.
  • 14
  • 15
    O conceito semiótico de isotopia (termo originalmente físico-químico) se refere à recorrência ou à redundância de traços semânticos numa sequência (ao menos duas unidades).
  • 16
    A título de curiosidade, seguem alguns números de dicionários terminológicos no âmbito da Linguística: Dictionary of Lexicography (Hartmann & James, 2001Hartmann, R. R. K., & James, G. (2001). Dictionary of Lexicography. Routledge.), com 1993 verbetes; Dicionário de Linguística (Dubois et al, 2007Dubois, J. (2007). Dicionário de Linguística. Tradução Frederico Pessoa de Barros. Cultrix.), 1911; Dicionário de ciências da linguagem (Neveu, 2008Neveu, F. (2008). Dicionário de ciências da linguagem. Tradução Albertina Cunha, & José Antônio Nunes. Vozes. ), 986; Dicionário de linguística e gramática (Câmara Júnior, 1996Câmara Júnior, J. M. (1996). Dicionário de linguística e gramática: referente à língua portuguesa. Vozes.), 786; Dicionário de Fonética e Fonologia (Silva, 2017Silva, T. C. (2017). Dicionário de Fonética e Fonologia. Contexto.), 728; Dicionário de gêneros textuais (Costa, 2014Costa, S. R. (2014). Dicionário de gêneros textuais. Autêntica.), 647; Dicionário de Semiótica (Greimas & Courtés, 2008Greimas, A. J., & Courtés, J. (2008). Dicionário de semiótica. Tradução Alceu Dias Lima. Contexto.), 645; Dicionário crítico de Sociolinguística (Bagno, 2017Bagno, M. (2017). Dicionário crítico de Sociolinguística. Parábola Editorial.), 426; Dicionário de linguística da enunciação (Flores et al., 2009Flores, V. N (2009). Dicionário de linguística da enunciação. Contexto.), cerca de 400; Dicionário de linguagem e linguística (Trask, 2015Trask, R. L. (2015). Dicionário de linguagem e linguística. Contexto. ), 299.
  • 17
    Consideramos termos simples as seguintes estruturas: substantivo simples (anglicismo), estrangeirismo simples (cluster), substantivo composto (palavra-ônibus) e abreviatura (s.v.).

Datas de Publicação

  • Publicação nesta coleção
    01 Ago 2022
  • Data do Fascículo
    2022

Histórico

  • Recebido
    20 Out 2020
  • Aceito
    09 Nov 2021
Pontifícia Universidade Católica de São Paulo - PUC-SP PUC-SP - LAEL, Rua Monte Alegre 984, 4B-02, São Paulo, SP 05014-001, Brasil, Tel.: +55 11 3670-8374 - São Paulo - SP - Brazil
E-mail: delta@pucsp.br