Acessibilidade / Reportar erro

Do ‘texto como texto’ ao ‘texto como dado’: o potencial das pesquisas em Relações Internacionais

From ‘text as text’ to ‘text as data’: the research potential in International Relations

RESUMO

Introdução:

O objetivo deste artigo é apresentar o potencial da análise do ‘texto como dado’ nas pesquisas em Relações Internacionais. A partir do diagnóstico de discrepância na proporção de publicações que adotam essa abordagem de análise textual, apresentamos as principais metodologias na dimensão que vai do ‘texto como texto’ ao ‘texto como dado’ para destacar a oportunidade existente. Visando estimular a produção na área, desenvolvemos um caso prático e replicável, onde respondemos à seguinte pergunta: Diante do conflito Israel e Palestina, como representantes do Brasil, Estados Unidos, Israel e Palestina emocionalmente se expressaram em discursos proferidos nos encontros do Conselho de Segurança das Nações Unidas (CSNU)?

Materiais e Métodos:

Através de revisão estruturada da literatura, é apresentado o estado atual do campo da análise textual no âmbito das Relações Internacionais. Um caso prático é desenvolvido de forma integralmente replicável na linguagem R com a aplicação da análise de sentimentos aos 77.857 discursos proferidos no CSNU de 1995 a 2019.

Resultados:

Demonstramos o potencial da abordagem do ‘texto como dado’ para realizar análises sistemáticas de grandes acervos documentais e sua complementariedade a estudos qualitativos que tratam de obter conclusões científicas através da abordagem do ‘texto como texto’. Diante do exemplo prático, mostramos como a abordagem do ‘texto como dado’ fornece uma análise bem-informada e consistente sobre os acontecimentos reais e inflexões expressos no conteúdo dos discursos, sem a necessidade de intensa dedicação manual prévia.

Discussão:

O estado atual das pesquisas em Relações Internacionais apresenta evidente discrepância na produção de pesquisas com a abordagem do ‘texto como dado’ quando comparada à abordagem do ‘texto como texto’. Acreditamos que este cenário possa ser resultado da ausência de treinamento em metodologias contemporâneas e intensivas em abordagens computacionais. O artigo enfrenta esse desafio através de exercício teórico e metodológico totalmente replicável.

Palavras-chave
texto como dado; texto como texto; análise de conteúdo; CSNU; análise de sentimentos

ABSTRACT

Introduction:

The purpose of this article is to present the potential of ‘text as data’ analysis in research in International Relations. From the discrepancy in the proportion of publications that adopt this textual analysis approach, we presented the leading methodologies in the dimension ranging from ‘text as text’ to ‘text as data’ to highlight the existing opportunity. Aiming to stimulate production in the area, we developed a practical and replicable case, where we answered the following question: In the face of the Israel and Palestine conflict, how do the representatives of Brazil, United States, Israel and Palestine emotionally express themselves through their speeches at the Security Council meetings United Nations (UNSC)?

Materials and Methods:

Through a structured literature review, we presented the current state of the field of textual analysis in the scope of International Relations. A practical case was developed in a fully replicable way in the R language applying the sentiment analysis to the 77,857 given speeches at the UNSC from 1995 to 2019.

Results:

We demonstrated the potential of ‘text as data’ to carry out systematic analyses of large document collections and their complementarity to qualitative studies that try to obtain scientific conclusions through the ‘text as text’ approach. With the practical example, we show how the ‘text as data’ approach provides a well-informed and consistent analysis of actual events and inflections expressed in the content of speeches without the need for intense prior manual dedication.

Discussion:

The current state of the research in International Relations shows an evident discrepancy in the production of research with the ‘text as data’ approach compared to the ‘text as text’ approach. This scenario may result from the absence of training in contemporary methodologies and the lack of intensive computational approaches in the carried-out research. The article faces this challenge through a replicable theoretical and methodological exercise.

Keywords
text as data; text as text; content analysis; UNSC; sentiment analysis

I. Introdução1 1 Agradecemos aos comentários e sugestões dos pareceristas anônimos da Revista de Sociologia e Política e ao Prof. Dr. Danilo Freire por disponibilizar template que permitiu o desenvolvimento desse artigo em Rmarkdown.

A abordagem do “texto como dado” está em expansão nas Ciências Humanas. A cada dia, novos métodos, pacotes e técnicas são desenvolvidos, tornando modelos complexos mais acessíveis e otimizados para uso em pesquisas e no desenvolvimento científico. Exemplo ilustrativo é o reconhecimento dos desenvolvedores do pacote quanteda, pela ‘significant research contribution’ ao receberem ‘The Best Statistical Software Award’ (2020) concedido pela ‘The Society for Political Methodology’. Iniciativas como o quanteda amplificam a análise automatizada de grandes bases de documentos (corpus) e estimulam a produção de material didático mundo afora.

Nesse movimento, programas de formação e treinamento em Ciências Sociais Computacionais, Ciência de Dados e, inclusive, Relações Internacionais Computacionais emergem em todo globo. Mesmo com suas peculiaridades, todos eles trazem consigo a marca do “texto como dado” e da análise automatizada de conteúdo em sua grade curricular. Contudo, apesar de todo esse movimento e do registro da importância da área no Brasil (Izumi & Moreira, 2018Izumi, M.Y. & Moreira, D.C. (2018) O texto como dado: desafios e oportunidades para as ciências sociais. Revista Brasileira De Informação Bibliográfica Em Ciências Sociais, 2(86), pp. 138-174.) e internacionalmente (Monroe & Schrodt, 2008aMonroe, B.L. & Schrodt, P.A. (2008a) Introduction to the special issue: the statistical analysis of political text. Political Analysis, 16(4), pp. 351-355. DOI:doi
doi...
; Grimmer & Stewart, 2013Grimmer, J. & Stewart, B.M. (2013) Text as data: the promise and pitfalls of automatic content analysis methods for political texts. Political Analysis, 21(3), pp. 267/297. DOI:doi
doi...
; Roberts, 2016Roberts, M.E. (2016) Introduction to the virtual issue: recent innovations in text analysis for social science. Disponível em: http://oxfordjournals.org/our_journals/polana/text-as-data.pdf Acesso em: 15 de set. 2021.
http://oxfordjournals.org/our_journals/p...
), ainda há um longo caminho para a consolidação do campo no país e, em especial, nas pesquisas em Relações Internacionais (RI) que são nacionalmente desenvolvidas. É esse o desafio que este artigo busca enfrentar.

Este artigo possui caráter essencialmente metodológico e tem como objetivo principal apresentar de forma agnóstica (Grimmer et al., 2021Grimmer, J., Roberts, M.E. & Stewart, B.M. (2021) Machine learning for social science: an agnostic approach. Annual Review of Political Science, 24(1), pp. 395-419. DOI:doi
doi...
) o potencial da análise do “texto como dado” no campo das Relações Internacionais, estimulando, assim, o uso dessa abordagem na agenda de pesquisas do país. Para tanto, na seção II apresentamos o estado atual da arte e as metodologias disponíveis ao comparar a abordagem do “texto como dado” com a abordagem do “texto como texto”. Na seção III, com foco especial nas pesquisas em Relações Internacionais, apresentamos uma discussão sobre a abordagem do “texto como dado” no contexto dos debates metodológicos em RI e uma breve revisão da literatura nacional em Relações Internacionais que utiliza a abordagem do “texto como dado”. Em seguida, na seção IV, iniciamos a apresentação de um exemplo prático para demonstrar a aplicação da abordagem do “texto como dado”, integralmente replicável para fins pedagógicos. Neste exemplo, aplicamos a análise de sentimentos aos 77.857 discursos proferidos no Conselho de Segurança das Nações Unidas de 1995 a 2019. Na seção V, voltamos nosso olhar para um caso específico, que busca responder à seguinte pergunta: Como o Brasil, Estados Unidos, Israel e Palestina se comportaram emocionalmente em seus discursos nos encontros do Conselho de Segurança das Nações Unidas (CSNU) que trataram do conflito Israel-Palestina? Interpretamos os resultados da análise de sentimentos à luz da literatura qualitativa sobre o conflito, observando que os períodos com mais sentimentos negativos coincidem com importantes momentos históricos, no caso, a Segunda Intifada, a partir dos anos 2000, e a Primavera Árabe, a partir de 2011. Por fim, na seção VI, apresentamos algumas considerações sobre o avanço desse campo na agenda de pesquisas do país.

II. Do ‘texto como texto’ ao ‘texto como dado’

As Ciências Humanas têm longa tradição na análise do “texto como texto” e do “texto como dado”. Mais recentemente, porém, com a queda no custo de registro e armazenamento de textos em larga escala já em formato digital, a abordagem do “texto como dado” se tornou mais presente nas pesquisas e a diferença entre as duas abordagens se torna cada vez mais evidente. De um lado, pesquisadores acessam criticamente o conteúdo armazenado para descobrir os padrões e conexões de conhecimento e poder nas estruturas sociais reproduzidos nos textos (Foucault, 1996Foucault, M. (1996) A ordem do discurso - Aula inaugural no Collège de France, pronunciada em 2 de dezembro de 1970. São Paulo: Edições Loyola.; Dijk, 1997Dijk, T.A. van (1997) What is political discourse analysis? Belgian Journal of Linguistics, 11(1). pp. 11-52. DOI:doi
doi...
). De outro, estudiosos buscaram produzir conhecimento sobre os produtores de texto a partir da codificação de seu conteúdo, pois é no vácuo entre ação e comunicação que reside a política (Krippendorff, 2012Krippendorff, K.H. (2012) Content analysis: an introduction to its methodology. Los Angeles: Sage Publications, Inc.; Moreira, 2020Moreira, D. (2020) Com a palavra os nobres deputados: ênfase temática dos discursos dos parlamentares brasileiros. Dados, 63(1), pp. 1-37. DOI:doi
doi...
).

Ao refletir a comunicação humana, o texto é “o mais difundido - e certamente o mais persistente - artefato do comportamento político” (Monroe & Schrodt, 2008bMonroe, B.L. & Schrodt, P.A. (2008b) Introduction to the special issue: the statistical analysis of political text. Political Analysis, 16(4), pp. 351-355. Disponível em: https://econpapers.repec.org/article/cuppolals/v_3a16_3ay_3a2008_3ai_3a04_3ap_3a351-355_5f00.htm Acesso em: 15 de set. 2021.
https://econpapers.repec.org/article/cup...
, p. 351). Por esse aspecto, todo texto pode ser concebido como uma forma de dado. Contudo, diferente dos dados encontrados no âmbito da economia (PIB, inflação, preços etc.), por exemplo, que resultam do registro de medidas padronizadas a partir de uma abstração que visa garantir algum sentido às atividades humanas, o texto em si não demanda esse exercício de mensuração para seu registro. Através da linguagem, o texto bruto reflete diretamente a comunicação nele embutida. Logo, o texto não requer um primeiro processamento ou abstração para ser analisado. Diante desta importante distinção entre o texto e outros tipos de dados brutos, é necessário apresentar qual é, portanto, a diferença entre o “texto como dado” e o “texto como texto” (Benoit, 2020Benoit, K. (2020) Text as data: an overview. In: L. Curini & R. Franzese (orgs) The SAGE handbook of research methods in political science and international relations. Thousand Oaks: SAGE Publishing Ltd, pp. 461-497.).

Seguindo a mesma proposta de Benoit (2020)Benoit, K. (2020) Text as data: an overview. In: L. Curini & R. Franzese (orgs) The SAGE handbook of research methods in political science and international relations. Thousand Oaks: SAGE Publishing Ltd, pp. 461-497., vamos apresentar as abordagens de “texto como texto” e “texto como dado” ao longo de um mesmo continuum, uma mesma dimensão. Nessa dimensão temos distribuídas as diferentes metodologias que hoje podem ser empregadas. O Gráfico 1 irá nos guiar na definição do que é a abordagem do “texto como dado” em contraposição à abordagem do “texto como texto”.

Gráfico 1
Do ‘Texto como Texto’ ao ‘Texto como Dado’: principais abordagens

No extremo esquerdo do Gráfico 1, localizam-se os métodos de análise direta do conteúdo expresso. Métodos que obtêm informação direta do conteúdo através da linguagem sem a necessidade de extração sistemática de elementos do texto, sendo seu estado inicial suficiente para análise. Temos, portanto, os métodos de análise do “texto como texto”, que focam no que um texto significa e em um conteúdo a ser avaliado diretamente. A seguir, destacamos alguns desses métodos.

II.1. Análise literária

É no extremo esquerdo do Gráfico 1 que se encontram análises interpretativas, a análise da retórica política e a tão reconhecida análise crítica do discurso. No campo da análise de discurso, o conteúdo do texto é diretamente acessado pelo analista para avaliar como símbolos e valores são expressos para explicar a dinâmica de poder (Dijk, 1994Dijk, T.A. van (1994). Critical discourse analysis. Discourse & Society, 5(4), pp. 435-436. DOI:doi
doi...
). Logo, a partir de uma interpretação direta do conteúdo emitido, a análise de discurso é capaz de descrever como se configura a presença de símbolos e signos de valor social embutidos na comunicação. Assim, não há necessariamente um instrumento metodológico entre o dado bruto e o pesquisador. Como destaca Benoit (2020)Benoit, K. (2020) Text as data: an overview. In: L. Curini & R. Franzese (orgs) The SAGE handbook of research methods in political science and international relations. Thousand Oaks: SAGE Publishing Ltd, pp. 461-497., a análise do “texto como texto” é quase sempre qualitativa, pois o texto bruto é inerentemente qualitativo.

Apesar do texto em si diretamente transmitir informação que pode ser interpretada para fins de pesquisa, frequentemente estamos mais interessados no que o conteúdo revela sobre uma propriedade latente, por vezes, uma propriedade do criador do conteúdo expresso. Em Relações Internacionais, podemos, por exemplo, estar interessados em sentimentos, preferências políticas ou ideologia (Schonhardt-Bailey, 2003Schonhardt-Bailey, C. (2003) Ideology, Party and Interests in the British Parliament of 1841-1847. British Journal of Political Science, 33(4), pp. 581-605. DOI:doi
doi...
; Benoit et al., 2005Benoit, K., Laver, M., Arnold, C., Pennings, P. & Hosli, M.O. (2005) Measuring national delegate positions at the convention on the future of Europe using computerized word scoring. European Union Politics, 6(3), pp. 291-313. DOI:doi
doi...
; Laver et al., 2003Laver, M., Benoit, K. & Garry, J. (2003) Extracting policy positions from political texts using words as data. American Political Science Review, 97(2), pp. 311-331. DOI:doi
doi...
). Assim, os dados textuais podem conter informações sobre orientações e crenças que formas não-verbais de comportamento não permitem mensurar.

Por exemplo, Mesquita & Medeiros (2016)Mesquita, R. & Medeiros, M.A. (2016) Legitimising emerging power diplomacy: an analysis of government and media discourses on Brazilian foreign policy under Lula. Contexto Internacional, 38(1), pp. 385-432. DOI:doi
doi...
utilizam análise de discurso francesa para observar se a política externa brasileira sob o governo Luis Inácio Lula da Silva (2003-2010) conseguiu legitimar a identidade internacional do país enquanto poder em ascensão aos olhos da mídia doméstica e internacional. Os autores analisaram um corpus de 36 pronunciamentos oficiais do Presidente da República e do Ministro das Relações Exteriores e 137 artigos de mídia, com foco em dois casos diplomáticos: a liderança da MINUSTAH (2004) e o Acordo Nuclear assinado com Irã e Turquia (2010). Tendo em vista o objetivo dos autores, o foco está em explorar os múltiplos sentidos que a noção de “identidade internacional” pode assumir e quais as características que a definem, a partir de discursos em política externa e de colunas e notícias da mídia. Este tipo de tarefa envolve investigar um texto a partir da heterogeneidade e da polissemia da linguagem, ou seja, da capacidade das palavras adquirirem sentidos diferentes de acordo com o contexto, o que demanda maior interpretação direta e, por isso, suscita a aplicação da análise de discurso.

Conforme as análises se deslocam de um polo a outro, elas deixam de depender apenas do texto bruto e da interpretação direta e passam a incorporar outros elementos. É justamente quando são empregadas técnicas que visam sistematicamente a obtenção de características latentes, aquelas que não estão diretamente expressas no texto, que migramos da abordagem do “texto como texto” para a abordagem do “texto como dado”. Ainda que sutil, trata-se da obtenção de resultados a partir da interpretação direta do texto versus uma análise de características extraídas de seu conteúdo através de procedimento que não envolve interpretação direta (Benoit, 2020Benoit, K. (2020) Text as data: an overview. In: L. Curini & R. Franzese (orgs) The SAGE handbook of research methods in political science and international relations. Thousand Oaks: SAGE Publishing Ltd, pp. 461-497.).

A essência do “texto como dado”, portanto, consiste na reestruturação de seu conteúdo. Ao implementar um processo de transformação em sua estrutura, adaptamos o conteúdo expresso às ferramentas de análise de dados. Assim, os dados textuais passam para o mesmo domínio de dados quantitativos amplamente conhecidos, habilitando o uso de técnicas estatísticas, a comparação de distribuições, modelos de escala e medição, técnicas de redução dimensional, análise multivariada, inferência, modelos preditivos, métodos computacionais e aprendizado de máquina.

Diante do fato de que o texto em seu estado bruto já permite conclusões através de sua leitura direta, transformá-lo em dado implica a perda de qualidade e nuances que somente o cérebro humano é atualmente capaz de interpretar. Como destaca Benoit (2020Benoit, K. (2020) Text as data: an overview. In: L. Curini & R. Franzese (orgs) The SAGE handbook of research methods in political science and international relations. Thousand Oaks: SAGE Publishing Ltd, pp. 461-497., p. 465), “não podemos ignorar a violência semântica à nossa matéria-prima e suas consequências de processar nosso texto bruto em dados textuais”. Contudo, transformar o texto em dado permite um ganho de escala que as atividades de processamento e análise manuais não são capazes de fornecer. Remodelar a estrutura do texto para a obtenção de dados nos permite acessar conclusões com estimativas de confiança precisas, inferências sistemáticas e em larga escala. Cabe, portanto, destacar que, enquanto o objetivo da análise do “texto como texto” é a interpretação do conteúdo comunicado, a análise do “texto como dado” possui outro objetivo, qual seja, a busca sistemática por padrões presentes num acervo de volume de tamanha dimensão que inviabiliza a dedicação manual.

II.2. Análise qualitativa de texto

Tratar o “texto como dado” não significa a adoção exclusiva de abordagens quantitativas. A necessária reformulação na estrutura bruta do conteúdo para sua análise sistemática pode ser alocada na dimensão do Gráfico 1 como um continuum que conecta métodos integralmente qualitativos a abordagens majoritariamente quantitativas e automatizadas. A análise de conteúdo clássica, por exemplo, requer leitura e compreensão do texto para extrair características e informações latentes presentes no conteúdo. Ela se diferencia da análise de discurso, por exemplo, por não ter como objetivo final a interpretação direta do conteúdo expresso, mas sim por buscar a extração de características sistemáticas do conteúdo observado. Na análise de conteúdo clássica, a extração de características do texto é feita manualmente por codificadores sem, necessariamente, depender de análise estatística prévia. Exemplos de projetos com essa característica são o Manifesto Project (Budge et al., 1987Budge, I., Robertson, D. & Hearl, D. (1987) Ideology, strategy and party change: spatial analyses of post-war election programmes in 19 democracies. Cambridge: Cambridge University Press. DOI:doi
doi...
; Budge et al., 2001Budge, I., Klingemann, H. & Volkens, A. (2001) Mapping policy preferences: estimates for parties, electors, and governments 1945-1998. Oxford; New York.) e o Comparative Policy Agendas Project (Jagers & Walgrave, 2007Jagers, J. & Walgrave, S. (2007) Populism as political communication style: an empirical study of political parties’ discourse in Belgium. European Journal of Political Research, 46(3), pp. 319-45. DOI:doi
doi...
; Baumgartner et al., 2006Baumgartner, F.R., Green-Pedersen, C. & Jones B.D. (2006) Comparative studies of policy agendas. Journal of European Public Policy, 13(7), pp. 959-74. DOI:doi
doi...
).

Como exemplo, vale conferir o trabalho de Hutchesonet al. (2004)Hutcheson, J., Domke, D., Billeaudeaux, A. & Garland, P. (2004) U.S. national identity, political elites, and a patriotic press following September 11. Political Communication, 21(1), pp. 27-50. DOI:doi
doi...
, que analisou o conteúdo das revistas americanas Time e Newsweek, mais especificamente as publicações nas cinco semanas seguintes aos atentados de 11 de setembro de 2001 que tratavam de alguma forma deste acontecimento e da subsequente guerra ao terror. Duzentas e dez histórias foram codificadas manualmente quanto à fonte do pronunciamento (oficiais do governo americano, cidadãos americanos, dentre outros) e ao tipo de pronunciamento (atribuição de culpa, referência a valores americanos, dentre outros). Duas pessoas conduziram a codificação dos pronunciamentos e uma medida de concordância entre eles serviu como forma de validação da análise de conteúdo. Os autores conseguiram demonstrar uma maior ênfase na identidade nacional americana no discurso público nos Estados Unidos nas semanas seguintes aos atentados.

II.3. Análise quantitativa híbrida

Se a análise de conteúdo gera dados quantitativos para posterior tratamento, na análise quantitativa métodos e técnicas de caráter qualitativo podem ser empregados. Entre as diferentes metodologias quantitativas de análise de conteúdo que empregam essa combinação está a análise de dicionário - que será usada em nosso exemplo de aplicação na seção IV. A análise de dicionário consiste na atribuição de valor a palavras utilizadas no texto (Izumi & Moreira, 2018Izumi, M.Y. & Moreira, D.C. (2018) O texto como dado: desafios e oportunidades para as ciências sociais. Revista Brasileira De Informação Bibliográfica Em Ciências Sociais, 2(86), pp. 138-174.; Grimmer & Stewart, 2013Grimmer, J. & Stewart, B.M. (2013) Text as data: the promise and pitfalls of automatic content analysis methods for political texts. Political Analysis, 21(3), pp. 267/297. DOI:doi
doi...
; Jagers & Walgrave, 2007Jagers, J. & Walgrave, S. (2007) Populism as political communication style: an empirical study of political parties’ discourse in Belgium. European Journal of Political Research, 46(3), pp. 319-45. DOI:doi
doi...
). Nesse sentido, um termo, palavra ou expressão pode ser previamente classificado de forma qualitativa para indicar que denota um valor, um sentido positivo ou negativo, por exemplo. Com o dicionário de termos e valores, o método trata de contabilizar a frequência de seu uso em cada documento. É justamente a frequência de uso dos termos, sua presença relativa com atribuição de pesos, a diferença entre as categorias de valores e a potencial aplicação desses resultados em escalas pré-definidas que permite a análise sistemática do texto bruto. Por essa razão, o principal desafio da análise de dicionário é a adequada correspondência entre padrões fixos brutos (termos, palavras e expressões) e seu conteúdo semântico (conceitos, valores) a eles atribuídos no dicionário. De um lado, a classificação automatizada do conteúdo de um texto através do dicionário pode resultar em conclusões equivocadas e enviesadas de acordo com o dicionário e eventuais recursos de linguagem que impeçam a classificação precisa de seu conteúdo. De outro, a abordagem permite ganho de escala inimaginável quando comparada à abordagem puramente qualitativa. Este é, basicamente, o custo de oportunidade a ser avaliado pelo pesquisador ao transitar pelo continuum apresentado no Gráfico 1.

Um exemplo de uso de análise de dicionário nas RI é o artigo de Medzihorsky et al. (2017)Medzihorsky, J., Popovic, M. & Jenne, E.K. (2017) Rhetoric of civil conflict management: United Nations Security Council debates over the Syrian civil war. Research & Politics, 4(2), pp. 1-10. DOI:doi
doi...
, que analisou 347 discursos proferidos no Conselho de Segurança das Nações Unidas (CSNU) sobre o conflito sírio entre 2011 e 2015. Os autores aplicaram um dicionário com quatro categorias (violação de direitos humanos, não violação de direitos humanos, pró-intervenção e não intervenção) para classificar os discursos dos países em intervencionistas e não intervencionistas e distingui-los entre aqueles que enquadravam ou não este conflito como uma situação de violação de direitos humanos. Cada categoria é constituída por um conjunto de palavras. Quanto mais as palavras de uma determinada categoria aparecem em um discurso, mais ele pode ser classificado em determinada categoria. O estudo identificou que discursos favoráveis à prática da intervenção (maior presença da categoria pró-intervenção) também enquadravam o conflito como um caso de violação de direitos humanos (categoria violação de direitos humanos), o que indicaria a internalização por parte dos países da norma de Responsabilidade de Proteger (R2P), cujo embasamento normativo envolve a legitimação de intervenções para interromper violações de direitos humanos (Acharya, 2013Acharya, A. (2013) The R2P and norm diffusion: towards a framework of norm circulation. Global Responsibility to Protect, 5(4), pp. 466-479. DOI:doi
doi...
).

II.4. Resumos estatísticos

Avançar no continuum do Gráfico 1 para tratar o “texto como dado” e empreender métodos quantitativos que visam obter seu conteúdo latente significa tratar o texto de forma bruta e sem significado direto. Assim, a forma mais bruta do “texto como dado” nada mais é do que sua interpretação como uma sequência de caracteres armazenados em formato de máquina. Destacar esse aspecto pode parecer muito distante do nosso propósito aqui, mas resumos estatísticos produzidos a partir do texto dependem justamente do como estão construídas as sequências de caracteres de um texto. Tais resumos podem atender a diferentes propósitos de pesquisa, sendo alguns deles: contagem de caracteres, análise de frequência, análise relativa de frequência, similaridade entre documentos, diversidade lexical. Não vamos adentrar em todos, mas convém destacar dois deles em função de sua peculiaridade na análise do “texto como dado”: medidas de diversidade lexical e medidas de similaridade.

Medidas de diversidade lexical são resultado direto de como se configuram distintas cadeias de caracteres e são uma ótima ferramenta para análise das habilidades linguísticas de oradores ou escritores, ou a complexidade de ideias expressas em diferentes documentos. No âmbito da Ciência Política e das Relações Internacionais, este tipo de medida foi usado para apresentar como o advento do sufrágio promoveu mudanças no comportamento político (Spirling, 2015Spirling, A. (2015) Democratization and linguistic complexity: the effect of franchise extension on parliamentary discourse, 1832-1915. The Journal of Politics, 78(1), pp. 120-136. DOI:doi
doi...
) e como o meio pelo qual a comunicação é expressa direciona sua complexidade (Benoit et al., 2019Benoit, K., Munger, K. & Spirling, A. (2019) Measuring and explaining political sophistication through textual complexity. American Journal of Political Science, 63(2), pp. 491-508. DOI:doi
doi...
).

Por sua vez, medidas de similaridade e distância permitem que documentos sejam comparados. Aqui, medidas como a similaridade de cosseno ou o conhecido coeficiente de correlação de Pearson podem ser usados2 2 Para mais detalhes, veja Izumi & Moreira (2018) ou Grimmer & Stewart (2013). . Exemplos de sua aplicação no âmbito da Ciência Política e das Relações Internacionais são estudos das origens de legislações e documentos e a influência de grupos de interesse na formulação de conteúdo (Wilkerson et al., 2015Wilkerson, J., Smith, D. & Stramp, N. (2015) Tracing the flow of policy ideas in legislatures: a text reuse approach. American Journal of Political Science, 59(4), pp. 943-956. DOI:doi
doi...
; Hertel-Fernandez & Kashin, s/d).

II.5. Aprendizado de máquina

No extremo direito do Gráfico 1, temos métodos de aprendizado de máquina. Mesmo sendo, por vezes, usados em conjunto com técnicas qualitativas, a principal característica desse grupo de metodologias é a identificação de padrões textuais latentes por meio de decisões computacionais que resultam de inferências probabilísticas. São métodos que, necessariamente, não exigem qualquer conhecimento prévio sobre o significado do conteúdo em análise (Laver et al., 2003Laver, M., Benoit, K. & Garry, J. (2003) Extracting policy positions from political texts using words as data. American Political Science Review, 97(2), pp. 311-331. DOI:doi
doi...
).

As técnicas de aprendizagem computacional se valem da estrutura da linguagem para usar elementos do texto (em geral suas palavras) e sua frequência como sinais que orientam a inferência a seu respeito. Esses métodos se dividem em duas classes de aprendizado: supervisionado e não supervisionado. Em ambas, duas áreas de aplicação se destacam para os propósitos mais comuns das relações internacionais: escalonamento e classificação. No caso do escalonamento, o objetivo geral das pesquisas é o de posicionar numa ou mais dimensões pontos ideais estimados a respeito de documentos e seus autores. O posicionamento de representantes de diferentes países na Assembleia Geral da ONU sobre uma mesma temática pode, por exemplo, ser estimado e disposto numa mesma dimensão para se analisar o quão distinto é o posicionamento de cada um em relação aos demais. Por sua vez, pesquisas que visam classificar documentos em geral se dedicam a identificar quais temas estão presentes num acervo de textos (corpus). Nesse contexto, busca-se analisar, por exemplo, qual a ênfase temática de um orador ao longo do tempo ou durante uma rodada de debates para compará-lo com seus pares e verificar se há alguma associação latente entre potenciais temas e emissores de conteúdo. Para avançar e compreender do que se tratam as classes de i) aprendizado supervisionado e ii) não supervisionado, vamos usar exemplos de classificação automatizada. Sob a perspectiva do “texto como dado”, o escalonamento, portanto, visa estimar uma posição em uma dimensão latente. Por sua vez, a classificação visa estimar a associação de um texto a uma classe latente.

  1. Aprendizado de Máquina Supervisionado: No aprendizado de máquina supervisionado para classificação de texto, as decisões computacionais são realizadas a partir de inputs de treinamento, amostras de texto manualmente classificados, rotulados ou organizados. O modelo “aprende” com o input recebido e é capaz de realizar a tarefa desejada, seja classificação ou escalonamento, com o restante do acervo de documentos. Retomando o exemplo que vimos para o caso da análise de dicionário, no apredizado computacional supervisionado, não seria necessário que o analista apresentasse ao modelo um dicionário próprio que indicasse palavras específicas que pertencem a categorias de valores tais como positivo ou negativo. No apredizado computacional supervisionado, o modelo utilizaria o vocabulário presente na amostra de documentos manualmente classificados nas categorias de sentimento positivo ou negativo (amostra de treinamento) para, posteriormente, calcular a probabilidade de cada documento do restante do acervo pertencer a uma ou outra categoria. Esse processo básico é bastante comum, sendo composto por métodos amplamente conhecidos como Naive Bayes (Pang et al., 2002Pang, B., Lee, L. & Vaithyanathan, S. (2002) Thumbs up? Sentiment classification using machine learning techniques. In: Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing (EMNLP 2002), pp. 79-86. Doha: Association for Computational Linguistics. DOI:doi
    doi...
    ), Suport Vector Machines - SVMs (Joachims, 1999Joachims, T. (1999) Transductive inference for text classification using support vector machines. In: Proceedings of the Sixteenth International Conference on Machine Learning, pp. 200-209. ICML ‘99. San Francisco: Morgan Kaufmann Publishers Inc.), florestas aleatórias (random forests) (Fang & Zhan, 2015Fang, X. & Zhan, J. (2015) Sentiment analysis using product review data. Journal of Big Data, 2(5), pp. 1-14. DOI:doi
    doi...
    ), redes neurais (Lai et al., 2015Lai, S., Xu, L., Liu, K. & Zhao, J. (2015) Recurrent convolutional neural networks for text classification. In: Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence, pp. 2267-2273. AAAI’15. Austin: AAAI Press.) e modelos baseados em regressão (Taddy, 2013Taddy, M. (2013) Multinomial inverse regression for text analysis. Journal of the American Statistical Association, 108(503), pp. 755-770. DOI:doi
    doi...
    ).

    Quanto ao escalonamento no aprendizado supervisionado, pode-se estimar pontos ideais de uma coleção de textos diante de uma escala previamente conhecida. Nesse caso, a amostra de treinamento pode indicar qual posição da escala diferentes tipos de documentos ocupam. Com essa amostra, o restante do acervo é distribuído ao longo da escala. Um exemplo de aplicação pode ser a temática ambiental. Textos de treinamento que contêm linguagem sobre dois extremos da política ambiental podem ser usados para posicionar o restante do acervo. O dimensionamento do restante do acervo irá, portanto, ser relativo apenas aos termos relacionados à política ambiental. O Wordscores é um dos principais modelos que adotam essa abordagem (Laver et al., 2003Laver, M., Benoit, K. & Garry, J. (2003) Extracting policy positions from political texts using words as data. American Political Science Review, 97(2), pp. 311-331. DOI:doi
    doi...
    ), mas há outros que utilizam o aprendizado supervisionado para estimação de pontos ideais, como o dimensionamento de afinidade de classe (Perry & Benoit, 2017Perry, P.O. & Benoit, K. (2017) Scaling text with the class affinity model. arXiv:1710.08963 [cs, stat], outubro. Disponível em: http://arxiv.org/abs/1710.08963 Acesso em: 15 de set. 2021.
    http://arxiv.org/abs/1710.08963...
    ).

    Um exemplo de uso do aprendizado de máquina supervisionado na área de RI é o trabalho de Bastos & Mercea (2018)Bastos, M. & Mercea, D. (2018) Parametrizing Brexit: mapping Twitter political space to parliamentary constituencies. Information, Communication & Society, 21(7), pp. 921-939. DOI:doi
    doi...
    . Com o objetivo de verificar se a ideologia foi um fator relevante para o resultado do referendo do Brexit em 23 de junho de 2016, os autores analisaram 8.821.116 tweets que faziam referência ao tal referendo entre 15 de abril de 2016 e 24 de junho de 2016. O conteúdo das postagens foi classificado em quatro coordenadas ideológicas: nacionalismo, economicismo, globalismo e populismo. O algoritmo foi treinado por especialistas que classificaram 10.000 tweets nessas coordenadas ideológicas e, em seguida, todo acervo foi classificado de forma automatizada. Os textos classificados foram localizados geograficamente e colocados em comparação com os votos do eleitorado (voting constituencies). Os autores encontraram evidências, por exemplo, de que o nacionalismo foi um componente importante do debate em torno do referendo durante a maior parte da campanha, com três quartos das mensagens contendo algum grau de sentimento nacionalista.

  2. Aprendizado de Máquina Não Supervisionado: A principal característica das abordagens de aprendizado não supervisionado é o fato de não dependerem de uma etapa de treinamento baseada numa amostra (training-set) já classificada ou escalonada. Ao invés dos algorítimos utilizarem a informação do conjunto de treinamento para classificação ou escalonamento, eles se baseiam nas características do conteúdo (termos, palavras, expressões etc.) dos documentos para produzir resultados. Uma vez realizada a inferência a partir do aprendizado não supervisionado, os resultados são validados à luz dos objetivos do pesquisador. O leque de modelos de aprendizagem não supervisionada é grande3 3 Para mais detalhes, veja Izumi & Moreira (2018) ou Grimmer & Stewart (2013). . Para o objetivo de classificação, os métodos mais conhecidos são os dedicados à modelagem de tópicos. O Latent Dirichlet Alocation (LDA) desenvolvido por David Blei (2003)Blei, D.M., Ng, A.Y. & Jordan, M.I. (2003) Latent dirichlet allocation. The Journal of Machine Learning Research, 3, pp. 993-1022., por exemplo, usa a frequência relativa de palavras para inferir a proporção de um conjunto de tópicos (temas) em um documento. Como um desdobramento desse modelo, o Expressed Agenda Model (Grimmer, 2010Grimmer, J. (2010) A Bayesian hierarchical topic model for political texts: measuring expressed agendas in Senate press releases. Political Analysis, 18(1), pp. 1-35. DOI:doi
    doi...
    ) adota estrutura hierárquica com o objetivo de inferir a ênfase temática de autores de documentos, tendo como foco o autor e, portanto, como este distribui sua atenção temática4 4 Para conhecer um exemplo de aplicação ao caso brasileiro, ver Moreira (2020). . Outro modelo de aprendizagem não supervisionada bastante promissor para a modelagem de tópicos é o Structural Topic Model (Roberts et al., 2019Roberts, M., Stewart, B. & Tingley, D. (2019) stm: R package for structural topic models. Journal of Statistical Software, 91(2), pp. 1-40. DOI:doi
    doi...
    ), que permite a inferência de tópicos com a adição de covariáveis (metadados) ao modelo. Por sua vez, para o objetivo de escalonamento um modelo amplamente difundido é o Wordfish (Slapin & Proksch, 2008Slapin, J.B. & Proksch, S. (2008) A scaling model for estimating time-series party positions from texts. American Journal of Political Science, 52(3), pp. 705-722. DOI:doi
    doi...
    ). Através do conjunto de palavras dos documentos, ele produz estimativas da posição latente de um documento em relação aos demais presentes no acervo (corpus) numa dimensão cujo significado substantivo pode ser posteriormente interpretado5 5 Exemplos: como ideologia (Slapin & Proksch, 2008), preferência sobre a política ambiental (Klüver, 2009), apoio ou oposição à austeridade no orçamento (Lowe & Benoit, 2013), preferências para o nível de integração europeia (Proksch & Slapin, 2010), entre outros. .

    Por exemplo, Dooremalen & Uitermark (2020)Dooremalen, T. van & Uitermark, J. (2020) The framing of 9/11 in American, French, and Dutch national newspapers (2001-2015): an inductive approach to studying events. International Sociology, 36(3), pp. 464-488. DOI:doi
    doi...
    combinam o uso de contagem de palavras, modelagem de tópicos e análise de conteúdo para examinar a atenção dada aos atentados de 11 de setembro de 2001, os assuntos aos quais eles foram ligados e as implicações atribuídas ao acontecimento, a partir de um corpus formado por publicações de jornais nos Estados Unidos, na França e nos Países Baixos, entre 2001 e 2015. Para medir a atenção dada aos atentados, os autores contaram quantas vezes o evento aparecia nas publicações. Para analisar os tópicos relacionados, utilizaram a técnica de modelagem de tópicos, Latent Dirichlet Allocation (LDA), que fornece clusters de associações de palavras, sugerindo a existência de tópicos. Dois pesquisadores codificaram os tópicos de forma independente, observando os quinze termos mais frequentes em cada cluster, gerando doze tópicos relacionados ao 11 de setembro, como “terrorismo”, “economia” e “tráfego aéreo”. Cada tópico foi codificado como “assuntos domésticos” ou “assuntos externos”. A pesquisa pelas implicações do evento foi feita através da análise qualitativa de frases e parágrafos contendo assertivas sobre determinadas ideias, políticas ou instituições que deveriam ser apoiadas, rejeitadas ou transformadas após o 11 de setembro. Um dos achados do artigo foi que, com relação aos tópicos domésticos, os Estados Unidos enfatizaram a associação dos atentados enquanto evento de segurança, ao passo que os Países Baixos o associaram a um evento islâmico. Na França, por outro lado, não houve tanta ênfase no enquadramento do 11 de setembro como um assunto doméstico, de modo que o evento foi enfatizado como um acontecimento não doméstico.

II.6. Aprendizado profundo

O aprendizado profundo ou deep learning é o nome dado a um conjunto de métodos de aprendizado de máquina baseados em redes neurais artificiais (Goodfellow et al., 2016Goodfellow, I., Bengio, Y. & Courville, A. (2016) Deep learning. Cambridge: The MIT Press.). Esse conjunto de métodos merece destaque especial diante de todo seu potencial na abordagem do ‘texto como dado’. Nessa categoria, a principal metodologia é chamada de Word Embeddings (Benoit, 2020Benoit, K. (2020) Text as data: an overview. In: L. Curini & R. Franzese (orgs) The SAGE handbook of research methods in political science and international relations. Thousand Oaks: SAGE Publishing Ltd, pp. 461-497.), por utilizar matrizes de palavras observadas ponderadas por seus “vetores de palavras”, estimados a partir do ajuste de um modelo semântico distributivo (DSM). Em outras palavras, é um método que aborda o conteúdo do texto de modo que palavras com significados semelhantes tenham uma representação semelhante.

O Word Embeddings conecta palavras de acordo com seus usos no acervo, permitindo uma melhor interpretação de contexto semântico do que a mera matriz de documentos e termos (DFM ou DTM) ou a sacola de palavras (bag of words). Cada palavra é mapeada para um vetor e os valores do vetor são aprendidos de uma forma que se assemelha a uma rede neural. Por isso, a técnica pertence ao campo do aprendizado profundo (deep learning). Como destaca Bennoit (2020), entre os modelos disponíveis, encontram-se o word2vec (Mikolov et al., 2013Mikolov, T., Sutskever, I., Chen, K., Corrado, G. & Dean, J. (2013) Distributed representations of words and phrases and their compositionality. arXiv:1310.4546 [cs, stat]. Disponível em: http://arxiv.org/abs/1310.4546 Acesso em: 15 de set. 2021.
http://arxiv.org/abs/1310.4546...
), que usa um modelo de rede neural “skip-gram” para estimar a probabilidade de uma palavra estar “próxima” de outra palavra; o GloVe (“vetores glovales de palavras”: Pennington, Socher & Manning (2014)Pennington, J., Socher, R. & Manning, C. (2014) GloVe: global vectors for word representation. In: Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), pp. 1532-1543. Doha: Association for Computational Linguistics. DOI:doi
doi...
), que prevê vocábulos circundantes usando uma forma de regressão logística dinâmica; e o ELMo (Embeddings from Language Models: Peters et al. (2018)Peters, M.E., Neumann, M., Iyyer, M., Gardner, M., Clark, C., Lee, K. & Zettlemoyer, L. (2018) Deep contextualized word representations. In: Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long Papers), pp. 2227-2237. New Orleans, Louisiana: Association for Computational Linguistics. DOI:doi
doi...
).

Sakamoto (2020)Sakamoto, T. (2020) Cross-national analysis of global security discourse using word embeddings. APSA Preprints. DOI:doi
doi...
utiliza a técnica de word embeddings para analisar como a noção de “ameaça à paz” tem sido discutida pelos membros do CSNU, especialmente os permanentes, através de seus discursos entre 1994 e 2019. A técnica se baseia nas relações de coocorrência entre as palavras para representar uma relação semântica entre uma combinação de palavras. Por exemplo, o artigo observa que, ao analisar os discursos entre 1994 e 1999, a palavra “ameaça” vem constantemente acompanhada de “Kosovo”, “OTAN” e “Kuwait”, enquanto nos discursos de 2015 a 2019, as palavras “ISIS”, referente ao grupo terrorista Estado Islâmico, “Boko Haram”, outro grupo terrorista, e “Oriente Médio” aparecem com maior frequência, o que mostra como a noção de ameaça varia ao longo do tempo.

Mesmo sem o texto bruto requerer qualquer tipo de pré-tratamento para ser interpretado, transitar pelo continuum apresentado no Gráfico 1 potencializa a capacidade humana de processar conteúdo em larga escala. Ademais, veremos na seção IV que é na complementação entre a abordagem do “texto como texto” e do “texto como dado” que residem inúmeros atalhos capazes de criar oportunidades para as pesquisas em Relações Internacionais. Porém, antes de avançar para uma aplicação, na seção III vamos discutir como a abordagem do “texto como dado” pode ser entendida no contexto dos debates metodológicos na área e apresentar brevemente o desenvolvimento desse campo nas pesquisas brasileiras em Relações Internacionais através de uma revisão dos artigos publicados, teses e dissertações nacionais da área.

III. O ‘texto como dado’ nas relações internacionais

Como entender a abordagem do “texto como dado” enquanto método de pesquisa na área de Relações Internacionais? Esta é a questão da atual seção, onde são levados em conta os Grandes Debates presentes no desenvolvimento histórico das RI como disciplina, especialmente o segundo e quarto, mais relacionados às questões metodológicas. De forma específica, descrevemos brevemente os dois debates, como eles são refletidos na produção acadêmica das Relações Internacionais e, por fim, situamos as abordagens do “texto como texto” e do “texto como dado” no quadro dessas discussões.

Inicialmente, o chamado “segundo debate”, que ocorreu entre behavioristas e tradicionalistas, entre os defensores de uma maior influência das ciências exatas e de métodos quantitativos e aqueles que prezavam por uma abordagem mais histórica e filosófica das RI (Messari & Nogueira, 2005Messari, N. & Nogueira, J.P. (2005) Teoria das relações internacionais - correntes e debates. Rio de Janeiro: GEN Atlas.; Jackson & Sørensen, 2018Jackson, R. & Sørensen, G. (2018) Introdução às relações internacionais - 3a edição revista e ampliada: teorias e abordagens. Rio de Janeiro: Zahar.). Para os behavioristas, se as RI pretendiam se tornar ciência, então deveriam se guiar por princípios positivistas, pela ideia de que o conhecimento científico surge apenas a partir da coleta de dados observáveis e mensuráveis. Por outro lado, para tradicionalistas como Hedley Bull e Hans Morgenthau, o estudo das RI envolve juízos conceituais e interpretativos não abarcados pelo foco na coleta de dados e em inferências científicas (Dunne et al., 2013Dunne, T., Kurki, M. & Smith, S. (2013) International Relations Theories. Oxford: OUP Oxford.).

Em seguida, o intitulado “quarto debate” (às vezes nomeado por alguns como terceiro) também envolve questões metodológicas: desta vez entre positivistas e pós-positivistas. Na linha behaviorista descrita acima, os primeiros são representados pelas tradições teóricas predominantes em RI, especialmente o neorrealismo, com estudos voltados a analisar fatos observáveis e dados mensuráveis, para encontrar explicações científicas do mundo das Relações Internacionais. Por enfatizarem a importância da observação, positivistas evitam falar sobre “realidades” que não podem ser observadas enquanto prática, como “discursos” ou “estruturas sociais” (Dunne et al., 2013Dunne, T., Kurki, M. & Smith, S. (2013) International Relations Theories. Oxford: OUP Oxford.). Os pós-positivistas são uma reação a essas tradições teóricas, possuem uma visão crítica sobre a busca pela verdade dos fenômenos, preferindo uma atenção maior às diferentes visões e interpretações de mundo conflitantes, às relações de poder e ao papel da linguagem e do discurso. Pós-positivistas tendem a assumir uma postura mais interpretativista, com foco na análise da linguagem, dos sentidos e das crenças para estudar processos sociais (Dunne et al., 2013Dunne, T., Kurki, M. & Smith, S. (2013) International Relations Theories. Oxford: OUP Oxford.). Dentre as abordagens pós-positivistas se encontram o pós-estruturalismo, o pós-colonialismo e o feminismo (Jackson & Sørensen, 2018Jackson, R. & Sørensen, G. (2018) Introdução às relações internacionais - 3a edição revista e ampliada: teorias e abordagens. Rio de Janeiro: Zahar.).

As divergências entre behavioristas e tradicionalistas, positivistas e pós-positivistas, refletem-se nas produções acadêmicas em Relações Internacionais mundo afora. Maliniak et al. (2011)Maliniak, D., Oakes, A., Peterson S. & Tierney M.J. (2011) International relations in the US academy. International Studies Quarterly, 55(2), pp. 437-464. DOI:doi
doi...
, por meio do projeto Teaching, Research & International Policy (TRIP) entre 1980 e 2007, observaram, através de entrevistas, que os estudiosos das RI consideram a divisão quantitativo-qualitativo como a principal entre os acadêmicos e demonstram forte comprometimento com o positivismo. Além disso, notaram que em 2006 90% dos artigos publicados nas doze principais revistas da área de RI tinham abordagem positivista. Li (2019)Li, Q. (2019) The second great debate revisited: exploring the impact of the qualitative-quantitative divide in international relations. International Studies Review, 21(3), pp. 447-476. DOI:doi
doi...
utilizou os mesmos dados, dessa vez cobrindo os anos de 1980 a 2014, e verificou que as doze principais revistas em RI publicaram mais artigos qualitativos entre as décadas de 1980 e 1990, mas que a partir dos anos 2000 os artigos quantitativos se tornaram predominantes. O autor notou também que os trabalhos que utilizaram métodos mistos foram minoritários durante todo o período, numa proporção abaixo de 5% e que os jornais em RI, em termos de publicações, formaram dois clusters: um focado em pesquisa quantitativa; outro, em pesquisa qualitativa. Por fim, Eun (2017)Eun, Y. (2017) To what extent is post-positivism ‘practised’ in international relations? Evidence from China and the USA. International Political Science Review, 38(5), pp. 593-607. DOI:doi
doi...
identificou uma predominância de trabalhos com abordagem positivista tanto nos trabalhos publicados na comunidade de RI nos Estados Unidos quanto na China.

No cenário internacional, portanto, as publicações em RI refletem uma divisão entre os acadêmicos quanto à abordagem metodológica, mais positivista ou pós-positivista, e recentemente nota-se uma tendência de maior produção de trabalhos positivistas e quantitativos. No Brasil, Medeiros et al. (2016)Medeiros, M.A., Barnabé, I., Albuquerque, R. & Lima, R. (2016) What does the field of international relations look like in South America? Revista Brasileira de Política Internacional, 59(1), e004. DOI:doi
doi...
aplicaram análise de conteúdo sobre 7.857 artigos publicados em 35 revistas acadêmicas de 6 países da América do Sul (Argentina, Brasil, Colômbia, Chile, Uruguai e Venezuela) entre 2006 e 2014 para descobrir as teorias, os métodos e as áreas de pesquisa predominantes na área de Relações Internacionais. Os autores observaram que os trabalhos na área de RI produzidos nas revistas analisadas são predominantemente positivistas e qualitativos. Apesar da prevalência de métodos qualitativos, a análise quantitativa se mostrou majoritária pela primeira vez em 2014, último ano analisado pelo trabalho, o que pode ser reflexo da recente tendência quantitativa no cenário acadêmico internacional em RI.

Considerando o exposto acima, qual o lugar das análises textuais no contexto dos debates metodológicos das Relações Internacionais levando em conta as definições das abordagens do “texto como texto” e do “texto como dado”?

A partir de um olhar menos acurado, pode-se conjecturar que o recurso à análise de texto em uma pesquisa de Relações Internacionais a posicionaria mais próxima de uma perspectiva pós-positivista, uma vez que esta vertente dá uma atenção maior a fontes discursivas. Um olhar mais meticuloso, no entanto, perceberá que o continuum apresentado neste trabalho que vai do “texto como texto” ao “texto como dado” contempla ambas as vertentes: a positivista e a pós-positivista (Gráfico 1). Por um lado, a abordagem do “texto como texto” está mais próxima da faceta pós-positivista, uma vez que possui maior foco na interpretação a partir de conceitos abstratos e com a identificação de relações de poder nos sentidos do texto, sendo útil, então, a aplicação de técnicas como Análise do Discurso. Por outro lado, porém, a abordagem do “texto como dado”, quando trata os elementos de um texto enquanto dados quantitativos, acerca-se da vertente positivista, atenta a mensurações de variáveis e identificação de padrões que podem ser utilizadas em testes de hipóteses. Portanto, o continuum que vai do “texto como texto” ao “texto como dado” incorpora ambas as tradições positivista e pós-positivista que marcam os debates metodológicos em RI, abrindo a oportunidade para que a pesquisa acadêmica baseada em análise textual utilize métodos mistos.

É diante do potencial de combinação das duas abordagens que acreditamos ser oportuno estimular o desenvolvimento de pesquisas que adotem a perspectiva do “texto como dado” (Gráfico 1) e incorporem o que há de mais avançado na área da análise de texto. Vilela & Neiva (2011)Vilela, E. & Neiva, P. (2011) Temas e regiões nas políticas externas de Lula e Fernando Henrique: comparação do discurso dos dois presidentes. Revista Brasileira de Política Internacional, 54(2), pp. 70-96. DOI:doi
doi...
, ao avaliarem como se encontra a produção nacional a esse respeito, analisaram 177 artigos publicados na Revista Brasileira de Política Internacional (RBPI) em um horizonte temporal de dez anos e identificaram que 39% deles faziam referência direta a documentos oficiais ou à manifestação de autoridades governamentais, empresários e outros atores estatais e não estatais. No entanto, apenas um artigo utilizava a técnica de análise de conteúdo. Trata-se do artigo de Santos (2010)Santos, M.H.C. (2010) Exportação de democracia na política externa norte-americana no pós-Guerra-Fria: doutrinas e o uso da força. Revista Brasileira de Política Internacional. 53(1), pp. 157-191. DOI:doi
doi...
, que aplicou a técnica a 415 discursos de Presidentes e Secretários de Estado dos EUA entre 1989 e 2008 com o objetivo de comparar a frequência das menções à democracia e à segurança.

Para ampliar o diagnóstico de Vilela & Neiva (2011)Vilela, E. & Neiva, P. (2011) Temas e regiões nas políticas externas de Lula e Fernando Henrique: comparação do discurso dos dois presidentes. Revista Brasileira de Política Internacional, 54(2), pp. 70-96. DOI:doi
doi...
e destacar a validade do estímulo à produção na área, avaliamos as 14 principais revistas nacionais na área de Relações Internacionais, para identificar artigos que utilizaram a abordagem do “texto como texto” e do “texto como dado” entre 2011 e 2021. Os artigos identificados foram classificados de acordo com as categorias do nosso continuum (Gráfico 1). Para tanto, realizamos uma busca pelas expressões “análise de conteúdo”, “content analysis”, “análise do discurso”, “discourse analysis” e termos correlatos através do software “Publish or Perish”, com filtro para o Google Scholar. Após revisão dos artigos encontrados, identificamos e classificamos quarenta e seis artigos da área de Relações Internacionais que utilizaram as abordagens do “texto como texto” e do “texto como dado”. O resultado pode ser conferido no Gráfico 2.

Gráfico 2
Percentual de artigos por categoria do ‘texto como texto’ ao ‘texto como dado’ nas Relações Internacionais no Brasil

Podemos observar que mais da metade dos artigos analisados se enquadram como análises literárias - trabalhos que utilizam fontes textuais e uma metodologia baseada na leitura e na interpretação direta do texto-, com poucos deles utilizando recursos computacionais que auxiliem na exploração, na codificação e na análise dos dados e viabilizem estatísticas e análises automatizadas. De maneira geral, portanto, a produção acadêmica nacional de RI que resulta da análise de conteúdo utiliza majoritariamente a abordagem do “texto como texto” como principal ferramenta para responder às perguntas de pesquisa do campo.

Acreditamos que tal diagnóstico é fruto do treinamento metodológico que os pesquisadores da área receberam. Com o objetivo de potencializar o alcance desses trabalhos através da adoção de métodos e técnicas da abordagem do “texto como dado” na área de RI no Brasil, mais do que apresentar as diferentes técnicas existentes (seção II), na seção IV propomos um exemplo prático totalmente replicável de uma das técnicas do “texto como dado”: a análise de sentimento.

IV. As emoções no Conselho de Segurança da ONU

Diante do leque de metodologias disponíveis para a análise do “texto como dado”, nesta seção apresentamos um caso prático de sua aplicação no âmbito das Relações Internacionais. As análises referentes a este caso são descritivas e voltadas a demonstrar a utilização da abordagem do “texto como dado”, tendo, portanto, caráter essencialmente pedagógico com o objetivo de apresentar a potencialidade do método. O caso prático visa responder a duas indagações, uma mais geral e outra mais específica: i) Como os discursos proferidos entre 1995 e 2019 no CSNU retrataram a expressão de emoções positivas e negativas? ii) Diante do conflito Israel e Palestina, como representantes de Brasil, Estados Unidos, Israel e Palestina se expressaram emocionalmente em discursos proferidos nos encontros do CSNU? Para tanto, vamos utilizar o banco de dados UN Security Council Debates, que contém 77.857 discursos proferidos por representantes dos Estados membros do Conselho de Segurança das Nações Unidas entre 1995 e 2019. Sobre o conteúdo expresso pelos países-membros, vamos aplicar a análise de dicionário, uma das metodologias que destacamos ao tratar da Análise Quantitativa Híbrida, na seção II.

O CSNU é formado por quinze membros, sendo cinco permanentes (China, Estados Unidos, França, Reino Unido e Rússia.) e dez rotativos, eleitos pela Assembleia Geral com mandato de dois anos. Inicialmente, o Conselho era formado por onze membros, sendo cinco permanentes e seis rotativos. A resolução 1991 (XVIII) da Assembleia Geral, adotada em 1963 e com entrada em vigor em 1965, aumentou o número de membros para quinze. Em 1971, através da resolução 2758 (XXVI) da Assembleia Geral, a República Popular da China (Pequim) substitui a República da China (Taiwan). É no CSNU que são discutidos temas relativos à paz e à segurança internacionais, onde soluções são propostas e decisões são tomadas para resolução de conflitos.

Sabendo que o Conselho de Segurança das Nações Unidas é um órgão sempre ativo, em que reuniões podem ser convocadas a qualquer momento e situações de conflito consideradas uma ameaça à paz e à segurança internacionais são levadas a debate, por que analisar o sentimento expresso por Estados membros? Enquanto indivíduos, sabemos que toda situação de estresse produz uma resposta emocional em quem está diante dela. Com os países não é diferente. As situações discutidas no CSNU suscitam as mais diversas emoções em seus membros, desde fortes indignações e descontentamentos até sentimentos de alegria. Situações de conflito com grave sofrimento humano podem liberar sensação de tristeza e pesar. Situações de términos bem-sucedidos de missões de paz e fins de conflitos, por outro lado, podem gerar celebração e comemoração. Sentimentos positivos e negativos, são, por sua vez, expressos no vocabulário utilizado nos discursos proferidos pelos representantes dos países. Por exemplo, o discurso de Mayr-Harting, representante da Áustria, em 2010, demonstrou satisfação diante do processo eleitoral no Afeganistão:

“(...) Em vista da recente conclusão do processo eleitoral, gostaríamos de elogiar as instituições eleitorais afegãs por seu dedicado trabalho em circunstâncias muito desafiadoras. Esperamos que a recém-eleita Câmara Baixa da Assembleia Nacional do Afeganistão seja convocada rapidamente, a fim de assumir suas importantes funções legislativas. (...)6 6 Tradução livre. Código do discurso: “UNSC_2010_SPV.6464_spch018.txt”. ”.

Em 2015, um discurso de Van Oosterom, representante dos Países Baixos, demonstrava preocupação com a situação no Oriente Médio:

“(...) Meu governo está, portanto, profundamente preocupado com a deterioração da situação da segurança no Oriente Médio. A brutalidade dos crimes cometidos por grupos extremistas na região não tem paralelo na história recente. O futuro da paisagem multiétnica e religiosa do Oriente Médio está sob ameaça iminente. (...)”7 7 Tradução livre. Código do discurso: “UNSC_2015_SPV.7419_spch101.txt”.

Os diplomatas no CSNU proferem discursos em nome dos seus países. As ideias desses representantes podem ser entendidas, de certa forma, como as ideias do Estado que representam e os sentimentos expressos nos discursos podem ser entendidos como os sentimentos desses Estados. A análise de sentimentos aplicada a países se conforma bem com a lógica construtivista de que Estados são também pessoas, no sentido de atores intencionais e com propósitos (Wendt, 2004Wendt, A. (2004) The state as person in international theory. Review of International Studies, 30(2), pp. 289-316. DOI:doi
doi...
). Além de possuírem ideias e sentimentos, os Estados também possuem pontos de vista e interpretações das mais variadas sobre as situações de conflito discutidas no CSNU. Cada um tem uma forma diferente de se posicionar através de seus pronunciamentos, quase sempre evidenciando emoções no conteúdo expresso. Reagir de forma furiosa ou calma também é fruto de cálculo estratégico, liturgia diplomática, e não de reações automáticas. Diante de um conflito grave, com fortes eventos de violência, escolhe-se entre o caminho do uso da força e o caminho do diálogo, podendo o discurso ser mais furioso, mais negativo; ou mais apaziguador, neutro e até esperançoso, positivo. São essas as variações que pretendemos capturar na análise de sentimento dos discursos proferidos.

IV.1. O contexto de produção e delimitação do corpus

Seja para analisar o “texto como texto” ou o “texto como dado”, é imprescindível conhecer o contexto da produção do conteúdo expresso. No nosso caso, é importante saber como os encontros do CSNU são organizados e como os discursos são proferidos. São cinco os pontos mais relevantes para nossa análise:

  1. Sabe-se que no CSNU não estão todos os Estados membros da ONU, mas apenas 15 representantes. Cinco deles, como indicamos acima, são permanentes, estão presentes em todos os encontros, e por isso é normal que também tenham um número maior de discursos. Os outros 10 são membros rotativos. Desde 1945, alguns deles participaram mais, outros menos. O Brasil, por exemplo, é o segundo país que mais participou (o primeiro é o Japão). Temos, portanto, uma informação importante sobre o contexto de produção dos discursos que vamos analisar: os países possuem oportunidades distintas de discursar e, por isso, o número de discursos pode variar bastante entre os países;

  2. Não há um limite fixo para o tamanho dos discursos. Existe apenas uma recomendação, expressa no documento S/2010/507, intitulado “Note by the President”, de 2010: de que os países devem discursar por cerca de 5 minutos. Podemos, então, esperar que os discursos variem quanto ao seu tamanho.

  3. Os países podem discursar mais de uma vez no mesmo encontro. Geralmente, cada representante discursa apenas uma vez, mas pode ocorrer que uma discussão se inicie ou que algum representante considere que deve esclarecer um ponto específico, ou responder a outro representante;

  4. Os encontros são coordenados pelo Presidente do Conselho, que é um representante de um país-membro que ocupa a presidência durante 1 mês. Uma das funções do Presidente é organizar a ordem dos oradores. Por tal razão, vários discursos do nosso banco de dados inicial são meramente protocolares, do tipo “Passo agora a palavra ao representante da França”. Logo, diante do nosso objetivo de pesquisa, precisamos desconsiderar esses discursos;

  5. Um dos documentos possíveis de serem produzidos em encontros do CSNU são os Presidential Statements (PRST). São documentos verbalizados pelo Presidente do Conselho através de discurso, que expressam um consenso entre todos os 15 membros. Isso quer dizer que esses discursos, 873 no total, não representam apenas o posicionamento do país-membro que ocupa a presidência, não sendo esse país exatamente o autor do discurso. É preciso lidar com cuidado com esses discursos. Não precisamos excluí-los, como devemos fazer com os discursos protocolares, mas analisá-los apenas nos momentos apropriados, explicados mais adiante. Afinal de contas, são documentos importantes que demonstram que há certo consenso entre os membros e o tom expresso nessa comunicação é, sem dúvida, importante para nossa análise.

Ainda que a abordagem do “texto como dado” automatize a análise, é de grande importância ter conhecimento qualitativo sobre o contexto de produção do conteúdo. No nosso caso, é importante compreender quais os tipos de pronunciamentos produzidos no CSNU e como essa produção ocorre. Ao longo desta seção, o leitor notará que são essas informações que nos ajudam a organizar os dados e escolher a unidade de análise para aplicação da análise de dicionário.

IV.2. A escolha do dicionário

Os países interpretam e reagem emocionalmente de forma distinta às mesmas situações, aos mesmos assuntos. Dessa forma, podemos compará-los de acordo com o conteúdo expresso através do vocabulário utilizado em sua comunicação. Logo, para detectar reações emocionais, a análise de sentimentos funciona com base em um dicionário, em que cada palavra possui um valor relativo a sentimentos específicos. Existem vários dicionários, cada um com um conjunto próprio de palavras e com uma forma específica de organizá-las. Por exemplo, o dicionário AFINN (Nielsen, 2011Nielsen, F.Å. (2011) A new ANEW: evaluation of a word list for sentiment analysis in microblogs. arXiv:1103.2903 [cs]. Disponível em: http://arxiv.org/abs/1103.2903 Acesso em: 15 de set. 2021.
http://arxiv.org/abs/1103.2903...
) é organizado de forma que cada palavra possui uma pontuação que varia de -5 a +5. No caso do dicionário Bing (Minqing & Bing, 2004Minqing, H. & Bing, L. (2004) Mining and summarizing customer reviews. In: Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 168-177. KDD ‘04. New York: Association for Computing Machinery. DOI:doi
doi...
), cada palavra simplesmente é classificada como “positivo” ou “negativo”.

Para os propósitos deste trabalho, utilizaremos o dicionário Lexicoder (Young & Soroka, 2012Young, L. & Soroka, S. (2012) Affective news: the automated coding of sentiment in political texts. Political Communication, 29(2), pp. 205-231. DOI:doi
doi...
), elaborado para lidar com discursos com conteúdo de notícias, debates legislativos e política. Cada palavra desse dicionário é classificada em dois sentimentos possíveis: “positivo” e “negativo”. Além disso, o dicionário é capaz de identificar termos que mudam as valências das frases. Por exemplo, em um discurso pode estar a frase “estou muito feliz com nosso debate”. Ao detectar a palavra “feliz”, o discurso ganharia uma pontuação a mais no polo positivo. No entanto, a frase poderia ser outra: “Não estou feliz com nosso debate”. Temos mais uma vez a palavra “feliz” na frase, mas contá-la como uma palavra positiva seria claramente um erro, uma vez que ela vem após a expressão “Não estou”. Este trecho do discurso, portanto, deveria ser considerado negativo. O Lexicoder detecta as expressões que mudam a valência das palavras e as contabiliza a partir das categorias “negativo negativo” e “negativo positivo”.

Este dicionário também possui um conjunto de etapas de pré-processamento do texto, para que a classificação seja mais eficaz. Ao aplicar o dicionário aos discursos do CSNU, cada um dos discursos recebe uma pontuação, resultado da subtração das palavras positivas pelas palavras negativas. Quanto mais palavras positivas um discurso possui, mais ele expressa sentimentos positivos. O inverso ocorre quando o número de palavras negativas é maior do que o de palavras positivas.

Ainda que os temas do dicionário e dos discursos do Conselho de Segurança sejam afins, uma vez que tratam de conteúdos políticos, é possível que haja inconsistências na classificação das palavras, considerando que o Lexicoder não foi construído para ser aplicado especificamente aos discursos do Conselho. É possível, por exemplo, que algumas palavras tratadas como positivas pelo Lexicoder sejam neutras ou até mesmo negativas quando utilizadas nos discursos do Conselho. Por isso, como medida de precaução e para evitar distorções na análise de sentimentos, é preciso avaliar os vocábulos mais detectados pelo dicionário e remover falsos positivos. Essa avaliação foca nas palavras mais detectadas por serem aquelas que teriam maior peso na mensuração e poderiam causar distorções mais graves.

Após avaliar as 100 palavras positivas e as 100 negativas mais presentes nos discursos, mostrou-se necessário remover do dicionário oito palavras: sete da primeira categoria e um da segunda. Trata-se de vocábulos que poderiam expressar algum tipo de sentimento em outros contextos, mas não nos debates no Conselho de Segurança. Dentre eles, encontra-se united, a palavra mais presente nos discursos, aparecendo 201.497 vezes. Ele está classificado pelo Lexicoder como um vocábulo positivo, o que é compreensível tendo em vista que ele pode expressar ideias como consenso e cooperação. Nos debates do Conselho de Segurança, no entanto, ele é muito frequentemente utilizado como parte da expressão united nations, apenas para fazer referência à ONU, sem que isso indique um sentimento positivo.

Veremos a seguir exemplos ilustrativos de como essa técnica funciona na prática. Primeiro, analisaremos o CSNU de forma geral, investigando como o sentimento do conjunto total de discursos variou ao longo do tempo. Em um segundo momento, observaremos quais os Estados e tópicos cujos discursos mais expressaram sentimentos negativos. Para concluir, abordaremos brevemente um estudo de caso sobre os sentimentos expressos por Brasil, Estados Unidos, Israel e Palestina nos discursos proferidos em encontros do CSNU que versaram sobre o conflito Israel-Palestina, contrastando os resultados da análise de sentimento com a literatura qualitativa sobre o tema.

IV.3. As emoções do CSNU ao longo do tempo

Como os discursos proferidos no CSNU expressaram emoções positivas e negativas entre 1995 e 2019? Uma vez que pretendemos descobrir a variação emocional no CSNU como um todo ao longo do tempo, será útil incluir os discursos que proferem PRSTs (Presidential Statements), uma vez que são expressão do Conselho, que é o ator sob análise. Não vamos aplicar o dicionário a cada discurso do banco de dados, mas a cada conjunto de discursos que um Estado proferiu em um encontro. Então, se um Estado discursou duas vezes em um determinado encontro, vamos unir os conteúdos em um só discurso. Nossa unidade de análise, portanto, não é o discurso, mas o conjunto de discursos proferidos por um Estado em um determinado encontro, em uma determinada data. Para essa análise, portanto, nosso banco de dados será, in fine, constituído: pelos discursos proferidos pelos países em um mesmo encontro, em uma mesma data, excluídos os discursos protocolares - o que resulta em um total de 47.283 discursos (60% dos 77.857 discursos iniciais).

O Gráfico 3 mostra que o CSNU foi palco de discursos mais positivos do que negativos, aspecto que pode se justificar pela própria natureza do conteúdo mais diplomático dos pronunciamentos. Mesmo assim, podemos perceber que existe um momento em que a “positividade” do Conselho é abalada. A partir de 2011, nota-se que o sentimento geral cai e só volta a subir a partir de 2017. Tendo em vista informações qualitativas sobre acontecimentos relativos à paz e à segurança internacionais na época, podemos conjecturar que os eventos da Primavera Árabe e todos os conflitos e guerras civis que se seguiram, como os da Síria, da Tunísia, do Egito, além da tomada da cidade iraquiana de Mosul pelo grupo terrorista Estado Islâmico em 2014 tiveram um impacto negativo no sentimento geral do Conselho. Já vimos um trecho do representante austríaco no CSNU mencionando grupos extremistas, mas é válido citar também um trecho de discurso de Stephen O’Brien, Subsecretário-Geral para Assuntos Humanitários e Coordenador de Assistência Emergencial da ONU, em 2015, sobre a crise na Síria:

“(...) Os intensos combates em todo o país também causaram um aumento no deslocamento. Consideravelmente mais de 100.000 pessoas fugiram das áreas ao sul da cidade de Hasakah após os avanços do Estado Islâmico no Iraque e no Levante (ISIL) no mês passado. Na governadoria de Raqqa, mais de 70.000 tiveram que fugir enquanto os combates aumentavam entre o ISIL e grupos armados não estatais. No sul da Síria, mais de 40.000 fugiram da cidade de Dar’a após uma ofensiva lançada por grupos armados não estatais. Ao todo, mais de 1 milhão de pessoas foram deslocadas de suas casas até agora em 2015, muitas pela segunda ou terceira vez, além dos 7,6 milhões que já estavam deslocados internamente no final de 2014. Outro marco trágico foi registrado quando o número de refugiados registrados atingiu 4 milhões no início de julho, a maior população de refugiados de um único conflito em todo o mundo em mais de um quarto de século. (...)”8 8 Tradução livre. Código do discurso: “UNSC_2015_SPV.7493_spch002.txt”.

Gráfico 3
O sentimento geral do CSNU

Podemos verificar também quais conflitos debatidos no CSNU geraram mais reações negativas. Vamos desconsiderar os tópicos em torno dos quais há menos de 100 discursos e verificar quais tópicos cujos encontros do CSNU nos quais ocorreram tiveram o maior percentual de menções negativas. Esta escolha é arbitrária e baseada na ideia de que alguns tópicos geraram pouquíssimos encontros, as vezes apenas um, como o sobre a situação em Honduras. Também excluiremos as reuniões que trataram de assuntos gerais, como “terrorismo”, “crianças e conflitos armados”, “mulheres, paz e segurança”, para focarmos apenas nos conflitos geograficamente localizáveis, como os da Síria, do Iêmen, da Ucrânia, dentre outros. Como procuramos identificar o sentimento no CSNU de maneira geral, continuaremos com o mesmo corpus que utilizamos na análise anterior, calculando o percentual de menções negativas, pois alguns tópicos foram debatidos em mais encontros do que outros, e alguns encontros tiveram mais participantes do que outros. Os dez tópicos com maiores percentuais de menções negativas podem ser conferidos no Gráfico 4.

Gráfico 4
Dez tópicos com maiores percentuais de sentimento negativo no CSNU

Em primeiro lugar, vale destacar que os tópicos “Israel/Palestina”, “Líbano” e “Israel/Líbano” dizem respeito ao mesmo conflito: Israel-Palestina. Considerando os períodos em que os embates foram discutidos no Conselho, é interessante notar, consoante o Gráfico 3, que dessas dez hostilidades com maiores percentuais de negatividade, cinco foram adicionadas à agenda do Conselho a partir de 2011. As crises na Síria e no Iêmen entraram na agenda do Conselho em 2011; a Líbia chamou atenção do Conselho entre 1996 e 2004, voltando a ser objeto de reuniões a partir de 2011; a situação na Ucrânia começou a ser pautada em 2014; e reuniões sobre a Venezuela começaram a ocorrer em 2019. Tendo em vista essas informações, é possível afirmar que especialmente os conflitos na Síria, no Iêmen, na Líbia e na Ucrânia tiveram influência na queda da positividade do Conselho - que começa justamente de 2011 para 2012.

IV.4. As emoções dos países do CSNU ao longo do tempo

Depois de conhecer o sentimento geral expresso no CSNU, vamos proceder com análises sobre o comportamento emocional dos Estados. Uma pergunta de interesse é: quais países expressaram mais sentimento negativo em seus discursos proferidos? Como já anotado, alguns Estados participam do CSNU mais do que outros. Para colocá-los em pé de igualdade vamos calcular, para cada país, o percentual de menções negativas no conjunto de todos os seus discursos.

Para esta análise, vamos continuar utilizando o mesmo banco de dados, mas desta vez excluindo os discursos que proferem PRSTs, por não representarem países específicos, que é o nosso foco atual. Vamos também levar em conta apenas os países que fizeram mais de 10 discursos durante todo esse período. Esta escolha é arbitrária e baseada na ideia de que alguns representantes discursaram pouco, alguns apenas uma vez, como o Butão, o que talvez não seja o bastante para sabermos sua postura emocional diante de conflitos internacionais. O Gráfico 5 aponta os dez países com discursos mais negativos.

Gráfico 5
Países com maior percentual de discursos negativos

Pode-se notar não apenas países conhecidos por terem uma postura crítica em relação à ordem internacional, como a Coreia do Norte, Cuba, Venezuela e Irã, mas também podemos ver como o conflito Israel-Palestina é um grande foco de tensão. Merece destaque o fato de que Israel é o país com maior percentual de menções negativas do Conselho com pelo menos dez discursos proferidos. Além disso, Israel, Cuba, Síria e Irã são os países cujas menções negativas superam menções positivas, aparecendo no Gráfico 5 com um percentual de menções negativas superior a 50%. A presença da Síria na lista pode indicar não apenas a reação emocional negativa do país em relação ao conflito Israel-Palestina, do qual é parte, mas também em relação à contenda em seu próprio território nacional.

Tendo em vista a importância do embate Israel-Palestina no cenário internacional e para a atuação do CSNU, realizaremos um breve estudo de caso, comparando como alguns países reagiram emocionalmente aos debates sobre esse conflito ao longo dos anos. A escolha desse confronto se justifica também por ser aquele com maior número de encontros no Conselho, cujos debates estão presentes em todos os anos cobertos pelo banco de dados. Compararemos os discursos de quatro membros: Brasil, Estados Unidos, Israel e Palestina. Os dois últimos foram escolhidos por serem as partes em hostilidade, enquanto Brasil e Estados Unidos serão analisados para capturar a percepção de atores externos ao confronto. Enfatize-se que a escolha do caso a seguir possui propósito essencialmente pedagógico para apresentação do potencial da abordagem do “texto como dado” para as RI.

V. Estudo de caso: o conflito Israel-Palestina

Neste estudo de caso, nosso corpus é formado pelos discursos proferidos por Brasil, Estados Unidos, Israel e Palestina em encontros do CSNU que versaram sobre o conflito Israel-Palestina, entre 1995 e 2019. Nossa unidade de análise é o conjunto de discursos proferidos por um Estado em um mesmo encontro, em uma mesma data. O dicionário que será aplicado à unidade de análise é o Lexicoder, adequado para discursos com conteúdo de natureza política, como é o caso dos discursos proferidos no CSNU. Precisamos agora definir a fórmula de cálculo para mensuração do sentimento em cada unidade de análise.

A principal forma de calcular o sentimento em discursos é através do net tone (Young & Soroka, 2012Young, L. & Soroka, S. (2012) Affective news: the automated coding of sentiment in political texts. Political Communication, 29(2), pp. 205-231. DOI:doi
doi...
), resultante do cálculo do percentual de menções positivas menos o percentual de menções negativas. Esta fórmula é útil principalmente porque nos fornece uma escala que vai de -1 (discursos com apenas menções negativas) até +1 (discursos com apenas menções positivas). O resultado da aplicação desta fórmula no nosso caso ilustrativo pode ser conferido no Gráfico 6.

Gráfico 6
Score de sentimento de países selecionados sobre o conflito Israel-Palestina

Cada ponto representa uma de nossas unidades de análise. O Gráfico 6 apresenta o comportamento emocional de cada país ao longo do tempo e indica os momentos com discursos muito positivos ou muito negativos. Podemos, por exemplo, notar a existência de um discurso com 100% de menções positivas, proferido pelo Brasil, em 2004. Deve ser um discurso extremamente feliz e alegre, certo? Vamos dar uma olhada em seu conteúdo:

“Os motivos que levaram ao voto afirmativo do Brasil sobre a resolução rascunho constam da declaração de minha delegação durante a 4929ª reunião do Conselho de Segurança, realizada em 23 de março de 2004.”9 9 Tradução livre. Código do discurso: “UNSC_2004_SPV.4934_spch011.txt”.

O discurso mais positivo dentre aqueles feitos por esses quatro países sobre o conflito Israel-Palestina basicamente explica que o Brasil votou a favor de uma resolução rascunho por motivos que estão descritos em outro discurso, proferido no encontro de número 4929. Esse é um exemplo que mostra uma limitação do cálculo de net tone: a possibilidade de superestimação de discursos pequenos. Com menos palavras, torna-se mais fácil que o vocabulário de um discurso tenha apenas palavras de uma categoria de sentimento (positivo ou negativo).

Outra forma de observar discursos com mais menções positivas ou negativas é através do cálculo do sentimento a partir de números absolutos. Neste caso, o sentimento seria o resultado do cálculo do número de menções positivas menos o número de menções negativas. Esta fórmula não fornece uma escala bem delimitada e, por isso, dificulta a comparação e a identificação de tendências ao longo do tempo, mas torna visível os discursos que mais se destacaram em termos de menções positivas e negativas. O resultado da aplicação do cálculo de sentimento através de números absolutos pode ser conferido no Gráfico 7.

Gráfico 7
Sentimento obtido por número absoluto de menções positivas e negativas em discursos de países selecionados sobre o conflito Israel-Palestina

O pequeno discurso brasileiro está agora próximo à linha que indica o valor de zero e verifica-se que outras mudanças ocorreram. A curva de tendência do Brasil, por exemplo, está mais achatada. Uma vez que não temos uma escala fixa para todos os países no tempo, é difícil dizer que a postura brasileira pouco variou. O discurso que agora aparece com maior sentimento positivo foi proferido pelo representante da Palestina, em 2018. Trata-se de um longo discurso do Presidente Mahmoud Abbas, que, na ocasião, apesar de demonstrar postura crítica em relação a Israel e aos Estados Unidos, dedicou bastante tempo para falar positivamente do povo palestino e da necessidade de se promover processos de paz:

“(...) Estamos aqui por causa do desejo dos palestinos de continuar trabalhando de forma construtiva e corajosa. Temos toda a coragem de dizer sim e toda a coragem de dizer não, com base no direito internacional e nos nossos interesses. Estamos aqui para construir uma cultura de paz, rejeitar a violência, salvar o princípio dos dois Estados, obter segurança e estabilidade para todos, devolver a esperança ao nosso povo e aos povos da região e encontrar uma saída para o impasse que enfrentamos. Acreditamos na paz abrangente, duradoura e justa, que é uma escolha estratégica para o bem das gerações futuras em nossa região, palestinos e israelenses. Informarei, portanto, o Conselho sobre o nosso plano. (...)”10 10 Tradução livre. Código do discurso: “UNSC_2018_SPV.8183_spch006.txt”.

Os gráficos nos informam a variação de sentimento dos países analisados diante do conflito Israel-Palestina. A análise de sentimento nos fornece, então, uma primeira visão sobre o desenvolvimento do conflito e da forma como os países responderam a ele. Com este primeiro olhar, especialmente sobre o Gráfico 6, que possui uma escala bem definida, podemos suscitar questões para uma investigação mais apurada. De maneira geral, Brasil e Estados Unidos, que não são os principais atores em conflito, demonstram mais sentimentos positivos em comparação com Israel e Palestina. Quanto ao desenvolvimento do confronto de maneira mais específica, é notável a existência de dois períodos com maior presença de emoções negativas, um que começa a partir dos anos 2000 e vai até 2007; e outro a partir de 2011. Do mesmo modo, verifica-se um pequeno intervalo com discursos menos negativos em relação às hostilidades entre 2008 e 2010. Qual o contexto por trás dessas variações? Este aprofundamento é importante e podemos fazê-lo a partir da literatura qualitativa. Em outras palavras, podemos utilizar a abordagem do “texto como dado” como atalho para investigações que abordem o conteúdo expresso na forma do “texto como texto”. Vejamos a seguir como podemos avançar.

A Primeira Intifada, expressão que remete à revolta e à insurreição palestina contra Israel, ocorreu no final de 1987 e começou a perder força em 1991, ainda que levantes tenham continuado até 1993 (Harms & Ferry, 2017Harms, G. & Ferry, T.M. (2017) The Palestine-Israel conflict: a basic introduction - Fourth edition. London: Pluto Press.). O período entre 1991 e 2001 é conhecido como “processo de paz”, uma vez que foi marcado por várias tentativas de negociação para o fim do conflito Israel-Palestina, como a conferência de Madri (1991-1993), os acordos de Oslo, em 1993 e 1995, e o acordo de Camp David II (2000) (Harms & Ferry, 2017Harms, G. & Ferry, T.M. (2017) The Palestine-Israel conflict: a basic introduction - Fourth edition. London: Pluto Press.). No nosso Gráfico 6, é possível notar que, entre 1995 e 2000, temos um período mais marcado por sentimentos positivos, que vão dando lugar a uma tendência negativa a partir dos anos 2000, quando ocorreu a Segunda Intifada. Vale citar um trecho de um discurso do representante israelense, em 2000, que menciona esta Segunda Intifada e os processos de paz anteriores a ela:

“(...) A tentativa dos palestinos de dar a esta intifada armada o verniz de uma luta legítima, como se fosse o único meio de alcançar seus objetivos, é uma falsa representação grosseira da realidade. O processo de paz de Oslo forneceu um mecanismo viável para os palestinos realizarem seu objetivo de autodeterminação. As negociações face a face conduzidas dentro dessa estrutura renderam vários acordos de paz importantes e criaram uma situação em que 98 por cento dos palestinos na Cisjordânia e Gaza vivem sob domínio palestino. Além disso, o processo de Oslo tem o potencial de encerrar o conflito de uma vez por todas, atender às necessidades de ambos os lados e evitar mais derramamento de sangue. (...)”11 11 Tradução livre. Código do discurso: “UNSC_2000_SPV.4231_spch004.txt”.

A Segunda Intifada consistiu em uma série de revoltas palestinas contra Israel, que seguiram até 2004 (Harms & Ferry, 2017Harms, G. & Ferry, T.M. (2017) The Palestine-Israel conflict: a basic introduction - Fourth edition. London: Pluto Press.). A primeira década dos anos 2000 também é marcada pelas operações Summer Rains (2006) e Cast Lead (2008), realizadas por Israel em Gaza. No Gráfico 6 é possível notar que a tendência emocional volta a ser positiva a partir de 2008 e 2009. Merece destaque a chegada de Barack Obama à presidência dos Estados Unidos, aumentando o engajamento americano no processo de paz (Harms & Ferry, 2017Harms, G. & Ferry, T.M. (2017) The Palestine-Israel conflict: a basic introduction - Fourth edition. London: Pluto Press.). A partir de 2011 temos uma volta à tendência de sentimentos negativos, provavelmente influenciada pelo início da Primavera Árabe, que causou distúrbios no norte da África e no Oriente Médio, o que inclui as regiões que são palco do conflito Israel-Palestina. Em 2013, o representante israelense proferiu um discurso que citava a Primavera Árabe de forma negativa:

“(...) Para todos aqueles que acreditavam que a chamada Primavera Árabe resultaria no desabrochar de um novo Oriente Médio, tomem nota - a democracia ainda não se enraizou. Em vez disso, o que vimos foi mais derramamento de sangue e mais violência. Para realmente estabelecer a paz, precisamos construir uma estrutura que possa resistir aos fortes ventos da mudança que estão varrendo a região. (...)”12 12 Tradução livre. Código do discurso: “UNSC_2013_SPV.6950_spch006.txt”.

A partir de 2011, alguns encontros do CSNU sobre o conflito Israel-Palestina também passam a incluir em seus debates discussões sobre a situação na Síria, ator importante no conflito. É possível que uma parte dos sentimentos negativos expressos a partir de 2011 tenham como alvo o controverso governo de Bashar al-Assad, além de preocupações mais gerais sobre os rumos da Primavera Árabe. Nota-se, também, que a representação palestina no CSNU não seguiu uma tendência negativa a partir de 2011. Essa especificidade poderia ser mais aprofundada a partir de consulta dos próprios discursos e da literatura qualitativa. Sabe-se, por exemplo, que em 2012 a Palestina foi reconhecida pela Assembleia Geral da ONU como “Estado Observador Não Membro” e que, em 2014, a resolução 2334 foi aprovada no CSNU, condenando a prática de assentamentos de Israel, com abstenção dos Estados Unidos (Harms & Ferry, 2017Harms, G. & Ferry, T.M. (2017) The Palestine-Israel conflict: a basic introduction - Fourth edition. London: Pluto Press.). São, ambos, momentos positivos para a representação palestina. Por outro lado, as operações israelenses Pillar of Defense (2012) e Protective Edge (2014) (Harms & Ferry, 2017Harms, G. & Ferry, T.M. (2017) The Palestine-Israel conflict: a basic introduction - Fourth edition. London: Pluto Press.) ilustram o persistente ciclo de violência que marca o enfrentamento. Em 2013, o representante palestino mencionou de forma positiva o reconhecimento da Palestina como “Estado Observador Não Membro”:

“(...) Tenho a honra de me dirigir ao Conselho de Segurança hoje pela primeira vez em nome do Estado da Palestina após a decisão histórica da Assembleia Geral de conceder à Palestina o status de Estado não-membro observador nas Nações Unidas com a adoção da resolução 67/19, em 29 de novembro de 2012. O apoio esmagador dos Estados-Membros a essa iniciativa é um reflexo do forte apoio aos direitos inalienáveis e às aspirações nacionais legítimas do povo palestino, incluindo o direito à autodeterminação e a uma vida de liberdade e dignidade em seu Estado independente da Palestina, com Jerusalém Oriental como sua capital. Esse apoio representa claramente o reconhecimento há muito esperado por parte da Assembleia da Palestina como um Estado. Uma nova era começou e esperamos que marque um ponto de virada para tornar a paz e a segurança uma realidade entre os povos palestino e israelense e na região como um todo. (...)”13 13 Tradução livre. Código do discurso: “UNSC_2013_SPV.6906_spch004.txt”.

Diante dos exemplos anteriores sobre o CSNU, de forma geral, e sobre o conflito Israel-Palestina, especificamente, é possível perceber como a abordagem do “texto como dado” fornece uma análise bem-informada e consistente sobre os acontecimentos reais e inflexões expressos no conteúdo dos discursos sem a necessidade de intensa dedicação manual prévia. Considerando o caso acima sobre a contenda Israel-Palestina, vemos que a utilização de um dicionário de sentimentos nos permite uma primeira observação sobre o comportamento de diferentes atores ao longo do tempo, identificando períodos de maior ou menor positividade.

Uma forma de aprofundar a investigação seria, por exemplo, analisar quais os sujeitos ou as situações que despertam sentimentos negativos. Na verdade, existem múltiplos caminhos para continuar a exploração dos dados, não percorridos neste artigo por questão de espaço: identificar quais as palavras negativas mais frequentes para cada país e quais as palavras que mais aparecem ao redor delas, comparando os dois atores quanto à frequência relativa destas palavras; ou aplicar o dicionário de sentimentos não aos discursos inteiros, mas apenas aos trechos em que um determinado sujeito ou um termo chave é citado e calcular a semelhança entre os discursos dos atores, para verificar quais são mais próximos e distantes entre si. Ressalte-se, no entanto, que o recurso a métodos que tratam o texto como dados quantitativos pode ser insuficiente de acordo com a pergunta de pesquisa que se pretende responder.

Nesse sentido, para estudos ainda mais profundos que operam conceitos complexos, surge a oportunidade de o pesquisador adotar uma perspectiva metodológica mista (mixed methods design). Para tanto, pode-se complementar os resultados da abordagem do “texto como dado” com uma leitura atenta do acervo ou de discursos selecionados, utilizando, assim, técnicas do enfoque do “texto como texto”. A ótica qualitativa, por sua vez, pode focar em textos ou até mesmo em trechos específicos que podem ser escolhidos levando em conta aquilo que a análise quantitativa revelou. Portanto, é preciso enfatizar que o verdadeiro potencial da abordagem do “texto como dado” é liberado através de sua combinação com técnicas da abordagem do “texto como texto”, produzindo resultados robustos tanto em termos de alcance quanto de profundidade ao agregar valor às pesquisas em RI.

VI. Considerações Finais

Discursos, pronunciamentos, artigos de opinião, entrevistas, matérias de jornal, tratados internacionais, leis, dentre outras expressões orais e escritas, são marcadas pelo objetivo de comunicar. A evolução tecnológica tornou possível o armazenamento de grande volume de documentos, de imagens, de áudios e de vídeos que podem ser convertidos em textos. Hoje, é viável aos pesquisadores das Ciências Humanas o uso da abordagem do “texto como dado” para sua análise (Grimmer et al., 2021Grimmer, J., Roberts, M.E. & Stewart, B.M. (2021) Machine learning for social science: an agnostic approach. Annual Review of Political Science, 24(1), pp. 395-419. DOI:doi
doi...
). Nesse conjunto de disciplinas, as Relações Internacionais ocupam lugar de destaque. Como faz Michel Foucault ao inverter a famosa frase de Clausewitz e afirmar que “a política é a guerra continuada por outros meios” (Foucault, 2016Foucault, M. (2016) Em defesa da sociedade. São Paulo: WMF Martins Fontes., p. 22), fica patente como a comunicação cumpre papel fundamental na relação e liturgia diplomáticas entre as nações. As pesquisas em Relações Internacionais têm muito a contribuir a partir da abordagem do “texto como dado”.

Neste artigo, apresentamos as principais técnicas de análise textual a partir de um continuum que vai da abordagem do “texto como texto” ao “texto como dado”. Quanto mais a análise textual está próxima da primeira, maior a ênfase na leitura manual das fontes e na interpretação direta do conteúdo do texto, conferindo teor qualitativo à pesquisa. Na abordagem do “texto como texto” é possível: detectar as nuances e a complexidade da comunicação, como metáforas e ironias; associar o conteúdo com o contexto no qual foi produzido; além de tornar viável uma leitura à luz de conceitos e princípios difíceis de serem operacionalizados por uma abordagem automatizada. Por seu turno, pesquisas que utilizam técnicas mais próximas da abordagem do “texto como dado” envolvem menor grau de interpretação direta e maior aplicação de recursos computacionais para análises automatizadas de texto. Os ganhos provenientes da utilização da última abordagem são principalmente quantitativos, de escala, pois, especialmente através da inferência estatística, permitem análises sobre grandes quantidades de textos (que a leitura manual não seria capaz de contemplar) e identificação de padrões de forma sistematizada.

Através de uma breve revisão da literatura de RI no Brasil que utiliza as abordagens do “texto como texto” e do “texto como dado”, percebemos como a última ainda se encontra pouco explorada, com uma maioria de trabalhos mais próximos da abordagem do “texto como texto”. Para incentivar a realização de pesquisas com a abordagem do “texto como dado”, apresentamos um exemplo replicável de aplicação da técnica de análise de sentimento ao corpus contendo os discursos proferidos do CSNU entre 1995 e 2019. É importante destacar, através do exemplo, a importância do conhecimento sobre o contexto de produção dos textos a serem analisados e a utilização de fontes qualitativas para interpretação dos resultados.

A automatização da análise textual é útil para viabilizar análises sistematizadas e pesquisas em larga escala, mas não dispensa a necessidade de um bom desenho de pesquisa, de leitura manual e de interpretação direta do conteúdo de interesse. Uma aplicação eficiente da abordagem do “texto como dado” depende de um bom repertório qualitativo e científico sobre o objeto de estudo. Ademais, a abordagem do “texto como dado” não só possibilita a realização de estudos quantitativos sobre fontes textuais, mas também fornece ferramentas úteis para o desenvolvimento de estudos qualitativos, potencializando o uso de métodos mistos.

Tornar as metodologias contemporâneas de análise do “texto como dado” mais acessíveis aos pesquisadores no campo das Relações Internacionais é o desafio que enfrentamos com esse artigo. Esperamos que novos trabalhos se aventurem por todo o continuum que vai do “texto como texto” ao “texto como dado”, de sua interpretação direta à sua forma automatizada, com toda a potência que existe em sua combinação. Uma vez que o Brasil é um ator estratégico na geopolítica mundial, almejamos estimular a produção acadêmica nacional nessa área.

  • 1
    Agradecemos aos comentários e sugestões dos pareceristas anônimos da Revista de Sociologia e Política e ao Prof. Dr. Danilo Freire por disponibilizar template que permitiu o desenvolvimento desse artigo em Rmarkdown.
  • 2
    Para mais detalhes, veja Izumi & Moreira (2018)Izumi, M.Y. & Moreira, D.C. (2018) O texto como dado: desafios e oportunidades para as ciências sociais. Revista Brasileira De Informação Bibliográfica Em Ciências Sociais, 2(86), pp. 138-174. ou Grimmer & Stewart (2013)Grimmer, J. & Stewart, B.M. (2013) Text as data: the promise and pitfalls of automatic content analysis methods for political texts. Political Analysis, 21(3), pp. 267/297. DOI:doi
    doi...
    .
  • 3
    Para mais detalhes, veja Izumi & Moreira (2018)Izumi, M.Y. & Moreira, D.C. (2018) O texto como dado: desafios e oportunidades para as ciências sociais. Revista Brasileira De Informação Bibliográfica Em Ciências Sociais, 2(86), pp. 138-174. ou Grimmer & Stewart (2013)Grimmer, J. & Stewart, B.M. (2013) Text as data: the promise and pitfalls of automatic content analysis methods for political texts. Political Analysis, 21(3), pp. 267/297. DOI:doi
    doi...
    .
  • 4
    Para conhecer um exemplo de aplicação ao caso brasileiro, ver Moreira (2020)Moreira, D. (2020) Com a palavra os nobres deputados: ênfase temática dos discursos dos parlamentares brasileiros. Dados, 63(1), pp. 1-37. DOI:doi
    doi...
    .
  • 5
    Exemplos: como ideologia (Slapin & Proksch, 2008Slapin, J.B. & Proksch, S. (2008) A scaling model for estimating time-series party positions from texts. American Journal of Political Science, 52(3), pp. 705-722. DOI:doi
    doi...
    ), preferência sobre a política ambiental (Klüver, 2009Klüver, H. (2009) Measuring interest group influence using quantitative text analysis. European Union Politics, 10(4), pp. 535-549. DOI:doi
    doi...
    ), apoio ou oposição à austeridade no orçamento (Lowe & Benoit, 2013Lowe, W. & Benoit, K. (2013) Validating estimates of latent traits from textual data using human judgment as a benchmark. Political Analysis, 21(3), pp. 298-313. DOI:doi
    doi...
    ), preferências para o nível de integração europeia (Proksch & Slapin, 2010Proksch, S. & Slapin, J.B. (2010). Position taking in European Parliament speeches. British Journal of Political Science, 40(3), pp. 587-611. DOI:doi
    doi...
    ), entre outros.
  • 6
    Tradução livre. Código do discurso: “UNSC_2010_SPV.6464_spch018.txt”.
  • 7
    Tradução livre. Código do discurso: “UNSC_2015_SPV.7419_spch101.txt”.
  • 8
    Tradução livre. Código do discurso: “UNSC_2015_SPV.7493_spch002.txt”.
  • 9
    Tradução livre. Código do discurso: “UNSC_2004_SPV.4934_spch011.txt”.
  • 10
    Tradução livre. Código do discurso: “UNSC_2018_SPV.8183_spch006.txt”.
  • 11
    Tradução livre. Código do discurso: “UNSC_2000_SPV.4231_spch004.txt”.
  • 12
    Tradução livre. Código do discurso: “UNSC_2013_SPV.6950_spch006.txt”.
  • 13
    Tradução livre. Código do discurso: “UNSC_2013_SPV.6906_spch004.txt”.

Referências

  • Acharya, A. (2013) The R2P and norm diffusion: towards a framework of norm circulation. Global Responsibility to Protect, 5(4), pp. 466-479. DOI:doi
    » doi
  • Bastos, M. & Mercea, D. (2018) Parametrizing Brexit: mapping Twitter political space to parliamentary constituencies. Information, Communication & Society, 21(7), pp. 921-939. DOI:doi
    » doi
  • Baumgartner, F.R., Green-Pedersen, C. & Jones B.D. (2006) Comparative studies of policy agendas. Journal of European Public Policy, 13(7), pp. 959-74. DOI:doi
    » doi
  • Benoit, K. (2020) Text as data: an overview. In: L. Curini & R. Franzese (orgs) The SAGE handbook of research methods in political science and international relations Thousand Oaks: SAGE Publishing Ltd, pp. 461-497.
  • Benoit, K., Laver, M., Arnold, C., Pennings, P. & Hosli, M.O. (2005) Measuring national delegate positions at the convention on the future of Europe using computerized word scoring. European Union Politics, 6(3), pp. 291-313. DOI:doi
    » doi
  • Benoit, K., Munger, K. & Spirling, A. (2019) Measuring and explaining political sophistication through textual complexity. American Journal of Political Science, 63(2), pp. 491-508. DOI:doi
    » doi
  • Benoit, K., Watanabe, K., Wang, H., Nulty, P., Obeng, A., Müller, S. & Matsuo, A. (2018) Quanteda: an R package for the quantitative analysis of textual data. Journal of Open Source Software, 3(30), p. 774. DOI:doi
    » doi
  • Blei, D.M., Ng, A.Y. & Jordan, M.I. (2003) Latent dirichlet allocation. The Journal of Machine Learning Research, 3, pp. 993-1022.
  • Budge, I., Klingemann, H. & Volkens, A. (2001) Mapping policy preferences: estimates for parties, electors, and governments 1945-1998 Oxford; New York.
  • Budge, I., Robertson, D. & Hearl, D. (1987) Ideology, strategy and party change: spatial analyses of post-war election programmes in 19 democracies Cambridge: Cambridge University Press. DOI:doi
    » doi
  • Clausewitz, Carl von. (1996) Da Guerra 2. ed. São Paulo: Martins Fontes e Brasília: EdUNB.
  • Dijk, T.A. van (1994). Critical discourse analysis. Discourse & Society, 5(4), pp. 435-436. DOI:doi
    » doi
  • Dijk, T.A. van (1997) What is political discourse analysis? Belgian Journal of Linguistics, 11(1). pp. 11-52. DOI:doi
    » doi
  • Dooremalen, T. van & Uitermark, J. (2020) The framing of 9/11 in American, French, and Dutch national newspapers (2001-2015): an inductive approach to studying events. International Sociology, 36(3), pp. 464-488. DOI:doi
    » doi
  • Dunne, T., Kurki, M. & Smith, S. (2013) International Relations Theories Oxford: OUP Oxford.
  • Eun, Y. (2017) To what extent is post-positivism ‘practised’ in international relations? Evidence from China and the USA. International Political Science Review, 38(5), pp. 593-607. DOI:doi
    » doi
  • Fang, X. & Zhan, J. (2015) Sentiment analysis using product review data. Journal of Big Data, 2(5), pp. 1-14. DOI:doi
    » doi
  • Foucault, M. (1996) A ordem do discurso - Aula inaugural no Collège de France, pronunciada em 2 de dezembro de 1970 São Paulo: Edições Loyola.
  • Foucault, M. (2016) Em defesa da sociedade São Paulo: WMF Martins Fontes.
  • Goodfellow, I., Bengio, Y. & Courville, A. (2016) Deep learning Cambridge: The MIT Press.
  • Grimmer, J. & Stewart, B.M. (2013) Text as data: the promise and pitfalls of automatic content analysis methods for political texts. Political Analysis, 21(3), pp. 267/297. DOI:doi
    » doi
  • Grimmer, J. (2010) A Bayesian hierarchical topic model for political texts: measuring expressed agendas in Senate press releases. Political Analysis, 18(1), pp. 1-35. DOI:doi
    » doi
  • Grimmer, J., Roberts, M.E. & Stewart, B.M. (2021) Machine learning for social science: an agnostic approach. Annual Review of Political Science, 24(1), pp. 395-419. DOI:doi
    » doi
  • Harms, G. & Ferry, T.M. (2017) The Palestine-Israel conflict: a basic introduction - Fourth edition London: Pluto Press.
  • Hertel-Fernandez, A. & Kashin, K., [s.d.]. Capturing business power across the states with text reuse govposters Disponível em: https://projects.iq.harvard.edu/govposters/file/357876 Acesso em: 15 de set. 2021.
    » https://projects.iq.harvard.edu/govposters/file/357876
  • Hutcheson, J., Domke, D., Billeaudeaux, A. & Garland, P. (2004) U.S. national identity, political elites, and a patriotic press following September 11. Political Communication, 21(1), pp. 27-50. DOI:doi
    » doi
  • Izumi, M.Y. & Moreira, D.C. (2018) O texto como dado: desafios e oportunidades para as ciências sociais. Revista Brasileira De Informação Bibliográfica Em Ciências Sociais, 2(86), pp. 138-174.
  • Jackson, R. & Sørensen, G. (2018) Introdução às relações internacionais - 3a edição revista e ampliada: teorias e abordagens Rio de Janeiro: Zahar.
  • Jagers, J. & Walgrave, S. (2007) Populism as political communication style: an empirical study of political parties’ discourse in Belgium. European Journal of Political Research, 46(3), pp. 319-45. DOI:doi
    » doi
  • Joachims, T. (1999) Transductive inference for text classification using support vector machines. In: Proceedings of the Sixteenth International Conference on Machine Learning, pp. 200-209. ICML ‘99. San Francisco: Morgan Kaufmann Publishers Inc.
  • Klüver, H. (2009) Measuring interest group influence using quantitative text analysis. European Union Politics, 10(4), pp. 535-549. DOI:doi
    » doi
  • Krippendorff, K.H. (2012) Content analysis: an introduction to its methodology Los Angeles: Sage Publications, Inc.
  • Lai, S., Xu, L., Liu, K. & Zhao, J. (2015) Recurrent convolutional neural networks for text classification. In: Proceedings of the Twenty-Ninth AAAI Conference on Artificial Intelligence, pp. 2267-2273. AAAI’15. Austin: AAAI Press.
  • Laver, M., Benoit, K. & Garry, J. (2003) Extracting policy positions from political texts using words as data. American Political Science Review, 97(2), pp. 311-331. DOI:doi
    » doi
  • Li, Q. (2019) The second great debate revisited: exploring the impact of the qualitative-quantitative divide in international relations. International Studies Review, 21(3), pp. 447-476. DOI:doi
    » doi
  • Lowe, W. & Benoit, K. (2013) Validating estimates of latent traits from textual data using human judgment as a benchmark. Political Analysis, 21(3), pp. 298-313. DOI:doi
    » doi
  • Maliniak, D., Oakes, A., Peterson S. & Tierney M.J. (2011) International relations in the US academy. International Studies Quarterly, 55(2), pp. 437-464. DOI:doi
    » doi
  • Medeiros, M.A., Barnabé, I., Albuquerque, R. & Lima, R. (2016) What does the field of international relations look like in South America? Revista Brasileira de Política Internacional, 59(1), e004. DOI:doi
    » doi
  • Medzihorsky, J., Popovic, M. & Jenne, E.K. (2017) Rhetoric of civil conflict management: United Nations Security Council debates over the Syrian civil war. Research & Politics, 4(2), pp. 1-10. DOI:doi
    » doi
  • Mesquita, R. & Medeiros, M.A. (2016) Legitimising emerging power diplomacy: an analysis of government and media discourses on Brazilian foreign policy under Lula. Contexto Internacional, 38(1), pp. 385-432. DOI:doi
    » doi
  • Messari, N. & Nogueira, J.P. (2005) Teoria das relações internacionais - correntes e debates Rio de Janeiro: GEN Atlas.
  • Mikolov, T., Sutskever, I., Chen, K., Corrado, G. & Dean, J. (2013) Distributed representations of words and phrases and their compositionality. arXiv:1310.4546 [cs, stat] Disponível em: http://arxiv.org/abs/1310.4546 Acesso em: 15 de set. 2021.
    » http://arxiv.org/abs/1310.4546
  • Minqing, H. & Bing, L. (2004) Mining and summarizing customer reviews. In: Proceedings of the Tenth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp. 168-177. KDD ‘04. New York: Association for Computing Machinery. DOI:doi
    » doi
  • Monroe, B.L. & Schrodt, P.A. (2008a) Introduction to the special issue: the statistical analysis of political text. Political Analysis, 16(4), pp. 351-355. DOI:doi
    » doi
  • Monroe, B.L. & Schrodt, P.A. (2008b) Introduction to the special issue: the statistical analysis of political text. Political Analysis, 16(4), pp. 351-355. Disponível em: https://econpapers.repec.org/article/cuppolals/v_3a16_3ay_3a2008_3ai_3a04_3ap_3a351-355_5f00.htm Acesso em: 15 de set. 2021.
    » https://econpapers.repec.org/article/cuppolals/v_3a16_3ay_3a2008_3ai_3a04_3ap_3a351-355_5f00.htm
  • Moreira, D. (2020) Com a palavra os nobres deputados: ênfase temática dos discursos dos parlamentares brasileiros. Dados, 63(1), pp. 1-37. DOI:doi
    » doi
  • Nielsen, F.Å. (2011) A new ANEW: evaluation of a word list for sentiment analysis in microblogs. arXiv:1103.2903 [cs]. Disponível em: http://arxiv.org/abs/1103.2903 Acesso em: 15 de set. 2021.
    » http://arxiv.org/abs/1103.2903
  • Pang, B., Lee, L. & Vaithyanathan, S. (2002) Thumbs up? Sentiment classification using machine learning techniques. In: Proceedings of the 2002 Conference on Empirical Methods in Natural Language Processing (EMNLP 2002), pp. 79-86. Doha: Association for Computational Linguistics. DOI:doi
    » doi
  • Pennington, J., Socher, R. & Manning, C. (2014) GloVe: global vectors for word representation. In: Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP), pp. 1532-1543. Doha: Association for Computational Linguistics. DOI:doi
    » doi
  • Perry, P.O. & Benoit, K. (2017) Scaling text with the class affinity model. arXiv:1710.08963 [cs, stat], outubro. Disponível em: http://arxiv.org/abs/1710.08963 Acesso em: 15 de set. 2021.
    » http://arxiv.org/abs/1710.08963
  • Peters, M.E., Neumann, M., Iyyer, M., Gardner, M., Clark, C., Lee, K. & Zettlemoyer, L. (2018) Deep contextualized word representations. In: Proceedings of the 2018 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies, Volume 1 (Long Papers), pp. 2227-2237. New Orleans, Louisiana: Association for Computational Linguistics. DOI:doi
    » doi
  • Proksch, S. & Slapin, J.B. (2010). Position taking in European Parliament speeches. British Journal of Political Science, 40(3), pp. 587-611. DOI:doi
    » doi
  • Roberts, M., Stewart, B. & Tingley, D. (2019) stm: R package for structural topic models. Journal of Statistical Software, 91(2), pp. 1-40. DOI:doi
    » doi
  • Roberts, M.E. (2016) Introduction to the virtual issue: recent innovations in text analysis for social science Disponível em: http://oxfordjournals.org/our_journals/polana/text-as-data.pdf Acesso em: 15 de set. 2021.
    » http://oxfordjournals.org/our_journals/polana/text-as-data.pdf
  • Sakamoto, T. (2020) Cross-national analysis of global security discourse using word embeddings. APSA Preprints DOI:doi
    » doi
  • Sampaio, R. & Sousa, D. (2018) Eu quero acreditar! Da importância, formas de uso e limites dos testes de confiabilidade na análise de conteúdo. Revista de Sociologia e Política, 26(66), pp. 31-47. DOI:doi
    » doi
  • Santos, M.H.C. (2010) Exportação de democracia na política externa norte-americana no pós-Guerra-Fria: doutrinas e o uso da força. Revista Brasileira de Política Internacional 53(1), pp. 157-191. DOI:doi
    » doi
  • Schonhardt-Bailey, C. (2003) Ideology, Party and Interests in the British Parliament of 1841-1847. British Journal of Political Science, 33(4), pp. 581-605. DOI:doi
    » doi
  • Slapin, J.B. & Proksch, S. (2008) A scaling model for estimating time-series party positions from texts. American Journal of Political Science, 52(3), pp. 705-722. DOI:doi
    » doi
  • Spirling, A. (2015) Democratization and linguistic complexity: the effect of franchise extension on parliamentary discourse, 1832-1915. The Journal of Politics, 78(1), pp. 120-136. DOI:doi
    » doi
  • Taddy, M. (2013) Multinomial inverse regression for text analysis. Journal of the American Statistical Association, 108(503), pp. 755-770. DOI:doi
    » doi
  • Vilela, E. & Neiva, P. (2011) Temas e regiões nas políticas externas de Lula e Fernando Henrique: comparação do discurso dos dois presidentes. Revista Brasileira de Política Internacional, 54(2), pp. 70-96. DOI:doi
    » doi
  • Wendt, A. (2004) The state as person in international theory. Review of International Studies, 30(2), pp. 289-316. DOI:doi
    » doi
  • Wilkerson, J., Smith, D. & Stramp, N. (2015) Tracing the flow of policy ideas in legislatures: a text reuse approach. American Journal of Political Science, 59(4), pp. 943-956. DOI:doi
    » doi
  • Young, L. & Soroka, S. (2012) Affective news: the automated coding of sentiment in political texts. Political Communication, 29(2), pp. 205-231. DOI:doi
    » doi

Outras fontes

Anexo metodológico

Para a revisão de literatura, as revistas pesquisadas foram as seguintes: Brazilian Political Science Review, Caderno CRH, Contexto Internacional, Dados, Economia e Sociedade, Estudos Avançados, História (São Paulo), Lua Nova, Revista Brasileira de Ciências Sociais, Revista Brasileira de Política Internacional, Revista de Estudos Feministas, Revista de Sociologia e Política, Sociologias e Varia História. As palavras-chave buscadas foram exatamente as seguintes: “analise de conteudo”, “análise de conteúdo”, “content analysis”, “sentiment analysis”, “análise de sentimento”, “analise de sentimento”, “frequencia termo”, “nvivo”, “text mining”, “textmining”, “textsmart”, “word frequency”, “wordfrequency”, “wordstat”, “word as data”, “words as data”, “text as data”, “texts as data”, “texto como dado”, “palavras como dados”, “textos como dados”, “palavra como dados”, “maxqda”, “analise de discurso”, “analise do discurso”, “discourse analysis”, “bakhtin”, “charaudeau”, “fairclough”, “ideological square”, “quadrado ideológico”, “interdiscoursive”, “interdiscursivo”, “maingueneau”, “orlandi”, “pecheux”, “vandijk”. Essa lista de palavras e expressões foi selecionada a partir do apêndice metodológico do trabalho de Medeiros et al. (2016). A lista completa dos artigos e revistas selecionados pode ser encontrada no arquivo ri-txt-papers-bra.xlsx no repositório do OSF indicado na seção Outras Fontes. Caso o artigo tenha adotado mais de uma das categorias presentes no continuum, este foi classificado na categoria mais à direita do espectro.

Durante realização da análise de sentimentos, algumas palavras foram removidas devido à ambiguidade e problema de erro de mensuração. Foram removidas 7 palavras positivas e 1 palavra negativa: united (referência às Nações Unidas), like (indicação de que se gostaria de iniciar um discurso ou pronunciamento), special (agentes da ONU como Enviados Especiais e Representantes Especiais), civil (referência a civis em conflitos), comprehensive (adjetiva relatórios e briefings, como na expressão comprehensive report), principle (referência a princípios da Carta da ONU ou de Direito Internacional), resolution (resoluções adotadas pela ONU), too (advérbio de intensidade).

Datas de Publicação

  • Publicação nesta coleção
    19 Set 2022
  • Data do Fascículo
    2022

Histórico

  • Recebido
    24 Mar 2021
  • Aceito
    06 Jul 2021
  • Revisado
    24 Set 2021
Universidade Federal do Paraná Rua General Carneiro, 460 - sala 904, 80060-150 Curitiba PR - Brasil, Tel./Fax: (55 41) 3360-5320 - Curitiba - PR - Brazil
E-mail: editoriarsp@gmail.com