RESUMO
Este artigo relata uma investigação versada na identificação de posicionamentos jornalísticos por meio da utilização de modelos algoritmos embasados no processamento de linguagem natural. Para tanto, um estudo de caso comparativo entre Brasil e Portugal é apresentado, com foco na identificação e análise de posicionamentos de portais de notícias digitais em relação a questões políticas associadas às campanhas de vacinação contra a covid-19 nos anos de 2021 e 2022. São considerados cinco veículos jornalísticos de cada país, com base em critérios de popularidade. O percurso metodológico é fundamentado no uso de ferramentas computacionais de produção própria para extração de dados e análise, sobretudo no âmbito de processamento de linguagem natural (PLN), a fim de rotular os textos conforme os posicionamentos expressos (análise de sentimentos). Os resultados revelam uma majoração ao negativo por parte dos jornais brasileiros e um cenário de equilíbrio no debate delineado nos jornais portugueses.
PALAVRAS-CHAVE
jornalismo; análise de sentimentos; vacinação; covid-19
ABSTRACT
This paper reports an investigation versed in identifying journalistic stances through the utilization of algorithmic models based on natural language processing. To this end, a comparative case study between Brazil and Portugal is presented, focusing on the identification and analysis of digital news portals regarding political issues associated with covid-19 vaccination campaigns in the years 2021 and 2022. Five journalistic outlets from each country are considered based on popularity criteria. The methodological approach is grounded in the use of computational tools for data extraction and analysis, particularly within the scope of natural language processing (NLP), in order to label the texts according to expressed stances (sentiment analysis). The results reveal an increase in negative sentiment in Brazilian newspapers and a scenario of balance in the debate outlined in Portuguese newspapers.
KEYWORDS
journalism; sentiment analysis; vaccination; covid-19
INTRODUÇÃO
A democratização de acesso às tecnologias de informação e comunicação, assim como os avanços tecnológicos alcançados no âmbito da internet, resultaram na imersão de um cenário em que os meios tradicionais de comunicação deixaram de ser fontes exclusivas de informação, entrando em cena as redes sociais, os aplicativos de mensagens e os inumeráveis sítios que fornecem informações sem necessariamente uma garantia de fonte (Catalina, Sousa e Sousa, 2019). Neste contexto, o trabalho desempenhado por jornalistas tornou-se fundamental em diversas questões, como é o caso da veiculação de notícias na área da saúde. O jornalismo na saúde é algo de grande importância, tendo seus estudos remetidos à interdisciplinarização entre as ciências da comunicação e as ciências da saúde (Lee e McElroy, 2019).
Ante as necessidades informacionais atreladas às questões de saúde provocadas pela crise sanitária da pandemia da covid-19, observou-se uma grande demanda e necessidade por informações precisas, relevantes, rápidas e imparciais (Mohammadi et alii, 2021). No contexto de Portugal, Lopes et alii (2020) afirmam que a pandemia da covid-19 acabou por se mostrar um importante marco para o jornalismo português, em que veículos jornalísticos se consolidaram enquanto frentes de enfrentamento à pandemia, com discursos voltados para a circulação de informações de apoio ao não contágio e às medidas de segurança sanitária. No Brasil, de maneira ligeiramente similar, o jornalismo enquanto fonte informacional se viu envolta a manifestações por parte da sociedade em busca de informações fidedignas e apartidárias, voltadas a uma orientação da verdade (Varão e Ferreira, 2020).
O ciberjornalismo se destaca por sua capacidade de circulação de maneira rápida e abrangente, além da possibilidade de interação entre jornalistas e população por meio de ferramentas disponíveis nos portais jornalísticos (Ferrari, 2014). Neste âmbito, a discussão pública e a natureza plural do fenômeno noticioso acabam por proporcionar um ambiente diversificado de visões, corroborando para análises mais profundas e críticas sobre um determinado problema (Peeters e Maeseele, 2023). Tal característica enriquece o debate público e se alinha ao próprio exercício da cidadania (Miguel e Biroli, 2010). Entretanto, ao mesmo tempo, em um universo plural, o acesso individualizado e restrito pode ir ao encontro à formação de opiniões e visões enviesadas para com o ponto de vista do jornalista ou do veículo de comunicação (Helberger, 2020).
Além disso, é importante pontuar que fatores históricos, políticos, sociais e culturais também possuem influência sobre as abordagens jornalísticas de determinadas regiões, refletindo diferenças estruturais como o próprio papel da imprensa na sociedade e a natureza do debate público (Reis e Sousa, 2017; Albuquerque, 2019). Estudos sobre a midiatização da saúde em Portugal indicam uma predominância de fontes governamentais e institucionais, com a mídia priorizando essas fontes em razão da sua habilidade comunicativa (Lopes et alii, 2012). Essa tendência, embora resulte em um jornalismo menos polarizado e mais alinhado a uma tradição europeia de mediação institucional (Williams, 2006), pode limitar a participação de vozes cidadãs e a expressão de sentimentos (Gomes, 2020). Em contraste, o Brasil enfrenta um cenário midiático mais dinâmico e crítico, marcado pela polarização política e por eventos críticos ligados ao populismo (André et alii, 2024). Essa polarização, que deslegitima os veículos tradicionais (Fernandes et alii, 2021), foi intensificada pela crise da covid-19 e pelo conflito entre o governo Bolsonaro e a imprensa (Mello, 2021).
Neste cenário, a compreensão das variações sobre possíveis posicionamentos dos veículos de notícias quanto a temas específicos é algo de grande relevância. Face a isso, o presente estudo apresenta um percurso da aplicação de estratégias provenientes do uso de soluções algorítmicas de processamento de linguagem natural, de produção própria, como mecanismo de identificação de sentimentos em textos noticiosos publicados na internet. Para tanto, é realizado um estudo de caso comparativo de posicionamentos das mídias jornalísticas, brasileira e portuguesa, com base em um conjunto de peças jornalísticas veiculadas em formato digital, as quais referenciam a pandemia da covid-19 e as campanhas vacinais. Embora a temática covid-19 seja densamente explorada na literatura científica, considera-se que pontos específicos, como é o caso da abordagem utilizada, ainda demandam investigação.
MATERIAIS E MÉTODOS
A presente investigação possui uma abordagem quantitativa-qualitativa. O viés quantitativo é voltado, principalmente, à geração de resultados bom base na exploração de métodos de análise estatística. Enquanto o viés qualitativo tem foco na identificação das informações circulantes e dos sentimentos associados a tais informações por parte dos portais de notícias, analisados na perspectiva das abordagens de comunicação e nas relações com possíveis posicionamentos sobre as estratégias de enfrentamento da covid-19 por parte das autoridades sanitárias. As análises são instrumentalizadas por meio do processo Descoberta do Conhecimento em Bases de Dados (Knowledge Discovery in Databases, KDD), proposto por Fayyad, Shapiro-Piatetsky e Smith (1996), com aplicação de soluções de classificação temática e análise de sentimentos (Figura 1).
Para a composição da base de dados, foram selecionados dez diferentes jornais com veiculação digital, sendo cinco brasileiros e cinco portugueses. A escolha foi baseada na relevância em termos de popularidade de busca e acesso, pela observação de dados na ferramenta Google Trends, considerando os anos de 2021 e 2022. Para o Brasil, foram considerados os sites elencados no Quadro 1, os quais incluem plataformas provenientes de jornais que originalmente foram criados com foco na mídia impressa e plataformas nativas digitais. Todos os sites possuem mecanismo próprio de busca indexada direta, com exceção do jornal Poder360 que utiliza solução integrada do buscador Google.
O Gráfico 1 apresenta a popularidade dos jornais brasileiros em 2021 e 2022. O portal de notícias G1 exibe popularidade notavelmente superior aos demais jornais digitais, o que tornou necessária a utilização de estratégia de visualização baseada em segmentação descontínua de eixo, isto é, variação proporcional entre segmentos delimitados no gráfico. Os jornais Estadão, Folha de S. Paulo, Metrópoles e Poder360 possuem popularidade relativamente similar na ferramenta de monitoramento, com pequenas variações observadas em períodos específicos, o que não desqualifica a importância dos mesmos em relação ao interesse e acesso.
Para os jornais digitais portugueses foram considerados os cinco elencados no Quadro 2, os quais, de semelhante forma aos abordados no contexto do Brasil, apresentam jornais nativos digitais e jornais que foram criados com foco na mídia impressa. Foi identificado nos jornais Correio da Manhã e Público, mecanismo próprio de busca de notícias, enquanto nos jornais Diário de Notícias, Jornal de Notícias e Observador, foi identificada a utilização de ferramenta de pesquisa integrada do motor de busca Google.
Em termos de popularidade (Gráfico 2), o interesse de busca observado por avaliação de dados de monitoramento da ferramenta Google Trends revela uma proximidade entre os cinco jornais, com variações pontuais observadas durante o período analisado, isto é, os anos de 2021 e 2022. Cabe ressaltar que os jornais Correio da Manhã, Observador e Público apresentaram picos pontuais de popularidade, porém mantendo, de forma geral, valores próximos ao longo de toda a série temporal.
Para extração dos dados foi construído um script de raspagem de dados (Broucke e Baesens, 2018), usando a linguagem de programação Python. Embora os sites jornalísticos considerados possuam ferramentas nativas ou terceirizadas para a pesquisa de notícias, verificações prévias mostraram limitação destas ferramentas, principalmente na listagem temporal das notícias. Assim, foi considerada a listagem de notícias com base em busca direta por meio da indexação realizada pelo motor de busca Google, com delimitação de período temporal (2021 e 2022), fonte e termos de interesse (covid e vacina). A Figura 2 apresenta a visualização de uma pesquisa no buscador em que se especifica o site do jornal Poder360 para o período de fevereiro de 2021, com os termos covid e vacina. A utilização do operador lógico AND proporciona que os resultados alcançados na busca contenham ambos os termos de pesquisa.
O script de raspagem de dados acessa os sites das notícias para coletar os dados textuais, adaptando-se à estrutura específica de cada página com parametrizações ajustadas para identificar o conteúdo. Os dados obtidos contemplam os seguintes atributos: nome do jornal, país, data de publicação, título e texto da notícia. Durante a consolidação dos dados foram realizadas verificações quanto ao conteúdo textual recuperado. Estes conteúdos podem apresentar ocorrências de menções a publicidades ou chamadas a notícias correlatas dentro do espaço de corpo das notícias (Figura 3). A limpeza de dados é realizada com a aplicação de técnicas de expressões regulares (Fitzgerald, 2012).
A aplicação do processamento de linguagem natural (PLN) possibilita extrapolar estratégias clássicas de análise de conteúdo que se apropriam, de forma geral, de conjuntos amostrais limitados (Lucy et alii, 2020; Khurana et alii, 2023; Cordeiro, 2024). A classificação temática permite a identificação dos possíveis conteúdos para grupos distintos de elementos, sejam estes, frases, parágrafos ou documentos, que possuam similaridade entre si. Uma das principais estratégias para a classificação temática é o uso de técnicas de modelagem de tópicos, como o método Latent Dirichlet Allocation (LDA) (Blei, Ng e Jordan, 2003). O LDA parte da premissa de que documentos textuais seguem uma estrutura composta por combinações de tópicos, e cada tópico também é composto por uma combinação de termos, os quais normalmente possuem relações sintáticas ou semânticas. Na presente investigação, a técnica LDA, materializada por meio da construção de um script em linguagem de programação Python, é utilizada para identificar as classes temáticas (tópicos) das notícias extraídas.
A análise de sentimentos pode ser descrita como uma técnica de PLN que possui como objetivo a identificação e quantificação da polaridade emocional associada a um determinado elemento textual, comumente baseada nos rótulos positivo, neutro e negativo (Cordeiro et alii, 2022). Entre as soluções de análise de sentimentos está o Valence Aware Dictionary and sEntiment Reasoner (VADER), proposto por Hutto e Gilbert (2014), o qual se destaca por possuir grande capacidade de lidar com variações textuais que extrapolam a norma culta da escrita. Embora o VADER tenha foco na língua inglesa, a ramificação LeIA (Léxico para Inferência Adaptada) possibilita sua aplicação para a língua portuguesa (Almeida, 2018), sendo esta utilizada na presente investigação.
RESULTADOS E DISCUSSÕES
Foram consideradas 23.679 peças noticiosas para o conjunto amostral de jornais brasileiros e portugueses. Nesta seção são apresentados e comentados os resultados alcançados no contexto da análise de peças noticiosas relacionadas à vacinação contra a covid-19 com o uso de soluções computacionais inteligentes.
TEMAS E SIGNIFICADOS
O Gráfico 3 apresenta uma projeção da distribuição de grupos, em que se observa a existência de três grandes áreas temáticas. A primeira é composta pelos conjuntos de tópicos sinalizados como 1, 2 e 5; a segunda é referente ao conjunto de tópicos 4 e; finalmente, a terceira compreende o conjunto de tópicos 3. Os eixos representam as duas dimensões principais da projeção obtida, capturando a variação nos dados de tópicos em um espaço de características. Desta maneira, a distância visual entre os conjuntos revela a similaridade temática, isto é, quanto mais próximo estão dois conjuntos, mais semelhantes são as temáticas que possuem. O Gráfico 4 apresenta as nuvens de palavras segmentadas por tópicos.
O tópico 1 possui considerável destaque para os termos “gente” e “dose”, acompanhado por outros termos com menor evidência, como “família”, “vídeo”, “casa” e “vacinado”. Esse conjunto de termos faz menção a notícias mais específicas sobre procedimentos vacinais realizados na população, sobretudo noticiando casos de destaque. O modelo computacional utilizado para identificação de tópicos possibilita a mensuração de representativa dos documentos textuais, isto é, as notícias, associando um percentual que permite recuperar elementos centrais do corpus textual. Com base nisso, o Quadro 3 apresenta um conjunto das dez notícias de maior representatividade para o tópico 1, em que se observa a noticiabilidade da vacinação em pessoas, sobretudo, notadamente conhecidas pela sociedade.
Conforme pode ser observado no Gráfico 3, os conjuntos de tópicos 1 e 2 possuem uma alta intersecção. Entretanto, a nuvem de palavras do tópico 2 (Gráfico 4) apresenta termos que distam daqueles observados no tópico 1, tais como: “Bolsonaro”, “presidente” e “governo”, remetendo a questões relacionadas a ações, decisões e manifestações associadas ao governo, de forma geral, e ao presidente Jair Bolsonaro. O Quadro 4 apresenta as dez notícias centrais do tópico 2, em que se observa principalmente a exploração da repercussão de falas de autoridades e ações ocorridas no contexto do avanço do processo vacinal no Brasil. A proximidade entre os conjuntos de tópicos 1 e 2 se dá principalmente pela ocorrência de termos compartilhados de forma específica e manifestações por parte de pessoas sobre políticas e ações do governo.
O tópico 3 apresenta termos como: “dose”, “criança”, “prefeitura”, “unidade” e “secretaria”, representados pela nuvem de palavras no Gráfico 4-c. Neste contexto, se observa menção às ações de vacinação contra a covid-19, com informações sobre pontos de vacinação e testes de infecção. O Quadro 5 apresenta, em maiores detalhes, as dez notícias mais representativas deste tópico, em que se constata, inclusive, referência à vacinação de crianças e ações de prefeituras.
O Gráfico 4-d apresenta a nuvem de palavras para o tópico 4. Neste tópico, observam-se termos mais relacionados à doença no contexto clínico, centralizados por “caso” e “dose”, e acompanhados por termos como “estudo”, “pandemia”, “morte”, “vírus” e “dado”. Os avanços científicos alcançados ao longo da pandemia da covid-19 em termos de intervenções médicas, desenvolvimento de vacinas e estudos comportamentais foram notáveis (Tzenios, Chahine, Tazanio, 2023), sendo consideravelmente explorados e noticiados pela mídia (Valenti et alii, 2023). O Quadro 6 reproduz o recorte das dez notícias de maior representatividade para o grupo, em que se pode observar a ocorrência de notícias sobre a realização de estudos científicos abordando sintomas, riscos e associações a outras doenças.
O conjunto de notícias identificado pelo tópico 5 trata sobretudo de questões relacionadas a notícias informativas sobre o processo de vacinação no Brasil. A nuvem de palavras (Gráfico 4-e) apresenta destaque para os termos “dose”, “usf”, “ubs”, “reforço” e “criança”. Tais termos, acompanhados de outros de menor frequência na nuvem de palavras, demonstram a tendência de conteúdos sobre questões relacionadas ao processo vacinal e às unidades de saúde. No Quadro 7, é possível observar as dez notícias de maior representatividade para o tópico, em que se notam, essencialmente, boletins e informações sobre o avanço da vacinação no país.
De maneira semelhante ao que foi realizado com o conjunto amostral de notícias brasileiras, foram aplicadas as estratégias de identificação temática para as notícias portuguesas. Em seguida, foi realizada a inferência de tópicos, e os quatro conjuntos identificados são apresentados no Gráfico 5, em que é possível observar que os conjuntos 3 e 4 encontram-se relativamente próximos, enquanto os conjuntos 1 e 2 distam consideravelmente entre si e dos demais. O Gráfico 6 apresenta as nuvens de palavras segmentadas por tópicos para o conjunto amostral de notícias portuguesas.
O conjunto de tópicos 1 exibe forte relação com temas relacionados a autoridades governamentais (Gráfico 6-a) e questões internacionais, em que se observam termos como: “presidente”, “governo”, “estado”, “ministro”, “internacional” e “mundo”. Um ponto que chama a atenção é a notável ocorrência do termo “Bolsonaro”. O Quadro 8 apresenta as dez notícias mais representativas, em que é possível notar a presença de notícias que remetem a ações e falas do presidente brasileiro Jair Bolsonaro durante o período pandêmico. Para além disso se observam ainda notícias no contexto internacional, tanto relacionadas a autoridades governamentais quanto a desportistas. Entre o recorte de notícias de maior representatividade se observa apenas uma notícia com menção direta a Portugal, se referindo a fala do então candidato presidencial André Ventura sobre o recandidato à presidência de Portugal Marcelo Rebelo de Sousa.
O conjunto de tópicos 2 revela termos principais que dizem respeito a questões diretas da pandemia de covid-19, tais como: “doente”, “médico”, “situação”, “sistema” e “serviço”, conforme pode ser observado no Gráfico 6-b. O Quadro 9 apresenta as dez notícias de maior representatividade, para o qual se nota uma concentração de notícias que relatam a vacinação de indivíduos, em que há uma apresentação de casos denotados como exemplos da eficácia e importância do imunizante, e situações de quebra de regras delimitadas no contexto do esquema vacinal.
O conjunto referente ao tópico 3 traz “caso” e “dose” como termos principais, seguidos de termos como “vacinado”, “população”, “número” e “grupo”, conforme é apresentado no Gráfico 6-c. Esse conjunto é composto por notícias que possuem o foco na informação sobre o avanço da campanha vacinal em Portugal, tanto em termos numéricos quanto na divulgação de calendários (Quadro 10).
Por fim, o conjunto de tópicos 4, o qual foi identificado com uma proximidade relativa ao conjunto de tópicos 3, apresenta destaque para os termos “caso”, “doença”, “vírus” e “dose”, circundado por termos como “estudo”, “medicamento”, “variante” e “risco” (Gráfico 6-d). O Quadro 11 apresenta o recorte das dez notícias de maior representatividade para o conjunto de tópicos 4, em que se nota uma concentração de notícias sobre estudos que remetem, principalmente, a questões que extrapolam o próprio cerne da doença em si, assim como questões relacionadas à eficácia da vacina face às variantes identificadas ao longo do período pandêmico.
POSICIONAMENTOS E PRODUÇÃO DE SENTIDOS
Após os procedimentos de identificação temática, foram realizadas investigações sobre os posicionamentos e sentidos com base nos sentimentos identificados por meio da aplicação de uma solução computacional de produção própria de análise de sentimentos. Os resultados obtidos foram quantificados por meio de uma visualização comparativa entre os jornais e com a apresentação dos indicadores gerais de sentimento segmentados por jornal. Para contextualizar as análises, é relevante levar em conta especificidades próprias que moldam as abordagens midiáticas em cada país, sobretudo advindas dos temas e significados anteriormente identificados.
No contexto das notícias brasileiras, considerou-se o conjunto de tópicos 2, por emio do qual se fez a inferência de sentimentos. O Gráfico 7 apresenta uma visão geral do posicionamento dos jornais brasileiros analisados. Para construção do gráfico, considerou-se a média aritmética da soma dos sentimentos relativos a cada uma das notícias que compõem o corpus textual. É possível observar que todos os jornais apresentaram uma tendência majoritária a um tom negativo, com destaque para o jornal Folha de S. Paulo. A Tabela 2 apresenta os percentuais gerais obtidos para os jornais brasileiros. Esse cenário vai ao encontro de uma disparidade entre interesse público e corporativo da mídia, conforme destacado por Rebouças e Patrício (2022) em estudo sobre os editoriais publicados pela Folha de S. Paulo sobre a covid-19. Os autores observaram que o jornal utilizou a crise sanitária como pano de fundo para discussões que ultrapassavam o campo da saúde e se conectavam principalmente a críticas ao governo do então presidente Jair Bolsonaro. Isso se reverberou também em outros veículos de comunicação (Mello, 2021).
O Gráfico 8 revela, de forma segmentada, o percentual de sentimentos para cada um dos jornais brasileiros. Para todos os jornais, o percentual de notícias com sentimento inferido como negativo ficou próximo de 50%, e como positivo, com valores próximos a 30%. Em parte, a expressão anunciada pelo considerável número de notícias identificadas com sentimento negativo diz respeito, conforme abordado por Mello (2021), ao embate entre o então presidente Jair Bolsonaro e a mídia brasileira, quer seja na comunicação da informação, ou ainda, na argumentação que eventualmente evoca a emoção ou mesmo a visão ideológica.
O grande ponto é que, sendo a mídia favorável ou não a Bolsonaro, para a compreensão teórica do espetáculo, a política atualmente está completamente inserida numa lógica de paixões, emoções e dramatização. Bolsonaro e a imprensa brasileira possuem todos os mecanismos (atores e cenários, por que não dizer) necessários à lógica do espetáculo. A mídia não controla Bolsonaro e Bolsonaro nem tanto a controla. Mas as disputas e dramatizações estão presentes em todos os seus episódios
(Cioccari e Persichetti, 2021, p. 212).
A dualidade entre a mídia e o então presidente Jair Bolsonaro gerou narrativas polarizadas, frequentemente marcadas por discursos emocionais e ideológicos que sustentaram uma dinâmica de constante disputa entre imprensa e governo, influenciando a recepção pública das informações (Fernandes et alii, 2021; Mello, 2021). Esse contexto contribui para a fragilização da confiança nas instituições, assim como para uma intensificação da polarização política que se emerge como protagonista em contextos e áreas de grande sensibilidade, impactando negativamente a coesão social.
Por outro lado, as análises de sentimento realizadas no contexto das notícias portuguesas revelaram um cenário de polaridade entre os jornais, indo do jornal Observador com um maior registro de notícias classificadas com sentimento negativo para o Diário de Notícias com um retrato oposto, apontando para um conteúdo classificado com sentimentos positivos, o que pode ser notado na Tabela 3 e no Gráfico 9.
O Gráfico 10 traz a distribuição percentual quantitativa de sentimento para os jornais portugueses. Observa-se que os jornais Correio da Manhã, Observador e Público apresentam percentuais de notícias classificadas com sentimento negativo superior a 50%. É importante pontuar que na análise geral ponderada, o Correio da Manhã revela uma tendência central. Por outro lado, os jornais Diário de Notícias e Jornal de Notícias se destacam pelo quantitativo de notícias com classificação de sentimentos positivos, ambos com valores superiores a 50%. Conforme apontado por Gomes (2012), este fenômeno pode ser entendido em parte como uma resposta à função do jornalismo em épocas de crise de saúde pública, como a pandemia da covid-19, em que a cobertura midiática prioriza informações de impacto imediato sobre saúde. Embora o Diário de Notícias e o Jornal de Notícias tenham adotado uma narrativa mais positiva, destacando avanços no combate à pandemia, as outras publicações mostram-se mais alinhadas com uma perspectiva crítica das medidas de saúde pública, refletindo o papel da imprensa em fornecer uma visão de contraste e prevenção.
Quanto às notícias que tendem ao sentimento negativo, destacam-se as falas de autoridades sobre fatos ocorridos em Portugal em decorrência da crise sanitária da covid-19, referindo a questões como saúde pública e economia, tal como em notícia publicada pelo jornal Observador sobre a disponibilização de informações relativas à disponibilização de informações sobre o trânsito livre de pessoas: “Costa lamenta a ‘falta de clareza’ na informação das autoridades portuguesas, a qual ‘não se sabe muito bem onde se pode encontrar’, estando dispersa nos sites do Turismo de Portugal e do Ministério dos Negócios Estrangeiros (MNE)” (Lopes, 2021).
Do outro lado, se destacam notícias com foco em manifestações sobre os avanços das ações de enfrentamento da covid-19 e a retomada de atividades sociais e econômicas, tal como a afirmação do primeiro-ministro António Costa abordada em notícia do jornal Diário de Notícias: “O primeiro-ministro, António Costa, disse hoje que a indústria portuguesa irá contribuir certamente para o ‘esforço coletivo’ acordado entre todos os Estados-membros no sentido de aumentar a capacidade de produção de vacinas contra a covid-19 na União Europeia” (Diário de Notícias/Lusa, 2021, online). Cabe pontuar que durante o período de crise pandêmica, o governo português realizou ações de apoio à mídia por meio de ações que envolveram a aquisição de publicidade institucional (Cádima, 2021). Embora a condição de quarto poder remeta ao significado de autonomia da mídia, o seu financiamento acaba entrelaçando um rol de influências na construção de padrões em definições de agenda (Nyarko e Teer-Tomaselli, 2018). No caso da vacinação contra a covid-19, essa dependência pode promover uma narrativa que esteja limitada às campanhas de imunização e às manifestações e ações provenientes de atores públicos.
CONSIDERAÇÕES FINAIS
A importância de compreender os sentimentos implícitos na circulação de conteúdos e informações em ciberjornais é algo de grande importância, principalmente ao se tratar de questões relacionadas à saúde pública. Nesta investigação, foram apresentados resultados comparativos que abordaram ciberjornais brasileiros e portugueses, destacando um levantamento de temas e sentimentos associados aos textos veiculados. A aplicação de soluções computacionais para extração e análise de dados revelou-se consideravelmente favorável ao volume de documentos recuperados, possibilitando a sumarização de dados e a geração de indicadores úteis para o direcionamento e construção de análises mais orientadas. As principais áreas temáticas nas notícias sobre vacinação abrangem o impacto da crise sanitária na saúde pública, as respostas e estratégias governamentais, e as implicações sociais e econômicas da pandemia. No Brasil, houve um foco significativo na crítica política, refletindo a tensão entre a mídia e o governo Bolsonaro, enquanto em Portugal as notícias se concentraram mais nos avanços de combate à pandemia e no processo vacinal em si.
Com relação à análise de sentimentos, notadamente os jornais brasileiros considerados na composição do corpus textual revelaram uma tendência de maior volume de textos com classificação de sentimentos negativos, o que, de certa forma, confirma as questões que estiveram dentro dos holofotes da mídia ao longo do período pandêmico, a destacar manifestações e ações ligadas ao então presidente do Brasil, Jair Bolsonaro, assim como medidas e estratégias governamentais. Por outro lado, no conjunto de dados dos jornais portugueses é possível notar uma polarização de sentimento entre os jornais considerados, que tanto revela um equilíbrio saudável ao debate público e formação de opinião quanto reafirma visões e posicionamentos explícitos dos veículos de comunicação.
Cabe ressaltar que o delineamento dos resultados alcançados abre a oportunidade para aprofundamento posterior da investigação, tanto por meio da aplicação de métodos de análise de conteúdo no conjunto de dados textuais categorizados por tópicos, quanto de um ponto de vista orientado pelos sentimentos identificados e pelas polarizações presentes em um mesmo veículo de comunicação e na composição comparativa dos jornais eletrônicos explorados, o que pode ser realizado, por exemplo, mediante análise de cartografia de controvérsias.
REFERÊNCIAS
-
AGÊNCIA BRASIL. Retrospectiva 2022: confira as principais notícias de janeiro. Agência Brasil, 20 dez. 2022. Disponível em: https://agenciabrasil.ebc.com.br/geral/noticia/2022-09/retrospectiva-2022-confira-principais-noticias-de-janeiro Acesso em: 16 maio 2024.
» https://agenciabrasil.ebc.com.br/geral/noticia/2022-09/retrospectiva-2022-confira-principais-noticias-de-janeiro - ALBUQUERQUE, Afonso. O papel da imprensa no debate público: impasses contemporâneos. Cadernos Adenauer, v. 20, n. 4, p. 11-25, 2019.
-
ALMEIDA, Rafael. LeIA - Léxico para Inferência Adaptada 2018. Disponível em: https://github.com/rafjaa/LeIA Acesso em: 10 mar. 2023.
» https://github.com/rafjaa/LeIA -
ANDRÉ, Hendryo; BRONOSKY, Marcelo Engel; SANTOS, David Candido dos. Reflexões sobre o papel social de um jornalismo em transformação. Revista Pauta Geral, v. 11, p. 321-342, 2024. Disponível em: https://revistas.uepg.br/index.php/pauta/article/view/23469 Acesso em: 20 maio 2024.
» https://revistas.uepg.br/index.php/pauta/article/view/23469 - BLEI, David; NG, Andrew Y.; JORDAN, Michael. Latent Dirichlet allocation. Journal of Machine Learning, v. 3, p. 993-1022, 2003.
- BROUCKE, Seppe vanden; BAESENS, Bart. Practical Web Scraping for Data Science: Best Practices and Examples with Python. New York: Apress, 2018.
- CÁDIMA, Francisco Rui. A COVID-19 e a crise dos Media em Portugal. In: CÁDIMA, Francisco Rui; FERREIRA, Ivone. (Orgs.). Perspectivas Multidisciplinares da Comunicação em Contexto de Pandemia vol. II. Lisboa: ICNOVA, 2021. p. 30-46.
-
CATALINA-GARCÍA, Beatriz; SOUSA, Jorge Pedro; SOUSA, Li-Chang Shuen Cristina Silva. Consumo de notícias y percepción de fake news entre estudiantes de comunicación de Brasil, España y Portugal. Revista de Comunicación, v. 18, n. 2, p. 93-115, 2019. Disponível em: https://revistadecomunicacion.com/article/view/1288 Acesso em: 20 maio 2024.
» https://revistadecomunicacion.com/article/view/1288 -
CIOCCARI, Deysi; PERSICHETTI, Simonetta. Armas, ódio, medo e espetáculo em Jair Bolsonaro. Revista Alterjor, v. 18, n. 2, p. 201-214, 2021. Disponível em: https://www.revistas.usp.br/alterjor/article/view/144688 Acesso em: 20 maio 2024.
» https://www.revistas.usp.br/alterjor/article/view/144688 -
CORDEIRO, Douglas Farias; LEAL, Maiara Raquel Campos; VIEIRA, Larissa Machado; DA SILVA, Núbia Rosa. Cartografando comentários e sentimentos no perfil de Jair Bolsonaro no Instagram acerca da Covid-19. Galáxia, v. 47, e56929, 2022. Disponível em: https://revistas.pucsp.br/index.php/galaxia/article/view/56929/ Acesso em: 20 maio 2024.
» https://revistas.pucsp.br/index.php/galaxia/article/view/56929/ -
CORDEIRO, Douglas Farias. Perspectivas en contraste: análisis comparativo cuantitativo España y Brasil de la cobertura del conflicto israelí-palestino en Google News. Documentación de las Ciencias de la Información, v. 47, p. 15-25, 2024. Disponível em: https://revistas.ucm.es/index.php/DCIN/article/view/92187 Acesso em: 20 maio 2024.
» https://revistas.ucm.es/index.php/DCIN/article/view/92187 -
DIÁRIO DE NOTÍCIAS/LUSA. Indústria portuguesa contribuirá para esforço coletivo da UE [...]. Diário de Notícias, 26 fev. 2021. Disponível em: https://www.dn.pt/politica/industria-portuguesa-contribuira-para-esforco-coletivo-da-ue-no-aumento-da-producao-de-vacinas-disse-costa-13395870.html/ Acesso em: 20 maio 2024.
» https://www.dn.pt/politica/industria-portuguesa-contribuira-para-esforco-coletivo-da-ue-no-aumento-da-producao-de-vacinas-disse-costa-13395870.html/ -
FERNANDES, Carla Montouri; OLIVEIRA, Luiz Ademir de; COIMBRA, Mayra Regina; SANTOS, Deborah Luísa Vieira dos. Comunicação política e midiatização: o embate de Bolsonaro com a imprensa. Intexto, n. 52, p. 98933, 2021. Disponível em: https://seer.ufrgs.br/index.php/intexto/article/view/98933 Acesso em: 20 maio 2024.
» https://seer.ufrgs.br/index.php/intexto/article/view/98933 - FERRARI, Pollyana. A Força da Mídia Social: interface e linguagem jornalística no ambiente digital. São Paulo: Estação das Letras e Cores, 2014.
- FITZGERALD, Michael. Introdução às Expressões Regulares São Paulo: Novatec, 2012.
-
GOMES, Emiliana Sofia. O Jornalismo em saúde e as fontes de informação: o caso da covid-19 em Portugal. Revista de la Asociación Española de Investigación de la Comunicación, v. 7, n. 14, p. 127-149, 2020. Disponível em: https://www.revistaeic.eu/index.php/raeic/article/view/263 Acesso em: 20 maio 2024.
» https://www.revistaeic.eu/index.php/raeic/article/view/263 -
GOMES, Pedro Marques. O Diário de Notícias e o 25 de Novembro de 1975: um momento de mudanças. Comunicação Pública, v. 7, n. 11, p. 23-40, 2012. Disponível em: https://journals.openedition.org/cp/178 Acesso em: 20 maio 2024.
» https://journals.openedition.org/cp/178 -
HELBERGER, Natali. The political power of platforms: how current attempts to regulate misinformation amplify opinion power. Digital Journalism, v. 8, n. 6, p. 842-854, 2020. Disponível em: https://www.tandfonline.com/doi/full/10.1080/21670811.2020.1773888 Acesso em: 20 maio 2024.
» https://www.tandfonline.com/doi/full/10.1080/21670811.2020.1773888 -
HUTTO, Clayton; GILBERT, Eric. VADER: A Parsimonious Rule-based Model for Sentiment Analysis of Social Media Text. In: International Conference on Weblogs and Social Media 8, 2014, Ann Arbor. Proceedings [...]. Ann Arbor: ICWSM, 2014. Disponível em: https://ojs.aaai.org/index.php/ICWSM/article/view/14550 Acesso em: 20 maio 2024.
» https://ojs.aaai.org/index.php/ICWSM/article/view/14550 -
LEE, Na Yeon; MCELROY, Kathleen. Online comments: the nature of comments on health journalism. Computers in Human Behaviors, v. 92, p. 282-287, 2019. Disponível em: https://www.sciencedirect.com/science/article/abs/pii/S0747563218305417 Acesso em: 20 maio 2024.
» https://www.sciencedirect.com/science/article/abs/pii/S0747563218305417 -
LOPES, Felisbela; RUÃO, Teresa; MARINHO, Sandra; ARAÚJO, Rita Alexandra Manso. A media pandemic: influenza A in Portuguese newspapers. International Journal of Healthcare Management, v. 5, n. 1, p. 19-27, 2012. Disponível em: https://www.tandfonline.com/doi/abs/10.1179/2047971911Y.0000000001 Acesso em: 20 maio 2024.
» https://www.tandfonline.com/doi/abs/10.1179/2047971911Y.0000000001 -
LOPES, Felisbela; ARAÚJO, Rita Alexandra Manso; MAGALHÃES, Olga; SÁ, Alberto. COVID-19: quando o jornalismo se assume como uma frente de combate à pandemia. In: MARTINS, Manuela; RODRIGUES, Eloy. A Universidade do Minho em tempos de pandemia Tomo III – Projeções. Braga: UMinho Editora, 2020. Disponível em: https://ebooks.uminho.pt/index.php/uminho/catalog/book/27 Acesso em: 20 maio 2024.
» https://ebooks.uminho.pt/index.php/uminho/catalog/book/27 -
LOPES, M. A. Dezenas de portugueses impedidos de viajar por causa de novas regras. Observador/LUSA, 17 dez. 2021. Disponível em: https://observador.pt/2021/12/17/dezenas-de-portugueses-impedidos-de-viajar-por-causa-de-novas-regras/ Acesso em: 20 maio 2024.
» https://observador.pt/2021/12/17/dezenas-de-portugueses-impedidos-de-viajar-por-causa-de-novas-regras/ -
LUCY, Li; DEMSZKY, Dorottya; BROMLEY, Patricia; JURAFSKY, Dan. Content analysis of textbooks via natural language processing: findings on gender, race, and ethnicity in Texas U.S. history textbooks. AERA Open, v. 6, n. 3, p. 1-27, 2020. Disponível em: https://journals.sagepub.com/doi/full/10.1177/2332858420940312 Acesso em: 20 maio 2024.
» https://journals.sagepub.com/doi/full/10.1177/2332858420940312 -
MELLO, Renata Aiala. Bolsonaro e o jornalismo em conflito midiático. Revista de Estudos da Linguagem, v. 29, n. 4, p. 2485-2508, 2021. Disponível em: http://www.periodicos.letras.ufmg.br/index.php/relin/article/view/18251 Acesso em: 20 maio 2024.
» http://www.periodicos.letras.ufmg.br/index.php/relin/article/view/18251 -
MIGUEL, Luis Felipe; BIROLI, Flávia. A produção da imparcialidade: a construção do discurso universal a partir da perspectiva jornalística. Revista Brasileira de Ciências Sociais, v. 25, n. 73, p. 59-74, 2010. Disponível em: https://www.scielo.br/j/rbcsoc/a/7mM4dBPXgZMy8zbbVYYB3MN Acesso em: 20 maio 2024.
» https://www.scielo.br/j/rbcsoc/a/7mM4dBPXgZMy8zbbVYYB3MN -
MOHAMMADI Samira; RAMEZANKHANI, Ali; MONTAZERI, Ali; NASROLLAHI, Akbar; MOHAMMADI, Nastaran Keshavarz. Why medical journalism wins public health journalism: systems thinking recommendations for health-promoting media. Health Education, v. 121, n. 2, p. 161-173, 2021. Disponível em: https://www.emerald.com/insight/content/doi/10.1108/he-05-2020-0033/full/html Acesso em: 20 maio 2024.
» https://www.emerald.com/insight/content/doi/10.1108/he-05-2020-0033/full/html -
NYARKO, Jacob; TEER-TOMASELLI, Ruth Elizabeth. The Interface Between Media Funding and Agenda Setting: The Conduit for Media Independence. Journal of Creative Communications, v. 13, n. 1, p. 34-53, 2018. Disponível em: https://journals.sagepub.com/doi/abs/10.1177/0973258617743620 Acesso em: 20 maio 2024.
» https://journals.sagepub.com/doi/abs/10.1177/0973258617743620 -
PEETERS, Maud; MAESEELE, Pieter. The interpretive interface: where journalistic and pluralistic discourses (don’t) meet. Digital Journalism, p. 1-19, 2023. Disponível em: https://www.tandfonline.com/doi/abs/10.1080/21670811.2023.2174150 Acesso em: 20 maio 2024.
» https://www.tandfonline.com/doi/abs/10.1080/21670811.2023.2174150 -
REBOUÇAS, Hébely; PATRÍCIO, Edgard. Interesse público versus interesses corporativos: disputas entre Folha de S. Paulo e governo Bolsonaro em editoriais sobre a Covid-19. Lumina, v. 16, n. 2, p. 77-95, 2022. Disponível em: https://periodicos.ufjf.br/index.php/lumina/article/view/35753 Acesso em: 20 maio 2024.
» https://periodicos.ufjf.br/index.php/lumina/article/view/35753 -
REIS, Bruno Carriço; SOUSA, João Carlos. A invisibilidade do desemprego juvenil no discurso mediático da imprensa portuguesa. Observatório, v. 11, p. 134-148, 2017. Disponível em: https://obs.obercom.pt/index.php/obs/article/view/989 Acesso em: 20 maio 2024.
» https://obs.obercom.pt/index.php/obs/article/view/989 -
TZENIOS, Nikolaos; CHAHINE, Mohamad; TAZANIOS, Mary. Better strategies for coronavirus (COVID-19) vaccination. Special Journal of the Medical Academy and Other Life Sciences, v. 1, n. 2, 2023. Disponível em: https://sjmas.com/index.php/sjmas/article/view/11 Acesso em: 20 maio 2024.
» https://sjmas.com/index.php/sjmas/article/view/11 -
VALENTI, Antonio; MIRABILE, Marco; CANNONE, Erika; BOCCUNI, Fabio; DIONISI, Pierluca; FORTUNA, Grazia; GAGLIARDI, Diana; VIZZACCARO, Romina; LAVICOLI, Sergio. The impact of covid-19 pandemics on the development of health risk communication: challenges and opportunities. International Journal of Environmental Research and Public Health, v. 20, n. 1, p. 645, 2023. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC9819513/ Acesso em: 20 maio 2024.
» https://pmc.ncbi.nlm.nih.gov/articles/PMC9819513/ - VARÃO, Rafiza; FERREIRA, Fernanda Vasques. Jornalismo como Instância de Confiabilidade de Informações durante a Pandemia da Covid-19. In: OLIVEIRA, Hebe Maria Gonçalves de; GADINI, Sérgio. Jornalismo em tempos de pandemia do novo coronavírus Aveiro: RIA Editorial, 2020. p. 373-398.
-
WILLIAMS, Kevin. Competing models of journalism? Anglo-American and European reporting in the information age. Journalistica, v. 1, n. 2, p. 43-65, 2006. Disponível em: https://tidsskrift.dk/journalistica/article/view/1788 Acesso em: 20 maio 2024.
» https://tidsskrift.dk/journalistica/article/view/1788
Datas de Publicação
-
Publicação nesta coleção
16 Jun 2025 -
Data do Fascículo
2025
Histórico
-
Recebido
20 Maio 2024 -
Aceito
20 Nov 2024














Fonte: Autores
Fonte: adaptado de Google Trends, 2023
Fonte: adaptado de Google Trends, 2023
Fonte: Google, 2023.
Fonte: Metrópoles, 2023.
Fonte: dados de pesquisa.
Fonte: dados de pesquisa.
Fonte: dados de pesquisa.
Fonte: dados de pesquisa.
Fonte: dados de pesquisa
Fonte: dados de pesquisa
Fonte: dados de pesquisa
Fonte: dados de pesquisa