RESUMO
O Sistema Único de Saúde (SUS) disseminou bilhões de registros administrativos correspondentes a três décadas de existência. Na contramão de dados hospitalares e de notificação fragmentados por serem orientados ao serviço, e não ao usuário do SUS, os dados ambulatoriais apresentam dados vinculáveis ao identificador pseudonimizado, viabilizando acompanhar o itinerário terapêutico. Este trabalho apresenta, uma ferramenta automatizada da Sala Aberta de Inteligência em Saúde (Sabeis) de processamento, com software livre, de microdados fornecidos via estratégia TabWin/TabNet a partir do diretório de transferência de arquivos, sem aparato sofisticado de Big Data; e descreve os dados abertos do Sistema de Informação Ambulatorial, de 2008 a 2023, empregando recursos modestos de hardware por especialistas em saúde pública e informática em saúde. Foram processados 8.106.361.265 registros, correspondentes a 3.135 procedimentos, 16.407 diagnósticos e 51.875.308 usuários, segundo o arquivo correspondente à Autorização de Procedimentos Ambulatoriais e Alta Complexidade/Custo. Verificou-se a crescente qualidade do identificador pseudonimizado, sobretudo a partir de 2022, com 0,8% dos usuários com mais de um sexo, mais de um estado de residência, acima de oito procedimentos ou cinco diagnósticos. A presente abordagem demonstrou a potencialidade para o acompanhamento de políticas públicas, utilizando os dados ambulatoriais com identificador pseudonimizado do usuário do SUS.
PALAVRAS-CHAVE
Ciência de dados; Sistemas de gerenciamento de base de dados; Sistema Único de Saúde; Documentação; Avaliação de tecnologias em saúde.
ABSTRACT
The Brazilian Unified Health System (SUS) has disseminated billions of administrative records corresponding to three decades of existence. Unlike hospital and notification data, which are fragmented as they are service-oriented rather than user-oriented, outpatient data can be linked via a pseudonymized identifier, enabling the tracking of therapeutic pathways. This paper presents an automated microdata processing tool from the Open Health Intelligence Platform (SABEIS) using open-source software to handle microdata provided through the TabWin/TabNet strategy from the file transfer directory, without relying on sophisticated Big Data. It describes the open data from the SUS Ambulatory Information System from 2008 to 2023, using modest hardware resources by public health and health informatics specialists. A total of 8,106,361,265 records were processed, corresponding to 3,135 procedures, 16,407 diagnoses, and 51,875,308 users, according to the files of APAC-SIA High-cost ambulatory procedures and high-cost medicines. There was a noticeable improvement in the quality of the pseudonymized identifier, especially from 2022 onwards, with 0.8% of users recorded as having more than one sex, more than one state of residence, over eight procedures, or five diagnoses, demonstrating the potential for public policy monitoring and knowledge generation. This approach demonstrated the potential for monitoring public policies using outpatient data with a pseudonymized SUS user identifier.
KEYWORDS
Data science; Database management systems; Unified Health System; Documentation; Technology assessment; health.
Introdução
Apesar da abundância de registros e sistemas de informação com dados abertos, a gestão, o controle social e a comunidade acadêmica lidam, por três décadas, com dados fragmentados e incompletos. Isso se deve ao fato de que nem todas as políticas públicas do Sistema Único de Saúde (SUS) disseminaram, até a presente data, microdados consolidados de diferentes fontes. Destacam-se as notáveis ausências históricas de microdados abertos da Atenção Primária e da Assistência Farmacêutica, tanto em seus componentes básicos quanto estratégicos. Entretanto, iniciativas como a da Rede Interagencial de Informações para a Saúde (Ripsa) foram capazes de prover, ao longo de pelo menos 20 anos, capacidade analítica com indicadores com dados agregados que mostraram a rápida transformação das Redes de Atenção à Saúde (RAS), sobretudo de serviços sem internação1.
A acertada estratégia de disponibilização de microdados, isto é, registros de contatos assistenciais e atividades administrativas sem agregação, tem sido crucial para valorizar os gestores e trabalhadores do SUS. As séries históricas que contemplam as primeiras decisões implantadas no SUS com as Normas Operacionais Básicas (NOB), políticas nacionais e demais atos normativos, quando integradas, viabilizam a avaliação longitudinal do itinerário terapêutico realizado. Além disso, o uso de dados abertos contribui para o monitoramento dos serviços oferecidos pelo SUS e para aprimorar a qualidade dos próprios dados2,3.
Ainda que a transparência ativa da gestão pública apresente entraves e que a disseminação de microdados seja parcial4, o SUS construiu, com o TabNet e o TabWin, uma tecnologia bem-sucedida de tabulação e uso de dados não agregados. A tecnologia de disseminação implantada no decorrer das décadas de 1990 e 2000 se mostrou robusta e válida até o presente momento; e conta atualmente com uma massa crítica de sanitaristas letrados nessas ferramentas. Essas ferramentas têm sido fundamentais na produção de uma grande parte dos indicadores e quantitativos para planos de saúde e relatórios de gestão5-7.
As ferramentas e dados oficiais, porém, não apresentam os microdados disponíveis no SUS das Ações e Serviços Públicos de Saúde (ASPS) diferentes de forma integrada, o que limita algumas análises. Por exemplo, os dados do Sistema de Informação Ambulatorial (SIA) incluem um identificador pseudonimizado do usuário do SUS, permitindo o acompanhamento do itinerário dentro do SUS. No entanto, a análise desses dados requer métodos sofisticados que envolvem técnicas capazes de lidar com bilhões de registros, cujo conhecimento geralmente não está disponível para conselheiros de saúde, sanitaristas, epidemiologistas ou profissionais que realizam Avaliação de Tecnologias de Saúde (ATS), em análises necessárias para que novos medicamentos, produtos e procedimentos sejam incorporados ao SUS8.
A lacuna de dados integrados e a indisponibilidade de métodos oficiais de curadoria obrigam cada núcleo de pesquisa e gestão ao desenvolvimento de ferramentas próprias para extração, transformação e carga (Extract, Transform and Load - ETL) de dados abertos produzidos via SIA, cuja consolidação de dados pode apresentar variações conforme o método aplicado5,9-16.
O presente trabalho reúne as ciências ‘informática em saúde’ e a ‘sanitária’, cuja conciliação é estratégica para o País17,18, focalizada nos insumos para tomada em decisão de saúde pública com dados de mundo real. Não foram detectados relatos de processamento completo e automatizado do SIA com software livre e aberto, apenas experiências de consolidação sem enfoque na integração de dados ambulatoriais ou com ferramentas proprietárias10.
Também não foram encontrados trabalhos com a base de dados abertos completa do sai, problematizando o identificador pseudonimizado do usuário do SUS, lastreado no Cartão Nacional de Saúde (CNS), o qual é amplamente utilizado para tomada de decisão no SUS, embora exista ferramenta que aplica o relacionamento determinístico de informações diagnósticas e de tratamento obtidas no SIA voltada para oncologia19. Entretanto, existe ampla literatura que relata o uso de pareamento determinístico-probabilístico com dados de acesso restrito por conterem informações de identificação do usuário do SUS, como nome completo, nome da mãe, documento de identificação, endereço com logradouro, ente outros13,14,20-23, cujos microdados com identificador pseudonimizado derivado das ferramentas de vinculação não estão disponíveis para comparação.
Embora a quantidade de informações disponíveis no SUS cresça exponencialmente, ainda persistem lacunas que demandam atenção para subsidiar políticas públicas e assegurar um atendimento integral aos usuários do sistema. Portanto, o objetivo deste estudo é explorar os dados abertos do SIA e investigar as potenciais oportunidades de monitoramento longitudinal, adotando o identificador pseudonimizado como rastreio do usuário do SUS, que permitem auxiliar, em especial, a tomada de decisão relacionada com incorporação, exclusão ou alteração de tecnologias de saúde no âmbito do SUS.
Material e métodos
Este estudo caracteriza-se como uma pesquisa exploratória e descritiva, fundamentada na análise de dados secundários oriundos de sistemas de informação do SUS, com enfoque na construção e estruturação de uma base integrada de dados a partir de múltiplos subsistemas.
Fonte e natureza dos dados
Os dados utilizados são de acesso público e foram obtidos a partir do repositório do Ministério da Saúde. Os arquivos de dados são disseminados, fragmentados por subsistema, 27 Unidades da Federação (UF) e data de competência com formato ano e mês em dois dígitos cada (AAMM), totalizando milhares de arquivos a serem processados.
Arquitetura e ambiente computacional
O processo de ETL foi realizado utilizando GNU Bash 5.2.15 para automação de rotinas; SQL (PostgreSQL 15.6, Ubuntu 23.10.1) para estruturação, transformação e carga dos dados; Wine 8.0.1 para emulação do descompactador oficial dbf2dbc.exe; dbview para extração dos dados DBF em formato CSV. O ambiente computacional consistiu em um minipc Lenovo ThinkCentre M75q Gen 2, com 32 GB de RAM, processador AMD Ryzen™ 5 PRO 5650GE ×12, e SSD Kingston SNV2S4000G (4TB). O código-fonte e o repositório de dados estão disponíveis sob as licenças General Public License (GPL 3.014) e Open Database License (ODbL).
Processamento e integração dos dados (ETL)
A consolidação dos dados seguiu as etapas conforme a metodologia Sala Aberta de Inteligência em Saúde (Sabeis)24: 1) coleta automatizada, incluindo uma verificação do tamanho do arquivo (bytes) para assegurar a integridade do download; 2) descompactação e conversão dos arquivos do formato DBC para DBF, com posterior extração para CSV; 3) carga no Sistema Gerenciador de Banco de Dados (SGBD), como camada intermediária de dados (staging) brutos ou semibrutos; 4) validação da carga, verificando a correspondência do número de registros entre o arquivo original e os dados carregados no banco PostgreSQL, garantindo a consistência; 5) comparação da quantidade aprovada de procedimento com os dados oficiais disponibilizados pelo tabulador TabNet25; 6) padronização de atributos conforme o dicionário de dados do SUS, mantendo uma estrutura unificada entre os subsistemas do sai; 7) carga das tabelas SQL orientadas a objetos no SGBD, utilizando o recurso Inherits para estruturar ‘tabelas-mãe’ por subsistema; 8) geração de data marts26,27, respeitando as regras de negócio para análise e relatórios; 9) adição do CNS no arquivo Produção Ambulatorial (PA) a partir de outros subsistemas, utilizando-se o código de autorização do procedimento, respectivo ao gestor estadual e o mês competência28. O identificador do usuário é o mesmo ao longo dos diferentes subsistemas.
A Resolução nº 510, de 7 de abril de 2016, do Conselho Nacional de Saúde29, prevê no art. 1º, inciso V, que pesquisas com ‘informações de acesso público’ não necessitam de avaliação por Comitê de Ética em Pesquisa (CEP).
Resultados
Foram processados dados do SIA de 2008 a 2023 (tabela 1) e realizada a qualificação do identificador pseudonimizado do usuário (tabelas 2 a 4), avaliando sua trajetória do SUS (tabelas 2 e 5), cuja extração resultou em cerca de 1 terabyte em disco. Foram processados 44.637 arquivos de dados, contendo 8.106.361.265 registros, sendo que foi necessário enriquecer 5.024.137.874 registros do arquivo PA com os demais laudos para obter o identificador pseudonimizado.
Sumário dos dados administrativos produzidos via Sistema de Informação Ambulatorial de 2008 a 2023
Usuários segundo subsistema do Sistema de Informação Ambulatorial de 2008 a 2023 em números absolutos (triângulo inferior em itálico) e número de usuários por cem mil habitantes por região do Brasil (2a) e utilização de mais de um tipo de serviço ambulatorial (2b)
Qualidade do identificador pseudonimizado baseado no Cartão Nacional de Saúde relativo ao total de usuários com Produção Ambulatorial do Sistema de Informação Ambulatorial, entre 2008 e 2023, e percentual de registros a investigar por período, por região*
Segundo a residência, todos os municípios e o Distrito Federal apresentaram, ao menos, um registro no SIA. Entretanto, é possível afirmar que nem todos os municípios ou regiões administrativas do Distrito Federal registraram procedimento no período avaliado para todas as políticas (tabela 1). A política vigente com menor número de municípios contemplados foi Acompanhamento Multiprofissional (AMP), com 1.050.
Quanto ao município de residência, todos os municípios e o Distrito Federal apresentaram pelo menos um registro de Laudos Diversos (AD), Medicamentos (AM), Quimioterapia (AQ), Boletim Individual (BI) e, consequentemente, PA. No SIA, não foram encontrados registros de Radioterapia (AR) para os munícipes de Santa Isabel do Rio Negro-AM e Uiramutã-RR. Os municípios com menor cobertura relativa aos laudos do SIA foram Amaturá-AM, Nova Roma-GO, Serra Nova Dourada-MT, Nova Roma do Sul-RS, Putinga-RS e Nova Castilho-SP, jamais tendo registro de laudos para Acompanhamento a Cirurgia Bariátrica (AB), Confecção de Fístula Arteriovenosa (ACF), AMP, Nefrologia (AN), Tratamento Dialítico (ATD), Psicossocial (PS) e Atenção Domiciliar (SAD).
Com o identificador pseudonimizado, é possível avaliar o acesso a diferentes políticas de saúde pelo mesmo usuário, bem como para o estadiamento no tratamento oncológico registrado via SIA30. Na tabela 2, são apresentados números absolutos e por cem mil habitantes para o Brasil e as cinco regiões. Um exemplo é o acesso à política de tratamento oncológico (AQ ou AR) ofertada ao mesmo usuário de AM, ainda que não tenha ocorrido no mesmo período. É importante ressaltar que a maioria dos medicamentos registrados no SIA são do Componente Especializado da Assistência Farmacêutica (Ceaf). Entre 2008 e 2023, 266.500 usuários entre 2.666.836 (10,0%) de usuários de AQ acessaram AM, enquanto 170.633 usuários entre 1.666.261 (10,2%) de usuários de AR acessaram AM em algum momento. Os dados gerais podem situar a desigualdade das ASPS. Assumindo o número de registros como proxy de acesso, verificou-se que foi três vezes superior na região Sul em comparação à região Norte para AQ, e 1,7x superior ao observar a PA na totalidade.
As tabelas 3 e 4 contribuem para tipificar a qualidade do identificador pseudonimizado. A distribuição de sexo, raça/cor e idade apresenta consistência em relação ao que é praticado no SUS. Da mesma forma, é possível higienizar dado estrato desconsiderando identificadores pseudonimizados com número de registros elevado, o que pode indicar o uso do mesmo CNS para indivíduos diferentes. Adicionalmente, pode-se verificar o número de estados de residência, indiciando coincidência do número utilizado por gestores diferentes; elevado número de procedimentos e diagnósticos estatisticamente impraticáveis para o mesmo sujeito; tempo de tratamento discrepante, entre outros quesitos. Ao avaliar usuários com ambos os sexos nos registros administrativos, mais de 2 estados de residência, 15 procedimentos ou 10 diagnósticos, apenas 3,05% se enquadram nessa situação, podendo, inclusive, ser retirados da análise como critério de exclusão.
Qualidade do identificador pseudonimizado baseado no Cartão Nacional de Saúde relativo ao total de usuários de oncologia (quimioteriapia - AQ e radiologia - AR) com Produção Ambulatorial do Sistema de Informação Ambulatorial, entre 2008 e 2023, e percentual de registros a investigar por período, por região*
Caracterização dos procedimentos realizados mais de três vezes por usuário com maior número de usuários do SUS, entre 2008 e 2023
Na tabela 4, o valor de usuários a higienizar para tratamento oncológico, considerando critérios mais rigorosos de ambos os sexos, acima de 1 estado de residência, 8 procedimentos ou 6 diagnósticos, o número cai para 0,46% de usuários não unívocos, cujos registros devem ser higienizados adotando-se outros atributos (como idade e perfil de tratamento) ou excluídos da análise a depender do objetivo. A qualidade do identificador pseudonimizado cresce ao longo da evolução do CadSUS, com a conciliação do cadastro local em relação ao nacional, com a conciliação do (Master Patient Index - MPI) com o registro da Receita Federal realizado a partir de 2016 e com a definição do Cadastro de Pessoa Física (CPF), como identificador único nacional, a partir de 2021. Ressalta-se a necessidade de higienização dos registros por usuários do SUS na região Norte em relação às demais, a qual permanece substancial em 2023 (11,4%), enquanto a menor encontra-se na região Nordeste com 1,8%, conforme os critérios adotados. Por sua vez, ao considerar políticas específicas, a exemplo da oncologia, o contingente a higienizar da região Norte é de 1,5% dos casos, enquanto no Sudeste é de 0,3% em 2023.
A transparência oferecida pelos dados abertos e sua organização em repositórios, ou lagos de dados, possibilita explorar como algumas políticas são difundidas e realizar análises de situação exploratória e direcionadas por dados (data-driven analysis). Por exemplo, como observado na tabela 5, a hemodiálise apresentou 466.918 usuários, cujo custo médio, segundo números oficiais sem deflacionamento, foi de R$ 81.945,25, correspondendo a um tratamento longo, cuja mediana, em dias, foi 818 meses. Adicionalmente, destaca-se a reabilitação do desenvolvimento neuropsicomotor, cuja mediana de idade é 6 e o valor médio por usuário foi de 6.820,61, com 426 procedimentos por usuário, considerando uma média simples.
Discussão
O estudo destacou a capacidade de gerenciar e aprimorar dados abertos sem a presença de profissionais especializados em administração de servidores, mas sim com especialistas em saúde pública que possuem conhecimentos substanciais em tecnologia da informação, assumindo uma função próxima à de engenheiros de análise de dados em saúde27.
O SUS apresentou no SIA 3.135 procedimentos ambulatoriais, segundo o Sistema de Gerenciamento da Tabela de Procedimentos, Medicamentos e Órteses, Próteses e Materiais Especiais (Sigtap), realizados sob 16.407 diagnósticos primários. Os dados abertos não são fornecidos orientados ao usuário, mas fragmentados à respectiva ASPS. Logo, quando ocorre a opção administrativa em descontinuar no SIA uma dada ASPS, o usuário pode deixar de ser monitorado de forma integrada às demais políticas ambulatoriais e especializadas, como demonstrado na tabela 1 com os dados de laudos de AN, a qual contém apenas dados de 2008 a 2014.
Ao avaliar a ausência de procedimentos realizados segundo o município de residência, os dados podem revelar vazios assistenciais, porém, podem indiciar uma cultura de cadastramento fora do domicílio para a obtenção do acesso, revelando fragilidades no Planejamento Regional Integrado (PRI) e conflitos federativos e, portanto, na pactuação entre municípios, uma vez que a resolutividade deve ocorrer na região de saúde, e não totalmente no município, não podendo ser cerceado o acesso para quem não habita no mesmo município de atendimento31,32.
Embora os dados abertos sejam amplamente utilizados na produção acadêmica e pela gestão do SUS, o uso do CNS é questionado em fóruns em função das possíveis inconsistências, por exemplo, duplicidades relativas à disponibilidade de sistema de informação local de produção do cartão dos municípios e estados que geram um número próprio para seu cidadão sem sincronicidade com a base nacional mantida pelo Ministério da Saúde33.
A avaliação da qualidade de identificadores pseudonimizados é fundamental, conforme ilustrado pelas tabelas 3 e 4. A análise permite a identificação e exclusão de registros cujo identificador contemple critérios de inconsistência, ante a possibilidade do uso do mesmo número de identificação entre diferentes gestores para pessoas diferentes, inferida pelo número de estados de residência, sexos diferentes e idades calculadas em relação ao primeiro registro e a data de atendimento ou tempos de tratamento discrepantes, bem como a presença de um número estatisticamente inviável de procedimentos e diagnósticos para um único sujeito, podem ser utilizados para refinar os dados. Por exemplo, apenas 3,05% dos registros apresentaram inconsistências como a presença de ambos os sexos, mais de 2 estados de residência, 15 ou mais procedimentos, ou 10 ou mais diagnósticos, validando a aplicação desses critérios de exclusão para garantir a integridade da análise.
Dessa forma, o presente trabalho demonstrou que a consolidação nacional dos dados e a oferta do identificador pseudonimizado podem ser trabalhadas de modo a constituir estratos populacionais segundo a política de saúde, configurando, inclusive, coortes conforme o tratamento ou diagnóstico.
É importante destacar o conhecimento aplicado por informatas em saúde utilizando simplicidade na codificação e recursos de hardware domésticos. Uma das dificuldades para o processamento de dados ambulatoriais é o manejo dos arquivos originais em formato DBC dotados de milhões de registros. O descompactador oficial fornecido pelo Ministério da Saúde, o dbf2dbc.exe, foi o único viável para processar todos os arquivos de dados utilizando recursos computacionais domésticos sem falhas. Não se obteve consistência ao utilizar ferramentas alternativas em arquivos de estados com maior número de registros, como São Paulo e Minas Gerais, particularmente após 2019, ao utilizar alternativas para linguagens de programação estatísticas e interpretadas como projeto R e Python em computador doméstico9,34.
O Bash é também uma linguagem interpretada, isto é, opera como interpretador de comandos, executando instruções fornecidas pelo sistema operacional. Entretanto, o Bash é projetado principalmente para uso interativo, o que significa que é otimizado para a execução imediata de comandos de sistema, sem a necessidade de compilação ou estruturação complexa de código. A vantagem do processamento em linguagem Bash está no enfoque de a ETL ser projetada para a automação de tarefas em sistemas Unix e Linux, com a execução de comandos do sistema operacional, manipulação de arquivos, processamento de texto e criação de scripts de terminal (shell).
O processamento foi realizado sem adotar ferramentas específicas para big data, evitando plataformas de ETL visual com funcionalidades de ‘arrastar e soltar’. Em vez disso, foram utilizadas técnicas de ingestão em Bash e operações SQL, seguindo boas práticas de desenvolvimento com software livre. Como resultado, a presente abordagem é otimizada para operações comuns ao ambiente de linha de comando ao invés de soluções de ETL como do ecossistema Pentaho ou Informática PowerCenter®, incluindo acesso direto e eficiente aos recursos do sistema operacional Unix/Linux, o que significa que muitas operações podem ser realizadas sem a sobrecarga associada à inicialização de uma máquina virtual (como no caso do Python) ou ao processamento de dados complexos (como no caso do R). Destaca-se, adicionalmente, a baixa sobrecarga de memória e processamento devido à natureza direta e enfoque em tarefas simples do sistema operacional35-38.
Fragilidades no repasse financeiro podem criar iniquidades no acesso ao ATD em diferentes territórios do Brasil e dificuldades na avaliação quando os dados não constam no sistema de informação, seja para procedimentos, seja o valor gasto com medicamento39. Logo, lacunas na disseminação de dados oficiais vinculados ao sistema de informação de origem implicam, por exemplo, a coleta discrepante dos montantes gastos a partir de fontes diferentes, cujas estimativas podem variar conforme o método do estudo farmacoeconômico.
Conclusões
O presente trabalho demonstrou a importância da uniformização dos microdados abertos em estratégia de disseminação integrada de modo a avançar em análises longitudinais com dados administrativos, sobretudo por serem uma fonte comum e disponível para o debate amplo do Estado com a sociedade civil. Infelizmente, os dados hospitalares, de notificação de agravo, nascidos vivos, óbitos, imunização, existentes na mesma estratégia TabWin/TabNet, não são disponibilizados de forma integrada e aberta, pois, apesar de os registros serem individualizados por contato assistencial ou usuário, inviabilizam análise longitudinal do itinerário no SUS. Ainda assim, tais microdados reunidos sistematicamente e organizados em lagos de dados apresentam grande potencial para estudos ecológicos por município com sistemas de indicadores e salas de situação40-43.
Demonstrou-se a importância de a qualidade da ETL ser aferida a cada etapa e de sua resultante ser explicitada nos estudos envolvendo grandes volumes de dados disseminados. O presente ensejo recomenda a prática de ciência aberta com disponibilização do código-fonte, não apenas para a reprodutibilidade, mas, sobretudo, diante do recurso das redes neurais de processamento profundo e o inevitável uso das Inteligências Artificiais (IA) generativas. A qualidade explícita do tratamento de dados pode ser critério para reduzir alucinações de IA e asserções espúrias, não criando outros propagadores de desinformação.
Espera-se que a transformação digital em saúde disponibilize lagos de dados integrados para que pesquisadores e gestores adotem os conhecimentos da informática em saúde com uma base com e não incorram na fragmentação de dados por serviço de gestão, atenção ou vigilância conduzida antes de haver a Política Nacional de Informação e Informática (PNIIS), mas que promova dados orientados ao usuário do SUS conforme preconizado nas pactuações tripartite44-46.
-
Suporte financeiro:
não houve
Disponibilidade de dados:
os dados de pesquisa estão contidos no próprio manuscrito
Referências
-
1 Pinto LF, Freitas MPS, Figueiredo AWS. Sistemas Nacionais de Informação e levantamentos populacionais: algumas contribuições do Ministério da Saúde e do IBGE para a análise das capitais brasileiras nos últimos 30 anos. Ciênc saúde coletiva. 2018;23(6):1859-70. DOI: https://doi.org/10.1590/1413-81232018236.05072018
» https://doi.org/10.1590/1413-81232018236.05072018 -
2 Fernandes FECV, Leal IS, Andrade JDA. Percepção dos profissionais da atenção primária à saúde sobre o sistema de informação ambulatorial. Rev Enferm Atenção Saúde. 2017;6(2):77-92. DOI: https://doi.org/10.18554/reas.v6i2.1673
» https://doi.org/10.18554/reas.v6i2.1673 -
3 Silva AR, Oliveira TM, Lima CF, et al. Sistemas de informação como instrumento para tomada de decisão em saúde: revisão integrativa. Rev enferm UFPE on line. 10(9):3455-62. DOI: https://doi.org/10.5205/1981-8963-v10i9a11428p3455-3462-2016
» https://doi.org/10.5205/1981-8963-v10i9a11428p3455-3462-2016 -
4 Maduro-Abreu A, Litre G, Santos L, et al. Transparência da informação pública no Brasil: uma análise da acessibilidade de Big Data para o estudo das interfaces entre mudanças climáticas, mudanças produtivas e saúde. RECIIS. 2020;14(1):111-25. DOI: https://doi.org/10.29397/reciis.v14i1.1690
» https://doi.org/10.29397/reciis.v14i1.1690 - 5 Silva NP. A utilização dos programas TABWIN e TABNET como ferramentas de apoio à disseminação das informações em saúde [dissertação]. Rio de Janeiro: Escola Nacional de Saúde Pública Sergio Arouca, Fundação Oswaldo Cruz; 2009.
- 6 Leandro BBS, Rezende FAV, Pinto JMC. Informações e registros em saúde e seus usos no SUS. Rio de Janeiro: Editora FIOCRUZ; 2020.
- 7 Garcia PT, Reis RS. Gestão pública em saúde: o plano de saúde como ferramenta de gestão. São Luís: EDUFMA; 2016.
- 8 Ferré F. Infoestrutura para apoio à decisão estratégica no SUS. In: Santos AO, Lopes LT, organizadoras. Reflexões e futuro. Brasília, DF: Conass; 2021. p. 114-27. (Coleção Covid-19; v. 6).
-
9 Saldanha RF, Bastos RR, Barcellos C. Microdatasus: pacote para download e pré-processamento de microdados do Departamento de Informática do SUS (DATASUS). Cad Saúde Pública. 2019;35(9):e00032419. DOI: https://doi.org/10.1590/0102-311X00032419
» https://doi.org/10.1590/0102-311X00032419 -
10 Santos RS, Santos RS, Gutierrez MA. MINERSUS Ambiente computacional para extração de informações para a gestão da saúde pública por meio da mineração dos dados do SUS. Rev Bras Eng Biomed. 2008;24(2):77-90. DOI: https://doi.org/10.4322/rbeb.2012.050
» https://doi.org/10.4322/rbeb.2012.050 - 11 Franceschini PM, Porto JB, Kunst R. Ferramenta de Visualização de Dados Públicos da Saúde Disponibilizados pelo DATASUS. In: International Conference on Information Resources Management; 2021; [local desconhecido]: AIS Electronic Library; 2021.
- 12 Barbosa MN. Possibilidades e limitações de uso das bases de dados do DATASUS no controle externo de políticas públicas de saúde no Brasil [trabalho de conclusão de curso]. Brasília, DF: Instituto Cerzedello Corrêa, Escola Superior do Tribunal de Contas da União; 2019.
-
13 Cherchiglia ML, Guerra Júnior AA, Andrade EIG, et al. A construção da base de dados nacional em terapia renal substitutiva (TRS) centrada no indivíduo: aplicação do método de linkage determinístico-probabilístico. Rev Bras Estud Popul. 2007;24(1):163-67. DOI: https://doi.org/10.1590/S0102-30982007000100010
» https://doi.org/10.1590/S0102-30982007000100010 -
14 Barreto ML, Ichihara MY, Pescarini JM, et al. Cohort Profile: The 100 Million Brazilian Cohort. Int J Epidemiol. 2022;51(2):e27-e38. DOI: https://doi.org/10.1093/ije/dyab213
» https://doi.org/10.1093/ije/dyab213 -
15 Moura L de, Prestes IV, Duncan BB, et al. Construção de base de dados nacional de pacientes em tratamento dialítico no Sistema Único de Saúde, 2000-2012. Epidemiol Serv Saude. 2014;23(2):227-38. DOI: https://doi.org/10.5123/S1679-49742014000200004
» https://doi.org/10.5123/S1679-49742014000200004 - 16 Moya J, Risi Junior JB, Martinello A. Salas de situação em saúde: compartilhando as experiências do Brasil. Brasília, DF: Organização Pan-Americana da Saúde; Ministério da Saúde; 2010.
-
17 Fornazin M, Joia LA. Articulando perspectivas teóricas para analisar a informática em saúde no Brasil. Saude Soc. 2015;24:46-60. DOI: https://doi.org/10.1590/S0104-12902015000100004
» https://doi.org/10.1590/S0104-12902015000100004 - 18 Giannotti EM, Fonseca F, Panitz LM. Sistemas de Informação da Atenção à Saúde: contextos históricos, avanços e perspectivas no SUS. Brasília, DF: Cidade Gráfica e Editora Ltda; 2015.
-
19 Atty ATM, Jardim BC, Dias MBK, et al. PAINEL-Oncologia: uma Ferramenta de Gestão. Rev Bras Cancerol. 2020;66(2); DOI: https://doi.org/10.32635/2176-9745.rbc.2020v66n2.827
» https://doi.org/10.32635/2176-9745.rbc.2020v66n2.827 -
20 Camargo Jr. KR, Coeli CM. Reclink: aplicativo para o relacionamento de bases de dados, implementando o método probabilistic record linkage. Cad Saúde Pública. 2000;16(2):439-47. DOI: https://doi.org/10.1590/S0102-311X2000000200014
» https://doi.org/10.1590/S0102-311X2000000200014 -
21 Ali MS, Ichihara MY, Lopes LC, et al. Administrative Data Linkage in Brazil: Potentials for Health Technology Assessment. Front Pharmacol. 2019;10:984. DOI: https://doi.org/10.3389/fphar.2019.00984
» https://doi.org/10.3389/fphar.2019.00984 -
22 Guerra Junior AA, Pereira RG, Gurgel EI, et al. Building the National Database of Health Centred on the Individual: Administrative and Epidemiological Record Linkage-Brazil, 2000-2015. Int J Popul Data Sci. 2018;3(1):446. DOI: https://doi.org/10.23889/ijpds.v3i1.446
» https://doi.org/10.23889/ijpds.v3i1.446 -
23 Tomazelli JG, Girianelli VR, Silva GA. Estratégias usadas no relacionamento entre Sistemas de Informações em Saúde para seguimento das mulheres com mamografias suspeitas no Sistema Único de Saúde. Rev Bras Epidemiol. 2018;21:e180015. DOI: https://doi.org/10.1590/1980-549720180015
» https://doi.org/10.1590/1980-549720180015 - 24 Ferré F, Oliveira G, Queiroz M, et al. Sala de Situação aberta com dados administrativos para gestão de Protocolos Clínicos e Diretrizes Terapêuticas de tecnologias providas pelo SUS. In: 20º Simpósio Brasileiro de Computação Aplicada à Saúde SBC; 2020 set 15-18; Porto Alegre. Porto Alegre: Sociedade Brasileira de Computação; 2020. p. 392-403.
-
25 TabNet [Internet]. Brasília, DF: DATASUS. c2008 [acesso em 2022 out 28]. Informações de saúde. Produção Ambulatorial do SUS por local de atendimento. Disponível em: http://tabnet.datasus.gov.br/cgi/deftohtm.exe?sia/cnv/qauf.def
» http://tabnet.datasus.gov.br/cgi/deftohtm.exe?sia/cnv/qauf.def - 26 Elmasri R, Navathe SB. Sistemas de banco de dados. 6ª ed. São Paulo: Pearson Addison Wesley; 2011.
-
27 Khan B, Jan S, Khan W, et al. An overview of ETL techniques, tools, processes and evaluations in data warehousing. J Big Data. 2024;6. DOI: http://dx.doi.org/10.32604/jbd.2023.046223
» http://dx.doi.org/10.32604/jbd.2023.046223 - 28 Franco TB. Trabalho, cuidado e transição tecnológica na saúde: um olhar a partir do sistema cartão nacional de saúde. Porto Alegre: Editora Rede Unida; 2021 (Série Micropolítica do Trabalho e o Cuidado em Saúde).
- 29 Conselho Nacional de Saúde (BR). Resolução nº 510, de 7 de abril de 2016. Dispõe sobre as normas aplicáveis a pesquisas em Ciências Humanas e Sociais. Diário Oficial da União, Brasília, DF. 2016 maio 24; Edição 98; Seção I:44-46.
-
30 Atty ATM, Tomazelli JG, Dias MBK. Análise Exploratória das Informações sobre Estadiamento nas Autorizações de Procedimentos de Alta Complexidade no Brasil e Regiões no Período 2010-2014. Rev Bras Cancerol. 2019;63(4):257-64. DOI: https://doi.org/10.32635/2176-9745.RBC.2017v63n4.126
» https://doi.org/10.32635/2176-9745.RBC.2017v63n4.126 -
31 Medeiros CRG, Saldanha OMFL, Grave MTQ, et al. Planejamento regional integrado: a governança em região de pequenos municípios. Saude Soc. 2017;26(1):129-40. DOI: https://doi.org/10.1590/S0104-12902017162817
» https://doi.org/10.1590/S0104-12902017162817 -
32 Lima LD, Viana ALD, Machado CV, et al. Regionalização e acesso à saúde nos estados brasileiros: condicionantes históricos e político-institucionais. Ciênc saúde coletiva. 2012;17(11):2881-92. DOI: https://doi.org/10.1590/S1413-81232012001100005
» https://doi.org/10.1590/S1413-81232012001100005 -
33 Cunha RE. Cartão Nacional de Saúde: os desafios da concepção e implantação de um sistema nacional de captura de informações de atendimento em saúde. Ciênc saúde coletiva. 2002;7(4):869-78. DOI: https://doi.org/10.1590/S1413-81232002000400018
» https://doi.org/10.1590/S1413-81232002000400018 -
34 Petruzalek D. read.dbc: Read Data Stored in DBC (Compressed DBF) Files [Internet]. New York: Datacamp; 2016 [acesso em 2022 out 28]. Disponível em: https://cran.r-project.org/web/packages/read.dbc/index.html
» https://cran.r-project.org/web/packages/read.dbc/index.html -
35 Park H, Lee S, Gim G, et al. Dataverse: Open-Source ETL (Extract, Transform, Load) Pipeline for Large Language Models. arXiv [csCL]. 2024. DOI: https://doi.org/10.48550/arXiv.2403.19340
» https://doi.org/10.48550/arXiv.2403.19340 -
36 Ernest A, Mensah E, Gilbert A. Qualitative assessment of compiled, interpreted and hybrid programming languages. Comm App Electronics. 2017;7:8-13. DOI: https://doi.org/10.5120/cae201765268
» https://doi.org/10.5120/cae201765268 - 37 Sanner MF. Python: a programming language for software integration and development. J Mol Graph Model. 1999;17(1):57-61.
-
38 Prechelt L. An empirical comparison of seven programming languages. Computer 2000;33(10):23-29. DOI: https://doi.org/10.1109/2.876288
» https://doi.org/10.1109/2.876288 -
39 Souza Júnior EV, Santos GDS, Jesus ALO, et al. Tratamento hemodialítico e seus impactos financeiros no nordeste do Brasil. Rev Enferm UFPE On Line. 2019;13. DOI: http://dx.doi.org/10.5205/1981-8963.2019.239674
» http://dx.doi.org/10.5205/1981-8963.2019.239674 -
40 Aly CMC, Reis AT, Carneiro SAM, et al. O Sistema Único de Saúde em série histórica de indicadores: uma perspectiva nacional para ação. Saúde debate. 2017;41(113):500-12. DOI: https://doi.org/10.1590/0103-1104201711312
» https://doi.org/10.1590/0103-1104201711312 - 41 Brilhante OMA. Caldas LQ. Gestão e avaliação de risco em saúde ambiental. Rio de Janeiro: Editora FIOCRUZ; 1999.
- 42 Moya J, Risi Junior JB, Martinello A, et al. Sala de Situação em Saúde: compartilhando as experiências do Brasil. Brasília, DF: Organização Pan-Americana da Saúde; Ministério da Saúde; 2010.
-
43 Rosa L, Mrejen M, Franceschini MC, et al. Instituto de Estudos Para Políticas de Saúde [Internet]. [local desconhecido]: IEPS; 2022 [acesso em 2024 abr 5]. Disponível em: https://iepsdata.org.br/
» https://iepsdata.org.br/ - 44 Ministério da Saúde (BR); Conselho Nacional de Saúde. Resolução nº 659, de 26 de julho de 2021. Dispõe sobre a Política Nacional de Informação e Informática em Saúde (PNIIS). Diário Oficial da União, Brasília, DF. 2022 jun 15; Edição 113; Seção I:104.
- 45 Ministério da Saúde (BR). Estratégia de Saúde Digital para o Brasil 2020-2028. Brasília, DF: Ministério da Saúde; 2020.
- 46 Ministério da Saúde (BR), Gabinete do Ministro. Portaria nº 1.434, de 28 de maio de 2020. Institui o Programa Conecte SUS e altera a Portaria de Consolidação nº 1/GM/MS, de 28 de setembro de 2017, para instituir a Rede Nacional de Dados em Saúde e dispor sobre a adoção de padrões de interoperabilidade em saúde. Diário Oficial da União, Brasília, DF. 2020 maio 29; Edição 102; Seção I:231.
Editado por
-
Editor responsável:
Alessandro Jatobá
Datas de Publicação
-
Publicação nesta coleção
17 Nov 2025 -
Data do Fascículo
2025
Histórico
-
Recebido
14 Nov 2024 -
Aceito
19 Jun 2025
