A Pesquisa Nacional de Saúde (PNS) é a pesquisa mais ampla sobre saúde já realizada no país. Trata-se de um survey com perguntas sobre hábitos de vida, diagnósticos de saúde e testes bioquímicos, realizado em 2013 pelo Instituto Brasileiro de Geografia e Estatística (IBGE) em parceria com o Ministério da Saúde e diversas instituições de ensino e pesquisa. A coleta de dados ocorreu com 60.202 respondentes, e a amostra total contém informações a respeito de mais de 250 mil moradores de 1.600 municípios brasileiros. Os domicílios sem respondentes individuais têm suas informações coletadas em outro questionário. Os dados combinam informações dos questionários domiciliar (idade, raça e gênero dos moradores) e individual (tabagismo, diagnósticos e histórico médico de moradores com mais de 18 anos, sorteados). Não há informações epidemiológicas sobre menores de idade, mas estimativas importantes deste grupo serão feitas nas partes finais deste texto.

Pesquisas como a PNS têm metodologia domiciliar: são selecionadas aleatoriamente casas em vários bairros para representar um grupo de quarteirões. Este agrupamento amostral permite fazer generalizações sobre a população brasileira. Foto por sergio souza no Unsplash.

Sensibilização: a análise de fatos sociais através dos dados

Todo dado tem uma história própria, que os acompanha desde o início do planejamento da obtenção até a sua divulgação. Quando acessamos alguma estatística oficial em um site, existe todo um processo que nos levou até aquela cifra. São estas etapas antecedentes à divulgação de um dado que interferem no resultado final.

A forma como são organizadas as etapas de planejamento, de coleta e de sistematização dos dados tem um efeito significativo no resultado produzido. Nem sempre um dado é investigado tendo-se em vista nas dúvidas dos pesquisadores interessados no assunto, mas sim em necessidades reais de grupos e instituições. Também, as pessoas envolvidas em todas essas etapas interferem no resultado: com seus objetivos, agendas governamentais, interesses próprios de pesquisa ou pressão das agências financiadoras.

Quais dados serão selecionados? Como eles serão obtidos? Em qual registro confiaremos? A validação passará pelo crivo de quem? Ele será validado de forma automática ou manual? Se precisarmos deixar algumas informações de fora, quais deixaremos? Como serão desenhados os formulários ou questionários para a obtenção do dado? São todas perguntas que fazem parte do quotidiano de quem planeja, analisa e estrutura dados nas agências públicas, nos núcleos de pesquisa científica e nas empresas do setor de consultoria e insights.

O fato social saúde-doença e as possíveis ferramentas de análise

Existem diferentes formas de estimar o fato social da saúde e do adoecimento das populações: os dados administrativos e os dados amostrais. Dados administrativos são oriundos de ferramentas de registro oficias do governo, para fins de monitoramento da máquina pública; e dados amostrais são obtidos em pesquisas. As análises que são produzidas destes dois tipos de dados resultam em achados de diferentes naturezas e propósitos.

Dados administrativos

O uso de técnicas baseadas nas informações de mortes por doenças específicas e na expectativa de vida das pessoas ao longo do tempo é um caminho de se entender sociedade e saúde. Os dados oficiais de monitoramento da rede de saúde brasileira são de natureza administrativa, ou seja, são emitidos e processados por agentes públicos de acordo com a arquitetura de seu sistema de coleta de dados. Não são obtidos diretamente da população e o dado leva como natureza os diagnósticos médicos e os registros hospitalares. No Brasil, as bases de dados que alimentam este monitoramento contêm informações contábeis e de vigilância sanitária do Ministério da Saúde (DataSus), que compreendem desde o número de internações por causas específicas, inquéritos nutricionais, até novos diagnósticos de doenças que as unidades públicas e privadas de saúde são obrigadas a notificar.

Dados amostrais

Uma outra alternativa é o uso de pesquisas amostrais domiciliares que cobrem diferentes níveis de território e efetuam uma investigação baseada nos relatos e na história de vida dos entrevistados, diferentemente da replicação de padrões identificados em estudos clínicos ou em dados administrativos de notificação obrigatória. Surveys são retratos de um tempo, de um período onde a pesquisa foi realizada. As análises oriundas de survey são descrições e decomposições de um objeto (os fatos sociais), estão localizados no tempo e, assim como fotografias sociais, são representações de um momento (REALE, 2013).

Vantagens e limitações dos dois tipos de dados para inquéritos de saúde

O DALY é uma das visualizações deste fato social saúde-doença, sendo uma medida que funciona tal qual um indicador sintético de mensuração do impacto de doenças em populações. Esta medida foi proposta por Christopher Murray e Alan D. Lopez em um trabalho pioneiro da década de 90. Resumidamente, ele se baseia na relação entre os anos de vida que se espera que uma pessoa da idade x e do sexo y perca por causa de uma morte precoce ocasionada pela doença z (MELSE et al, 2000). Como muitos destes parâmetros mencionados acima não estão imediatamente disponíveis, os pesquisadores precisam recorrer a estimativas baseadas em padrões da literatura ou confiar nas estatísticas de morte fornecidas para toda a população (LEITE et al, 2002). Com essa cifra, é possível realizar um cálculo que extrapola o padrão de adoecimento identificado em grupos específicos para toda uma população.

Mas até onde vão os dados administrativos? Suas limitações residem em dependerem da cobertura e do acesso ao sistema público de saúde por parte de alguns grupos, que poderiam ser alcançados em um inquérito domiciliar amostral. Dados administrativos também estão subordinados aos subtipos de doenças que são notificados pelos órgãos oficiais de saúde e ao alcance da literatura médica atualizada de estudos clínicos populacionais, (LEITE et al, 2002).

Em contrapartida, entrevistas em survey estão sujeitas ao contexto social e cognitivo de quem está sendo entrevistado, e à saliência, que na linguística cognitiva significa a força do acionamento da memória e do entendimento de conceitos em situações específicas (SCHMID, 2010; STRACK & MARTIN, 1987). Para a saúde, o contexto-situação é o autorreconhecimento de um diagnóstico médico durante uma entrevista de questionário.

Sua principal desvantagem é que, por se tratarem de um estudo baseado em entrevistas nas casas das pessoas, suveys domiciliares desconsideram a população institucionalizada (presos, internados, indivíduos em situação de abrigo estatal) na semana de realização dos inquéritos (LEITE et al, 2002). Também subnotificam alguns casos por não perguntarem de maneira específica sobre todos os tipos de doenças, embora sempre há a possibilidade de a pessoa informar o entrevistador que possui outras doenças crônicas em inquéritos desta natureza. Por outro lado, estas pesquisas possibilitam uma avaliação do status de saúde do indivíduo sob uma perspectiva diferente daquela obtida com base em registros de serviços de saúde ou de amostra de provedores de tais serviços, resultando em uma visão do fenômeno social por uma diferente ótica.

Para fins didáticos, optou-se pela aplicação do critério amostral nesta investigação. Será ilustrado o funcionamento do uso de estatísticas domiciliares em grandes estimativas de saúde, e esta metodologia muito utilizada em análises sociológicas será introduzida por meio de um caso concreto, com a necessidade de levantar informações sobre a saúde da população brasileira. Assim como nas ponderações finais do artigo, deve-se reconhecer as limitações do alcance dos inquéritos domiciliares em qualquer tipo de investigação social, mas também seus méritos e vantagens.

Agora, inicia-se a estimativa do grupo de risco por meio das informações obtidas na PNS.

Estimando o grupo de risco

De forma a conseguir calcular o grupo de risco da COVID-19 com a amostra de 2013 e, posteriormente, estimá-lo em 2020, será feita a combinação da interpretação descritiva da amostra da PNS em 2013 com a projeção populacional para dezembro de 2019 por meio da Pesquisa Nacional por Amostra de Domicílios (PNAD) e a correção populacional pelas taxas de mortalidade anuais divulgadas pelo IBGE até 2018. Também será utilizada a imputação múltipla para estimar algumas prevalências de idades específicas. Por fim, espera-se alcançar uma estimativa preliminar aproximada e conservadora do número de pessoas no grupo de risco em 2020. Este raciocínio será explicado ao longo da composição da fórmula.

Um caminho para estimar o tamanho da população de risco do COVID-19 em 2020.

Idosos

Segundo informações fornecidas a agentes de saúde pública em serviços nacionais (como o NHS, o SUS ou o NSE), o grupo de risco é composto de três coletivos epidemiológicos: fumantes, doentes crônicos e idosos. Os idosos serão um grupo mais fácil para se encontrar usando dados mais recentes (como os da PNAD). A PNS será utilizada em pessoas que tenham de 18 a 65 anos em 2020 (ou seja, de 11 a 58 anos em 2013), e a contabilização de idosos será deixada para o final. Portanto, comecemos com os fumantes.

Tabagismo atual e histórico

Para começar, agregam-se todos os fumantes com mais de 18 e menos de 65 anos em 2020. A base utilizada será de 144.225 respondentes com 11 a 58 anos (pois o ano onde a informação foi coletada é 2013). Foram identificados 15.231 deles com histórico de tabagismo ou tabagismo atual (eles são unificados devido ao dano irreversível causado aos pulmões). Mais tarde, explicarei como obtive os dados para quem tinha de 11 a 17 anos.

Pacientes crônicos

Parte-se, então, à inclusão das doenças crônicas que englobam o grupo de risco segundo as fontes consultadas. Foram encontradas perguntas e variáveis identificadoras para as seguintes tipologias de doenças crônicas:

Cardíacas (crônicas do aparelho circulatório);

Pneumopatias (bronquite, asma, DPO, rinite e outras);

Hepáticas (do fígado);

Imunossupressoras (causadas por falhas no sistema imune);

Cerebrovasculares (aneurisma, AVC etc.);

Doença renal crônica (DRC);

Diabetes;

Hipertensão;

Câncer.

Infelizmente, houve problemas de limitação do estudo a respeito de três tipos de doenças crônicas: hepáticas (do fígado), imunossupressoras (como lúpus ou complicações ligadas ao vírus HIV) e câncer. O estudo não separa pessoas que já superaram o câncer daquelas à época diagnosticadas. Portanto, todas serão tratadas como um conjunto, pois pessoas já tratadas têm alto risco de possuírem algum comprometimento da saúde devido ao tratamento passado.

Não há no questionário perguntas ligadas a doenças crônicas hepáticas ou imunossupressoras. Com muito otimismo se espera que estejam contabilizadas na variável de outras doenças, embora se deva reconhecer que o não entendimento de certas doenças como crônicas ou o esquecimento no ato da pesquisa podem causar subestimação não só destas mas também de outras. Como discutido anteriormente, a alternativa para o mapeamento de pacientes crônicos seria a combinação de estatísticas de prevalência e incidência identificadas na literatura médica com informações de internação e de notificação do Ministério da Saúde. Entretanto, para não misturar as técnicas e as bases de dados alimentadoras e prezando uma maior homogeneidade nos dados, seus erros e vieses, esta etapa será deixada de lado. Estimula-se fortemente o uso desta técnica para fornecer uma estatística contrafactual à aqui apresentada. Agora, voltando à pesquisa:

A PNS-13 contabilizava 11.890 pessoas de 18 a 58 anos com doenças crônicas. Algumas delas têm histórico de tabagismo, e no cômputo final do grupo de risco elas não serão duplicadas por serem individualmente identificadas no banco de dados.

Grávidas e puérperas

Deve-se também incluir mulheres grávidas e puérperas (mulheres que tiveram filhos nos últimos 45 dias, extensíveis até 60). Embora não sejam grupo de risco em outros países, aqui no Brasil elas foram assim consideradas pelo Ministério da Saúde (MS). De posse dessa informação, acrescentei todas as 800 grávidas entre 18 e 58 anos, sendo que algumas destas são fumantes e pacientes crônicas.

Infelizmente, não é possível obter dados a respeito das puérperas, dado que a cobertura da PNS é anual. Tampouco se encontram números mais recentes, pois as estatísticas vitais de nascimento mais atuais datam de 2018. A proporção que foi apresentada aqui provavelmente é subestimada, pois o mês onde nos encontramos (abril) tem uma das maiores taxas de nascimento de todo o ano, e acabamos de passar por dois períodos que também têm elevado número de nascimentos (fevereiro e março) e, portanto, de puérperas. Esta cifra deve ser tomada com cautela.