MEDICINA BASEADA EM EVIDÊNCIAS
DADOS ACADÊMICOS
CÓDIGO DO CURSO: 9
DISCIPLINA: Medicina Baseada em Evidências
CÓD. DISCIPLINA: MBE
PERÍODO: 7º
CARGA HORÁRIA TOTAL: 60 horas
Estudos Ecológicos e Multinível
"Nenhum homem é uma ilha, completo em si mesmo; todo homem é uma parte do continente, uma parte do todo."— John Donne
Introdução
A maioria dos cidadãos dos Estados Unidos tem o direito legal de possuir uma arma de fogo para proteção pessoal. No entanto, se essa posse realmente traz benefícios ao indivíduo é algo que há muito tempo gera debate (Hemenway e Azrael, 2000; Cummings e Koepsell, 1998; Kleck e Gertz, 1995).Alguns defendem que manter uma arma em casa pode afastar criminosos e permitir que as possíveis vítimas se defendam. Por outro lado, há quem argumente que exibir uma arma pode provocar uma reação armada do invasor ou que o fácil acesso a uma arma dentro de casa pode transformar um conflito doméstico em um episódio de violência com arma de fogo. Killias (1993) relatou um estudo que buscava esclarecer a relação entre a posse de armas de fogo e o risco de homicídio ou suicídio. Uma amostra de domicílios em 13 países participou de uma pesquisa internacional sobre criminalidade, a qual forneceu estimativas específicas de cada país quanto à proporção de residências com pelo menos uma arma de fogo. Essas informações foram então combinadas com as taxas de mortalidade por homicídio em cada país.A Figura 16.1 apresenta os resultados relativos a todos os homicídios. Constatou-se que a prevalência de armas de fogo nos domicílios possuía uma correlação positiva significativa com a taxa de homicídios.
FIGURA 16.1 – Associação ecológica entre a prevalência de armas de fogo em domicílios e a taxa de homicídios em 13 países, 1983–1989.(Com base nos dados de Killias [1993])

Em outras análises, a prevalência da posse de armas de fogo também apresentou correlação positiva com as taxas de mortalidade por homicídios cometidos com armas de fogo, com o total de suicídios, com os suicídios por arma de fogo, e com as proporções de homicídios e suicídios causados por armas. O artigo concluiu que “as correlações identificadas neste estudo sugerem que a presença de uma arma de fogo no domicílio aumenta a probabilidade de ocorrência de homicídio ou suicídio.
O estudo de Killias é um exemplo de estudo ecológico. Estudos ecológicos investigam associações entre exposição e desfecho em grupos de pessoas, analisando como a frequência da exposição em cada grupo se relaciona com a frequência do desfecho naquele mesmo grupo. Esses estudos geralmente são realizados por dois motivos principais. Primeiro, pode ser que o pesquisador tenha apenas informações agregadas sobre cada grupo, mesmo sabendo que tanto a exposição quanto o desfecho variam entre os indivíduos dentro de cada grupo. Por exemplo, no estudo de Killias, havia apenas estimativas da prevalência geral de posse de armas para cada país — não havia dados sobre a posse de armas por indivíduo ou domicílio. Assim, não era possível determinar, com os dados disponíveis, se uma vítima de homicídio em determinado país tinha mais ou menos chance de possuir uma arma em comparação com outros indivíduos naquele mesmo país. Cada um dos 13 países foi tratado como uma unidade de observação. Nessa abordagem, a associação entre exposição e desfecho é estudada no nível populacional, como uma forma indireta de inferir o que ocorre no nível individual. Como será discutido adiante, há vários riscos e limitações ao tentar fazer esse tipo de inferência entre níveis distintos.
Em segundo lugar, a exposição de interesse pode, na verdade, variar apenas no nível do grupo, e não entre os indivíduos dentro de cada grupo. Por exemplo, as penalidades legais por dirigir sob efeito de álcool variam entre os estados, mas todos os indivíduos de um mesmo estado estão sujeitos à mesma legislação estadual. Nessa situação, a associação entre exposição e desfecho precisa ser analisada em nível agregado, já que não há variação da exposição dentro do grupo. Em princípio, as populações agregadas em estudos ecológicos podem ter qualquer tamanho, incluindo domicílios, salas de aula, locais de trabalho, instituições, comunidades, regiões geográficas ou até países inteiros. Frequentemente, os grupos são populações definidas geopoliticamente, para as quais os dados necessários são rotineiramente coletados — uma vez que a maioria dos estudos ecológicos utiliza dados secundários já existentes (Dufault e Klar, 2011). Estudos ecológicos devem ser vistos como uma classe de delineamentos de estudo, e não como um único tipo de desenho específico (Morgenstern, 1995; Walter, 1991a). A distinção entre usar populações agregadas ou indivíduos como unidades de estudo é uma das dimensões que permite diferenciar os tipos de delineamento de estudo. Em outros aspectos, os delineamentos ecológicos podem ser classificados de forma semelhante aos estudos com indivíduos.
Por exemplo:
-
Ensaios em grupo (Group-randomized trials):
Ensaios comunitários de intervenção envolvem a designação aleatória de comunidades inteiras para condições de intervenção ou controle. Eles são o equivalente ecológico aos ensaios clínicos randomizados com indivíduos.
Por exemplo, Finkelstein et al. (2008) avaliaram a efetividade de um programa comunitário para reduzir a prescrição desnecessária de antibióticos em crianças, randomizando 16 comunidades de Massachusetts entre intervenção e controle.
Todos os profissionais de saúde de uma mesma comunidade pertenciam ao mesmo grupo de tratamento. Prontuários eletrônicos foram utilizados para monitorar as prescrições de antibióticos em crianças de diferentes idades, conforme o local de residência — se em comunidade intervenção ou controle.
-
Estudos ecológicos de coorte (Ecological cohort studies):
A frequência de uma doença (ou outro desfecho) pode ser comparada entre populações expostas e não expostas, mesmo que o pesquisador não tenha controle sobre a exposição.
Por exemplo, Boice et al. (2006) analisaram as taxas de mortalidade por câncer em quatro condados próximos à instalação nuclear de Hanford, no Estado de Washington, onde houve liberação de iodo radioativo entre 1944 e 1957.
As taxas foram comparadas com aquelas de cinco condados demograficamente semelhantes no mesmo estado, mas com baixa ou nenhuma exposição ao iodo radioativo.
-
Estudos ecológicos transversais (Cross-sectional ecological studies):
Duas ou mais características, referentes ao mesmo ponto no tempo ou período, podem ser comparadas entre diferentes populações.
O estudo internacional de Killias sobre posse de armas e taxas de homicídio é um exemplo clássico desse tipo de estudo.
-
Estudos ecológicos longitudinais (Longitudinal ecological studies):
Analisam mudanças na frequência de um desfecho ao longo do tempo em populações inteiras, correspondendo aos estudos longitudinais em nível individual.
Por exemplo, Héry et al. (2010) examinaram a incidência de melanoma cutâneo na Islândia ao longo de um período de 53 anos, em relação ao aumento do uso de camas de bronzeamento artificial no país e ao crescimento de viagens internacionais a destinos ensolarados.
Contudo, não havia dados individuais disponíveis que relacionassem diretamente o uso das camas de bronzeamento com os casos de melanoma.
Diversas revisões úteis sobre questões metodológicas que surgem em estudos ecológicos foram publicadas, incluindo: Wakefield (2008); Morgenstern (1995); Walter (1991a, 1991b).
Dufault e Klar (2011) revisaram a qualidade dos relatos de estudos ecológicos em diversos periódicos de epidemiologia e apresentaram recomendações para seu aprimoramento.
VARIÁVEIS EM NÍVEL INDIVIDUAL E EM NÍVEL DE GRUPO
Grupos são formados por indivíduos — uma afirmação que destaca dois níveis de agregação nos quais características relevantes para a ocorrência de doenças podem ser observadas.As variáveis em nível individual incluem características bem conhecidas, como idade, sexo, posse de arma de fogo, entre outras. No entanto, em estudos ecológicos, essas medidas individuais frequentemente não estão disponíveis.
As variáveis em nível de grupo podem ser classificadas em dois tipos:
• Medida agregada
Refere-se ao resumo da distribuição de uma característica individual dentro de um grupo — ou seja, uma estatística descritiva derivada de dados individuais.
Exemplos incluem:
-
Idade médiaIdade
-
mediana
-
Proporção de pessoas com 65 anos ou mais
Essas medidas agregam a distribuição da variável individual em um valor único representativo do grupo. Elas também são chamadas de variáveis derivadas (Susser, 1994a; Diez-Roux, 2002).
Além disso, uma medida agregada pode assumir novos significados ao nível grupal, funcionando como um indicador do ambiente em que os indivíduos vivem.
Por exemplo, no caso da posse de armas e homicídios, o risco de uma pessoa ser vítima de homicídio pode ser influenciado não apenas por ela possuir ou não uma arma, mas também pela prevalência geral de armas na comunidade.
Assim, a posse individual de arma e a prevalência populacional de posse de armas, embora representem a mesma característica em diferentes níveis, podem afetar o risco de homicídio por mecanismos distintos.
• Medida intrinsecamente coletiva
Conhecida como medida integral por alguns autores (Diez-Roux, 2002; Pickett e Pearl, 2001; Susser, 1994a; Selvin e Hagstrom, 1963), caracteriza o grupo como um todo, e não tem variação entre indivíduos de um mesmo grupo.
Exemplos:
-
Tamanho de uma cidade
-
Densidade populacional
-
Existência de leis locais sobre registro de armas
Tais medidas se aplicam automaticamente a todos os membros do grupo e não variam entre indivíduos dentro do mesmo grupo. Um exemplo importante desse tipo de variável é a presença ou ausência de políticas públicas ou programas que afetam toda a população e influenciam a frequência de doenças.
As variáveis em nível de grupo — sejam resumos agregados de variáveis individuais ou medidas intrinsecamente coletivas — também podem ser chamadas de variáveis contextuais (Diez-Roux, 2002).
Mais amplamente, as populações podem ser divididas em vários níveis de agregação — por exemplo: setor censitário, cidade, estado e país — que podem ser organizados hierarquicamente.
Estudos multinível (a serem discutidos posteriormente) utilizam dados de dois ou mais níveis de agregação.
Para os propósitos atuais, porém, dois níveis são suficientes para introduzir as principais questões metodológicas em estudos ecológicos — especialmente os problemas que surgem quando apenas dados agregados estão disponíveis.
Esses dois níveis são comumente denominados:
-
Nível macro (grupo/população)
-
Nível micro (indivíduo)
ESTUDANDO EFEITOS DE EXPOSIÇÕES EM NÍVEL INDIVIDUAL
Um dos principais usos dos estudos ecológicos em epidemiologia tem sido investigar a relação entre uma exposição em nível individual e o risco de doença também em nível individual, utilizando a associação entre a prevalência da exposição e a frequência da doença em nível populacional como substituto (proxy) para a associação em nível individual — que é o verdadeiro objeto de interesse.
Por exemplo, Delong (2011) relatou uma associação positiva, no nível estadual dos EUA, entre:
-
A proporção de crianças vacinadas até os dois anos de idade, e
-
A prevalência de autismo ou distúrbios de fala/linguagem nos mesmos estados.
Sugeriu-se que essa associação em nível macro poderia sustentar a possível existência de uma associação em nível micro entre o recebimento de múltiplas vacinas e o risco de desenvolvimento de autismo ou transtornos de linguagem — ainda que essa inferência exija cautela.
O estudo de Killias sobre posse de armas e homicídios é outro exemplo de tentativa de inferir associações individuais a partir de dados agregados.
Outros exemplos históricos notáveis de estudos ecológicos que buscaram avaliar associações individuais incluem:
-
Tabagismo e câncer de pulmão: Taxas de mortalidade por câncer de pulmão foram mais altas em países com maiores vendas per capita de tabaco, sendo este achado usado para apoiar a inferência de que fumar causa câncer de pulmão (Comitê Consultivo do Surgeon General, 1964).
-
Pobreza e pelagra: Como descrito no Capítulo 7, Goldberger et al. (1920) observaram que a pelagra era mais comum em vilarejos de operários de fábricas têxteis na Carolina do Sul, onde uma maior proporção de homens tinha renda per capita abaixo de 6 a 8 dólares por mês. Posteriormente, os pesquisadores confirmaram essa associação em nível individual e mostraram que ela estava provavelmente relacionada a diferenças na alimentação conforme a renda.
-
Flúor na água potável e cárie dentária: Dean (1938) observou que a prevalência de cárie dentária era menor entre crianças de várias comunidades do Meio-Oeste dos EUA que possuíam níveis mais altos de flúor na água potável.
Vantagens dos Estudos Ecológicos
1. Disponibilidade de dados pré-existentes e baixo custo
Uma das principais vantagens de utilizar estudos ecológicos para investigar associações em nível individual é a disponibilidade de dados populacionais pré-existentes. Quando esses dados já estão acessíveis, o estudo pode ser realizado de forma rápida e com baixo custo.
2. Maior variação entre populações do que dentro delas
Outra vantagem ocorre quando a frequência da exposição varia substancialmente entre diferentes populações, mas pouco dentro de cada população.
Essa situação é ilustrada na Figura 16.2, onde tanto a exposição quanto o desfecho são tratados como variáveis contínuas. Por construção, a relação verdadeira entre exposição e desfecho é positiva e linear, com erro aleatório ao redor de uma mesma linha de regressão.

Cada retângulo representa os dados individuais de uma de três comunidades hipotéticas. A exposição varia pouco dentro de cada comunidade, mas a média da exposição varia bastante entre as comunidades. Como resultado, a relação linear entre exposição e desfecho é mais fácil de detectar quando se consideram os dados agregados das três comunidades (r de Pearson = 0,90), mas é menos evidente dentro de cada comunidade isoladamente (com r = 0,42; 0,04; e 0,20, respectivamente).
Exemplo real:
O epidemiologista Geoffrey Rose observou que estudar a relação entre dureza da água e mortalidade por doenças cardiovasculares por meio de estudos caso-controle em regiões britânicas seria inútil, já que quase todos os indivíduos em uma mesma região consomem a mesma água fornecida pelo sistema público, resultando em exposição uniforme dentro de cada região.
Por outro lado, a dureza da água variava significativamente entre as regiões, o que possibilitou detectar uma associação inversa entre dureza da água e mortalidade cardiovascular (Rose, 1985).
De forma semelhante, grandes diferenças geográficas e culturais na ingestão de gorduras na dieta podem facilitar a detecção de associações entre gordura alimentar e incidência de câncer de mama em estudos ecológicos, enquanto isso pode ser difícil de observar em estudos individuais dentro de uma mesma região geográfica (Goodwin e Boyd, 1987).
3. Redução de erros de medição individuais
Uma terceira vantagem surge quando a exposição apresenta alto grau de erro de mensuração ou variação biológica de curto prazo no nível individual (Piantadosi et al., 1988; Susser, 1994a,b). Nesses casos, a agregação dos dados individuais para o nível populacional pode reduzir os efeitos desses erros, permitindo detectar associações que, de outro modo, poderiam passar despercebidas (Prentice e Sheppard, 1995).
Estimando Risco Atribuível e Risco Relativo
Os resultados de estudos ecológicos são, por vezes, apresentados apenas como coeficientes de correlação (Dufault e Klar, 2011), os quais indicam ao menos a direção e a intensidade aproximada da associação, em nível de grupo, entre a prevalência da exposição e a frequência da doença.
Por exemplo, nos dados do estudo de Killias (Figura 16.1), a correlação de Pearson entre a prevalência de armas de fogo em domicílios e a taxa de homicídios entre países é de +0,73, enquanto a correlação de Spearman é de +0,47 — ambas sugerindo uma associação positiva de moderada a forte.
No entanto, para fins epidemiológicos, as medidas de associação mais úteis são o risco relativo (RR) e o risco atribuível (RA), pois são mais informativas e facilitam a comparação com resultados de outros delineamentos de estudo.
Estimativa de RR e RA a partir de dados ecológicos
Pode-se obter estimativas pontuais de risco relativo e risco atribuível a partir de dados ecológicos usando uma generalização do método descrito por Morgenstern (1982, 1995):
-
Aplicar uma regressão aos dados em nível de grupo, modelando a frequência da doença em função da prevalência da exposição.
-
Usar o modelo ajustado para prever a frequência da doença em uma população 100% exposta (denominada R1) e em uma população 0% exposta (R0).
-
Estimar o risco relativo (RR) como R1 / R0 e o risco atribuível (RA) como R1 − R0.
Embora posteriormente sejam discutidos diversos problemas ao inferir associações individuais com base em dados ecológicos, os dados do estudo de Killias sobre posse de armas e homicídios são úteis para ilustrar esse método e os problemas que podem surgir.
Modelos de regressão utilizados (Tabela 16.1)
A Tabela 16.1 mostra os resultados da aplicação de quatro modelos de regressão diferentes:
• Regressão linear simples (não ponderada)
-
Atribui peso igual a cada um dos 13 países.
-
Assume uma relação linear entre prevalência da exposição e frequência do desfecho.
-
Problema: viola a suposição de homocedasticidade (variância constante), pois países menores têm taxas menos precisas.
• Regressão linear ponderada
-
Também assume relação linear, mas pondera os dados de cada país pelo tamanho populacional estimado.
-
Tenta contornar a violação da homocedasticidade.
-
Problema: tanto nos modelos ponderado quanto não ponderado, podem ocorrer valores negativos previstos para R0 ou R1 — o que é impossível para taxas ou proporções.
• Regressão de Poisson
-
Assume relação linear entre o logaritmo da taxa e a prevalência da exposição.
-
Atribui maior peso a países maiores e garante valores positivos para R0 e R1.
-
Problema: os resíduos frequentemente apresentam mais variação do que o esperado (superdispersão).
• Regressão binomial negativa
-
Usa modelo log-linear como a Poisson, mas permite variação extra além da assumida pelo modelo de Poisson.
-
Geralmente melhor ajustado para dados com superdispersão.
Variações nas estimativas
Todos os modelos apontaram uma forte associação positiva entre prevalência de posse de armas e taxa de homicídios. No entanto, as estimativas de RR e RA variam amplamente entre os modelos.
Uma das razões é que estimar R0 e R1 exige extrapolar a regressão ajustada para além da faixa observada de prevalências de exposição — isto é, prever taxas de homicídio em cenários hipotéticos de 0% ou 100% de domicílios com armas.
Pequenas diferenças no formato da regressão são amplificadas pela extrapolação, levando a estimativas muito divergentes. Por exemplo, no modelo de regressão linear ponderada, a estimativa de R0 foi negativa, o que inviabiliza o cálculo de RR nesse caso.
Limitações e melhor modelo
Como os estudos ecológicos geralmente têm poucos pontos de dados populacionais, há baixa potência estatística para detectar diferenças significativas entre os modelos (Greenland, 1992; Richardson et al., 1987).
No exemplo em questão, a comparação dos indicadores de qualidade de ajuste (goodness-of-fit) sugere que o modelo de regressão binomial negativa é o que melhor representa os dados — portanto, os valores da última linha da Tabela 16.1 seriam os mais confiáveis para estimar RR e RA.

⚠️ Armadilhas dos Estudos Ecológicos
Estudos ecológicos que tentam estimar associações em nível individual entre exposição e doença estão sujeitos a várias fontes potenciais de viés, algumas sem paralelo em estudos individuais.
📌 Exemplo ilustrativo: posse de armas e homicídios
Em diversos formatos, os dados sugerem uma associação positiva entre posse de armas e risco de homicídio. No entanto, considere os dados hipotéticos da Tabela 16.2, de um estudo semelhante ao de Killias, mas com apenas quatro países.

Embora a associação entre países seja perfeita e linear (mais armas, mais homicídios), os dados individuais revelam o oposto: dentro de cada país, a taxa de homicídios entre quem possui arma é metade daquela entre quem não possui.
➡️ Ou seja: a associação em nível individual tem direção oposta à vista em nível populacional.
A Figura 16.3 mostra graficamente esse fenômeno: dentro de cada população, o aumento da exposição diminui o desfecho, mas entre populações, o aumento da exposição média aumenta o desfecho médio.

Esse exemplo evidencia o fenômeno conhecido como falácia ecológica — erro de inferência que ocorre ao assumir que uma associação observada em nível populacional também se aplica em nível individual (Robinson, 1950).
De forma mais ampla, isso representa um caso de viés entre níveis (cross-level bias).
⚠️ Causas da falácia ecológica e do viés entre níveis
1. O grupo é um confundidor
-
Por exemplo, na Tabela 16.2, à medida que a posse de armas aumenta entre os países, a taxa de homicídios entre não possuidores também aumenta.Isso indica que o "país" está associado tanto à exposição quanto ao desfecho entre os não expostos (Firebaugh, 1978).
Isso pode ocorrer quando:
-
Os grupos diferem na distribuição de fatores de risco individuais, como idade e sexo.
-
Ex: País com maior proporção de jovens do sexo masculino (mais propensos a portar armas e sofrer homicídios).
-
-
Existe um fator grupal intrínseco confundidor, como fraca fiscalização legal, que pode aumentar tanto a posse de armas quanto os homicídios.
-
A exposição tem efeitos indiretos no grupo:
-
O risco de homicídio para quem não possui armas pode ser maior em sociedades onde a posse de armas é comum.
-
🔁 Exemplo análogo: imunidade de rebanho
-
O risco de contrair uma doença depende da imunidade coletiva, não apenas da condição imunológica individual.
-
Isso também pode ocorrer com doenças não infecciosas:
-
Ex: A presença de detectores de fumaça em uma casa pode reduzir o risco de incêndio para casas vizinhas
-
2. Modificador de efeito distribuído desigualmente entre os grupos
Greenland e Morgenstern (1989) mostram que, mesmo com incidência de câncer de esôfago estável entre não fumantes, a incidência entre fumantes varia conforme a prevalência de um modificador de efeito entre grupos.
➡️ Isso pode gerar viés ecológico, até mesmo sugerindo uma associação inversa falsa.
3. Especificação incorreta do modelo
-
Muitas exposições graduais têm relações não lineares com o risco.
-
Um estudo ecológico pode utilizar apenas a média da exposição no grupo, ignorando a distribuição real.
-
Ex: Dois grupos com mesma média de exposição podem ter distribuições diferentes (dispersa vs. concentrada), o que afeta as taxas reais da doença.
-
➡️ Modelos lineares simples podem parecer ajustados, mas distorcem a realidade individual.
4. Erro de mensuração e controle de confundimento
📉 Erro de classificação não diferencial
-
Em estudos individuais, esse erro tende a reduzir estimativas (viés para nulo).
-
Em estudos ecológicos, ele pode causar viés para longe do nulo (Brenner et al., 1992).
⚖️ Dificuldade de controlar confundimento
-
Confundidores podem atuar tanto no nível individual quanto no grupal.
-
Alguns têm relação não linear com o risco, e não podem ser controlados adequadamente com médias agregadas.
-
Ex: Melhor que usar apenas a idade média é usar proporções por faixa etária (Greenland e Robins, 1994).
-
📊 Padronização
-
Pode ser útil, como uso de taxas ajustadas por idade em vez de taxas brutas.
-
É importante que prevalência da exposição e outras covariáveis também sejam padronizadas para a mesma população de referência (Rosenbaum e Rubin, 1984).
🎯 Como minimizar os vieses
-
Selecionar grupos com baixa variação interna e alta variação entre grupos na exposição (Wakefield, 2008).
-
Grupos devem ser semelhantes em potenciais confundidores, o que nem sempre é compatível com a maximização da heterogeneidade de exposição
❗ E então, por que ainda usar estudos ecológicos?
Diante de tantas armadilhas, por que um epidemiologista usaria esse tipo de estudo?
Alguns argumentam que estudos ecológicos devem ser usados apenas para geração de hipóteses (Piantadosi, 1994). Mas mesmo isso seria difícil de justificar se eles forem tão propensos a enganar quanto a esclarecer.
🔬 Exemplo real: análise empírica do viés ecológico
Piantadosi et al. (1988) realizaram uma das raras análises empíricas do viés ecológico:
-
Analisaram os mesmos pares de variáveis da Second National Health and Nutrition Examination Survey (NHANES) em nível individual e ecológico.
-
A Figura 16.4 mostra a correlação entre os dois níveis: embora existam anomalias (como no par raça/peso), houve uma correspondência geral na direção e magnitude das associações.
🔄 Casos ilustrativos
-
Posse de armas e homicídios: estudos caso-controle também encontraram associação positiva (Kellermann et al., 1993), reforçando a conclusão do estudo de Killias.
-
Vacina tríplice viral (MMR) e autismo: revisão sistemática de estudos individuais não encontrou associação (Demicheli et al., 2012), contrariando o estudo ecológico de Delong (2011).

Estudos dos Efeitos de Exposições em Nível de Grupo
Uma segunda aplicação dos delineamentos ecológicos em epidemiologia é o estudo dos efeitos de características em nível de grupo sobre a saúde. Diversos autores argumentam que o contexto social e ambiental — refletido tanto por características intrinsecamente coletivas quanto por medidas derivadas de características individuais agregadas ao nível grupal — pode exercer grande influência sobre a saúde, mas que esses fatores contextuais têm recebido relativamente pouca atenção na pesquisa epidemiológica (Putnam e Galea, 2008; Schwartz, 1994; Susser e Susser, 1996; Diez-Roux, 1998; March e Susser, 2006; Gordon, 1966).
➡️ Desconsiderar todos os estudos ecológicos com base na vulnerabilidade ao viés pode levar à negligência de um conjunto importante de determinantes da frequência de doenças.
Exposição grupal: políticas e programas
Um tipo fundamental de exposição em nível de grupo que pode afetar a saúde é a implementação de políticas ou programas populacionais. O Capítulo 21 aborda abordagens epidemiológicas para avaliação de políticas com mais profundidade, mas os estudos ecológicos representam uma dessas abordagens.
📌 Exemplo 16-1: Leis de armazenamento seguro de armas e mortes infantis por armas de fogo
Durante os anos 1990, alguns estados americanos promulgaram leis que tornavam os proprietários de armas criminalmente responsáveis caso uma criança tivesse acesso não supervisionado a uma arma e causasse ferimentos a si ou a terceiros.Cummings et al. (1997) investigaram se a existência de tais leis estava associada à redução nas taxas de mortes por armas de fogo entre crianças.
🗂️ Dados utilizados:
-
Número de suicídios, homicídios e mortes não intencionais por arma de fogo em crianças.
-
Número de crianças em risco, por estratificação simultânea por: faixa etária, sexo, raça, estado e ano-calendário (1979–1994).
-
Leis em 12 estados, com vigência variando ao longo do período.
-
Um grupo foi considerado exposto se a lei esteve em vigor por pelo menos seis meses naquele ano; caso contrário, foi considerado não exposto.
⚙️ Análise estatística:
-
Usou-se regressão binomial negativa, modelando o número de mortes por arma como função do número de crianças em risco, estado, ano e presença da lei.
-
Fatores como idade, sexo e raça foram avaliados como possíveis confundidores, mas tiveram pouco impacto após inclusão do estado e do ano no modelo.
✅ Resultados:
-
Quando a lei de armazenamento seguro estava em vigor, a incidência de mortes não intencionais por arma de fogo entre crianças menores de 15 anos foi 23% menor (RR = 0,77; IC 95%: 0,63–0,94).
-
Houve também associações negativas mais fracas com suicídios (RR = 0,81; IC 95%: 0,66–1,01) e homicídios (RR = 0,89; IC 95%: 0,76–1,05).
📌 Interpretação
A exposição de interesse — presença da lei — é uma característica intrinsecamente coletiva, aplicável a todas as crianças de determinado estado e ano. Trata-se de um caso limite, no qual toda a variação de exposição ocorre entre os grupos e não dentro dos grupos.
➡️ Isso minimiza o erro associado à extrapolação e reduz o risco de viés entre níveis (cross-level bias), já que a inferência desejada também é em nível de grupo — o mesmo nível em que a intervenção (lei) atua e pode ser modificada.
Ainda assim, fatores de confusão em nível individual ou grupal podem distorcer a associação observada. Neste estudo, a estratificação cruzada por idade, sexo, raça, estado e tempo permitiu controlar variações sistemáticas na mortalidade por armas associadas a esses fatores, isolando melhor o efeito da política.
➡️ A regressão binomial negativa foi apropriada para lidar com superdispersão (variação além da esperada), fornecendo intervalos de confiança mais amplos e realistas (McCullagh e Nelder, 1989; Gardner et al., 1995).
📊 Outras aplicações de estudos ecológicos para exposições macroestruturais:
-
Desigualdade de renda populacional e sua associação com diversos indicadores de saúde (Lynch et al., 2004).
-
Uso ambulatorial de antibióticos e resistência bacteriana (Goossens et al., 2005).
-
Covariação geográfica de doenças inflamatórias intestinais e esclerose múltipla, sugerindo causas ambientais compartilhadas (Green et al., 2006).
-
Preços de bebidas alcoólicas e mortalidade por cirrose hepática (Seeley, 1960).
➡️ Blakely e Woodward (2000) discutem diversos mecanismos genéricos pelos quais fatores ecológicos podem afetar a saúde individual.
Estudos Multinível
A maioria das doenças pode ser entendida como resultado de uma rede de causas contributivas que operam em diferentes níveis.
Por exemplo, o status de obesidade de uma pessoa não depende apenas do comportamento alimentar individual, mas também da renda familiar e das decisões de compra de alimentos, que por sua vez são influenciadas por fatores sociais mais amplos, como preços e disponibilidade de alimentos.
Mesmo quando um estudo epidemiológico foca em uma exposição específica, é necessário considerar fatores em diferentes níveis como possíveis confundidores ou modificadores de efeito. Os estudos ecológicos têm capacidade limitada para isso, pois geralmente dependem de dados agregados já existentes.
Por outro lado, os estudos em nível individual costumam ser restritos a um único local ou aplicar critérios de pareamento (por exemplo, por área de residência), o que impede a análise de efeitos contextuais, como exposições grupais que só podem ser detectadas quando há variação entre áreas.
🔎 Exemplo:
O risco de lesões em acidentes de trânsito pode depender não apenas do nível de álcool no sangue do condutor individual, mas também da distribuição desses níveis entre outros condutores na mesma via.🎯
O que são estudos multinível?
Quando os dados disponíveis contêm informações tanto em nível individual quanto em nível de grupo, é possível realizar estudos epidemiológicos multinível (Gelman e Hill, 2007; Diez-Roux, 2000, 2004).
Esses estudos têm dois objetivos principais:
1. Investigar efeitos em múltiplos níveis simultaneamente
-
Permite separar efeitos individuais de efeitos contextuais.
-
Reduz o risco de falácia ecológica e viés entre níveis (cross-level bias).
-
Identifica modificações de efeito entre níveis, como por exemplo: "o efeito da escolaridade individual sobre saúde varia conforme o nível médio de escolaridade da vizinhança?"
2. Explicar variações na frequência de um desfecho entre grupos
-
Efeitos composicionais: diferenças na distribuição de fatores de risco individuais entre grupos.
-
Efeitos contextuais: características dos próprios grupos que afetam o desfecho.
⚙️ Exemplo 16-2: Imigração e transtornos psiquiátricos no Canadá
Menezes et al. (2011) utilizaram dados da Canadian Community Health Survey para analisar a associação entre:
-
Status de imigrante do indivíduo (nascido no exterior ou no Canadá)
-
Concentração de imigrantes no bairro (proporção de residentes nascidos no exterior)
O desfecho foi a presença de transtornos psiquiátricos no último ano, avaliado por meio de questionário validado.
As análises usaram regressão logística multinível com os níveis:
-
Indivíduo (nível 1)
-
Bairro (áreas censitárias com 400–700 habitantes, nível 2)
🧪 Três variáveis principais:
-
Status de imigrante (1 = imigrante, 0 = nativo)
-
Concentração de imigrantes no bairro, padronizada como escore z
-
Interação entre status de imigrante e concentração no bairro (efeito cruzado)
🔍 Resultados (para dependência de substâncias):
-
Imigrantes tinham menor chance de dependência (OR = 0,472; IC 95%: 0,338–0,660)
-
A concentração de imigrantes no bairro sozinha teve pouco efeito (OR = 0,990)
-
A interação foi significativa (OR = 0,704), indicando que o efeito do status de imigrante varia conforme o bairro
➡️ Para nativos, a prevalência de dependência não variou com o bairro.
➡️ Para imigrantes, quanto maior a concentração de imigrantes no bairro, menor a chance de dependência.
📐 Modelagem estatística multinível
A equação geral da regressão logística multinível foi:
logit(probabilidade de dependência) = intercepto específico do bairro
+ (coef. para status de imigrante × valor individual)
+ (coef. para concentração de imigrantes × valor do bairro)
+ (coef. da interação cruzada)+ (demais covariáveis)
O intercepto de cada grupo (bairro) é tratado como um efeito aleatório, com média e variância estimadas a partir dos dados.
Essa variância entre grupos:
-
Mede o quanto os bairros diferem entre si após ajustar os fatores explicativos.
-
Pode ser usada para avaliar quanto da variabilidade no desfecho se deve ao contexto versus à composição individual.
📊 Avanços adicionais em modelagem multinível:
-
Permitir que coeficientes de variáveis individuais variem entre os grupos (efeitos aleatórios nos betas).
-
Estimar médias ajustadas por grupo, ponderando pelo tamanho de cada grupo.
-
Avaliar o quanto da variância residual entre grupos diminui ao se incluir variáveis explicativas — ou seja, quantificar os efeitos contextuais vs. composicionais.
🧮 Outras abordagens: GEE e análise de survey complexo
-
Equações de Estimação Generalizadas (GEE): Não modelam a variação entre grupos, tratam a correlação dentro do grupo como efeito colateral. Requerem número suficiente de grupos e fornecem efeitos marginais (média da população).
-
Métodos para survey complexo: Usados quando a amostra é probabilística. Consideram estratificação, clusters e pesos amostrais (Korn e Graubard, 1999). Visam inferência para a população-alvo real, ao contrário dos métodos baseados em superpopulações teóricas.
✅ Conclusão
Estudos multinível:
-
Combinam forças dos estudos individuais e ecológicos
-
Permitem desagregar efeitos contextuais e individuais
-
Exigem modelos estatísticos específicos
-
São essenciais para evitar falácias de inferência entre níveis
📋 Tabela 16.3 — Resultados resumidos para dependência de substâncias

A Tabela 16.3 apresenta os principais resultados da regressão logística multinível aplicada ao estudo sobre imigração e transtornos psiquiátricos. Três exposições principais foram analisadas:
Status de imigrante:
-
Indivíduo nascido no exterior (codificado como 1) versus nativo (codificado como 0).
-
OR = 0,472
-
IC 95% = 0,338–0,660 ➞ Indivíduos imigrantes apresentaram menor chance de dependência de substâncias, em média.
Concentração de imigrantes no bairro:
-
Representada como escore-z padronizado (P − média) / desvio padrão, onde:
-
Média da proporção de imigrantes entre os bairros: 15,5%
-
Desvio padrão: 16,2%
-
OR = 0,990
-
IC 95% = 0,941–1,042 ➞ Isoladamente, a concentração de imigrantes no bairro teve pouco efeito aparente.
Interação entre status de imigrante × concentração no bairro:
Produto entre as duas variáveis acima.
-
OR = 0,704
-
IC 95% = 0,587–0,845 ➞ Esse efeito de interação indica que o efeito de ser imigrante depende do contexto de vizinhança.
📈 Interpretação dos efeitos cruzados
A análise revela que:
-
Para nativos canadenses, a chance de dependência de substâncias não varia significativamente de acordo com a proporção de imigrantes no bairro.
-
Para imigrantes, a chance de dependência de substâncias é menor quanto maior a concentração de outros imigrantes na vizinhança.
A Figura 16.5, baseada nos resultados da Tabela 16.3, ilustra graficamente esse efeito de interação:
-
A linha pontilhada vertical indica a média de concentração de imigrantes nos bairros (15,5%).
-
É nesse ponto que o OR para status de imigrante assume exatamente o valor de 0,472, como mostrado na Tabela 16.3.
-
Quando a concentração de imigrantes aumenta além da média, o efeito protetor do status de imigrante sobre a dependência de substâncias se torna mais acentuado.
📌 Importância estatística do modelo multinível
Esse exemplo também serve como base para demonstrar como modelos estatísticos adequados ajudam a:
-
Evitar falácia ecológica
-
Desagregar efeitos individuais e contextuais
-
Detectar interações cruzadas (cross-level interactions)
Na modelagem utilizada:
-
As interceptações específicas por bairro (αg[i]) não são estimadas como constantes fixas, mas sim como efeitos aleatórios com distribuição normal, cuja variância é estimada a partir dos dados.
-
Essa variância representa o quanto os bairros diferem entre si mesmo após o ajuste pelos preditores.
⚙️ Extensões possíveis em modelos multinível
-
Analisar como a variância entre grupos muda quando covariáveis adicionais são incluídas ➞ avalia efeitos contextuais vs. composicionais.
-
Permitir que os coeficientes de variáveis individuais variem entre grupos ➞ útil para verificar heterogeneidade de efeitos.
-
Estimar médias ajustadas por grupo, levando em conta tamanhos diferentes de grupos.
🔁 Métodos alternativos: GEE e análise de survey complexo
GEE (Equações de Estimação Generalizadas):
-
Trata a correlação entre indivíduos do mesmo grupo como um "incômodo" a ser corrigido, e não como objeto principal.
-
Estima efeitos médios populacionais (marginais), diferente da regressão com efeitos mistos, que estima efeitos específicos de grupo.
-
Requer número adequado de grupos para validade dos ICs.
Métodos de análise de surveys complexos:
-
Úteis quando a amostra representa uma população maior.
-
Consideram estratificação, conglomerados (clusters) e pesos amostrais (Korn & Graubard, 1999).
-
Buscam inferir para a população real, ao contrário dos modelos baseados em superpopulações hipotéticas.
Exemplo: Diez-Roux et al. (2001) aplicaram análise de survey complexo para estudar ambiente socioeconômico de vizinhanças e incidência de doença arterial coronariana (DAC).
🧭 Figura 16.5 — Interação entre status de imigrante e concentração de imigrantes no bairro sobre dependência de substâncias

A Figura 16.5 ilustra, com base nos resultados da Tabela 16.3, como a probabilidade de dependência de substâncias varia em função de:
-
Status individual de imigrante (imigrante ou nativo), e
-
Concentração de imigrantes na vizinhança (representada como escore z).
🎯 Principais achados representados graficamente:
-
O eixo x mostra o escore z da concentração de imigrantes no bairro (i.e., quanto a vizinhança se desvia da média nacional de 15,5%).
-
O eixo y representa a chance estimada de dependência de substâncias (em termos de odds).
-
A linha para nativos canadenses (indivíduos não imigrantes):
-
É quase horizontal, indicando que a chance de dependência de substâncias muda muito pouco com a variação da concentração de imigrantes no bairro.
-
-
A linha para imigrantes:
-
Tem declive negativo, ou seja, quanto maior a concentração de imigrantes no bairro, menor a chance de dependência entre os imigrantes.
-
A linha pontilhada vertical marca a média da concentração de imigrantes nos bairros (escore z = 0, que equivale a 15,5% de imigrantes).
Nesse ponto médio:
-
O odds ratio para status de imigrante é exatamente 0,472, valor do efeito principal apresentado na Tabela 16.3.
🧠 Interpretação conceitual da figura
-
Para nativos, viver em um bairro com mais ou menos imigrantes não altera substancialmente seu risco de dependência de substâncias.
-
Para imigrantes, o contexto da vizinhança importa: quanto mais concentrado em outros imigrantes o bairro, maior a proteção social e menor a probabilidade de dependência.
-
Isso sugere que fatores contextuais (como apoio social, normas culturais, coesão comunitária) podem moderar o impacto do status de imigração na saúde mental e comportamental.
Considerações sobre o Desenho do Estudo
Como demonstrado acima, a incorporação de dados em nível individual pode transformar um estudo puramente ecológico em um estudo multinível. Isso pode evitar a falácia ecológica e outras formas de viés entre níveis, permitir um melhor tratamento da confusão e permitir o estudo de exposições em nível individual e de grupo. Ter dados em nível individual e de grupo também pode gerar ganhos em precisão ou poder estatístico (Glynn et al., 2008).
Apesar dessas vantagens, a coleta de dados em nível individual pode ser dispendiosa, enquanto a coleta de dados em nível de grupo pode ser barata, obtida por meio de fontes governamentais ou outras fontes existentes. Vários autores (Haneuse e Bartell, 2011; Wakefield e Haneuse, 2008; Glynn et al., 2008; Jackson et al., 2006) demonstraram como dados ecológicos podem ser usados para desenvolver um plano de amostragem eficiente para a obtenção de dados suplementares em nível individual.
Um estudo de dois níveis é conduzido em duas fases:
(1) os dados ecológicos são obtidos inicialmente e utilizados para caracterizar os grupos em alguma combinação de desfecho, exposição e possivelmente outras covariáveis; e
(2) os dados da fase 1 são utilizados para elaborar um plano de amostragem eficiente para a coleta de dados em nível individual em alguns ou todos os grupos (Wakefield e Haneuse, 2008).
Estudos de simulação sugeriram que a amostra de indivíduos na fase 2 não precisa ser grande para gerar grandes benefícios (Glynn et al., 2008). O delineamento amostral ideal na fase 2 depende de vários fatores, incluindo a frequência dos desfechos, a prevalência da exposição e sua variabilidade entre os grupos. Em geral, mais informações são obtidas a partir da amostragem de áreas com prevalência de exposição relativamente alta ou relativamente baixa e de indivíduos em categorias de desfecho ou exposição relativamente raras (Glynn et al., 2008). Nesse sentido, Haneuse e Wakefield (2008) propuseram delineamentos que combinam dados ecológicos e de caso-controle.
CONSIDERAÇÕES FINAIS
Estudos ecológicos têm sido, por vezes, menosprezados como uma fonte relativamente fraca de evidências em epidemiologia devido à sua vulnerabilidade a vieses quando associações em nível de grupo são estudadas como proxies para associações em nível individual.
Essa aplicação de estudos ecológicos é, de fato, baseada em suposições fortes e geralmente não testáveis, e uma interpretação cautelosa é necessária quando o delineamento é usado para esse propósito. No entanto, muitos desses vieses potenciais são bastante reduzidos ou desaparecem completamente quando estudos ecológicos são usados para estudar os efeitos de exposições que se aplicam a um grupo inteiro. Consequentemente, os estudos ecológicos podem ser uma ferramenta muito útil para avaliar políticas e programas — um tema a ser explorado mais detalhadamente no Capítulo 21.
Delineamentos de estudos epidemiológicos que utilizam dados tanto em nível de grupo quanto individual estão se tornando cada vez mais comuns, e com razão. Ao preço de uma complexidade adicional, esses estudos multinível têm o potencial de combinar as melhores características dos estudos ecológicos e individuais.De qualquer forma, nossa compreensão de por que certas pessoas desenvolvem certas doenças pode frequentemente ser ampliada ao refletirmos sobre como as pessoas se organizam em grupos e como interagem dentro desses grupos. Estudos ecológicos e multiníveis têm um papel especial a desempenhar na tradução dessas ideias em pesquisas epidemiológicas.
