Em um outro texto falamos sobre causalidade nas ciências sociais, ou seja, falamos como esse termo é interpretado nas ciências e sobre os modelos que tentam extrair a causa de efeitos. Assim, passando brevemente pelas técnicas de inferência causal. Todavia, sinto que não fiz justiça à técnica que vai pelo nome de Variável Instrumental (ou Instrumental Variable, i.e, IV), então é objetivo do presente texto elaborar melhor sobre as minúcias dessa técnica, assim como, investigá-la por um olhar mais formal desta.
Antes de adentrarmos em IV é preciso lembrar o que é um confundidor. Definimos informalmente um confundidor como uma variável que afeta tanto o tratamento quanto o resultado. Podemos representar essa situação no seguinte DAG:
Sabemos que se X é observado, podemos extrair o efeito causal médio via técnicas como Matching, Propensity Score Matching, Inverse Probability of Treatment Weighting (IPTW), etc. Para nossos propósitos não é necessário especificar o que consiste essas técnicas e como derivam sua validade, apenas é importante saber que elas, em uma certa maneira, simulam um experimento controlado randomizado mesmo sem de fato ter ocorrido uma aleatorização, isto é feito geralmente balanceando a distribuição de covariantes no grupo controle e tratamento.
Infelizmente existe um problema incontornável ao pesquisador, que ocorre justamente quando temos um confundidor que não é mensurável, ou seja, não é observado. Consequentemente isso enviesa o efeito causal e não conseguimos controlar pelos confundidores como era feito antes.
Variável Instrumental
Justamente nesse cenário que nos deparamos que IV aparece como solução.Sendo que essa técnica alternativa de inferência causal dispensa a hipótese de ignorabilidade. Como dito no outro texto:[tal] hipótese nos diz que dado as covariáveis X pré tratamento, a atribuição de tratamento é independente dos resultados potenciais. Ou seja, entre as pessoas com o mesmo valor de X, podemos pensar o tratamento A como sendo atribuído aleatoriamente. Controlamos confundidores para fazer a ignorabilidade ser realizada, mas no cenário que justamente não conseguimos controlá-los, se faz necessário dispensar essa hipótese.
Na figura acima temos o cenário ideal para o uso de IV. Neste caso, Z é uma variável instrumental, uma vez que afeta o tratamento, mas não afeta (diretamente) o resultado. Pense Z como uma encouragment (encorajamento). Imagine no DAG anterior que A é fumar na gravidez, Y é o peso do bebê, U é todo covariante possível (alguns podem ser mensuráveis, mas é de se esperar que outros não sejam) e Z seria um encorajamento aleatorizado para se parar de fumar (Z =1) ou receber o cuidado usual (Z = 0)
Em cenário de RCT (“Randomized Control Trial” ou “Estudo clínico randomizado controlado” em português) o design do encorajamento se daria da seguinte maneira:
E[Y^(Z=1)] — E[Y^(Z=0)]
Essa equação representa o efeito causal do encorajamento, sendo feito em uma análise da intenção de tratamento (ou “intention-to-treat”, i.e, ITT). Porém, isso não nos informa sobre o efeito causal do tratamento no resultado! E é aí que usaremos IV.
Vamos elaborar nosso experimento controlado. Mas não tema, em casos observacionais o tratamento é o mesmo, apenas vamos depender da natureza fazer a randomização por nós. O que por si só não é algo trivial, porém é o que temos.
Imagine agora que Z é a randomização para tratamento (1 se randomizado para tratamento, 0 caso contrário), A é o tratamento recebido (1 ser recebido, 0 caso contrário) e Y é o nosso resultado. Infelizmente temos um problema. Um problema que vai fazer com que mesmo em um cenário controlado, vai parecer como um estudo observacional, que é o fato que nem todos que foram atribuídos ao tratamento, vão realmente receber o tratamento.
Disso temos que trabalhar como o conceito de tratamento potencial.
Os dados observados por nós são Z, A e Y. Sabemos que para um dado sujeito, eles foram atribuídos Z e receberam o tratamento A, caso o tratamento recebido fosse diferente eles seriam atribuídos 1-Z.
Cada indivíduo tem dois tratamentos potenciais:
A^(Z=1) = A^(1), que é o valor do tratamento se randomizado para Z = 1
A^(Z=0) = A^(0), que é o valor do tratamento se randomizado para Z = 0
Efeito causal da atribuição no recebimento
Podemos pensar no efeito causal da atribuição no recebimento de tratamento como:
E[A^(1) - A^(0)]
Essa é a proporção de tratados se todos fossem atribuídos para receber tratamento, menos a proporção de tratados se ninguém tivesse sido atribuído a receber tratamento. Se houver compliance perfeita (isto é, quem é atribuído o tratamento, de fato recebe o tratamento, assim como não recebe tratamento, caso não seja atribuído), então essa equação seria igual a 1.
Esse efeito pode ser estimado com os dados observados, então:
E[A^(1)] = E[A|Z=1] e E[A^(0)] = E[A|Z=0]
Efeito causal da atribuição no resultado
Podemos pensar no efeito causal da atribuição no resultado como:
E[Y^(Z=1) — Y^(Z=0)]
Isto é o valor médio do resultado caso todos tivessem sido atribuídos para receber o tratamento, menos o valor médio do resultado caso ninguém tivesse sido atribuído para receber o tratamento. Ou seja, é o efeito intention-to-treat ou ITT. Sabemos que se houvesse compliance perfeito, isso seria igual ao efeito causal do tratamento.
Esse efeito pode ser estimado com os dados observados:
E[Y^(Z=1)] = E[Y|Z=1] e E[Y^(Z=0)] = E[Y|Z=0]
Efeito causal do tratamento
Como estimar esse efeito, uma vez que ele é o nosso principal interesse? Primeiro, podemos pensar Z como um (forte) encorajamento para receber tratamento, isto é, um IV. Mas e agora?
Lembremos que
A^(0): o tratamento que a unidade receberia se fosse randomizado para o grupo Z=0
A^(1): o tratamento que a unidade receberia se fosse randomizado para o grupo Z=1
Valores potenciais de tratamento
Cada rótulo uma subpopulação:
Nunca tomam — não tomam o tratamento, independente da randomização. Encorajamento não funciona. Assim, não aprendemos nada sobre o efeito do tratamento nessa subpopulação.
Compliers — tomam o tratamento quando encorajados, e não tomam caso contrário. Neste grupo, o tratamento recebido é randomizado.
Desafiadores — Fazem o contrário do que são encorajados a fazer. Neste grupo o tratamento recebido também é aleatorizado, mas do jeito oposto.
Sempre tomam — Sempre tomam o tratamento, independente da randomização. Neste grupo também não aprendemos nada sobre o efeito do tratamento.
Para descobrirmos o efeito causal, temos que focar no efeito local deste. Ou seja, temos que achar o efeito causal condicionado a subpopulação de compliers!
Local Average treatment effect (LATE)
A alvo da inferência é:
E[Y^(Z=1)|A^(0)=0,A^(1)=1] — E[Y^(Z=0)|A^(0)=0,A^(1)=1] = E[Y^(Z=1) — Y^(Z=0) |compliers]
Sendo E[Y^(Z=1) — Y^(Z=0) |compliers] o efeito causal médio de tratamento atribuido na população de compliers.
Mas para compliers, Z = 1 implica em A = 1 e correspondentemente Z = 0 implica A = 0. Uma vez que isso que os define como compliers! Então enquanto tivermos falando dessa subpopulação podemos usar Z e A de forma intercambiável, portanto:
E[Y^(Z=1)|A^(0)=0,A^(1)=1] — E[Y^(Z=0)|A^(0)=0,A^(1)=1] = E[Y^(A=1) — Y^(A=0) |compliers]
Isso é causal, pois contrasta contrafactuais em uma população comum.
Essa equação também é conhecida como Complier Average Causal Effect (CACE)
Dados Observados
Infelizmente na ausência de hipóteses adicionais ficamos presos no problema fundamental da inferência causal, isto é, faltam dados para (nesse caso) classificar uma unidade numa dada subpopulação. No fundo, queremos apenas a classe de compliers que são chamados de estratos principais. Ademais são latentes, ou seja, não são observados diretamente.
Então para resolver o problema fundamental é necessário hipóteses adicionais. Quais seriam essas?
Hipóteses sobre IV
Primeiramente, uma variável é uma variável instrumental (IV) se:
- Está associado com o tratamento.
- Afeta o resultado apenas pelo seu efeito no tratamento.
Isto é conhecido como a restrição de exclusão (“restriction exclusion”).
Enquanto a primeira condição para ser uma IV pode ser verificada com os dados observados, a segunda precisa ser justificada. Grande parte dos artigos que usam esse método dedicam parte legitimando a restrição de exclusão.
Supondo que temos um IV válido, estamos interessados em usar para nos ajudar a estimar o CACE:
E[Y^(A=1) — Y^(A=0) |compliers]
É o efeito causal do tratamento entre os sujeitos que apenas tomaram o tratamento se eles foram randomizados para Z = 1.
Mas ainda não é suficiente. Precisamos de mais uma hipótese.
Hipótese de monotonicidade
Essa hipótese nos diz que não há nenhum desafiador. Ou seja, ninguém consistentemente faz o oposto do que foi mandado. É chamado de monotonicidade, pois a hipótese é que a probabilidade de tratamento deveria aumentar com mais encorajamento.
Então, voltemos ao nosso dados observados com a monotonicidade:
Agora é possível a identificação dos efeitos causais:
Lembre: o objetivo é estimar E[Y^(A=1) — Y^(A=0) |compliers]
Comecemos com algo que podemos identificar, o efeito ITT:
E[Y^(Z=1) — Y^(Z=0) ] = E[Y|Z=1] — E[Y|Z=0]
Essa igualdade vale por conta da randomização
E[Y|Z=1] = E[Y|Z=1,sempre toma]*P(sempre toma) + E[Y|Z=1,nunca toma]*P(nunca toma) + E[Y|Z=1,compliers]*P(compliers)
Ou seja, o valor esperado de Y entre as pessoas atribuídas tratamento é a média ponderada do valor esperado de Y dado Z =1 em três subpopulações.
E a formula vale analogamente para E[Y|Z=0]
Note: entre os que sempre tomam e os que nunca tomam, Z não faz nada. Portanto:
E[Y|Z=1,sempre toma] = E[Y|sempre toma]
E[Y|Z=1,nunca toma] = E[Y|nunca toma]
Assim como, note que P(sempre toma|Z) = P(sempre toma), etc. Isso decorre da randomização.
Colocando essas informações na fórmula, temos:
E[Y|Z=1] = E[Y|sempre toma]*P(sempre toma) + E[Y|nunca toma]*P(nunca toma) + E[Y|Z=1,compliers]*P(compliers)
E[Y|Z=0] = E[Y|sempre toma]*P(sempre toma) + E[Y|nunca toma]*P(nunca toma) + E[Y|Z=0,compliers]*P(compliers)
Assim,
E[Y|Z=1, compliers] — E[Y|Z=0, compliers] = (E[Y|Z=1] — E[Y|Z=0])/P(compliers) = E[Y^(A=1)|compliers] — E[Y^(A=0)|compliers] = CACE
Consequentemente,
CACE = (E[Y|Z=1] — E[Y|Z=0])/P(compliers)
Note que P(compliers) é apenas E[A|Z=1] — E[A|Z=0]. Isso se deve ao fato que E[A|Z=1] é a proporção de pessoas que são sempre tomadoras ou compliers, enquanto E[A|Z=0] é a proporção de pessoas que são sempre tomadores. Logo a diferença dá a proporção de pessoas que são apenas compliers.
Então
CACE = (E[Y|Z=1] — E[Y|Z=0])/(E[A|Z=1] — E[A|Z=0])
No numerador temos o ITT: o efeito causal do tratamento atribuído ao resultado, enquanto no denominador temos o efeito causal do tratamento atribuído no tratamento recebido. No caso de compliance perfeita, o CACE = ITT.
Estimação:
Em cenário como o seguinte DAG,
Bastaria para achar o efeito causal do tratamento, uma simples regressão linear OLS (“Ordinary Least Squares” ou “Mínimos Quadrados Ordinários”).
O modelo valeria uma vez que são satisfeitas as hipóteses de Gauss-Markov. No presente caso vale ressaltar as hipóteses de que o termo de erro e a variável independente (A) não são correlacionadas, logo temos exogeneidade estrita. Em outros termos, não existem confundidores.
Mas em um cenário de IV sabemos que a exogeneidade estrita não vale, uma vez que existem confundidores e para piorar, eles não são mensuráveis. Então, o que fazer?
A solução é usar a técnica de Two Stage Least Squares (2SLS). Essa técnica consiste, como o nome diz, em dois estágios:
No primeiro estágio, regredimos o tratamento recebido A na variável instrumental Z:
Em que fazemos as hipóteses usuais que a média do termo de erro é zero e existe variância constante. Por randomização Z e u são independentes.
Assim, obtemos:
Para cada unidade, temos o valor predito de A dado Z.
No segundo estágio, regredimos o resultado Y no valor predito do estágio um, Âi:
Em que a média do termo de erro é zero, a variância é constante. Pela restrição de exclusão Z é independente de Y, dado A. Além disso, derivamos que o β1 é o efeito causal estimado que tanto queríamos.
Por fim:
Assim, completo minha exposição sobre variáveis instrumentais. Novamente espero que isso lhe tenha causado interesse sobre causalidade. Até a próxima!