2 O Pensamento Bayesiano
2.1 Inferência
Podemos dizer que inferência é qualquer processo racional de redução de incerteza. Se não há incerteza, não há necessidade da estatística.
Exemplo 2.1 (Bolas na caixa) Considere uma caixa com 5 bolas, algumas verdes (\(v\)), e o restante brancas (\(b\)). Suponha que amostramos duas bolas, sem reposição. Isto é, retiramos duas bolas desta caixa, e que ambas as bolas retiradas foram verdes. A partir deste experimento, podemos inferir que \(v \geq 2\), ou seja, ao menos duas bolas da caixa são verdes. Caso retirássemos uma branca e uma verde, poderíamos naturalmente inferir que ao menos uma bola da caixa é branca, e ao menos uma é verde.
Note que, mesmo após esse processo, a incerteza sobre a composição da caixa contínua. Contudo, com a nova informação, ocorre uma atualização da incerteza.
A inferência estatística é, portanto, o processo de redução de incertezas a partir de dados e métodos estatísticos. Neste contexto, a Inferência Bayesiana é a inferência estatística baseada na perspectiva subjetiva de probabilidade.
O objeto probabilidade pode ser estudada de diversas perspectivas. Estamos acostumados com o cálculo de probabilidade, em que desenvolvemos teoremas e outros resultados a partir dos axiomas de Kolmogorov.
\[ \begin{aligned} P(A) \geq 0, \forall A \in \mathcal{F} \\ P(\Omega) = 1 \\ P\left(\bigcup\limits_{n=1}^\infty A_n\right) = \sum^\infty_{n=1} A_n \end{aligned} \]
Por outro lado, há pessoas que se ocupam em entender a probabilidade do ponto de vista da Teoria da Medida, preocupando-se em estudar a probabilidade como uma função de medida.
Ainda assim, existe uma visão mais “filosófica” do estudo da probabilidade, que se preocupa na interpretação da probabilidade. Uma interpretação clássica é da probabilidade como medida de frequência, enquanto a interpretação subjetiva da probabilidade, utilizada na inferência Bayesiana, toma a probabilidade como uma medida de incerteza.
Por exemplo, num lançamento de moedas, a teoria frequentista afirma que, ao lançar uma moeda honesta um número grande de vezes, esperaria que 50% dos lançamentos resultasse em cara. Por outro lado, na teoria subjetiva da probabilidade, alguém que acredita que a moeda é honesta diria, antes do primeiro lançamento desta, que não há razão de acreditar que a moeda vá provavelmente cair cara, tão quanto acreditar que mais provavelmente cairá coroa. Nesta visão, a probabilidade é um número que mede, quantifica ou representa a incerteza do observador sobre um fenômeno.
Esta discussão sobre o significado de probabilidade é denominado Teoria da Probabilidade.
2.1.1 Cenários de Incerteza
Além do exemplo da caixa com bolas que discutimos anteriormente, podemos pensar em outros cenários de incerteza:
Exemplo 2.2 (Erupções na pele) Considere um indivíduo com erupções na pele. Este tipo de erupções pode ser causado por doenças diversas, dentre elas, uma é considerada grave, provocando incerteza no indivíduo sobre sua saúde. Sabendo disto, o indivíduo vai ao hospital em busca de informações sobre sua condição. A partir de experimentos, como exames médicos, a incerteza do indivíduo sobre a doença e sua saúde é reduzida pelas informações obtidas.
Exemplo 2.3 (Avião perdido) Em outro exemplo, considere que um avião caiu num corpo d’água e sua localização exata é desconhecida. Conforme descobrimos informações do avião, como partes encontradas no mar, consideração de oceanográficos e climáticos, análise técnica do modelo do avião, resultados de buscas passadas e outras informações, podemos gradativamente reduzir a região de queda do avião, até encontrarmos o ponto exato ou muito próximo desta queda.
Este exemplo é mais real do que pensa! Técnicas bayesianas foram utilizadas na busca pelo infame voo 447
Num último exemplo, suponha que estamos interessados em estudar a eficácia de um medicamento na redução da taxa do colesterol. A incerteza jaz exatamente na eficácia do medicamento, isto é, quanto a taxa de colesterol é reduziada após uso do medicamento. Para esta análise, coletaríamos amostras aleatórias simples. Suponha, por hipótese, que o colesterol dos pacientes em estudo amostrados (\(\boldsymbol{X}_n = (X_1, \dots, X_n)\) seguem uma distribuição Normal, com variância 16 e média desconhecida que queremos inferir:
\[ X \sim (?,16) \]
No modelo clássico, usaríamos de métodos como o uso do estimador não viesado de variância uniformemente mínima. Por outro lado, o bayesiano começaria com uma incerteza antes da coleta da amostra e, com a informação obtida, atualizaria sua incerteza em uma nova distribuição: \[ \mathcal{D} \stackrel{\boldsymbol{X}_n}{\rightarrow} \mathcal{D} \lvert x_1, \dots, x_n \]
Esta ferramenta de atualização de informação é o cerne da abordagem Bayesiana, e será extensivamente estudada pelo curso.