Primeira vez aqui? Seja bem vindo e cheque o FAQ!
x

Exercício 54 do Capítulo 8 do livro Mathematical Statistics and Data Analysis de John Rice (3ª Edição)

0 votos
15 visitas
perguntada Abr 7 em Estatística por Fabio Fujita (6 pontos)  
editado Abr 7 por Fabio Fujita

Suponha que uma amostra i.i.d. de tamanho 15 de uma distribuição normal apresente \( \bar{X}=10 \) e \( s^2=25 \). Encontre intervalos de confiança de 90% para \( \mu \) e \( \sigma^2 \).

Compartilhe

1 Resposta

0 votos
respondida Abr 7 por Fabio Fujita (6 pontos)  

Note que o exercício não especifica se o valor informado para \( s^2 \) refere-se à variância amostral viesada ou ao estimador não viesado da variância. Seguiremos o padrão utilizado no livro do John Rice, em que \( s^2 \) refere-se ao estimador não viesado da variância, ou seja:

\( s^2 = \frac{1}{n-1} \sum\limits_{i=1}^{n} (X_i - \bar{X})^2 =25 \)

Abordaremos ao final da questão as adaptações necessárias caso se deseje considerar \( s^2 \) como a variância amostral viesada.

Sabemos que para uma amostra i.i.d. de uma distribuição normal, \( \frac{\bar{X} - \mu}{S/\sqrt{n}} \) tem distribuição t-Student, com n-1 graus de liberdade (para prova detalhada, ver o Corolário B da Seção 6.3 do livro de John Rice). Considerando a simetria da distribuição t-Student, temos que:

\( P(-t_{n-1, \alpha/2} \leq \frac{\bar{X} - \mu}{s/\sqrt{n}} \leq t_{n-1, \alpha/2} ) = 1-\alpha \tag{1}\)

Onde \( 1-\alpha\) representa o intervalo de confiança e \(t_{n-1, \alpha/2} \) é obtido da fdp da distribuição t-Student, com \(n-1\) graus de liberdade, em que \( \alpha/2\) é a área à direita de \(t_{n-1, \alpha/2} \).

Rearranjando os termos:

\( P( \bar{X} - \frac{s}{\sqrt{n}}. t_{n-1, \alpha/2} \leq \mu \leq \bar{X} + \frac{s}{\sqrt{n}}. t_{n-1, \alpha/2} ) =1-\alpha \tag{2}\)

Consultando a tabela da distribuição t-Student disponível no Apêndice B do livro, encontramos que \( t_{n-1, \alpha/2} = 1,761\), para n=15 e \( \alpha/2=0,05 \). Substituindo os valores na equação (2), juntamente com \( s\) e \( n\) fornecidos no enunciado, obtém-se:

\( P( 7,727 \leq \mu \leq 12,273 ) \approx 90\% \)

O intervalo de confiança de 90% para \( \mu \) é, portanto, (7,727; 12,273).

Para encontrarmos o intervalo de confiança para a variância populacional, usaremos o fato de que para uma amostra i.i.d. de uma distribuição normal, \( \frac{(n-1).s^2}{\sigma^2} \) tem distribuição qui-quadrada, com n-1 graus de liberdade (para prova detalhada, ver o Teorema B da Seção 6.3 do livro de John Rice).

Note que devemos ter um pouco mais de cuidado no equacionamento do que no cálculo do intervalo de confiança da média, uma vez que a distribuição qui-quadrada não é simétrica como a distribuição t-Student. Temos portanto que:

\( P( \chi^2_{n-1,1-\alpha/2} \leq \frac{(n-1).s^2}{\sigma^2} \leq \chi^2_{n-1,\alpha/2}) = 1-\alpha \tag{3}\)

Onde: \( \chi^2_{n-1,1-\alpha/2} \) representa o valor de \( \chi^2\) para \( (n-1)\) graus de liberdade, com àrea \( \alpha/2\) à esquerda de \( \chi^2\). Analogamente, \( \chi^2_{n-1,\alpha/2} \) representa o valor de \( \chi^2\) para \( (n-1)\) graus de liberdade, com àrea \( \alpha/2\) à direita de \( \chi^2\).

Rearranjando os termos:

\( P\left( \frac{(n-1).s^2}{\chi^2_{n-1,\alpha/2}} \leq \sigma^2 \leq \frac{(n-1).s^2}{\chi^2_{n-1,1-\alpha/2}} \right) =1-\alpha \tag{4}\)

Consultando a tabela da distribuição qui-quadrado disponível no Apêndice B do livro, encontramos que, para \( \alpha=10\%\) e \(n=15\):

\( \chi^2_{n-1,1-\alpha/2} =6,57 \)
\( \chi^2_{n-1,\alpha/2} =23,68\)

Substituindo os valores na equação (4), juntamente com \( s\) e \( n\) fornecidos no enunciado, obtém-se:

\( P\left(14,780 \leq \sigma^2 \leq 53,272 \right) =90\% \)

O intervalo de confiança de 90% para \( \sigma^2 \) é, portanto, (14,780; 53,272).

Nota
No caso em que se considera \( s^2\) como sendo a variância amostral viesada como no livro do Stachursky, seriam necessárias algumas adaptações à solução.

No caso da média, \( \frac{\bar{X} - \mu}{S/\sqrt{n-1}} \) tem distribuição t-Student, com n-1 graus de liberdade e no caso da variância, \( \frac{n.s^2}{\sigma^2} \) tem distribuição qui-quadrada com n-1 graus de liberdade (para mais detalhes, ver fato 10.1.1 e o exemplo 9.1.4 do livro do Stachursky). Dessa forma, as equações (1) e (3) devem ser reescritas, respectivamente, como:

\( P(-t_{n-1, \alpha/2} \leq \frac{\bar{X} - \mu}{s/\sqrt{n-1}} \leq t_{n-1, \alpha/2} ) = 1-\alpha \tag{1´}\)

\( P( \chi^2_{n-1,1-\alpha/2} \leq \frac{n.s^2}{\sigma^2} \leq \chi^2_{n-1,\alpha/2}) = 1-\alpha \tag{3´}\)

comentou Abr 9 por Rodrigo Fernandes (16 pontos)  
editado Abr 9 por Rodrigo Fernandes
Ótima resposta, Fábio. Os cálculos me parecem corretos e achei a utilização do estimador \(s^{2}\) não viesado mais correto do que a versão viesada, levando em conta o contexto de utilização.

Um comentário que acho interessante fazer é sobre a definição de intervalo de confiança uma vez que o mesmo pode acabar se tornando um pouco abstrato ou utilizado de forma errada.

Como Rice trata no Capítulo 7 de seu livro, um intervalo de confiança para um dado parâmetro da população, estimado de acordo com a amostra retirada, é um intervalo \(aleatório\) que contêm esse parâmetro populacional \((1 - \alpha)\) das vezes. O que isso quer dizer é que se, teoricamente, retirarmos amostras suficientemente grandes \(N\) vezes e montaramos um intervalo de confiança com esse mesmo \(\alpha\) para cada amostra, teremos que o parâmetro populacional estará contido em \(N*(1 - \alpha)\) vezes nos \(N\) intervalos. E por que é um intervalo aleatório? Uma vez que as amostras contêm variáveis aleatórias, o intervalo também será.

Uma outra definição utilizada com frequência e mais simples para intervalo de confiança é: o intervalo que montamos tem \( (1 - \alpha)\) de conter o parâmetro populacional. Essa definição, não obstante, não é aceita por muitos pesquisadores. O problema da mesma é que o parâmetro populacional está dentro ou fora do intervalo com 100% de certeza. Um exemplo dado por Sze Huey Tan e Say Beng Tan, em um trabalho de 2010, exemplifica bem isso. Suponha que queremos determinar a pressão arterial média (no caso, já sabemos que ela é 120mmHg). Ainda, se oestudo nos informa, de acordo com uma certa amostra, que ela é 105mmHg e montamos o intervalo de confiança de 95% sendo \((95.5, 118.9)\), temos um problema. Ora, sabemos com certeza então que o IC montado  não contêm o parâmetro populacional e o IC falha diretamente.

Assim, a definição dada anteriormente se encaixa melhor!
...