Evento All - Locação de Salas - Curso de Inferência Estatística

Curso Completo

Estatística Inferencial

Da amostra à população — tomada de decisão baseada em dados. Material completo com teoria aprofundada, fórmulas comentadas, exemplos resolvidos e 40 atividades com gabarito.

Módulos Completos

Atividades com Gabarito

30+

Fórmulas Comentadas

Testes Estatísticos

Conteúdo Programático

🧩

Módulo 01 — Fundamentos

População, amostra, parâmetros, estimadores e tipos de amostragem.

📊

Módulo 02 — Distrib. Amostrais

TCL, distribuição da média amostral e da proporção.

🎯

Módulo 03 — Estim. Pontual

Não-viés, eficiência, consistência e suficiência dos estimadores.

📏

Módulo 04 — Intervalos

IC para média, proporção e variância. Tamanho amostral.

🔬

Módulo 05 — Testes Hipóteses

H₀, H₁, Erros Tipo I e II, valor-p, regiões críticas.

📐

Módulo 06 — Uma Amostra

Testes Z, t de Student e Qui-Quadrado para variância.

⚖️

Módulo 07 — Duas Amostras

Comparação de médias (t-pooled, Welch) e variâncias (F).

🔗

Módulo 08 — Correlação

Pearson, regressão linear simples e coeficiente R².

📋

Módulo 09 — χ² & Guia

Qui-quadrado de independência e guia de decisão de testes.

💬 Fundamento da Inferência

"Usar dados de uma amostra para tirar conclusões sobre uma população — sempre com uma medida quantificável de incerteza."

Módulo 01

Conceitos Fundamentais

Construindo a base da inferência estatística: população, amostra, parâmetros, estimadores e tipos de amostragem.

População vs. Amostra

📦 População (N)

Conjunto completo de elementos de interesse
Parâmetros: µ (média), σ² (variância), π (proporção)
Geralmente desconhecidos
Censo = levantamento completo (caro e lento)
Ex.: todos os alunos de uma universidade

🔍 Amostra (n)

Subconjunto selecionado da população
Estatísticas: x̄ (média), s² (variância), p̂ (proporção)
Calculadas a partir dos dados observados
Deve ser representativa da população!
Ex.: 500 alunos selecionados aleatoriamente

⇒ Inferência: usar as estatísticas da amostra para estimar os parâmetros da população, sempre com uma medida de incerteza (nível de confiança ou valor-p).

Tipos de Amostragem

Aleatória Simples: cada elemento tem igual probabilidade de seleção. Padrão ouro — exige lista completa (cadastro).
Estratificada: divide a população em estratos homogêneos (ex: faixa etária) e amostra cada estrato proporcionalmente.
Por Conglomerados: seleciona grupos naturais inteiros (bairros, escolas, empresas) e amostra dentro deles.
Sistemática: seleciona a cada k elementos: 1.º aleatório entre 1 e k, depois +k, +2k... Ex: k = N/n.

⚠️ A qualidade da inferência depende diretamente da qualidade da amostragem. Uma amostra viciada gera conclusões viciadas, independentemente do método estatístico utilizado.

Parâmetros vs. Estatísticas

Conceito	Notação Populacional	Notação Amostral	Observação
Média	µ (mu)	x̄ (x-barra)	x̄ estima µ
Variância	σ² (sigma²)	s²	s² usa (n−1) no denominador
Desvio Padrão	σ	s	s = √s²
Proporção	π (pi) ou p	p̂ (p-chapéu)	p̂ = x/n
Tamanho	N (maiúsculo)	n (minúsculo)	n ≤ N

✏️

Atividades — Módulo 01

4 questões

Uma pesquisadora deseja estudar a satisfação dos clientes de uma rede com 12.000 lojas. Ela decide entrevistar 400 clientes por loja escolhida aleatoriamente. Identifique: (a) população, (b) amostra, (c) parâmetro de interesse, (d) tipo de amostragem utilizado.

(a) População: todos os clientes da rede de 12.000 lojas (total desconhecido, mas muito grande).

(b) Amostra: os 400 clientes entrevistados por loja selecionada.

(c) Parâmetro de interesse: proporção ou média de satisfação (π ou µ) de todos os clientes da rede.

(d) Tipo de amostragem: Amostragem por Conglomerados — as lojas são os conglomerados (grupos naturais) selecionados, e dentro de cada loja são coletados os dados.

Diferencie parâmetro de estatística e dê um exemplo de cada um no contexto de uma pesquisa eleitoral.

Parâmetro: é uma medida descritiva da população inteira, geralmente desconhecida. Ex.: π = proporção real de votos que o candidato A receberá no dia da eleição (só saberemos após a apuração total).

Estatística: é uma medida calculada a partir da amostra, usada para estimar o parâmetro. Ex.: p̂ = proporção de entrevistados (n = 1.200) que declaram votar no candidato A = 0,47. Usamos p̂ para estimar π.

Uma escola com 800 alunos está distribuída em 4 turnos: Manhã (300), Tarde (280), Noite (160), Integral (60). Deseja-se selecionar 80 alunos para pesquisa. Calcule o número de alunos a entrevistar em cada turno usando amostragem estratificada proporcional.

Fração amostral: f = n/N = 80/800 = 0,10 (10%)

Para cada turno, multiplica-se o tamanho pelo fator f = 0,10:

• Manhã: 300 × 0,10 = 30 alunos

• Tarde: 280 × 0,10 = 28 alunos

• Noite: 160 × 0,10 = 16 alunos

• Integral: 60 × 0,10 = 6 alunos

Total: 30+28+16+6 = 80 ✓

Uma fábrica produz 5.000 peças por dia. O controle de qualidade precisa inspecionar 50 peças. Descreva como aplicar a amostragem sistemática e calcule o intervalo k.

Intervalo k: k = N/n = 5.000/50 = 100

Passo 1: Numerar as peças de 1 a 5.000 conforme saem da linha de produção.

Passo 2: Sortear aleatoriamente o ponto de partida entre 1 e 100 (ex: peça nº 37).

Passo 3: Selecionar a cada 100: peças 37, 137, 237, 337, ... até 4.937. Total = 50 peças ✓

Vantagem: simples de aplicar operacionalmente e distribui a amostra ao longo de todo o período de produção, capturando eventuais variações ao longo do turno.

Módulo 02

Distribuições Amostrais

O comportamento estatístico das estimativas: Teorema Central do Limite e distribuição da proporção amostral.

Teorema Central do Limite (TCL)

Para amostras de tamanho n ≥ 30, a distribuição amostral da média se aproxima de uma distribuição Normal, independentemente da distribuição da população original.

📐 Fórmulas do TCL

Média da distrib. amostral: μ_x̄ = μ
Erro Padrão da média: σ_x̄ = σ / √n
Padronização (Z-score): Z = (x̄ − μ) / (σ/√n) • A média das médias amostrais é igual à média populacional.
• O erro padrão DIMINUI com o aumento de n — amostras maiores são mais precisas.
• Para n ≥ 30: podemos usar Z mesmo sem normalidade na população.

✅ Exemplo do TCL

Uma população tem µ = 50 e σ = 12. Retira-se amostras de n = 36.
• σ_x̄ = 12/√36 = 12/6 = 2
• Distribuição de x̄ ~ N(50, 4) — Normal com média 50 e variância 4.
• P(x̄ > 53) = P(Z > (53−50)/2) = P(Z > 1,5) ≈ 0,067 = 6,7%

Distribuição Amostral da Proporção

📐 Fórmulas para p̂

E(p̂) = π (não-viesado)
Var(p̂) = π(1−π)/n
Erro Padrão: σ_p̂ = √[π(1−π)/n]
Padronização: Z = (p̂ − π) / σ_p̂ Condição de normalidade: n·π ≥ 5 e n·(1−π) ≥ 5

✅ Exemplo com Proporção

Eleição: π = 0,45. Amostra n = 200.
σ_p̂ = √(0,45 × 0,55 / 200) = √(0,001238) ≈ 0,0352
Verificando normalidade: n·π = 200×0,45 = 90 ≥ 5 ✓ | n·(1−π) = 110 ≥ 5 ✓
IC 95%: p̂ ± 1,96 × 0,0352 = p̂ ± 0,069

✏️

Atividades — Módulo 02

5 questões

Uma população tem µ = 80 e σ = 20. Calcule o erro padrão da média para amostras de: (a) n = 4, (b) n = 25, (c) n = 100. O que acontece com o erro padrão ao aumentar n?

σ_x̄ = σ/√n = 20/√n

(a) n = 4: σ_x̄ = 20/√4 = 20/2 = 10

(b) n = 25: σ_x̄ = 20/√25 = 20/5 = 4

(c) n = 100: σ_x̄ = 20/√100 = 20/10 = 2

Conclusão: O erro padrão diminui conforme n aumenta (relação de raiz quadrada). Ao quadruplicar n, o EP cai pela metade. Amostras maiores produzem estimativas mais precisas.

O tempo de atendimento em um banco segue distribuição exponencial com µ = 5 minutos e σ = 5 minutos. Para amostras de n = 64 clientes, qual é a probabilidade de a média amostral ser maior que 5,8 minutos?

Pelo TCL (n=64 ≥ 30): x̄ ~ N(5, 25/64)

σ_x̄ = 5/√64 = 5/8 = 0,625

Z = (5,8 − 5) / 0,625 = 0,8/0,625 = 1,28

P(x̄ > 5,8) = P(Z > 1,28) ≈ 1 − 0,8997 = 0,1003 ≈ 10,0%

Nota: o TCL permite usar a Normal mesmo a distribuição original sendo exponencial (assimétrica), pois n=64 ≥ 30.

Em uma eleição, sabe-se que a proporção real de eleitores favoráveis ao candidato é π = 0,52. Para uma amostra de n = 400 eleitores, calcule: (a) E(p̂), (b) σ_p̂, (c) P(p̂ < 0,50).

(a) E(p̂) = π = 0,52

σ_p̂ = √(0,52 × 0,48 / 400) = √(0,000624) ≈ 0,02498 ≈ 0,025

(b) σ_p̂ ≈ 0,025

Z = (0,50 − 0,52) / 0,025 = −0,02/0,025 = −0,80

(c) P(p̂ < 0,50) = P(Z < −0,80) ≈ 0,2119 ≈ 21,2%

Interpretação: há 21,2% de chance de a pesquisa mostrar menos de 50% de apoio ao candidato, mesmo que ele tenha 52% real — ressaltando a importância de margens de erro.

Explique por que o TCL é considerado o teorema mais importante da estatística inferencial. Dê um exemplo de aplicação onde a distribuição original não é normal.

Importância do TCL: sem ele, só poderíamos aplicar métodos baseados na Normal para dados que já seguem essa distribuição. O TCL garante que, para n ≥ 30, a distribuição amostral da média se aproxima da Normal independentemente da distribuição original.

Consequência prática: justifica o uso de intervalos de confiança e testes de hipóteses baseados em Z e t para praticamente qualquer tipo de dado — renda (assimétrica), contagens, tempos, etc.

Exemplo: Distribuição de renda (fortemente assimétrica à direita). A renda individual de cada brasileiro não segue Normal. Porém, se coletarmos 1.000 amostras de n=50 e calcularmos a média de cada uma, essas 1.000 médias seguirão uma distribuição aproximadamente Normal — o TCL em ação.

Verifique se a condição de normalidade está satisfeita para usar a distribuição Normal da proporção nos casos: (a) n=50, π=0,04; (b) n=200, π=0,06; (c) n=100, π=0,90.

Condição: n·π ≥ 5 E n·(1−π) ≥ 5

(a) n=50, π=0,04: n·π = 50×0,04 = 2 < 5 ❌ — NÃO satisfeita. Usar distribuição binomial exata.

(b) n=200, π=0,06: n·π = 200×0,06 = 12 ≥ 5 ✓ | n·(1−π) = 200×0,94 = 188 ≥ 5 ✓ — Satisfeita.

(c) n=100, π=0,90: n·π = 100×0,90 = 90 ≥ 5 ✓ | n·(1−π) = 100×0,10 = 10 ≥ 5 ✓ — Satisfeita.

Módulo 03

Estimação Pontual

Propriedades que fazem um estimador ser "bom": não-viés, eficiência, consistência e suficiência.

As 4 Propriedades dos Estimadores

✓

Não-Viesado

E(θ̂) = θ. O valor esperado do estimador é igual ao parâmetro verdadeiro. Não há tendência sistemática de super ou subestimar.

⚡

Eficiente

Var(θ̂) mínima. Entre todos os estimadores não-viesados, o mais eficiente tem menor variância — estimativa mais precisa.

∞

Consistente

θ̂ →ᵖ θ quando n → ∞. Conforme o tamanho da amostra aumenta, o estimador converge para o verdadeiro parâmetro.

Suficiente

O estimador utiliza toda a informação disponível na amostra sobre o parâmetro de interesse — não descarta dados relevantes.

📐 Estimadores e suas Propriedades

x̄ estima µ → não-viesado, eficiente (MVUE), consistente
s² = Σ(xᵢ−x̄)²/(n−1) estima σ² → não-viesado (com n−1)
s²ₙ = Σ(xᵢ−x̄)²/n → VIESADO (subestima σ²)
p̂ = x/n estima π → não-viesado, consistente MVUE = Minimum Variance Unbiased Estimator (estimador de variância mínima não-viesado)

⚠️ Usar s² com divisão por (n−1), e não por n, é ESSENCIAL para ter estimativa não-viesada da variância populacional. Este é o motivo da "Correção de Bessel".

✏️

Atividades — Módulo 03

4 questões

Demonstre por que x̄ é estimador não-viesado de µ. Mostre matematicamente que E(x̄) = µ.

E(x̄) = E[(x₁ + x₂ + ... + xₙ)/n] = (1/n)·[E(x₁) + E(x₂) + ... + E(xₙ)]

Como cada xᵢ é extraído da mesma população com média µ: E(xᵢ) = µ para todo i.

E(x̄) = (1/n)·[µ + µ + ... + µ] = (1/n)·(n·µ) = µ ✓

Portanto E(x̄) = µ, confirmando que x̄ é não-viesado. Em repetidas amostras, a média das médias amostrais converge para µ.

Compare os estimadores s²ₙ = Σ(xᵢ−x̄)²/n e s² = Σ(xᵢ−x̄)²/(n−1) para os dados {2, 4, 6, 8, 10}. Calcule ambos e mostre o viés.

x̄ = (2+4+6+8+10)/5 = 30/5 = 6

Desvios: −4, −2, 0, 2, 4 | Desvios²: 16, 4, 0, 4, 16 | Σ = 40

s²ₙ = 40/5 = 8,0 (viesado — subestima σ²)

s² = 40/4 = 10,0 (não-viesado — estimador correto)

Viés de s²ₙ: E(s²ₙ) = σ²×(n−1)/n = σ²×4/5 = 0,8·σ². Ele sistematicamente subestima σ² em 20% para n=5. Usar s² com (n−1) corrige esse viés.

O que significa um estimador ser "consistente"? Por que a consistência é uma propriedade desejável, mesmo que um estimador seja viesado para amostras pequenas?

Consistência: θ̂ converge em probabilidade para θ quando n → ∞. Formalmente: para qualquer ε > 0, P(|θ̂ − θ| > ε) → 0 quando n → ∞.

Importância: mesmo um estimador levemente viesado para amostras pequenas pode ser preferível se for consistente — pois com n suficientemente grande, o viés desaparece e o estimador se torna preciso.

Exemplo: s²ₙ (com divisão por n) é viesado, mas consistente: conforme n → ∞, o fator (n−1)/n → 1 e o viés desaparece. Para aplicações com n muito grande, ambos os estimadores dão resultado praticamente idêntico.

Em uma fábrica, 24 peças de uma amostra apresentaram a seguinte vida útil (horas): soma = 2.400h, Σ(xᵢ−x̄)² = 4.416. Calcule: (a) estimativa pontual de µ, (b) estimativa de σ², (c) estimativa de σ.

(a) Estimativa de µ:

x̄ = Σxᵢ/n = 2.400/24 = 100 horas

(b) Estimativa de σ²:

s² = Σ(xᵢ−x̄)²/(n−1) = 4.416/23 ≈ 192 h²

(c) Estimativa de σ:

s = √s² = √192 ≈ 13,86 horas

Interpretação: a vida útil média estimada é 100h, com desvio padrão de aproximadamente 13,86h.

Módulo 04

Intervalos de Confiança

Estimação com margem de erro: IC para média (σ conhecido e desconhecido), proporção, variância e tamanho amostral.

IC para Média — σ Conhecido

📐 Fórmula

IC (1−α)·100%: x̄ ± Z(α/2) · σ/√n

Valores críticos:
Confiança 90% → Z = 1,645
Confiança 95% → Z = 1,960
Confiança 99% → Z = 2,576

✅ Exemplo

Uma amostra de n=64 frascos tem x̄ = 500ml. σ = 8ml (conhecido). IC de 95%:
E = 1,96 × 8/√64 = 1,96 × 1 = 1,96ml
IC 95%: (498,04 ; 501,96) ml
Interpretação: em 95% das amostras possíveis, o intervalo calculado conterá µ.

IC para Média — σ Desconhecido (dist. t)

📐 Fórmula com t de Student

IC: x̄ ± t(α/2, n−1) · s/√n
gl = n − 1 (graus de liberdade) • Usar quando σ é desconhecido (situação mais comum na prática)
• Distribuição t tem caudas mais pesadas que Z → IC mais largo (mais conservador)
• Converge para Normal quando gl → ∞

Característica	Dist. t de Student	Dist. Normal (Z)
Parâmetro	Graus de liberdade (gl = n−1)	Nenhum
Caudas	Mais pesadas (maior incerteza)	Mais finas
Quando usar	σ desconhecido, qualquer n	σ conhecido ou n ≥ 30
Converge para	Normal quando n → ∞	—

IC para Proporção

📐 Fórmula

IC: p̂ ± Z(α/2) · √[p̂(1−p̂)/n]
Margem de erro: E = Z(α/2) · √[p̂(1−p̂)/n]

✅ Exemplo Eleitoral

Pesquisa com n=600 eleitores: p̂ = 0,52 favoráveis. IC de 95%:
E = 1,96 · √(0,52×0,48/600) = 1,96 · √0,000416 = 1,96 · 0,0204 ≈ 0,040
IC 95%: (0,480 ; 0,560) — o candidato tem entre 48% e 56% de intenção de voto.

Tamanho Amostral

📐 Fórmulas para Calcular n

Para média: n = (Z(α/2) · σ / E)²

Para proporção (com estimativa prévia π):
n = Z²(α/2) · π(1−π) / E²

Para proporção (sem estimativa prévia — máximo conservador):
n = Z²(α/2) · 0,25 / E² E = margem de erro desejada. π(1−π) é máximo em π = 0,5 → produto = 0,25

✅ Cálculo de Tamanho Amostral

Quero estimar µ com margem de erro E = 2, σ = 10, confiança 95%:
n = (1,96 × 10 / 2)² = (9,8)² ≈ 97 → usar n = 97

Para proporção, erro ≤ 3%, confiança 95%, sem estimativa prévia:
n = (1,96)² × 0,25 / (0,03)² = 3,8416 × 0,25 / 0,0009 ≈ 1.068

✏️

Atividades — Módulo 04

5 questões

Uma amostra de n=36 estudantes tem x̄ = 72 pontos. O desvio padrão populacional é σ = 12. Construa o IC de 95% e 99% para µ. O que acontece com a amplitude do IC ao aumentar a confiança?

σ_x̄ = 12/√36 = 2

IC 95%: 72 ± 1,96 × 2 = 72 ± 3,92 → (68,08 ; 75,92)

IC 99%: 72 ± 2,576 × 2 = 72 ± 5,15 → (66,85 ; 77,15)

Conclusão: Aumentar a confiança de 95% para 99% aumenta a amplitude do IC (de 7,84 para 10,30). Há um trade-off: mais confiança ↔ menos precisão. Para ter mais confiança com a mesma precisão, é preciso aumentar n.

Uma amostra de n=16 lâmpadas (σ desconhecido) tem x̄ = 1.200h e s = 80h. Construa o IC de 95% usando a distribuição t. (Consulte: t(0,025; 15) = 2,131)

σ desconhecido, n=16 → usar dist. t com gl = n−1 = 15

E = t(0,025; 15) × s/√n = 2,131 × 80/√16 = 2,131 × 20 = 42,62

IC 95%: 1.200 ± 42,62 → (1.157,4 ; 1.242,6) horas

Interpretação: com 95% de confiança, a vida útil média real das lâmpadas está entre 1.157 e 1.243 horas.

Em uma pesquisa com n=500 consumidores, 310 afirmaram preferir a marca A. Construa o IC de 95% para a proporção populacional π que prefere a marca A.

p̂ = 310/500 = 0,62

E = 1,96 × √(0,62 × 0,38 / 500) = 1,96 × √(0,0004712) = 1,96 × 0,02171 ≈ 0,0425

IC 95%: 0,62 ± 0,0425 → (0,578 ; 0,663)

Interpretação: estima-se com 95% de confiança que entre 57,8% e 66,3% dos consumidores preferem a marca A.

Uma empresa quer estimar o tempo médio de processamento de pedidos com margem de erro de no máximo 5 minutos e confiança 95%. Estudos anteriores indicam σ ≈ 30 minutos. Qual o tamanho mínimo de amostra?

n = (Z(α/2) × σ / E)² = (1,96 × 30 / 5)²

n = (58,8 / 5)² = (11,76)² = 138,3 → arredondar para cima

n mínimo = 139 pedidos

Atenção: sempre arredonda para cima para garantir que a margem de erro não seja excedida.

Um instituto de pesquisa quer saber, com margem de erro de 3 pontos percentuais e 95% de confiança, a proporção de brasileiros favoráveis a uma nova política, sem estimativa prévia. Qual o tamanho amostral necessário?

Sem estimativa prévia: usar π = 0,5 (caso mais conservador, maximiza n)

n = Z²(α/2) × 0,25 / E² = (1,96)² × 0,25 / (0,03)²

n = 3,8416 × 0,25 / 0,0009 = 0,9604 / 0,0009 ≈ 1.067,1

n mínimo = 1.068 pessoas

Este é o "tamanho padrão" de pesquisas eleitorais nacionais: ~1.000 a 1.200 entrevistas garante margem de ±3% com 95% de confiança.

Módulo 05

Testes de Hipóteses

Tomada de decisão sob incerteza: estrutura do teste, erros Tipo I e II, valor-p e tipos de região crítica.

Estrutura de um Teste — 5 Passos

Formular Hipóteses

H₀ (nula): afirmação conservadora a testar. H₁ (alternativa): o que queremos provar. H₀ sempre contém "=".

Definir Nível de Significância

α = P(Erro Tipo I) = P(rejeitar H₀ | H₀ verdadeira). Usual: α = 0,05 ou α = 0,01.

Calcular a Estatística de Teste

Calcula-se o valor Z, t, χ², F com base nos dados. Mede o quanto a amostra discrepa de H₀.

Regra de Decisão

Comparar com valor crítico OU comparar valor-p com α. Rejeitar H₀ se |est.| > crítico ou valor-p < α.

Conclusão Contextualizada

Interpretar no contexto do problema. "Há evidência estatística suficiente para concluir que..." ou "Não há evidência para rejeitar...".

Erros em Testes de Hipóteses

H₀ É VERDADEIRA

H₀ É FALSA

Não Rejeitar H₀

✅ Decisão Correta (prob. = 1−α)

⚠️ Erro Tipo II (β) — Falso Negativo

Rejeitar H₀

❌ Erro Tipo I (α) — Falso Positivo

✅ Decisão Correta — Poder = (1−β)

Tipos de Teste e Valor-p

Tipo	Hipótese Alternativa	Região Crítica	Valor-p
Bilateral	H₁: µ ≠ µ₀	Ambas as caudas (α/2 cada)	2 × P(Z > \|z\|)
Unilateral Direita	H₁: µ > µ₀	Cauda direita (α)	P(Z > z)
Unilateral Esquerda	H₁: µ < µ₀	Cauda esquerda (α)	P(Z < z)

💡 Valor-p: probabilidade de obter um resultado tão extremo quanto o observado, assumindo que H₀ é verdadeira. Se valor-p < α → Rejeitar H₀. Quanto menor o valor-p, maior a evidência contra H₀.

✏️

Atividades — Módulo 05

4 questões

Formule H₀ e H₁ para cada situação e identifique o tipo de teste (bilateral, unilateral direita, unilateral esquerda):
(a) Testar se um novo remédio reduz a pressão arterial abaixo de 120mmHg.
(b) Testar se o salário médio dos engenheiros é diferente de R$8.000.
(c) Testar se a proporção de defeitos subiu acima de 2%.

(a) H₀: µ ≥ 120 | H₁: µ < 120 → Unilateral Esquerda (queremos provar que reduz)

(b) H₀: µ = 8.000 | H₁: µ ≠ 8.000 → Bilateral (poderia ser maior ou menor)

(c) H₀: π ≤ 0,02 | H₁: π > 0,02 → Unilateral Direita (queremos detectar aumento)

Em um teste com α = 0,05, obteve-se valor-p = 0,03. Em outro teste, valor-p = 0,08. Para cada caso: (a) qual a decisão? (b) Qual o erro que pode ter sido cometido? (c) O que significa o valor-p em palavras?

Teste 1 (valor-p = 0,03 < α = 0,05):

(a) Rejeitar H₀. (b) Pode ter cometido Erro Tipo I (falso positivo) — rejeitar H₀ quando ela era verdadeira, com probabilidade α = 5%. (c) "Se H₀ fosse verdadeira, haveria apenas 3% de chance de observar um resultado tão extremo. Isso é evidência suficiente para rejeitar H₀."

Teste 2 (valor-p = 0,08 ≥ α = 0,05):

(a) Não rejeitar H₀. (b) Pode ter cometido Erro Tipo II (β) — não detectar um efeito real. (c) "Se H₀ fosse verdadeira, haveria 8% de chance de observar isso. Não é evidência suficiente para rejeitar H₀ com α = 5%."

Explique o trade-off entre Erros Tipo I (α) e Tipo II (β). Por que não podemos minimizar ambos simultaneamente para n fixo?

Trade-off: para um n fixo, reduzir α (tornar o teste mais exigente) aumenta automaticamente β (tornamos mais difícil detectar diferenças reais). São como as duas pontas de uma corda.

Analogia: Ao apertarmos o critério para condenar um réu (reduzir falsos positivos), inevitavelmente deixamos mais culpados livres (aumentamos falsos negativos) — e vice-versa.

Solução: aumentar o tamanho da amostra n. Com n maior, reduz-se o erro padrão, e o Poder (1−β) aumenta mantendo α controlado. Em planejamento de experimentos, calcula-se n para atingir poder ≥ 0,80 com α = 0,05.

O que é o "Poder" de um teste (1−β)? Uma empresa farmacêutica diz que seu teste tem "poder de 80%". O que isso significa praticamente?

Poder = 1 − β = P(Rejeitar H₀ | H₀ é FALSA) — probabilidade de detectar um efeito real quando ele existe.

Poder de 80%: se o novo medicamento realmente funciona, o estudo tem 80% de probabilidade de detectar esse efeito e rejeitar H₀. Ou seja, há 20% de risco de "perder" um efeito real (β = 0,20).

Implicação prática: estudos clínicos costumam exigir poder ≥ 80% para serem aprovados por agências regulatórias (ANVISA, FDA). Poder baixo pode levar à rejeição de medicamentos eficazes por amostras insuficientes.

Módulo 06

Testes para Uma Amostra

Teste Z (σ conhecido), Teste t de Student (σ desconhecido) e Qui-Quadrado para variância.

Teste Z e Teste t — Comparação

📐 Estatísticas de Teste

Teste Z (σ conhecido ou n≥30): Z = (x̄ − µ₀) / (σ/√n) ~ N(0,1)
Teste t (σ desconhecido): t = (x̄ − µ₀) / (s/√n) ~ t(n−1)
Teste Z (proporção): Z = (p̂ − π₀) / √[π₀(1−π₀)/n]

Teste Qui-Quadrado para Variância

📐 Fórmula χ²

H₀: σ² = σ₀²
χ² = (n−1)·s² / σ₀² ~ χ²(n−1) sob H₀

Rejeições (bilateral H₁: σ² ≠ σ₀²):
χ² < χ²(1−α/2, n−1) OU χ² > χ²(α/2, n−1) Premissas: população normal. Sensível à não-normalidade.

✏️

Atividades — Módulo 06

5 questões

Uma máquina deve encher embalagens com 500g. Uma amostra de n=64 embalagens tem x̄ = 497g. O desvio padrão do processo é σ = 8g. Ao nível de 5%, a máquina está descalibrada? (Teste bilateral)

H₀: µ = 500 | H₁: µ ≠ 500 | α = 0,05 | Crítico: ±1,96

Z = (497 − 500) / (8/√64) = −3 / 1 = −3,00

Decisão: |Z| = 3,00 > 1,96 → Rejeitar H₀

Conclusão: Há evidência estatística suficiente ao nível de 5% para afirmar que a máquina está descalibrada (enchendo menos que 500g).

valor-p ≈ 2 × P(Z < −3,00) ≈ 2 × 0,0013 = 0,0026 (muito abaixo de 0,05).

Um laboratório afirma que seu novo fertilizante aumenta a produção média acima de 50 kg/hectare. Uma amostra de n=20 plantações tem x̄ = 53,5 kg e s = 6 kg. Teste ao nível 5%, unilateral direita. [t(0,05; 19) = 1,729]

H₀: µ ≤ 50 | H₁: µ > 50 | α = 0,05 | gl = 19 | t crítico = 1,729

t = (53,5 − 50) / (6/√20) = 3,5 / 1,342 = 2,608

Decisão: t = 2,608 > 1,729 → Rejeitar H₀

Conclusão: Há evidência estatística ao nível de 5% para concluir que o fertilizante aumenta a produção acima de 50 kg/hectare.

Uma pesquisa afirma que 30% dos jovens usam transporte público. Em uma amostra de n=400 jovens, 108 usam transporte público. Ao nível de 5%, há evidência para refutar a afirmação? (Bilateral)

H₀: π = 0,30 | H₁: π ≠ 0,30 | α = 0,05 | Crítico: ±1,96

p̂ = 108/400 = 0,27

Z = (0,27 − 0,30) / √(0,30×0,70/400) = −0,03 / √0,000525 = −0,03 / 0,0229 ≈ −1,31

Decisão: |Z| = 1,31 < 1,96 → Não rejeitar H₀

Conclusão: Não há evidência suficiente ao nível de 5% para refutar a afirmação de que 30% dos jovens usam transporte público.

Um processo industrial deve ter variância σ² = 4 (desvio padrão de 2mm). Uma amostra de n=25 peças resulta s² = 6,5. Ao nível de 5% (bilateral), o processo está fora de controle? [χ²(0,025; 24) = 39,36 | χ²(0,975; 24) = 12,40]

H₀: σ² = 4 | H₁: σ² ≠ 4 | α = 0,05 | gl = 24

χ² = (n−1)·s²/σ₀² = 24 × 6,5 / 4 = 156/4 = 39,0

Região crítica: χ² < 12,40 ou χ² > 39,36

Decisão: χ² = 39,0 — está próximo, mas não ultrapassa 39,36 → Não rejeitar H₀

Conclusão: Ao nível de 5%, não há evidência suficiente para afirmar que a variância do processo mudou. (A decisão seria marginal — em situações críticas, recomenda-se aumentar n.)

Quando deve-se usar o Teste t em vez do Teste Z? Quais são as premissas necessárias para o Teste t? O que acontece com o Teste t quando n é muito grande (n > 120)?

Usar Teste t quando: σ² da população é desconhecido (situação mais comum na prática). Substitui-se σ por s (desvio padrão amostral).

Premissas do Teste t: (1) Amostra aleatória. (2) Para n pequeno (< 30): distribuição da variável X deve ser aproximadamente normal. Para n ≥ 30, o TCL garante robustez.

Para n muito grande (n > 120): a distribuição t converge para a Normal padrão (os graus de liberdade grandes tornam as caudas cada vez mais finas). Na prática, para n > 120, os valores críticos t e Z são praticamente idênticos e pode-se usar Z diretamente.

Módulo 07

Testes para Duas Amostras

Comparação de médias (t-pooled, Welch), variâncias (Teste F) e proporções entre dois grupos independentes.

Comparação de Duas Médias

📐 Casos e Fórmulas

H₀: µ₁ = µ₂ (equivalente: µ₁ − µ₂ = 0)

Caso 1 — Variâncias iguais (σ₁=σ₂ desconhecidas):
t = (x̄₁ − x̄₂) / [sp · √(1/n₁ + 1/n₂)]
sp² = [(n₁−1)s₁² + (n₂−1)s₂²] / (n₁+n₂−2) gl = n₁+n₂−2

Caso 2 — Variâncias desiguais (Welch):
t ≈ (x̄₁ − x̄₂) / √(s₁²/n₁ + s₂²/n₂) Usar Teste F primeiro para decidir entre os dois casos

Teste F — Comparação de Variâncias

📐 Fórmula do Teste F

H₀: σ₁² = σ₂²
F = s₁² / s₂² ~ F(n₁−1, n₂−1) sob H₀
Convenção: colocar s maior no numerador (F ≥ 1)
Rejeitar H₀ se F > F(α/2, n₁−1, n₂−1) O Teste F é aplicado ANTES do teste de comparação de médias para escolher entre t-pooled ou Welch.

✏️

Atividades — Módulo 07

4 questões

Dois métodos de ensino foram aplicados. Método A (n₁=15): x̄₁=78, s₁=8. Método B (n₂=12): x̄₂=72, s₂=9. Assumindo variâncias iguais (já verificado), ao nível de 5%, o Método A é superior? [t(0,05; 25) = 1,708 unilateral]

H₀: µ₁ ≤ µ₂ | H₁: µ₁ > µ₂ | α = 0,05 | gl = 15+12−2 = 25

sp² = [(15−1)×64 + (12−1)×81] / 25 = [896 + 891]/25 = 1787/25 = 71,48

sp = √71,48 ≈ 8,455

t = (78−72) / [8,455 × √(1/15 + 1/12)] = 6 / [8,455 × 0,3727] = 6/3,151 ≈ 1,904

Decisão: t = 1,904 > 1,708 → Rejeitar H₀

Conclusão: Há evidência ao nível de 5% de que o Método A produz desempenho médio superior ao Método B.

Antes de comparar duas médias, aplique o Teste F para verificar igualdade de variâncias. Grupo 1 (n₁=21): s₁=15. Grupo 2 (n₂=16): s₂=8. Ao nível 10% (bilateral). [F(0,05; 20; 15) = 2,76]

H₀: σ₁² = σ₂² | H₁: σ₁² ≠ σ₂² | α = 0,10

Colocar maior variância no numerador: s₁ = 15 > s₂ = 8

F = s₁²/s₂² = 225/64 ≈ 3,516

F crítico (bilateral α=0,10 → α/2=0,05): F(0,05; 20; 15) = 2,76

Decisão: F = 3,516 > 2,76 → Rejeitar H₀

Conclusão: As variâncias são significativamente diferentes. Deve-se usar o Teste de Welch (variâncias desiguais) para comparar as médias.

Qual é a diferença entre o Teste t pooled e o Teste t de Welch? Quando cada um deve ser usado? Qual é mais conservador?

Teste t Pooled (variâncias iguais): combina as variâncias amostrais em uma variância ponderada sp² com gl = n₁+n₂−2. Mais poderoso quando a suposição de igualdade é válida.

Teste de Welch (variâncias desiguais): usa s₁²/n₁ + s₂²/n₂ no denominador com gl aproximados (Welch-Satterthwaite — geralmente um número não-inteiro). Mais conservador.

Quando usar: Primeiro aplique o Teste F. Se F não rejeitar σ₁²=σ₂²: use pooled. Se F rejeitar: use Welch. Na prática moderna, muitos estatísticos recomendam sempre usar Welch por ser mais robusto.

Mais conservador: Welch (gl menores → valor crítico t maior → mais difícil rejeitar H₀).

Em duas cidades, pesquisou-se a intenção de voto: Cidade A (n₁=600): 312 favoráveis (p̂₁=0,52). Cidade B (n₂=400): 172 favoráveis (p̂₂=0,43). Ao nível de 1%, há diferença nas proporções? (Teste bilateral)

H₀: π₁ = π₂ | H₁: π₁ ≠ π₂ | α = 0,01 | Crítico: ±2,576

p̄ = (312+172)/(600+400) = 484/1000 = 0,484

Z = (0,52−0,43) / √[0,484×0,516×(1/600+1/400)]

= 0,09 / √[0,24974 × 0,004167] = 0,09 / √0,001041 = 0,09/0,03226 ≈ 2,79

Decisão: |Z| = 2,79 > 2,576 → Rejeitar H₀

Conclusão: Há evidência ao nível de 1% de diferença nas proporções de intenção de voto entre as duas cidades.

Módulo 08

Correlação e Regressão Linear

Correlação de Pearson com teste de significância, regressão linear simples, R² e pressupostos do modelo.

Correlação de Pearson — Inferência

📐 Fórmulas

r = Σ[(xᵢ−x̄)(yᵢ−ȳ)] / √{Σ(xᵢ−x̄)² · Σ(yᵢ−ȳ)²} −1 ≤ r ≤ 1

Teste de significância — H₀: ρ = 0
t = r√(n−2) / √(1−r²) ~ t(n−2) sob H₀

Regressão Linear Simples

📐 Modelo e Estimativas

Modelo: Ŷ = b₀ + b₁X

b₁ = Σ(xᵢ−x̄)(yᵢ−ȳ) / Σ(xᵢ−x̄)² (inclinação)
b₀ = ȳ − b₁·x̄ (intercepto)

R² = SQReg / SQTotal (0 ≤ R² ≤ 1)
Teste H₀: β₁ = 0: t = b₁/s(b₁) ~ t(n−2)

Pressupostos da Regressão (LINE)

L — Linearidade: relação linear entre X e Y (verificar scatter plot)
I — Independência: erros (resíduos) são independentes entre si
N — Normalidade: resíduos seguem distribuição Normal
E — Equivariância (Homoscedasticidade): variância dos erros é constante para todos os valores de X

✏️

Atividades — Módulo 08

5 questões

Para n=22 pares de dados, calculou-se r = 0,65. Ao nível de 5% (bilateral), há correlação significativa na população? [t(0,025; 20) = 2,086]

H₀: ρ = 0 | H₁: ρ ≠ 0 | α = 0,05 | gl = 22−2 = 20

t = r√(n−2)/√(1−r²) = 0,65×√20/√(1−0,4225)

= 0,65×4,472/√0,5775 = 2,907/0,7599 ≈ 3,826

Decisão: t = 3,826 > 2,086 → Rejeitar H₀

Conclusão: Há correlação linear significativa (r=0,65, p < 0,05). A relação entre as variáveis é moderada/forte e estatisticamente significativa.

Para 5 observações: X = {1,2,3,4,5}, Y = {2,4,5,4,5}. Calcule os coeficientes b₁ e b₀ da reta de regressão e o R².

x̄ = 3, ȳ = 4

Σ(xᵢ−x̄)(yᵢ−ȳ) = (−2)(−2)+(−1)(0)+(0)(1)+(1)(0)+(2)(1) = 4+0+0+0+2 = 6

Σ(xᵢ−x̄)² = 4+1+0+1+4 = 10

b₁ = 6/10 = 0,6 | b₀ = 4 − 0,6×3 = 4 − 1,8 = 2,2

Ŷ = 2,2 + 0,6X

SQReg = b₁×Σ(xᵢ−x̄)(yᵢ−ȳ) = 0,6×6 = 3,6 | SQTotal = Σ(yᵢ−ȳ)² = 4+0+1+0+1 = 6

R² = 3,6/6 = 0,60 → 60% da variação em Y é explicada por X

Em uma regressão (n=30), encontrou-se b₁ = 2,4 e s(b₁) = 0,8. Ao nível de 5% (bilateral), X é um preditor significativo de Y? [t(0,025; 28) ≈ 2,048]

H₀: β₁ = 0 (X não explica Y) | H₁: β₁ ≠ 0 | gl = n−2 = 28

t = b₁/s(b₁) = 2,4/0,8 = 3,00

Decisão: t = 3,00 > 2,048 → Rejeitar H₀

Conclusão: X é um preditor estatisticamente significativo de Y ao nível de 5%. A inclinação b₁ = 2,4 é significativamente diferente de zero — há uma relação linear relevante entre as variáveis.

Um modelo de regressão para prever vendas (Y) em função de gastos com publicidade (X) resultou em Ŷ = 5 + 3,2X com R² = 0,81. Interprete b₁, b₀ e R² no contexto do problema.

b₀ = 5: quando os gastos com publicidade são zero, a previsão de vendas é 5 unidades (nível base de vendas sem investimento em publicidade). Cuidado: extrapolações para X=0 podem não ter significado prático.

b₁ = 3,2: para cada unidade adicional investida em publicidade, as vendas aumentam em média 3,2 unidades. Esta é a taxa de retorno marginal da publicidade no modelo.

R² = 0,81: 81% da variação nas vendas é explicada pelos gastos com publicidade no modelo. É um bom ajuste — o modelo captura a maior parte da variabilidade dos dados.

Por que é importante verificar os pressupostos da regressão linear? Quais ferramentas gráficas são usadas para checar cada pressuposto?

Importância: se os pressupostos são violados, os estimadores b₀ e b₁ podem ser ineficientes ou viesados, os testes t e F deixam de ser válidos, e as previsões podem ser sistematicamente erradas.

Linearidade: Scatter plot de Y vs. X — verificar se a relação é aproximadamente linear (e não curvilínea).

Normalidade dos resíduos: Histograma dos resíduos ou Q-Q plot — verificar se seguem distribuição Normal.

Homoscedasticidade: Gráfico de resíduos vs. valores ajustados Ŷ — verificar se a dispersão dos resíduos é constante (sem "funil").

Independência: Gráfico de resíduos vs. ordem de observação (ou teste de Durbin-Watson) — verificar autocorrelação.

Módulo 09

Qui-Quadrado de Independência & Guia de Decisão

Teste de associação entre variáveis categóricas e resumo completo: qual teste usar em cada situação.

Teste χ² de Independência

📐 Fórmula

H₀: as variáveis são independentes
χ² = Σ (Oᵢⱼ − Eᵢⱼ)² / Eᵢⱼ ~ χ²(gl) sob H₀
gl = (r−1)(c−1) onde r = linhas, c = colunas
Eᵢⱼ = (Σ linha i × Σ coluna j) / n Condição: Eᵢⱼ ≥ 5 em todas as células. Verificar antes de aplicar.

✅ Exemplo Resolvido — Preferência de Produto

Tabela observada: Homens(A=45, B=30), Mulheres(A=35, B=40) | n=150
Freq. esperadas: E₁₁=80×75/150=40, E₁₂=70×75/150=35, E₂₁=40, E₂₂=35
χ² = (45−40)²/40 + (30−35)²/35 + (35−40)²/40 + (40−35)²/35
χ² = 0,625 + 0,714 + 0,625 + 0,714 = 2,679
gl=(2−1)(2−1)=1 | χ²crítico(5%)=3,841
Decisão: Não rejeitar H₀ — sem evidência de associação entre sexo e preferência.

Guia Rápido: Qual Teste Usar?

Objetivo	Condições	Teste
Testar µ de 1 amostra	σ conhecido ou n ≥ 30	Teste Z
Testar µ de 1 amostra	σ desconhecido	Teste t (n−1 gl)
Comparar µ₁ vs µ₂	σ₁=σ₂ desconhecidas	Teste t pooled
Comparar µ₁ vs µ₂	σ₁≠σ₂ desconhecidas	Teste t Welch
Comparar σ₁² vs σ₂²	Populações normais	Teste F
Testar π (proporção)	np₀ ≥ 5, n(1−p₀) ≥ 5	Teste Z
Testar σ² de 1 amostra	População normal	Teste χ²
Associação entre categ.	Eᵢⱼ ≥ 5 em cada célula	χ² Independência
Correlação entre X e Y	Bivariate normal, n ≥ 10	Pearson + Teste t

✏️

Atividades — Módulo 09

5 questões

Uma pesquisa perguntou a 200 pessoas (100 homens, 100 mulheres) se praticam exercícios regularmente. Homens: 60 sim, 40 não. Mulheres: 50 sim, 50 não. Ao nível de 5%, há associação entre sexo e prática de exercícios? [χ²(0,05; 1) = 3,841]

H₀: sexo e exercício são independentes | H₁: há associação

Frequências esperadas (Eᵢⱼ = lin × col / n):
E₁₁=110×100/200=55, E₁₂=90×100/200=45, E₂₁=55, E₂₂=45

χ² = (60−55)²/55 + (40−45)²/45 + (50−55)²/55 + (50−45)²/45

= 25/55 + 25/45 + 25/55 + 25/45 = 0,455+0,556+0,455+0,556 = 2,02

Decisão: χ² = 2,02 < 3,841 → Não rejeitar H₀

Conclusão: Não há evidência ao nível de 5% de associação entre sexo e prática de exercícios nesta amostra.

Para cada situação abaixo, identifique o teste mais adequado:
(a) Comparar rendimento médio de dois grupos com variâncias desconhecidas e diferentes.
(b) Verificar se a proporção de defeitos de uma linha é maior que 5%.
(c) Verificar se a variabilidade de um processo aumentou (σ² > 9).
(d) Verificar se tipo de escola (pública/privada) está associado ao nível de escolaridade dos pais (fundamental/médio/superior).

(a) Variâncias desconhecidas e diferentes → Teste t de Welch (verificar antes com Teste F).

(b) Proporção vs. valor fixo (5%), unilateral direita → Teste Z para Proporção (verificar np₀ ≥ 5 e n(1−p₀) ≥ 5).

(c) Variância de 1 amostra vs. valor fixo, unilateral direita → Teste Qui-Quadrado para Variância (premissa: população normal).

(d) Duas variáveis categóricas, tabela 2×3 → Teste χ² de Independência com gl = (2−1)(3−1) = 2.

Um analista encontrou em seu teste: valor calculado χ² = 7,23 com gl = 3. Ao nível de 5%, qual a decisão? [χ²(0,05; 3) = 7,815]. O que o analista deve concluir?

Comparação: χ² calculado = 7,23 vs. χ² crítico = 7,815

7,23 < 7,815 → Não rejeitar H₀

Conclusão: Não há evidência ao nível de 5% de associação entre as variáveis analisadas. Os dados são compatíveis com a hipótese de independência.

Nota: O resultado é marginal (próximo à região crítica). Pode-se reportar o valor-p exato: P(χ² > 7,23 | gl=3) ≈ 0,065. Embora não haja rejeição a 5%, a 10% seria rejeitado. Contexto importa.

Sintetize: qual é a lógica unificadora de todos os testes vistos no curso? O que têm em comum o Teste Z, t, F e χ²?

Lógica unificadora: todos seguem a mesma estrutura: "Assumindo que H₀ é verdadeira, quão improvável são os dados observados?"

O que têm em comum:
1. Calculam uma estatística de teste que mede o afastamento dos dados em relação ao esperado sob H₀.
2. Comparam essa estatística com uma distribuição de referência (Normal, t, F ou χ²) que seria esperada sob H₀.
3. Se o resultado for muito improvável sob H₀ (valor-p < α), rejeitam H₀.

Diferença: cada teste usa uma distribuição diferente dependendo do parâmetro sendo testado (média, variância, proporção) e das condições dos dados (σ conhecido, normalidade, etc.).

QUESTÃO INTEGRADORA: Uma empresa tem dois departamentos. Depto A (n=25): satisfação média x̄₁=7,2, s₁=1,5. Depto B (n=20): x̄₂=6,8, s₂=2,1. (a) Quais os passos para comparar as médias? (b) O que fazer antes de aplicar o teste t? (c) Se as variâncias forem iguais (já verificado), aplique o teste ao nível de 5% bilateral. [t(0,05; 43) ≈ 2,017]

(a) Passos: 1. Formular H₀:µ₁=µ₂, H₁:µ₁≠µ₂. 2. Definir α=0,05. 3. Testar igualdade de variâncias (Teste F). 4. Escolher t-pooled ou Welch. 5. Calcular estatística. 6. Decidir e concluir.

(b) Antes do t: aplicar Teste F para verificar H₀: σ₁²=σ₂². Isso determina qual versão do teste t usar.

(c) Aplicando t-pooled:

sp² = [24×2,25 + 19×4,41]/(25+20−2) = [54+83,79]/43 = 137,79/43 ≈ 3,204 → sp ≈ 1,790

t = (7,2−6,8)/[1,790×√(1/25+1/20)] = 0,4/[1,790×0,3

= 0,4/[1,790×0,3] = 0,4/0,537 ≈ 0,745

Decisão: |t| = 0,745 < 2,017 → Não rejeitar H₀

Conclusão: Não há evidência estatística ao nível de 5% de diferença na satisfação média entre os departamentos.