Problemas
envolvendo Teste de Hipóteses e ANOVA Completamente
Randomizado (ANOVA One-Way)
Desenho
Experimental Completamente Randomizado (ANOVA One-Way)
Ao executar a ANOVA unidirecional, um único fator de
entrada é variado em diferentes níveis com o objetivo de comparar os meios de
replicação das experiências. Isto nos permitirá determinar a proporção das
variações dos dados que são devidas ao nível do fator e à variabilidade devido
a erro aleatório (variação dentro do grupo). O grupo interno são variações
devido à variação individual dentro do tratamento dos grupos. A hipótese nula é
rejeitada quando a variação na variável resposta não se deve a erros aleatórios,
mas a variações tratamento.
Graus
de liberdade
O conceito de graus de
liberdade é amplamente utilizado nas estatísticas para um estimador imparcial.
Os graus de liberdade entre tratamento são K - 1; é o número de tratamentos
menos um. Os graus de liberdade para o erro é N - k. Os graus de liberdade
totais são N - 1.
Ex.:
Suponha que temos uma máquina
de fabricar sabão que é usada por empregados agrupados em três turnos compostos
por um número igual de empregados. Queremos saber se há uma diferença na
produtividade entre os três turnos. Se fossem dois turnos, teríamos usado o
teste de hipóteses baseadas em t e determinar se existe uma diferença,
mas porque temos três turnos usando o teste de hipóteses baseado em t
seria propenso a aumentar a probabilidade de cometer erros. Em ambos os casos,
formularemos uma hipótese sobre a produtividade dos três turnos antes de
prosseguir com o teste. Hipótese para este caso particular estipulará que não
há diferença entre a produtividade dos três grupos.
Hₒ: Produtividade do primeiro
turno = produtividade do segundo
turno
= produtividade do terceiro turno
E a hipótese alternativa será
H₁: Há uma diferença entre a
produtividade de pelo menos dois turnos.
Algumas
condições devem ser preenchidas para que os resultados sejam válidos:
• Os
dados do tratamento devem ser normalmente distribuídos.
• A variância
deve ser a mesma para todos os tratamentos.
• Todas
as amostras são selecionadas aleatoriamente.
Todas as amostras são
independentes.
Com o recurso do Minitab, no
meu caso a versão 14, temos:
O F-estatística é a
razão entre o "Tratamento“ da Tabela para o erro (4 / 29.4603 = 0,13578).
A estatística F por si
só não fornece motivos para rejeição ou não rejeição da hipótese nula.
Deve ser
comparado com o F-valor, que é encontrado em uma tabela F (Apêndice). Se
o valor F é maior que o valor F crítico na tabela F, então a
hipótese nula é rejeitada. Se não, não podemos rejeitar a hipótese.
No nosso caso, a partir da
tabela F o valor crítico de F para α = 0,05 com os graus
de liberdade ν₁ = 2 e ν₂ = 18 são 3,55. Porque 3,55 é
> 0,13578, por tanto não podemos rejeitar a hipótese nula. Concluímos que
não existe uma diferença estatisticamente significativa entre os meios dos três
turnos.
Nos próximos artigos, voltarei
a explorar alguns “cases” com experimentos totalmente randomizados.
Problemas
envolvendo Teste de Hipóteses - TESTES
NÃO PARAMÉTRICO
Todos os procedimentos básicos de estatística
dependem fortemente da suposição de que os dados da amostra estejam
distribuídos de acordo com uma distribuição específica.
Os testes paramétricos assumem que a distribuição de
probabilidade da população no qual retiramos os dados seja conhecida e que
somente os valores de certos parâmetros, tais como a média e o desvio padrão,
sejam desconhecidos. Se os dados não satisfazem as suposições assumidas pelas
técnicas tradicionais, métodos não paramétricos de inferência estatística devem
usados. As técnicas não paramétricas assumem pouca ou nenhuma hipótese sobre a
distribuição de probabilidade da população no qual retiramos os dados. Um teste
não-paramétrico é aquele cujo modelo não especifica condições sobre os
parâmetros da população da qual a amostra foi obtida. Mesmo quando existem
certas pressuposições, estas são mais brandas do que aquelas associadas aos
testes paramétricos.
Testes
paramétricos alternativos
Quando existe uma escolha entre usar um teste
paramétrico ou um teste não paramétrico e você está relativamente certo de que
as pressuposições para o procedimento paramétrico são satisfeitas, use o
procedimento paramétrico.
Teste não paramétrico
|
Teste paramétrico alternativo
|
Teste de sinal com 1 amostra
|
Z com 1 amostra, t com 1 amostra
|
Teste de Wilcoxon com 1 amostra
|
Z com 1 amostra, t com 1 amostra
|
Teste de Mann-Whitney
|
Teste t com 2 amostras
|
Teste de Kruskal-Wallis
|
ANOVA com um fator
|
Teste de mediana de Mood
|
ANOVA com um fator
|
Teste de Friedman
|
ANOVA com dois fatores
|
One-sample Test - The
Sign Test
Neste
momento, vou demonstrar métodos que comparam medida de central ou medidas
de localização para um valor hipótese ou estimar um intervalo para a
medida desejada. Estes são conhecidos como métodos
não-paramétricos.
Ex.:
Suponha que temos um conjunto de dados de vinte e seis
observações (N = 26) e queremos se o valor de 30 é uma estimativa razoável da
média.
Para testar a normalidade,
imprimimos as estatísticas descritivas do MINITAB e executamos um teste de
normalidade de Anderson-Darling. Para as estatísticas descritivas o
procedimento MINITAB é:
Com o recurso do Minitab, no
meu caso a versão 14, temos:
Esses
dados não parecem normais, então fazemos um teste de normalidade formal
(Anderson-Darling).
Observa-se
que o p-Valor = 0.005, o que significa que os dados seguem o padrão não-normal.
A
partir realizaremos um teste de sinal não-paramétrico
para ver se 30 é uma estimativa razoável da média, ou seja, se um valor de 30
poderia pertencer a essa distribuição:
Esta
saída apresenta três Intervalos de Confiança.
Se você se lembrar, estamos interessados na saída NLI (interpolação
não-linear). Isto diz que nossa mediana é 8, com intervalos de confiança que o
delimitam em 5 e 26.6. Como nosso valor hipotético 30 está fora deste
intervalo, rejeitamos a hipótese nula em favor da alternativa e concluímos que
no nível α = 0,05 rejeitamos a hipótese de que um valor de 30 é uma estimativa
razoável da mediana.
Esta
saída abaixo afirma que há 18 observações abaixo da mediana da hipótese, e 7
acima (lembre-se deve ser em torno de 50/50). O p-Valor = 0,0433, menor do que
o α, portanto, concluímos que no nível α = 0,05, rejeitamos a hipótese nula de
que 30 é uma estimativa razoável da média e aceitamos a hipótese alternativa.
Os
resultados do teste de hipótese são obviamente os mesmos que o teste de
Intervalo de Confiança. O método que você vier a escolher depende da
preferência pessoal e do tipo exato de pergunta que você está interessado em
responder.
Nos próximos artigos, voltarei
a explorar alguns “cases” com experimentos totalmente randomizados.
Bons estudos!
Nenhum comentário:
Postar um comentário