Páginas

Modelos Estatísticos: Teste de Hipóteses e ANOVA Completamente Randomizado (ANOVA One-Way) e TESTES NÃO PARAMÉTRICO

Problemas envolvendo Teste de Hipóteses e ANOVA Completamente Randomizado (ANOVA One-Way)

Desenho Experimental Completamente Randomizado (ANOVA One-Way)

Ao executar a ANOVA unidirecional, um único fator de entrada é variado em diferentes níveis com o objetivo de comparar os meios de replicação das experiências. Isto nos permitirá determinar a proporção das variações dos dados que são devidas ao nível do fator e à variabilidade devido a erro aleatório (variação dentro do grupo). O grupo interno são variações devido à variação individual dentro do tratamento dos grupos. A hipótese nula é rejeitada quando a variação na variável resposta não se deve a erros aleatórios, mas a variações tratamento.

Graus de liberdade
O conceito de graus de liberdade é amplamente utilizado nas estatísticas para um estimador imparcial. Os graus de liberdade entre tratamento são K - 1; é o número de tratamentos menos um. Os graus de liberdade para o erro é N - k. Os graus de liberdade totais são N - 1.

Ex.:
Suponha que temos uma máquina de fabricar sabão que é usada por empregados agrupados em três turnos compostos por um número igual de empregados. Queremos saber se há uma diferença na produtividade entre os três turnos. Se fossem dois turnos, teríamos usado o teste de hipóteses baseadas em t e determinar se existe uma diferença, mas porque temos três turnos usando o teste de hipóteses baseado em t seria propenso a aumentar a probabilidade de cometer erros. Em ambos os casos, formularemos uma hipótese sobre a produtividade dos três turnos antes de prosseguir com o teste. Hipótese para este caso particular estipulará que não há diferença entre a produtividade dos três grupos.
Hₒ: Produtividade do primeiro turno  = produtividade do segundo turno                                                 
                                                                                        = produtividade do terceiro turno

E a hipótese alternativa será

H: Há uma diferença entre a produtividade de pelo menos dois turnos.
Algumas condições devem ser preenchidas para que os resultados sejam válidos:

      Os dados do tratamento devem ser normalmente distribuídos.
      A variância deve ser a mesma para todos os tratamentos.
      Todas as amostras são selecionadas aleatoriamente.

Todas as amostras são independentes.


Com o recurso do Minitab, no meu caso a versão 14, temos:




O F-estatística é a razão entre o "Tratamento“ da Tabela para o erro (4 / 29.4603 = 0,13578).

A estatística F por si só não fornece motivos para rejeição ou não rejeição da hipótese nula. 
Deve ser comparado com o F-valor, que é encontrado em uma tabela F (Apêndice). Se o valor F é maior que o valor F crítico na tabela F, então a hipótese nula é rejeitada. Se não, não podemos rejeitar a hipótese.

No nosso caso, a partir da tabela F o valor crítico de F para α = 0,05 com os graus de liberdade ν = 2 e ν = 18 são 3,55. Porque 3,55 é > 0,13578, por tanto não podemos rejeitar a hipótese nula. Concluímos que não existe uma diferença estatisticamente significativa entre os meios dos três turnos.

Nos próximos artigos, voltarei a explorar alguns “cases” com experimentos totalmente randomizados.



Problemas envolvendo Teste de Hipóteses - TESTES NÃO PARAMÉTRICO

Todos os procedimentos básicos de estatística dependem fortemente da suposição de que os dados da amostra estejam distribuídos de acordo com uma distribuição específica.
Os testes paramétricos assumem que a distribuição de probabilidade da população no qual retiramos os dados seja conhecida e que somente os valores de certos parâmetros, tais como a média e o desvio padrão, sejam desconhecidos. Se os dados não satisfazem as suposições assumidas pelas técnicas tradicionais, métodos não paramétricos de inferência estatística devem usados. As técnicas não paramétricas assumem pouca ou nenhuma hipótese sobre a distribuição de probabilidade da população no qual retiramos os dados. Um teste não-paramétrico é aquele cujo modelo não especifica condições sobre os parâmetros da população da qual a amostra foi obtida. Mesmo quando existem certas pressuposições, estas são mais brandas do que aquelas associadas aos testes paramétricos.
           
Testes paramétricos alternativos
Quando existe uma escolha entre usar um teste paramétrico ou um teste não paramétrico e você está relativamente certo de que as pressuposições para o procedimento paramétrico são satisfeitas, use o procedimento paramétrico.

Teste não paramétrico
Teste paramétrico alternativo
Teste de sinal com 1 amostra
Z com 1 amostra, t com 1 amostra
Teste de Wilcoxon com 1 amostra
Z com 1 amostra, t com 1 amostra
Teste de Mann-Whitney
Teste t com 2 amostras
Teste de Kruskal-Wallis
ANOVA com um fator
Teste de mediana de Mood
ANOVA com um fator
Teste de Friedman
ANOVA com dois fatores

One-sample Test - The Sign Test
Neste momento, vou demonstrar métodos que comparam medida de central ou medidas de localização para um valor hipótese ou estimar um intervalo para a medida desejada. Estes são conhecidos como métodos não-paramétricos.

Ex.:
Suponha que temos um conjunto de dados de vinte e seis observações (N = 26) e queremos se o valor de 30 é uma estimativa razoável da média.
Para testar a normalidade, imprimimos as estatísticas descritivas do MINITAB e executamos um teste de normalidade de Anderson-Darling. Para as estatísticas descritivas o procedimento MINITAB é:
Com o recurso do Minitab, no meu caso a versão 14, temos:



Esses dados não parecem normais, então fazemos um teste de normalidade formal (Anderson-Darling).


Observa-se que o p-Valor = 0.005, o que significa que os dados seguem o padrão não-normal.
A partir realizaremos um teste de sinal não-paramétrico para ver se 30 é uma estimativa razoável da média, ou seja, se um valor de 30 poderia pertencer a essa distribuição:


Esta saída apresenta três Intervalos  de Confiança. Se você se lembrar, estamos interessados na saída NLI (interpolação não-linear). Isto diz que nossa mediana é 8, com intervalos de confiança que o delimitam em 5 e 26.6. Como nosso valor hipotético 30 está fora deste intervalo, rejeitamos a hipótese nula em favor da alternativa e concluímos que no nível α = 0,05 rejeitamos a hipótese de que um valor de 30 é uma estimativa razoável da mediana.
 
Esta saída abaixo afirma que há 18 observações abaixo da mediana da hipótese, e 7 acima (lembre-se deve ser em torno de 50/50). O p-Valor = 0,0433, menor do que o α, portanto, concluímos que no nível α = 0,05, rejeitamos a hipótese nula de que 30 é uma estimativa razoável da média e aceitamos a hipótese alternativa.


Os resultados do teste de hipótese são obviamente os mesmos que o teste de Intervalo de Confiança. O método que você vier a escolher depende da preferência pessoal e do tipo exato de pergunta que você está interessado em responder.


Nos próximos artigos, voltarei a explorar alguns “cases” com experimentos totalmente randomizados.



Bons estudos!


Nenhum comentário:

Postar um comentário