Introducing 

Prezi AI.

Your new presentation assistant.

Refine, enhance, and tailor your content, source relevant images, and edit visuals quicker than ever before.

Loading…
Transcript

Testes Estatísticos

Prof. Adriano Bressane

Instituto de Ciência e Tecnologia

Universidade Estadual Paulista

.

Decidindo sobre hipóteses

.

Medindo a incerteza

.

P-valor, Alfa e Poder de Teste

.

Testes unilaterais e bilaterais

.

Testes paramétricos e não-paramétricos

.

Algumas indicações

.

Estatística

Descritiva

procedimentos utilizados para organizar a coleta, a

apuração, a classificação e a descrição dos dados

.

Inferencial

procedimentos para generalizar o conhecimento adquirido em amostras para a população

Testes estatísticos

- estudos são baseados em amostras, isto é, com base em um subconjunto (parte) da população

- a inferência busca generalizar os resultados para a população (para o todo)

- para generalizar seus achados, os pesquisadores aplicam testes estatísticos

Introdução

- meados do século XIX

- cirurgião Joseph Lister (1827-1912)

- trabalhos de Pasteur; estudo das bactérias

- prática da cirurgia

- ciências interdependentes

Introdução

- ponderação de Lister:

"a assepsia das salas cirúrgicas deveria aumentar as taxas de sobrevivência nos pós-operatórios."

- verificação da hipótese:

- execução de um experimento com pacientes cirúrgicos

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

Introdução

- hipótese de Lister:

"a assepsia das salas cirúrgicas deveria aumentar as taxas de sobrevivência nos pós-operatórios."

- hipótese de outros cirurgiões:

"a assepsia das salas cirúrgicas não teria qualquer efeito sobre as taxas de sobrevivência nos pós-operatórios"

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

Introdução

- Será que uma diferença entre grupos tão grande como essa foi suficiente para convencer os médicos da época da necessidade de assepsia?

- Não, como mostra a história da Medicina. Mas como essa questão seria tratada hoje? Aplicando um teste estatístico !

Decidindo sobre as hipóteses

- considerando o estudo de Lister, há duas explicações para o resultado do ensaio:

1. Acaso. A diferença observada entre grupos seria obra do acaso.

2. Assepsia. A diferença observada entre grupos seria devida à intervenção.

Decidindo sobre as hipóteses

Passo 1

- hitpóteses pesquisa:

H0: hipótese nula: a intervenção não tem efeito

- no estudo de Lister:

H0: as taxas de sobrevivência são iguais nos dois grupos

Decidindo sobre as hipóteses

Passo 2

- hitpóteses pesquisa:

H1: HA: hipótese alternativa: a intervenção tem efeito

- no estudo de Lister:

H1: HA: as taxas de sobrevivência não são iguais nos grupos

Decidindo sobre as hipóteses

Passo 3

- análise de H0:

"se a H0 for verdadeira, é provável obter uma diferença maior ou igual a observada no experimento ?"

- no estudo de Lister:

"se a H0 for verdadeira, é provável obter uma diferença entre taxas de sobrevivência tão grande quanto ou maior do que a que Lister obteve ?"

Decidindo sobre as hipóteses

Passo 4

- cálculo do valor-p (p-value: probability value)

"probabilidade probabilidade de rejeitar a hipótese de nulidade quando a mesma é verdadeira"

- no estudo de Lister:

"probabilidade de ocorrer diferença entre taxas de sobrevivência tão grande ou maior do que a que Lister obteve, considerando verdadeira a hipótese da nulidade"

Decidindo sobre as hipóteses

Passo 5

- análise do valor-p (p-value: probability value)

a) "p-valor pequeno significa que é pouco provável obter uma diferença tão grande ou

maior do que a observada se a hipótese da nulidade for verdadeira. Então, rejeite a

hipótese da nulidade."

b) p-valor grande significa que é provável obter diferença tão grande ou maior do que a

observada se a hipótese da nulidade for verdadeira. Nesse caso, não rejeite a hipótese

da nulidade.

Decidindo sobre as hipóteses

Passo 5

- análise do valor-p (p-value: probability value)

Quão pequeno deve ser o p-valor para que você decida rejeitar a hipótese da nulidade?

- por tradição, o p-valor é considerado:

a) pequeno, quando p < 0,05: resultado é significante

b) muito pequeno, p < 0,01: resultado é altamente significante

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

Medindo a incerteza

- testes estatísticos estão sujeitos a incertezas

- incertezas associadas ao processo de inferência

- p-valor; alfa; poder do teste

Medindo a incerteza

Calculando o p-valor

- probabilidade de obter uma diferença tão grande ou maior do que a observada se o tratamento não tiver efeito

- se for pequeno, então conclui-se que a intervenção tem efeito na população

- a probabilidade de essa conclusão estar errada é muito pequena (p-valor < 0.05)

Medindo a incerteza

Calculando o p-valor

- o cálculo do valor de p é complexo e, para isso, são usados testes estatísticos em programas comptacionais

- cuidado na escolha do teste, é preciso analisar qual é o teste indicado caso-a-caso (indicações adiante)

- atenção na interpretação do p-valor: não é intuitiva porque usa a

contradição

"p-valor é a probabilidade de obter uma diferença entre grupos tão grande ou maior do que a obtida quando essa diferença não existe."

"p-valor é a probabilidade de o pesquisador estar errado quando diz que os grupos em comparação são diferentes."

"p-valor nada diz sobre o fato de H0 ser ou não ser verdadeiro. Informa, apenas, que a decisão de rejeitar H0 pode estar errada"

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

Medindo a incerteza

Apresentando o níve de significância (alfa)

- p-valor e alfa consistem na probabilidade de assumir que a diferença é significante, quando não é

- p-valor é calculado pelo teste estatístico, com base nos dados amostrais extraídos da população

- alfa é um valor pré-derminado, ao assumir uma determinada margem de erro ao rejeitar a hipótese nula quando é verdadeira

Medindo a incerteza

Apresentando o níve de significância (alfa)

1. definição do valor de alfa pelo pesquisador (por exemplo: 0,05 ou 0,01);

2. cálculo do p-valor pelo teste estatístico (por exemplo: t-Student);

3. comparação entre p-valor e alfa:

- se o p-valor ≤ alfa, entao H0 deve ser rejeitada

- se o p-valor > alfa, entao H0 não deve ser rejeitada

Medindo a incerteza

Apresentando o níve de significância (alfa)

Exemplos:

- se o p-valor = 0,024 e alfa = 0.05, entao p-valor < alfa, de modo que H0 é rejeitada ao nível de significância de 5%.

- se o p-valor = 0,024 e alfa = 0.01, entao p-valor > alfa, de modo que H0 não é rejeitada ao nível de significância de 1%.

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

Medindo a incerteza

Avaliando o poder do teste (1-beta)

- p-valor é a probabilidade de ocorrência do erro do tipo 1:

rejeitar a hipótese nula enquanto ela é verdadeira

- beta é a probabilidade de ocorrência do erro do tipo 2:

não rejeitar a hipótese nula enquanto ela é falsa

- poder do teste (1-beta) é a probabilidade de não ocorrer o erro do tipo 2:

rejeitar a hipótese nula enquanto ela é falsa

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

Medindo a incerteza

Avaliando o poder do teste (1-beta)

- fatores que afetam o poder do teste estatístico:

- tamanho da diferença: os testes estatísticos têm mais poder para detectar uma diferença de 40% do que uma diferença de 2%;

- nível de significância: diminuir o nível de significância, diminui o poder do teste;

- tamanho da amostra: a confiança na informação aumenta quando aumenta a quantidade de dados.

Medindo a incerteza

Avaliando o poder do teste (1-beta)

- valores comumente adotados em cálculos amostrais:

- nível de significância de 0.05: significa admitir até 5% de probabilidade de estar errado ao dizer que os grupos são diferentes;

- poder do teste de 0.8: equivalente a uma probabilidade de 80% detectar uma diferença que realmente existe.

Testes unilaterais e bilaterais

- a escolha entre testes unilaterais e bilaterais está diretamente associada a forma como a hipótese está construída:

- hipótese sobre igualdade (ou desigualdade / diferença entre grupos);

- hipótese sobre superioridade (ou inferioridade entre grupos).

Testes unilaterais e bilaterais

- teste unilateral:

- H1: afirma superioridade do grupo experimental em comparação com o grupo controle;

- H1: afirma inferioridade do grupo experimental em comparação com o grupo controle;

- H0: é rejeitada a favor de H1 se a diferença entre grupos tiver o sentido especificado

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

Testes unilaterais e bilaterais

- teste bilateral:

- H1: afirma desigualdade do grupo experimental em comparação com o grupo controle;

- H0: é rejeitada a favor de H1 se a diferença entre grupos for em qualquer sentido (positivo ou negativo)

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

Testes unilaterais e bilaterais

- predileção por testes bilaterais:

- testes unilaterais são válidos somente quando fosse impossível ocorrer uma diferença em sentido contrário;

- testes bilaterais são mais seguros – porque o tratamento pode dar resultado contrário ao esperado;

- testes bilaterais são mais conservadores – menor probabilidade de detectar significância

- testes unilaterais – podem ser justificados com base em uma revisão da literatura que mostre o sentido da diferença

Testes paramétricos e não-paramétricos

- testes paramétricos

- mais frequentes na área médica: t de Student, a análise de variância e o teste de Tukey;

- exigem o atendimento de premissas: variável numérica, hipótese baseada em parâmetros, normalidade, homocedasticidade;

- testes não-paramétricos

- não exigem o atendimento das premissas necessárias a aplicação dos testes paramétricos;

- as hipóteses não se baseiam na comparação de parâmetros (médias e variâncias); Mann-Whitney - H0: as distribuições são iguais

VIEIRA, S. Bioestatística: tópicos avançados. Rio de Janeiro: Elsevier, 2018.

Testes paramétricos e não-paramétricos

- testes não-paramétricos

- vantagem: lógica simples e aplicação bem mais fácil em comparação aos seus equivalentes paramétricos;

- desvantagem: são menos poderosos, ou seja, têm menor probabilidade de rejeitar a hipótese da nulidade quando essa hipótese é falsa

- testes paramétricos

- vantagem: são bastante robustos, ou seja, pequenas transgressões às pressuposições exigidas não invalidam os resultados

- desvantagem: aplicação mais difícil, pois há muitas exigências a serem atendidas, sobretudo, quando as amostras são pequenas

Testes paramétricos e não-paramétricos

- robustez dos testes paramétricos

- pressuposição de normalidade: basta que a distribuição dos dados seja aproximadamente normal

- pressuposição de homodedasticidade: basta que a homogeneidade de variâncias seja aproximadamente normal

- tamanho amostral: grande ou moderado, isto é, maior ou igual a 30 observações

Testes paramétricos e não-paramétricos

- recomenda-se testes paramétricos

1. Dados quantitativos;

2. As pressuposições exigidas para a aplicação do teste escolhido estão satisfeitas ou são pequenas as transgressões;

3. Amostra é de tamanho grande ou, pelo menos, moderado.

Testes paramétricos e não-paramétricos

- recomenda-se testes não-paramétricos

1. Dados qualitativos;

2. As pressuposições exigidas para a aplicação de testes paramétricos não estão satisfeitas;

3. Amostra é pequena;

4. Existem dados discrepantes ou censurados

Testes paramétricos e não-paramétricos

Algumas indicações

Para comparar dois grupos independentes:

- variável numérica com distribuição normal e homocedasticidade: teste paramétrico (t de Student não pareado);

- variável ordinal ou de variável numérica sem normalidade e/ou sem homocedasticidade: teste não paramétrico (teste de Mann-Whitney);

- variável nominal: testes de associação, como o qui-quadrado de Pearson ou o teste exato de Fisher

Testes paramétricos e não-paramétricos

Algumas indicações

Para comparar dois grupos dependentes:

- variável numérica com distribuição normal e homocedasticidade: teste paramétrico (t de Student pareado);

- variável ordinal ou de variável numérica sem distribuição normal e/ou sem homocedasticidade: teste não paramétrico (teste de Wilcoxon);

- variável nominal: teste de associação (qui-quadrado de Mc-Nemar)

Testes paramétricos e não-paramétricos

Algumas indicações

Para comparar mais de dois grupos independentes:

- variável numérica com distribuição normal e homocedasticidade: teste paramétrico (ANOVA);

- variável ordinal ou de variável numérica sem distribuição normal e/ou sem homocedasticidade: teste não paramétrico (teste de Kruskal-Wallis);

Testes paramétricos e não-paramétricos

Algumas indicações

Para comparar mais de dois grupos dependentes:

- variável numérica com distribuição normal e homocedasticidade: teste paramétrico (ANOVA para medidas repetidas);

- variável ordinal ou de variável numérica sem distribuição normal e/ou sem homocedasticidade: teste não paramétrico (teste de Friedman);

Referência

Capítulo 2.

VIEIRA, S. Bioestatística: tópicos avançados. 4ed. Rio de Janeiro: Elsevier, 2018.

Nota: todos os exemplos, tabelas e figuras foram baseadas em Vieira (2018)

Learn more about creating dynamic, engaging presentations with Prezi