Como fazer a comparação de médicas no bioedtat

O Excel é uma ferramenta de maior acessibilidade em comparação aos softwares estatísticos, e possui diversas funções para cálculo de testes estatísticos. No entanto, para sua utilização é preciso que o pesquisador tenha certa familiaridade com estatística e com as fórmulas do Excel (em oposição ao SPSS, por exemplo, que apresenta menus práticos em que basta clicar para efetuar o teste).

Esse primeiro texto propõe-se a apresentar para pesquisadores que não conhecem tão bem as fórmulas do excel o passo-a-passo de como calcular e interpretar o resultado. Ressalta-se, no entanto, que mais importante que calcular um teste estatístico corretamente é saber se ele é apropriado ou não para responder seu objetivo de pesquisa – neste caso, é melhor procurar um profissional para auxiliá-lo nessa decisão.

As fórmulas desse texto consideram o Excel versão 2010.

Teste T para duas populações independentes

O teste T para duas populações independentes é comumente utilizado para testar se a média de duas populações é significativamente diferente, maior ou menor quanto a certa variável, utilizando amostraS para tomar esta decisão. Por exemplo, podemos ter interesse saber se a idade média de homens e mulheres consumidores de um certo produto é significativamente diferente.

Para aplicar o teste T, precisamos nos certificar se as variáveis de interesse seguem distribuição normal e se suas variâncias são homogêneas (o que não será abordado neste texto) e como resultados, comumente vamos querer duas informações: a estatística de teste e o p-valor.

Para calcular o teste, primeiramente deve-se ajustar os dados no seguinte formato:

Para o cálculo do p-valor do teste quiquadrado, usa-se a fórmula T.TEST (em português, TESTE.T), informando como parâmetros, nesta ordem: as observações da variável no 1º grupo; as observações da variável no 2º grupo; a informação de que o teste é unilateral (1) ou bilateral (2); e o tipo de teste, se pareado (1), de populações independentes com variâncias iguais (2), ou de populações independentes com variâncias iguais (3).

Esclarecendo, os testes unilaterais testam a hipótese de que uma população tem média maior ou menor (especificando qual hipótese) que a outra, enquanto os testes bilaterais  avaliam se uma população tem média  diferente (sem especificar se maior ou menor) Da outra. No presente caso queremos fazer um teste bilateral, então o argumento informado na fórmula é 2.

Já quanto ao tipo de teste, foi previamente declarado que nossas populações são independentes, e idealmente teremos que realizar um teste complementar para definir se as variâncias das populações são iguais ou não. No caso, usaremos o teste que não assume variâncias iguais, então o argumento informado na fórmula é 3.

Já para calcular a estatística de teste T, usa-se a fórmula T.INV.2T (em português, INV.T.BC). Caso tivéssemos realizado um teste unilateral, usaríamos a fórmula T.INV (em português, INV.T).

Informa-se como parâmetros o p-valor recém calculado e os graus de liberdade. Relembrando o conceito estatístico, o total de graus de liberdade do teste T é calculado da seguinte forma: (qtde respostas no grupo1 + qtde respostas no grupo2 – 2). Neste caso, temos 11 respostas em cada grupo, resultando em (11 + 11 – 2) = 20 graus de liberdade.

Obtendo os resultados, passamos para a interpretação. O pesquisador deve ter definido previamente o nível de confiança desejado de seus resultados. Caso tenha definido um nível de confiança de 95%, observar-se-á o p-valor calculado e, caso este seja inferior a 0,05, será rejeitada a hipótese nula de que as médias dos grupos são iguais. No caso apresentado, com p-valor 0,028, rejeitamos a hipótese nula e aceitamos a hipótese alternativa de que há sim, diferença na média desses grupos.

Teste Quiquadrado

O teste quiquadrado é comumente utilizado para avaliar associação entre duas variáveis categóricas. Por exemplo, numa mesma população, podemos ter interesse em avaliar se há associação entre o gênero (masculino / feminino) e o fato do indivíduo de trabalhar (sim / não). Temos interesse em obter duas informações: a estatística do teste quiquadrado e o p-valor, para tomar a decisão, com certo nível de confiança, sobre se há ou não associação entre essas variáveis na população, com base numa amostra.

Para calcular o teste, primeiramente deve-se ajustar os dados no seguinte formato:

Os dados apresentam o resultado observado na amostra. Para o teste, é necessário calcular o resultado esperado caso não houvesse associação. Ele é calculado para cada categoria de resposta possível (Masculino Sim, Masculino Não, Feminino Sim, Feminino Não), multiplicando o total de cada coluna ou linha correspondente, e dividindo pelo total geral, usando as fórmulas aritméticas do Excel, conforme exemplo:


Caso seja calculado corretamente, as somas das colunas e linhas dos valores observados será exatamente igual a do valor observado.

Para o cálculo do p-valor do teste quiquadrado, usa-se a fórmula CHISQ.TEST (em português, TESTE.QUIQUA), informando como parâmetros os valores observados, e depois os valores esperados.

Já para calcular a estatística de teste quiquadrado, usa-se a fórmula CHIST.INV.RT (em português, INV.QUIQUA.CD) informando como parâmetros o p-valor recém calculado e os graus de liberdade. Relembrando o conceito estatístico, o total de graus de liberdade do teste quiquadrado é calculado da seguinte forma: (qtde categorias da variável1 – 1) x (qtde categorias da variável2 – 1). Neste caso, temos 2 categorias para a variável Trabalha e 2 categorias para a variável Gênero, resultando em (2-1) x (2-1) = 1 grau de liberdade.

Obtendo os resultados, resta interpretá-los. O pesquisador deve ter definido previamente o nível de confiança desejado de seus resultados. Caso tenha definido um nível de confiança de 95%, observar-se-á o p-valor calculado e, caso este seja inferior a 0,05, será rejeitada a hipótese nula de que não há associação entre as variáveis. No caso apresentado, com p-valor 0,018, rejeitamos a hipótese nula e aceitamos a hipótese alternativa de que há sim, associação entre o gênero e o fato da pessoa trabalhar.

Encerramos por aqui apresentando estes dois testes estatísticos muito úteis. Deixem comentários sobre que testes gostariam de aprender e, para análises mais avançadas, nos procure.

Deseja-se saber se a proporção de fêmeas de uma determinada espécie de animal silvestre é 50%, ou seja, se há uma razão 1:1 entre machos e fêmeas.  Foram observados, em 297 nascimentos, 167 fêmeas.

a) Formule as hipóteses do teste.

b) Utilizando o Minitab, verifique se a proporção observada de fêmeas é ou não diferente de 50%. 

No Minitab, para fazer o teste para comparação de uma proporção, siga o procedimento abaixo.

No  Rcmdr

1.     Carregue o arquivo  sexo_proporcoes.xlsx .

     a.      Clique em Dados->Importar arquivos de dados-> de conjunto de dados do Excel, Access ou dBase...

     b.      Defina o nome do conjunto de dados, exemplo "prop_exerc1”

     c.      Encontre e selecione o arquivo

     d.     Na janela aberta selecione “Planilha1” ou "Sheet1" 

     e.      Clique em “OK”

2.     Clique em Estatísticas-> Frequências/Proporções->Teste de frequências/proporção (1 amostra)...

  1. Selecione em "Dados" a variável "Sexo"
  2. Clique em "Opções"
  3. Selecione em Hipótese Alternativa: "Frequência da população != p0 "
  4. Selecione em Tipo de teste: Aproximação Normal
  5. No campo "Hipótese nula: p =" digite a proporção que se deseja comparar (0.5 , pois queremos comparar com 50%)
  6. Nível de Confiança = 0.95
  7. Clique em "OK".
  8. Interprete os resultados 

**


Pesquisadores decidiram avaliar se a proporção de cães machos é idêntica em cães domiciliados e não-domiciliados. Fizeram um levantamento em um certo município, e observaram que, dos 510 cães domiciliados amostrados, 301 eram machos, e, dentre os 230 não-domiciliados recolhidos nas ruas, 97 eram machos. 

a) Formule as hipóteses do teste.

b) Há diferença estatística entre as duas proporções?

No Minitab, para fazer o teste para comparação de duas proporções, siga o procedimento abaixo.


c) Para esse mesmo conjunto de dados (tabela abaixo), utilize também o teste de qui-quadrado. Quais são as hipóteses testadas nesse caso? Fazendo o teste, a decisão é idêntica à obtida com o teste para duas proporções?

domiciliados

não domiciliados

Total

Macho

301

97

398

Fêmea

209

133

342

Total

510

230

740

No  Rcmdr

1.     Carregue o arquivo  exerc2_prop.xls  .

     a.      Clique em Dados->Importar arquivos de dados-> de conjunto de dados do Excel, Access ou dBase...

     b.      Defina o nome do conjunto de dados, exemplo "prop_exerc2”

     c.      Encontre e selecione o arquivo

     d.     Na janela aberta selecione “Planilha1” ou "Sheet1" 

     e.      Clique em “OK”

2.     Clique em Estatísticas-> Frequências/Proporções->Teste de frequências/proporção (2 amostras)...

       a.     Selecione em "Dados" a variável ""

       b.     Clique em "Opções", selecione em Tipo de teste: Aproximação da normal com correção de continuidade 

       c.      Selecione em Hipótese Alternativa: Frequência da população <p0 

       d.     Clique em "OK".

       e.     Interprete os resultados 

***

3.      Clique em Estatísticas ->Tabelas de contingência ->Digite e analise tabela de dupla entrada...

     a.      Digite do seguinte jeito na tabela:

 

domiciliados

não domiciliados

Macho 

301

97

Fêmea

209

133


     b.      Clique em estatísticas 

     d.     Selecione em computar percentagens: Percentual nas linhas

     e.     Selecione em Testes de Hipótese : Teste de independência de Qui-quadrado, componentes da estadística de Qui-quadrado, apresente frequências esperadas, e Teste exato de Fisher

     f.     Clique em “OK”

     g.    Interprete os resultados   

Exercício 3 

    Em um estudo sobre dengue em Guarulhos no período de 2000 a 2005 (Mansho, 2006), dos 774 casos notificados, 409 ocorreram em mulheres. No município, a população feminina representa 50,9%. Deseja-se saber se a proporção de mulheres com dengue é estatisticamente diferente ou não da proporção de mulheres no município.

a) Formule as hipóteses do teste.

b) Utilizando um teste estatístico adequado, verifique se há diferença estatística. 

Em um estudo sobre leptospirose em gambás no Município de São Paulo (Bertola, 2006), 12 gambás apresentaram teste diagnóstico positivo em um total de 116 gambás testados localizados na Zona Sul. Na Zona Leste, foram observados 9 gambás positivos em um total de 24 gambás testados. Verifique se há diferença estatística entre as proporções de animais positivos nas duas regiões.

a) Formule as hipóteses do teste.

b) Utilizando um teste estatístico adequado, verifique se há diferença estatística. 

    Em um estudo sobre leptospirose em capivaras (Shimabukuro, 2006), foram observados 27 animais positivos na calha do Rio Tietê na região metropolitana de São Paulo, em um total de 45 animais testados. Como grupo-controle, foram observadas capivaras de outras regiões do Estado de São Paulo. Nesse grupo, de um total de 34 animais testados, 12 foram positivos. Verifique se há diferença estatística entre as proporções de animais positivos nos dois grupos (calha e controle).

a) Formule as hipóteses do teste.

b) Utilizando um teste estatístico adequado, verifique se há diferença estatística.

Postingan terbaru

LIHAT SEMUA