Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Regressão Linear Múltipla com o SPSS

No description
by

Emanuel Sousa

on 14 January 2014

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Regressão Linear Múltipla com o SPSS

Regressão Linear Múltipla com o SPSS
CONSIDERAÇÕES INICIAIS
A regressão linear múltipla é um processo estatístico, onde se procura encontrar um modelo linear válido que permita explicar e fazer previsões para uma
variável dependente
(ou explicada), a partir de duas ou mais
variáveis independentes
(ou explicativas).

Nesse sentido, a aplicação da regressão linear múltipla é uma ferramenta importante pois permite estimar o valor de uma variável com base num conjunto de outras variáveis, sendo que, quanto mais significativo for o “peso” de uma variável isolada, ou de um conjunto de variáveis explicativas, tanto mais se poderá afirmar que essa variável ou conjunto de variáveis afetam mais o comportamento da variável explicada, do que outras.
OBJETIVOS DO MODELO
A regressão linear múltipla aplica-se quando se pretende descrever, através de um modelo linear – a reta de regressão - a relação linear entre uma variável dependente e várias variáveis independentes.

A relação entre as variáveis pode ser de dependência funcional ou de mera associação. O objetivo deste trabalho é encontrar um modelo linear válido, isto é, um modelo linear em que os pressupostos inerentes à sua determinação estejam verificados.
PRESSUPOSTOS DO MODELO
Os pressupostos implícitos do modelo são:
a variância amostral é diferente de zero, isto é, nem todas as observações para as variáveis dependentes são iguais;
As variáveis dependentes são não estocásticas, isto é, assume-se que os valores das variáveis são fixos mesmo recolhendo diferentes amostras.
Os pressupostos a verificar são:
A relação entre a variável dependente e as independentes é linear nos parâmetros (coeficientes);
Os valores dos erros seguem uma distribuição normal com média zero e a variância dos erros é sempre constante para qualquer valor das variáveis independentes (homoscedasticidade dos erros ou ausência de heterocedasticidade);
Os valores dos erros distribuem-se independentemente uns dos outros;

VARIÁVEIS E AMOSTRA
Pretende-se analisar a possível influência de várias variáveis na variável dependente (ou explicada) -
taxa de natalidade bruta
As variáveis independentes (ou explicativas) selecionadas foram:
Ganho mensal médio
: consideramos que o nível de rendimento é decisivo na decisão de ter ou não um filho;
Taxa de desemprego Jovem
: consideramos que uma situação de desemprego influencia negativamente a decisão de ter ou não um filho;
Taxa de inflação
: consideramos que o aumento do custo de vida inibe a decisão ter um filho;
Idade média da mãe ao nascimento do primeiro filho
: consideramos que a idade média da mãe ao nascimento do primeiro filho influencia negativamente o número de filhos;
Números de casamentos
: consideramos que a decisão de ter um filho é afetada positivamente pelo matrimónio.

José Emanuel Sousa
Carolina Dias

O modelo linear tem a forma:


Assim consideram-se como hipóteses em análise:

H0 : A V.Dep é explicada pelas V.Ind selecionadas;

H1 : A V.Dep não é explicada pelas V.Ind selecionadas.

MODELO (EQUAÇÃO DA RETA DE REGRESSÃO)
Utilizando o método
Forward
da regressão linear no
SPSS
, a melhor regressão encontrada indica que as variáveis independentes que, em conjunto, melhor contribuem para explicar a taxa bruta de natalidade são:
Taxa de desemprego jovem;
Número de casamentos;

SIGNIFICÂNCIA GLOBAL DO MODELO E SIGNIFICÂNCIA DOS SEUS PARÂMETROS
O teste F (ANOVA) à significância global do modelo permite verificar se as variáveis independentes influenciam a variável dependente, ou seja, se o modelo pode ser aplicado para fazer previsões para a variável dependente, a taxa bruta de natalidade. Desta forma, o teste Anova permite verificar se existe pelo menos uma variável independente com coeficiente não nulo, isto é, se o modelo é válido para inferência.

Os testes t permitem avaliar a significância dos parâmetros do modelo, isto é, se os coeficientes da reta de regressão são significativos.
AVALIAÇÃO DA QUALIDADE DO MODELO
A qualidade do modelo é avaliada segundo diferentes indicadores:

Pela observação do coeficiente de determinação (0,942), podemos afirmar que 94,2% da variação da taxa bruta de natalidade é explicada pelo modelo, sendo os restantes 5,8% dessa variação explicada por outros fatores. Assim, 0,942 representa a probabilidade das variáveis independentes explicarem a variação da variável dependente.
O coeficiente de correlação (R=0,971) revela uma relação de intensidade forte entre os valores observados e os estimados da taxa bruta de natalidade.
O coeficiente de determinação ajustado (0,936) revela que 93,6% da variância da taxa bruta de natalidade é explicada pelo modelo.
O erro padrão da regressão mede a precisão das estimativas, verificando-se que, em média, os erros de predição são 0,21871%, isto é, em média as taxas de desemprego estimadas afastam-se da taxa real em 0,21871%.

VERIFICAÇÃO DE PRESSUPOSTOS
A relação linear entre a taxa bruta de natalidade e as variáveis independentes pode ser verificada através do coeficiente de correlação linear de Pearson:
Podemos observar que os coeficientes de correlação de Pearson (-0,887 e 0,939) revelam uma relação linear forte entre a taxa bruta de natalidade e as variáveis independentes – uma relação linear forte negativa com a taxa de desemprego jovem e uma relação linear forte positiva com o número de casamentos.
VERIFICAÇÃO DE PRESSUPOSTOS
O pressuposto dos erros seguirem uma distribuição normal é verificado através do teste de aderência à normal de Shapiro-Wilk, para uma amostra reduzida (n = 21).
Hipóteses a considerar:
H0: os erros seguem uma distribuição normal
H1: os erros não seguem uma distribuição normal
Regra de decisão:
Não rejeitar H0 se a significância for superior a 0,05
Rejeitar H0 se a significância for inferior ou igual a 0,05

O pressuposto dos erros terem média nula pode ser verificado através da análise dos resíduos:
VERIFICAÇÃO DE PRESSUPOSTOS
Como a média dos resíduos é zero, o pressuposto verifica-se.
O pressuposto da homocedasticidade dos erros é verificado através do diagrama de dispersão entre os resíduos estandardizados e os valores previstos estandardizados:
VERIFICAÇÃO DE PRESSUPOSTOS
Como os pontos apresentam um padrão de variabilidade constante em torno da reta resíduos = 0, onde se observa uma “nuvem” de pontos dispersos, não evidenciando qualquer padrão, considera-se o pressuposto verificado.
VERIFICAÇÃO DE PRESSUPOSTOS
O pressuposto dos erros serem independentes é avaliado através do teste Durbin-Watson cujas hipóteses são:
H0: os erros não são autocorrelacionados, isto é, são independentes.
H1: os erros são autocorrelacionados, isto é, não são independentes.

A estatística de Durbin – Watson é um teste estatístico usado para detetar a presença de auto correlação em resíduos. O valor do teste varia entre 0 e 4. Valores próximos dos extremos revelam a existência de autocorrelação dos erros, enquanto valores próximos de 2, revelam a inexistência de autocorrelação. Neste caso, como o valor do teste é 1,795 não existe autocorrelação dos erros.
PREVISÕES COM O MODELO
Como todos os pressupostos foram verificados o modelo de regressão é válido sem restrições:

.
Com o modelo válido determinado com o SPSS, é possível prever o comportamento da variável dependente, a taxa bruta de natalidade, em função do comportamento das variáveis independentes, a taxa de desemprego jovem e o número de casamentos realizados. Assim, para o ano 2013, que agora findou, poderíamos tentar estimar qual a taxa bruta de natalidade a partir dos valores das variáveis independentes para o referido ano, no entanto, os dados ainda não estão disponíveis. Assim, apenas é possível prever qual o comportamento da variável dependente, tendo em conta o comportamento das variáveis independentes. Nesse sentido, e segundo os últimos indicadores a taxa de desemprego jovem terá uma ligeira queda, enquanto o número de casamentos se manterá praticamente inalterado, o que sugere que a taxa bruta de natalidade se manterá num valor semelhante ao do ano de 2012, ou, quanto muito, terá um pequeno aumento.
Full transcript