Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Análise Discriminante

Apresentação para o Mestrado em Marketing Turístico (ESGHT)
by

Paulo Carrasco

on 25 January 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Análise Discriminante

Mestrado em Marketing Turistico UNIVERSIDADE DO ALGARVE Escola Superior de Gestão, Hotelaria e Turismo Paulo Carrasco Estatística Multivariada Análise Discriminante (1890 – 1962) "a genius who almost single-handedly created the foundations for modern statistical science," Anders Hald Sir Ronald Aylmer Fisher Estaticista, biólogo evolucionário e geneticista O que é
a
Análise Discriminante ? Identificar as variáveis que melhor diferenciam ou discriminam entre dois ou mais grupos de indivíduos estruturalmente diferentes e mutuamente exclusivos.



Elaborar através destas variáveis (discriminantes ) um índice ou função discriminante linear que expresse as diferenças entre os grupos (AD Descritiva)


Utilizar estas funções discriminantes para classificar à priori novos indivíduos nos grupos considerados (AD Preditiva) OBJECTIVOs Pressupostos Existência de um critério pré-definido que divida os indivíduos em 2 ou mais grupos (g>=2)

O número de observações em cada grupo é superior a 2

O número de variáveis discriminantes (p) deve ser inferior ao número total de indivíduos (n) menos 2 (p<n-2)

As variáveis discriminantes estão no nível intervalar

Eliminação de outliers ou valores extremos

Nenhuma das variáveis discriminantes deverá ser uma combinação linear de outras variáveis discriminantes Avaliação da normalidade individualmente a cada variável por recurso a:

Teste de Shapiro-Wilks
Teste de Kolmogorov-Smirnov
Exame gráfico do Histograma

Factores que contribuem para a satisfação deste requisito:

Dimensão semelhante entre grupos
Dimensão do menor grupo >20 com menos de 5 variáveis discriminantes
Número total de indivíduos elevado >50 A Análise Discriminante é

“uma técnica de análise multivariada que se emprega para descobrir as características que distinguem os membros de um grupo dos de outro, de modo que, conhecidas as características de um novo indivíduo, se possa prever a que grupo pertence” (E. Reis, 1997) EXEMPLO Considerando (g) grupos e (p) variáveis discriminantes a determinação de funções discriminantes consiste na estimação de um conjunto máximo de (m) funções lineares do tipo:







na qual, os coeficientes (w) são ponderadores que expressam o nível de contribuição na discriminação entre grupos respectivamente a cada variável original X. Determinação
de FunçÕes Discriminantes Num primeiro passo, as variáveis são escolhidas de forma manual e o seu poder discriminante é testado simultaneamente com as variáveis inseridas. Posteriormente é possível remover ou adicionar variáveis de acordo com o julgamento do utilizador. Resoluçao em SPSS Amostra (n=22) Outputs Análise Discriminante (AD)

Resumo da aula:

1. Introdução..........................
2. Objectivos.........................
3. Pressupostos....................
4. Determinação
de funções
discriminantes........................
5. Classificação de individuos.......................................
6. Exemplo............................................ Distribuição normal multivariada para (p) variáveis discriminantes

Homogeneidade das matrizes de variância-covariância para os grupos

Existência de diferenças significativas entre os grupos Teste de Homogeneidade das matrizes de variância-covariância

Teste de Box´s M:

H0: As matrizes de variância-covariância não diferem entre grupos
H1: As matrizes de variância-covariância diferem entre grupos

(Se p-value <0,05 então rejeita-se H0)

Nota: Há evidência de que a AD é relativamente robusta mesmo com violações moderadas deste pressuposto (Lachenbrch, 1975) Teste de diferenças significativas entre as médias do grupos:

Lambda de Wilk's





O lambda de Wilk’s é uma estatística inversa que tomará o valor 1 quando as diferenças entre grupos for minima.

É normalmente aproximado à distribuição F-Snedecor ou à Qui-Quadrado.

H0: A média da variável (i) não difere entre grupos
H1: A média da variável (i) difere entre grupos

(Se p-value < 0.05/p então a variável (i) tem poder discriminante) Numa perspectiva computacional a Análise Discriminante é semelhante à MANOVA (Multiple ANOVA) pois ambas permitem avaliar se entre dois ou mais grupos existem diferenças significativas relativamente a um conjunto de variáveis independentes. Contudo, na AD os grupos constituem a variável dependente enquanto na MANOVA é exactamente o inverso. NOTA: n. de individuos Métodos Disponíveis no SPSS Lambda de Wilks
(estabelece como métrica a “separação” geral entre os grupos com base no rácio SQE/SQT)

Distância de Mahalanobis
(considera apenas a separação entre os dois grupos mais idênticos)

V de Rao
(utiliza uma medida de separação entre os centróides de grupo e o grande centróide)

Rácio F entre grupos
(é uma adaptação da Distância de Mahalanobis à estatística F)

Variância Residual
(é escolhida a variável que minimiza a variância não–explicada para todos os grupos) Critérios de inclusão/remoção Standard ou simultâneo Stepwise Validação da Análise Discriminante Uma das possibilidades de utilização da AD consiste na determinação de (g) Funções de Classificação, que permitem identificar (à priori) através de um score o grupo mais provável a que um individuo pertence, conhecendo-se as suas características nas (p) variáveis discriminantes.

Assim por cada grupo é possível determinar uma função do tipo:





Um individuo será classificado no grupo no qual apresente o score mais elevado. Classificação de Indivíduos Métodos Como forma de validar a robustez da AD na sua componente preditiva, recorre-se à elaboração de uma matriz de classificações que compara as classificações iniciais (grupo original) com as classificações preditivas (grupo previsto).

Com base nesta matriz é possível observar a proporção de indivíduos incorrectamente classificados.

A classificação pode ser efectuada sobre o conjunto de indivíduos considerados no processo de determinação das funções de classificação ou numa amostra desse conjunto Este método inicia-se sem nenhuma variável e sequencialmente vão sendo adicionadas e removidas as variáveis de acordo com a sua capacidade discriminatória adicional.

Deve ser utilizado quando se pretende produzir funções discriminantes que incluam um número mínimo de variáveis discriminantes. Holdout – O conjunto inicial de indivíduos é dividido em duas secções, a primeira é utilizada para a determinação das funções de classificação, sobre a segunda secção é avaliado a precisão preditiva do processo de classificação

U ou Validação Cruzada – É retido um indivíduo em cada etapa e procede-se à estimação das funções de classificação com base nos restantes (n-1) indivíduos. No final de cada etapa o indivíduo retido é classificado e o procedimento é repetido até que todos os indivíduos sejam classificados Esta Estatisticas univariadas para cada
grupo da variavel discriminada
Esta coluna mostra se a média da variável é estatisticamente diferente entre os grupos Núcleo de Métodos Quantitativos
Full transcript