Loading presentation...

Present Remotely

Send the link below via email or IM

Copy

Present to your audience

Start remote presentation

  • Invited audience members will follow you as you navigate and present
  • People invited to a presentation do not need a Prezi account
  • This link expires 10 minutes after you close the presentation
  • A maximum of 30 users can follow your presentation
  • Learn more about this feature in our knowledge base article

Do you really want to delete this prezi?

Neither you, nor the coeditors you shared it with will be able to recover it again.

DeleteCancel

Make your likes visible on Facebook?

Connect your Facebook account to Prezi and let your likes appear on your timeline.
You can change this under Settings & Account at any time.

No, thanks

Data Mining

No description
by

Claudio Pires

on 10 September 2013

Comments (0)

Please log in to add your comment.

Report abuse

Transcript of Data Mining

Data Mining
Alunos: Cláudio Pires
Edgleison

É o processo de descobrir informacões relevantes, como padrões, associações, mudanças, anomalias e estruturas, em grandes quantidades de dados armazenados em banco de dados, depósitos de dados ou outros repositórios de informacão.
O que é Data Mining?
PRINCIPAIS TAREFAS
Preparação:
é o passo onde os dados são preparados para serem apresentados às técnicas de data mining.
Data Mining
: é onde os dados preparados são processados, ou seja, é onde se faz a mineração dos dados propriamente dita.
Análise de Dados
: o resultado do data mining é avaliado, visando determinar se algum conhecimento adicional foi descoberto, assim como definir a importância dos fatos gerados.

Descrição de classes
- provê um resumo conciso e sucinto de uma coleção de dados e a distingue de outras. O resumo de uma coleção de dados é chamado de caracterização de classe; enquanto a comparação entre duas ou mais coleções de dados é chamada comparação ou discriminação de classe. A descrição de classe não só deveria cobrir suas propriedades de resumo tal como a contagem, somas, e cálculos de médias, mas também suas propriedades sobre a dispersão dos dados, tais como a variância, desvio padrão, quartis, etc.
A extração de conhecimento em bases de dados consiste na seleção e processamento de dados com a finalidade de identificar novos padrões, dar maior precisão em padrões conhecidos e modelar o mundo real.
Extração de Conhecimento em Base de Dados

Associação
- é a descoberta de relações de associação ou correlações entre um conjunto de itens. Eles são expressados frequentemente na forma de regras que mostram as condições atributo-valor que acontecem frequentemente juntas em um determinado conjunto de dados. Uma regra de associação da forma X —+ Y é interpretada como "tuplas (conjunto de valores de atributos) de base de dados que satisfazem X são prováveis que satisfaçam Y". Análise de associação é extensamente usada em "transaction data analysis for directed marketing", design de catálogo e outros processos de decisões comerciais.

Classificação
- analisa um conjunto de dados de treinamento (i.e., um conjunto de objetos cuja classificação já é conhecida) e constrói um modelo para cada classe baseado nas características dos dados. Uma árvore de decisão ou um conjunto de regras de classificação é gerado por tal processo de classificação, que pode ser usado para entender melhor cada classe no banco de dados e para classificação de futuros dados. Por exemplo, alguém pode classificar doenças e ajudar a prever tipos de doenças baseados nos sintomas dos pacientes.

Previsão
- esta função de mineração prediz os possíveis valores de alguns dados perdidos ou a distribuição de valores de certos atributos em um conjunto de objetos. Ela envolve a descoberta de um conjunto de atributos relevantes para o atributo de interesse (e.g., por algumas análise estatística) e prediz a distribuição do valor baseada no valor do conjunto de dados semelhantes ao(s) objeto(s) selecionado(s). Por exemplo, o salário potencial de um empregado pode ser predito baseado na distribuição do salário de empregados semelhantes na companhia. Usualmente, análise de regressão, modelo linear generalizado, análise de correlação e árvores de decisão são ferramentas úteis em predição de qualidade. Também são usados algoritmos genéticos e redes neurais com bastante sucesso.

Agrupamento
- análise de "clusters" ou de agrupamento consiste em identificar possíveis agrupamentos nos dados, onde um agrupamento é uma coleção de objetos que são "semelhantes" um ao outro. Diferentes medidas de similaridade, baseadas em funções de distância podem ser especificadas para diferentes contextos de aplicação. Um bom método de "cluster" assegura que a similaridade inter-cluster é baixa e a similaridade intra-cluster é alta. Por exemplo, pode-se agrupar as casas de uma área de acordo com sua categoria, área construída e localização geográfica.

Análise de série temporal
- analisa um grande conjunto de dados de séries temporais para encontrar certas regularidades e características interessantes,incluindo a pesquisa de sequências ou subsequências semelhantes e descobrindo assim padrões sequenciais, periodicidades, tendências e divergências. Por exemplo , pode-se predizer a tendência dos valores acionários para uma companhia baseando-se em sua história acionária, situação empresarial, desempenho dos competidores e mercado atual.
OBRIGADO!!
Aplicações
Wal- Mart
Embora recente, a história do data mining já tem casos bem conhecidos. O mais divulgado é o da cadeia americana Wal-Mart, que identificou um hábito curioso dos consumidores. Há cinco anos, ao procurar eventuais relações entre o volume de vendas e os dias da semana, o software de data mining apontou que, às Sextas-feiras, as vendas de cervejas cresciam na mesma proporção que as de fraldas. Crianças bebendo cerveja? Não, uma investigação mais detalhada revelou que, ao comprar fraldas para seus bebês, os pais aproveitavam para abastecer o estoque de cerveja para o final de semana.
Setor de Contabilidade
A TI exerce uma função importante nos controles contábeis. Os dados obtidos de cada transação (evento empresarial) ocorrida na organização são rmazenados nos bancos de dados. Assim, os
contadores acessam esses dados par
a criar uma trilha de auditorias ininterrupta de cada transação para o ba
lanço, e depois apresentar os
lucros e perdas da empresa na transação
Para o setor de Marketing

Quando um cliente faz uma comp
ra em uma organização, a
transação gera dados que são armazenados nos bancos de dados da empresa. O pessoal de marketing acessa essas informações pra planejar campanhas de marketing direcionado, para avaliar o êxito das campanhas anteriores, para visualizar o melhor posicionamento de itens em
prateleiras e para criar um programa de fidelidade de
clientes em geral. Esses também vinculam essas informações a bancos de dados geográficos para descobrir onde um
produto específico vende melhor.
Comércio
Supermercados apresentam ofertas aos clientes que se cadastram, fornecendo informações importantes sobre suas vidas financeiras e preferências. A partir de então, esses dados são cruzados com suas compras mês a mês e as informações sobre compras casadas e nível de consumo são utilizadas para organizar as prateleiras de melhor forma a propiciar compras casadas, além de oferecer brindes e descontos personalizados. Esses supermercados vendem suas informações para que outras empresas façam propaganda e ofertas apropriadas para os clientes cujos dados foram minerados.
Full transcript