é uma das alternativas mais eficazes para extrair
conhecimento a partir de grandes volumes de
dados
A mineração de dados usa análise matemática para
derivar padrões e tendências que existem nos dados
também conhecida pelo termo inglês data mining
identificar fatores e tendências-chave
auxiliar a tomada de decisões sobre
estratégia e vantagens competitivas
KDD - Descoberta de conhecimento em base de dados
É um processo de varias etapas, não trivial,
interativo e iterativo, para identificar padrões
compreensíveis
O processo KDD é feito através de limpeza,
integração, seleção, transformação, mineração e
apresentação do conhecimento
Classificação de uma aplicação de
KDD quanto ao objeto
Descrição
Predição
Técnicas derivadas de duas áreas. Estatística e Inteligência artificial
Mineração de dados é a exploração de dados
por meio automático ou semi-automático
é a análise e descoberta de padrões escondidos nos dados
Tarefa mineração de dados: Agrupamento, associação,
classificação, Regressão e previsão
Ferramentas de Mineração Dados:Clementine (SPSS) Enterprise Miner
(SAS) Intelligent Miner (IBM) Analysis Services (Microsoft) Darwin
(Thinking Machines) PolyAnalist (Megaputer) Weka (Universidade de
Waikato)
Aplicações
Vendas e Marketing Identificar padrões de
comportamento de consumidores Associar
comportamentos à características demográficas de
consumidores Campanhas de marketing direto
(mailing campaigns) Identificar consumidores “leais
Bancos Identificar padrões de fraudes (cartões de crédito)
Identificar características de correntistas Mercado
Financeiro Minimizar prejuízos através de crédito a clientes
de “confiança
Médica Comportamento de pacientes Identificar terapias de
sucessos para diferentes tratamentos Fraudes em planos de
saúdes Comportamento de usuários de planos de saúde
Planos diferenciados por perfil
Tipos de algorítimo na miineração dos dados
Supervisionado - conhecimento prévio
sobre o padrão desejado
Não supervisionado - Nenhum conhecimento prévio
sobre o padrão desejado. Os métodos encontram
padrões existentes nos dados explorados