TI: Data Mining - CESPE

Description

Revisão Geral de Tecnologia da Informação - Edital SEFAZ-RS
R. Sá
Flashcards by R. Sá, updated more than 1 year ago
R. Sá
Created by R. Sá almost 6 years ago
22
0

Resource summary

Question Answer
Processo de identificar, analisar, explorar, em dados, padrões válidos, novos, potencialmente úteis e, ao final, compreensíveis DataMining
- Principais técnicas / Algoritmo: São ocorrências ligadas a um único evento. Associações Por exemplo: um estudos de modelos de compra em site de internet pode revelar que, na compra de uma televisão, compra-se também um suporte de televisão em 55% das vezes: mas, quando há uma promoção, o suporte é comprado em 90% das vezes. Com essas informações, as empresas podem tomar decisões mais acertadas pois aprenderam a respeito da rentabilidade de uma promoção.
- Principais técnicas / Algoritmo: Na sequência os eventos estão ligados ao longo do tempo. Sequências Pode-se descobrir, por exemplo, que quando se compra uma casa, em 65% as vezes se adquire uma nova geladeira no período de duas semanas; e que em 45% das vezes, um fogão também é comprado um mês após a compra da residência.
- Principais técnicas / Algoritmo: Reconhece modelos que descrevem o grupo ao qual o item pertence por meio do exame dos itens já classificados e pela inferência de um conjunto de regras. Classfificação Exemplo: empresas de operadoras de cartões de crédito e companhias telefônicas preocupam-se com a perda de clientes regulares, a classificação pode ajudar a descobrir as características de clientes que provavelmente virão abandona-las e oferecer um modelo para ajudar os gerentes a prever quem são, de modo que se elabore antecipadamente campanhas especiais para reter esses clientes.
- Principais técnicas / Algoritmo: Funciona de maneira semelhante a classificação quando ainda não foram definidos grupos. Uma ferramenta de data mining descobrirá diferentes agrupamentos dentro da massa de dados. Aglomeração Por exemplo ao encontrar grupos de afinidades para cartões bancários ou ao dividir o banco de dados em categorias de clientes com base na demografia e em investimentos pessoais. Obs: árvore geradora mínima
- Método: Objetiva particionar ‘n’ observações entre ‘k’ grupos; cada observação pertence ao grupo mais próximo da média. Método de clustering k-means CESPE - Analista de Controle Externo (TCE-PE)/Auditoria de Contas Públicas/2017
- Conceito: "um processo não trivial de identificação de novos padrões válidos, úteis e compreensíveis". *KDD = Knowledge Discovery in Databases (Descoberta de Conhecimento nas Bases de Dados) [1] FAYYAD, U; PIATETSKY-SHAPIRO, G; SMYTH, P. From Data Mining to Knowledge Discovery in Databases. American Association for Artificial Intelligence, 1996. Ou seja, tanto a questão como uma das definições mais utilizadas para o termo "descoberta de conhecimento em bases de dados" possuem o mesmo sentido: a coleta não trivial de conhecimento previamente desconhecido e que é potencialmente útil. CESPE - Auditor de Controle Externo (TCE-PA)/Informática/Analista de Sistema/2016
- Algoritmo: "eficiente algorítimo capaz de converter uma aprendizagem fraca em aprendizagem forte" Boosting CESPE - Analista em Tecnologia da Informação (MPOG)/2015
Árvore que conecta todos os vértices do grafo com o menor peso total possível Os algoritmos de agrupamento de dados baseados em árvores geradoras mínimas são capazes de detectar grupos com fronteiras irregulares. Árvore geradora mínima (MST, do inglês Minimum Spanning Tree CESPE - Analista Judiciário (TRE BA)/Apoio Especializado/Análise de Sistemas/2017
- Metodologia de DataMining: Divide os dados implementando um algoritmo de junção específico, mais adequado para a análise de informação desejada. E desta forma, é uma maneira de descrever conhecimento descoberto durante os processos de data mining. Clustering
- Ramificações: São sistemas computacionais baseados numa aproximação à computação baseada em ligações. Redes neurais
(CESPE - 2016 - FUNPRESP-JUD - Analista - Tecnologia da Informação) DataMining, as árvores de decisão podem ser usadas com sistemas de classificação para atribuir informação de tipo. (C/E) Certo. As árvores de decisão classificam os dados em um número finito de classes com base nos valores das variáveis de entrada. As árvores de decisão são ferramentas que podem ser utilizadas para a classificação dos dados. Ao percorrer a árvore, a classe ou tipo dos dados será definido. Por exemplo, um conjunto de regras definido em uma árvore pode definir os tipos de clientes com base em riscos de crédito por meio das classes “risco fraco”, “risco médio”, e “risco bom”.
(CESPE - 2016 - TCE-SC - Auditor Fiscal de Controle Externo - Informática) Julgue o item subsecutivo, acerca de mineração de dados. As aglomeraçõe (clusters), tipos de informação obtidos por meio da mineração de dados, caracterizam-se por se ligarem a um único e específico evento, em torno do qual ocorrem várias ações, com produção sistêmica de informações gerenciais que apoiarão uma nova ocorrência do mesmo tipo de evento. (C/E) Errado. Os clusters não estão relacionados a um único e específico evento, pois os dados de um mesmo cluster se relacionam com base em suas semelhanças. As aglomerações ou clusters descrevem as classes a que os membros de uma base de dados pertencem. O objetivo da análise de clusters é classificar casos (por exemplo, pessoas, coisas, eventos) em grupos ou clusters, de modo que o grau de associação seja forte entre os membros do mesmo cluster e fraco entre os membros de diferentes clusters.
(CESPE - 2014 - TJ-SE - Técnico Judiciário - Programação de Sistemas) Acerca de DataMining e de DataWarehouse, julgue o item subsecutivo. Os principais processos de DataMining são a identificação de variações embasado em normas, a detecção e análise de relacionamentos, a paginação de memória e o controle de periféricos. (C/E) Errado. A paginação de memória e o controle de periféricos são funções do sistema operacional e não da mineração de dados. A mineração de dados (data mining) refere-se à mineração ou descoberta de novas informações em termos de padrões ou regras com base em grandes quantidades de dados. Estes padrões podem incluir variações e relacionamentos.
(CESPE - 2013 - SERPRO - Analista - Negócios em Tecnologia da Informação) Com relação a datamining, datawarehouse, gerenciamento de conteúdo, ambientes colaborativos e portais corporativos, julgue os próximos itens. Clusterização é a tarefa preditiva relativa à identificação de um conjunto finito de categorias empregadas para descrever uma informação. Essas categorias nunca poderão ser mutuamente exclusivas. (C/E) Errado. Erros: 1. A clusterização não é tarefa preditiva. As tarefas preditivas são a classificação e a regressão. 2. Na clusterização, as classes não são previamente conhecidas e, portanto, não há como falar que elas não serão mutuamente exclusivas.
Show full summary Hide full summary

Similar

Rates of Reaction
Evie Papanicola
Nouns & Definite Articles Notes
Selam H
Chemistry General Quiz - 2
lauren_johncock
Biology Unit 1
anna.mat1997
The Biological basis of Heart Disease
Andrea Leyden
The Cold War: An Overview
Andrea Leyden
PSYA1 - attachment, AQA psychology
T W
GCSE AQA Physics Unit 2 Flashcards
Gabi Germain
GCSE Revision Tips
miminoma
Test your English grammar skills
Brad Hegarty
Contract Law
sherhui94