quarta-feira, 13 de fevereiro de 2019

Data Mining/ Analitycs

Princípios essenciais do Data Mining
Autor: Sergio Navega
Link: http://www.intelliwise.com/reports/i2002.pdf

Talvez a definição mais importante de Data Mining
 tenha sido elaborada por Usama Fayyad (Fayyad et al. 1996):
"...o processo não-trivial de identificar, em dados, padrões válidos, novos,
potencialmente úteis e ultimamente compreensíveis". Esse processo de mineração de dados é dividido em alguns passos apresentados na imagem abaixo:



A partir de fontes de dados (bancos de dados, relatórios, transações, etc) efetua-se uma limpeza (consistência, preenchimento de informações, remoção de ruído e etc), disto nascem os repositórios organizados (Data Marts e Data Warehouses) que já são úteis de diversas maneiras. Mas é a partir deles que se pode selecionar algumas colunas para atravessarem o processo de mineração. De forma interativa e frequentemente usando visualização gráfica, um analista refina e conduz o processo até que valiosos padrões apareçam. Observa-se que todo esse processo parece indicar uma hierarquia, algo que começa em instâncias elementares (embora volumosas) e terminam em um ponto relativamente concentrado, mas muito valioso. Esse é o objetivo:  encontrar padrões que  requer que os dados brutos sejam sistematicamente "simplificados" de forma a desconsiderar aquilo que é específico e privilegiar aquilo que é genérico.

Nenhum comentário:

Postar um comentário

Apresentação pessoal

Meu nome é Carolyne, tenho 21 anos e faço faculdade de Gestão de T.I na Fatec Itu, gosto bastante dessa área, pois  abrange diversos assunto...