Mineração de Dados
Data Mining, ou Mineração de Dados, é o processo de análise da informação a partir de diferentes perspectivas e categorizações. O objetivo do data mining é relacionar e encontrar padrões em informações extraídas da imensa base de dados abastecida por todas as transações de uma companhia.
O data mining é feito por meio de um software especializado que faz uma varredura em todo o material bruto e busca conhecer e aprender, por meio de algoritmos de estatística e inteligência artificial, padrões para criar análises. Explorado pela área da Tecnologia da Informação, o data mining é um subconjunto do big data, que corresponde a totalidade de dados, estruturados e não estruturados, recolhidos por uma organização.
Este conteúdo fica armazenado no data warehouse, que é o depósito de informação de uma empresa, um grande banco de dados de onde partem as operações de data mining.
A correta extração destes dados, e sua respectiva interpretação adequada, pode ser um diferencial competitivo para uma empresa. Descobrir a melhor maneira de tirar proveito dos dados brutos recolhidos é a grande chave da mineração de dados.
Estas informações podem apontar desde comportamento do consumidor, até oportunidades de aumento de receitas e corte de gastos. Tudo é feito por meio de operações como padronização dos dados, clusterização, associação, entre outras técnicas.
Exemplos de data mining
Estratégias de data mining podem ser utilizadas pelo mercado financeiro, como por exemplo, para determinar padrões de pagamento de usuários de empréstimos, o que pode ajudar na concessão, ou não, de crédito. O contrário também pode ser aplicado, e os desvios de padrão de compras e uso dos cartões bancários podem indicar fraudes ou irregularidades na conta.
Aplicado ao marketing, a mineração de dados sob a forma de descoberta de associações pode apresentar comportamentos de compra do consumidor em comparações que antes se quer poderiam ser pensadas. Este formato de data mining ocorre quando informações são cruzadas de forma a criarem novas associações até então não trabalhadas. Pode ser da mesma empresa, mas de diferentes setores. Ou com os dados de uma holding, aplicando a associação aos resultados de marcas diferentes.