Data Mining
Eksploracja danych to proces analizowania dużych ilości plików data w celu odkrycia wzorców i innych informacji. Zwykle jest wykonywany na Bazy danych, które przechowują dane w ustrukturyzowanym formacie. „Wydobywając” duże ilości danych, ukryte informacje można wykryć i wykorzystać do innych celów.
Przykłady eksploracji danych
Firma wydająca karty kredytowe może wykorzystać eksplorację danych, aby dowiedzieć się więcej o zwyczajach zakupowych swoich członków. Analizując zakupy od posiadaczy kart w całych Stanach Zjednoczonych, firma może odkryć nawyki zakupowe dla różnych grup demograficznych, takich jak wiek, rasa i lokalizacja. Informacje te mogą być przydatne przy oferowaniu indywidualnym konkretnym promocjom. Te same dane mogą również ujawnić wzorce zakupowe w różnych regionach kraju. Informacje te mogą być cenne dla firm, które chcą reklamować się lub zakładać firmy w określonych stanach.
Usługi online, takie jak Google i Facebook, wydobywa ogromne ilości danych w celu dostarczania ukierunkowanych treści i reklam swoim użytkownikom. Na przykład Google może analizować wyszukiwanie zapytania aby odkryć popularne wyszukiwania w określonych obszarach i przenieść je na górę listy autouzupełniania (sugestie, które pojawiają się podczas pisania). Eksplorując dane o aktywności użytkowników, Facebook może odkrywać popularne tematy w różnych grupach wiekowych i dostarczać ukierunkowane reklamy na podstawie tych informacji.
Chociaż eksploracja danych jest powszechnie stosowana do celów marketingowych, ma również wiele innych zastosowań. Na przykład firmy medyczne mogą wykorzystywać eksplorację danych do odkrywania powiązań między określonymi genami i chorobami. Firmy meteorologiczne mogą wyszukiwać dane, aby odkrywać wzorce pogodowe, które mogą pomóc w przewidywaniu przyszłych zdarzeń meteorologicznych. Instytucje zarządzające ruchem mogą przeszukiwać dane motoryzacyjne, aby prognozować przyszłe poziomy ruchu i tworzyć odpowiednie plany autostrad i ulic.
Wymagania dotyczące eksploracji danych
Eksploracja danych wymaga dwóch rzeczy - dużej ilości danych i dużej mocy obliczeniowej. Im bardziej uporządkowane dane, tym łatwiej jest je wydobyć w celu uzyskania przydatnych informacji. Dlatego ważne jest, aby każda organizacja, która chce zaangażować się w eksplorację danych, aktywnie wybierała dane do rejestrowania i jak je przechowywać. Jeśli chodzi o wydobywanie danych, superkomputery i klastry obliczeniowe mogą być używane do przetwarzania petabajty danych.