Nauka danych
Nauka o danych to nauka o data. Obejmuje opracowanie metod rejestrowania, przechowywania i analizowania danych w celu skutecznego wydobywania użytecznych informacji. Celem nauki o danych jest uzyskanie wglądu i wiedzy na podstawie dowolnego typu danych - zarówno ustrukturyzowanych, jak i nieustrukturyzowanych.
Nauka o danych jest związana z Computer Science, ale jest oddzielnym polem. Informatyka obejmuje tworzenie programów i Algorytmy do rejestrowania i przetwarzania danych, podczas gdy nauka o danych obejmuje każdy rodzaj analizy danych, który może, ale nie musi, wykorzystywać komputery. Nauka o danych jest ściślej związana z dziedziną matematyki statystyki, która obejmuje gromadzenie, organizację, analizę i prezentację danych.
Ze względu na duże ilości danych przechowywanych przez nowoczesne firmy i organizacje, nauka o danych stała się integralną częścią IT. Na przykład firma, która ma petabajty danych użytkownika może wykorzystywać naukę o danych do opracowywania skutecznych sposobów przechowywania, zarządzania i analizowania danych. Firma może wykorzystać metodę naukową do przeprowadzania testów i wyodrębniania wyników, które mogą dostarczyć znaczących spostrzeżeń na temat ich użytkowników.
Nauka o danych a eksploracja danych
Nauka o danych jest często mylona z data mining. Jednak eksploracja danych jest podzbiorem nauki o danych. Obejmuje analizę dużych ilości danych (takich jak big danych) w celu odkrycia wzorców i innych przydatnych informacji. Data science obejmuje cały zakres gromadzenia i przetwarzania danych.