Dataa syntyy jatkuvasti ympärillämme erilaisista digitaalisista prosesseista. Verkkoon kytketyt laitteet, erilaiset tietojärjestelmät, sosiaalinen media, laitesensorit ja monet muut lähteet kuten tabletit ja älypuhelimet luovat ja lähettävät raakadataa yhä suurempia ja kasvavia määriä.
Data voi olla täysin jäsentymätöntä tai jäsennettyä ja sitä syntyy reaaliajassa valtavalla nopeudella. Tällaisten tietomassojen varastointiin, käsittelyyn ja analysointiin eivät perinteiset tietotekniset ratkaisut kykene. Termi ”Big data”, joka tarkoittaa datan ominaisuuksien (volyymi, vauhti ja vaihtelevuus) lisäksi myös sen hallintaan ja jalostukseen liittyviä asioita kuten prosesseja ja teknologioita.