مع زيادة البيانات من وسائل التواصل الاجتماعي ومواقع التجارة الإلكترونية وعمليات البحث على الإنترنت واستطلاعات رأي العملاء وغيرها، ظهر مجال جديد للدراسة يعتمد على البيانات الكبيرة. وتتيح مجموعة البيانات هذه، التي تستمر في الزيادة، للمجموعات بمراقبة أنماط الشراء وسلوكياته وإجراء التنبؤات.

نظرًا لأن مجموعات البيانات غير منظمة، فقد يكون تفسير مجموعة البيانات من أجل صناعة القرار أمرًا معقدًا ويستغرق وقتًا طويلاً. وهنا يأتي دور علم البيانات.

تم استخدام مصطلح علم البيانات لأول مرة في ستينيات القرن العشرين عندما كان قابلاً للتبادل مع عبارة "علم الكمبيوتر". وتم استخدام "علم البيانات" لأول مرة كتخصص مستقل في عام 2001. كما يتم استخدام كل من علم البيانات والتعلم الآلي من قِبل مهندسي البيانات وفي كل صناعة تقريبًا.

لقد تطورت المجالات بحيث أصبح العمل كمحلل بيانات يقوم بعرض البيانات وإدارتها والوصول إليها، يتطلب معرفة لغة الاستعلام الهيكلية (SQL) بالإضافة إلى الرياضيات والإحصائيات وعرض مصور للبيانات (لتقديم النتائج للأطراف المعنية) واستخراج البيانات. ومن الضروري أيضًا فهم تقنيات تنظيف البيانات ومعالجتها. نظرًا لأن محللي البيانات غالبًا ما يقومون ببناء نماذج التعلم الآلي، فإن البرمجة ومعرفة الذكاء الاصطناعي ذات قيمة أيضًا.