Ilmu data (data science)

Ilmu data (data science) adalah studi yang berhubungan dengan volume data dalam jumlah besar untuk menemukan pola yang tak terlihat, memberi pengetahuan yang bermakna, dan membuat keputusan bisnis.

Menurut definisi di Wikipedia, ilmu data (data science) adalah suatu disiplin ilmu yang khusus mempelajari data, khususnya data kuantitatif (data numerik), baik yang terstruktur maupun tidak terstruktur. Berbagai subjek yang dibahas dalam ilmu data meliputi semua proses data, mulai dari pengumpulan data, pengolahan data, analisis data, hingga cara mengubah data menjadi kesatuan informasi yang dapat dipahami semua orang.

Stephan Kolassa menyatakan ada empat area atau domain yang menjadi pilar bagi seseorang yang menekuni ilmu data, yaitu pemograman, statistik, bisnis, dan komunikasi.

Bila diandaikan ilmu data sebagai proses yang punya tahapan, maka tahap awal adalah memperoleh wawasan yang mendalam dan tahap akhir adalah membuat prediksi.