Data besar ialah bidang yang mengendalikan cara untuk menganalisis, mengekstrak maklumat secara sistematik daripada atau sebaliknya menangani set data yang terlalu besar atau kompleks untuk ditangani oleh perisian aplikasi pemprosesan data tradisional. Data dengan banyak medan (turus) menawarkan kuasa statistik yang llebih besar, manakala data dengan kerumitan yang lebih tinggi (lebih banyak atribut atau turus) boleh membawa kepada kadar penemuan palsu yang lebih tinggi.[2] Cabaran analisis data besar termasuk menangkap data, storan data, analisis data, carian, perkongsian, pemindahan, visualisasi, pertanyaan, pengemaskinian, privasi maklumat dan sumber data. Data besar pada asalnya dikaitkan dengan tiga konsep utama: volum, kepelbagaian dan halaju.[3] Analisis data besar memberikan cabaran dalam persampelan, dan oleh itu sebelum ini membenarkan pemerhatian dan persampelan sahaja. Oleh itu, data besar selalunya termasuk data dengan saiz yang melebihi kapasiti perisian tradisional untuk diproses dalam masa dan nilai yang boleh diterima.

Pertumbuhan dan pendigitalan kapasiti penyimpanan maklumat global[1]

Rujukan

sunting
  1. ^ Hilbert, Martin; López, Priscila (2011). "The World's Technological Capacity to Store, Communicate, and Compute Information". Science. 332 (6025): 60–65. Bibcode:2011Sci...332...60H. doi:10.1126/science.1200970. PMID 21310967. Dicapai pada 13 April 2016.
  2. ^ Breur, Tom (July 2016). "Statistical Power Analysis and the contemporary "crisis" in social sciences". Journal of Marketing Analytics. London, England: Palgrave Macmillan. 4 (2–3): 61–65. doi:10.1057/s41270-016-0001-3. ISSN 2050-3318.
  3. ^ "The 5 V's of big data". Watson Health Perspectives (dalam bahasa Inggeris). 2016-09-17. Dicapai pada 2021-01-20.

Bacaan lanjut

sunting