大數據(big data),指無法在壹定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
從技術上看,大數據與雲計算的關系就像壹枚硬幣的正反面壹樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式架構。
它的特色在於對海量數據進行分布式數據挖掘。但它必須依托雲計算的分布式處理、分布式數據庫和雲存儲、虛擬化技術。