大数据,源于“人、机、物”,规模大且复杂以至于很难在一定时间范围内用现有数据库管理工具或数据处理工具进行捕捉、管理和处理的数据集合,其特征业界概括为“4V+1C”:Volume(规模大)、Variety(类型多)、Value(价值密度低)、Velocity(处理速度快),Complexity(复杂)。大数据思维特点: 不是随机样本,而是全体数据:小数据时代,用少量数据样本获得最多信息是受限于与数据交流的技术限制而非自然限制;大数据时代,该限制得到缓解,要分析与某事物相关的所有数据,进入全数据模式; 不是精确性,而是混杂性:接受数据的纷繁混杂,而不再执迷其精确性。相比小数据的精确性,大数据更强调数据的完整性和混杂性,更接近事实真相; 不是因果关系,而是相关关系:不揭示内部运作机制,通过识别有用的关联物来做分析或预测,因果关系只是相关关系的一种特殊情况,先追求“是什么”,而非“为什么”。
..
|