什么是大数据金字塔?我们为什么需要它?


大数据分析(BDA)市场目前的估值为100亿美元,预计到2023年将增长到406亿美元。在…领域有了巨大的增长big data每天。最受欢迎的是物联网,人工智能,云计算和自动化。

这只意味着一件事。

大数据将继续存在,不管你喜欢与否,它很快就会渗透到人类活动的大多数方面。然而,在我们深入到大数据将要给我们生活带来的改变的细节之前,先让我们了解一下什么是大数据?

什么是大数据,我们为什么需要大数据?

大数据是一个数据处理领域,它提供了研究,分析和从太大的数据集中提取相关信息的方法。我们需要大数据,因为这些数据集对于我们传统的数据处理软件来说变得过于复杂。

这些数据集可以是任何东西,从我们随机填写的在线表格的细节,到我们家里的智能冰箱收集的数据。它可以是随机的,就像我们收件箱中的促销优惠,也可以是具体的,就像GPS定位一样。

我们需要大数据,因为它可以帮助企业更好地打造产品,帮助行政管理人员改革行政管理,帮助政治家修改过时的政策,帮助政府提升治理水平。简而言之,大数据将帮助我们以更少的时间和资源浪费产生更好的结果

大数据原理

由于大数据是关于处理大量数据集的,因此它有一定的工作原则。在深入研究这些数据集的复杂性时,必须考虑到这些原则。

  • 体积:这是指数据集的规模
  • 速度:指数据生成的速率。
  • 多样性:产生的数据量的变化和多样性。请记住,几乎每一个馈入大数据处理的数据集都是非结构化的。
  • 可变性:不要与多样性混淆,可变性是指类似类型的数据字段的差异,不一致的数据类型和存在的数据中的异常。
  • 准确性:主要方面big data Analysis,准确性是指数据的来源和可靠性,它与预期结果的相关性以及它与分析的背景。它往往会随着以前的度量值的增加而下降。
  • 有效性:数据的准确性和准确性,是分析的最重要指标之一。
  • 脆弱性:数据易受隐私和安全破坏的影响。
  • 易变性:由于我们所处的快节奏时代,数据很快就会过时。数据的波动性表明relevance of data sets在它们变得过时之前持有。
  • 可视化:可能是大数据中最复杂的部分。可视化指的是使非结构化的,复杂的,易变的数据以一种易于转化为行动的方式变得可理解。
    • 这包括借助图形和图表推断故事和结论。它也为每个人都崇拜大数据的洞察力负责。这是Mjolnir到大数据的雷神。
  • 价值:就像我说的,大数据将在这里持续存在。即使大数据分析的ROI没有给出结果,从业人员仍然会依赖于意见和最佳实践。

大数据金字塔(DIKW金字塔)

DIKW pyramid(数据信息知识智慧)是一种表示数据,信息,知识和智慧之间骨架关系和功能关系的模型。

Jennifer Rowley在2007年的《传播学杂志》上公布了DIKW金字塔的智慧等级理论,并用这个解释了金字塔:

典型地,信息是以数据来定义的,知识是以信息来定义的,智慧是以知识来定义的。

仅靠数据是完全没有意义的。它通过生产性分析而变得有价值,这是提供尽可能好的结果所必需的。