3 3 知识图谱
目录:
“数据”这个术语对我们来说并不陌生。这是您选择信息技术和计算机时所教授的主要内容之一。如果你能记得,数据被认为是原始的信息形式。尽管已经存在了十年,但近年来, 大数据 这个词已经成为一个热门话题。从术语中可以看出,负载和数据负载是大数据,并且可以使用不同的方法和工具以不同的方式处理它们以获取所需的信息。本文讨论大数据的概念,使用数据仓库领域的先驱Doug Laney提到的3 V,该数据仓库被认为已经发起了 Infonomics (信息经济学)领域。
在继续之前,您可能需要阅读我们的关于大数据和大数据使用基础知识的文章,以掌握其基本内容。大数据3Vs
数据以其巨大的形式通过不同的方式积累起来,之前已经在不同的数据库中正确提交,并在一段时间后被抛弃。当这个概念出现时,数据越多,发现问题越容易 - 使用正确的工具,不同的和相关的信息,公司开始存储更长时间的数据。这就像添加新的存储设备或使用云来存储采集数据的任何形式的数据:文档,电子表格,数据库和HTML等。然后使用能够处理大块数据
注意:
大数据的范围不限于您收集和存储在您的场所和云中的数据。它可以包含来自不同其他来源的数据,包括但不限于公共领域的项目。 大数据的3D模型基于以下V:
体积:指管理数据存储
- 速度:指数据处理的速度
- 品种:指不同的,看起来不相关的数据集的分组数据
- 以下段落通过详细讨论每个维度(每个V)来解释大数据建模
A]大数据量
在谈论大数据时,人们可能会将数量理解为大量原始信息。虽然这是事实,但它也涉及数据的存储成本。重要的数据可以存储在场所以及云上,后者是灵活的选择。但是,您是否需要存储每一项?
根据Meta Group发布的白皮书,当数据量增加时,部分数据开始显得不必要。此外,它规定只有企业打算使用的数据量应该保留。其他数据可能会被丢弃,或者如果企业不愿意放弃“可能不重要的数据”,则可以将其丢弃在未使用的计算机设备上,甚至放在磁带上,这样企业就不必为存储这些数据付费。 >我使用了“所谓不重要的数据”,因为我也相信任何企业未来都可能需要任何类型的数据 - 迟早 - 因此需要保留大量时间,然后才能知道数据是确实不重要。就我个人而言,我将旧数据从旧时转储到硬盘,有时也转存到DVD上。主计算机和云存储包含我认为重要的数据,并且知道我将使用这些数据。在这些数据当中,有一种数据可能会在数年后以旧硬盘出现。上面的例子只是为了您的理解。它不适合大数据的描述,因为与企业认为的大数据相比,这个数量相当少。
B
]大数据中的速度
处理数据的速度是一个重要因素在谈论大数据的概念时。有很多网站,特别是电子商务。谷歌已经承认,页面加载速度对于更好的排名至关重要。除了排名,速度还为用户购物时提供了舒适感。这同样适用于正在处理其他信息的数据在谈论速度时,知道它不仅仅是更高的带宽是很重要的。它将随时可用的数据与不同的分析工具相结易于使用的数据意味着一些作业可以创建容易处理的数据结构。下一个维度 - 品种,在这方面进一步发展。
C]各种大数据
当存在负载和负载数据时,以分析工具可以轻松处理数据。还有用于组织数据的工具。存储时,数据可以是非结构化的和任何形式的。您可以自己弄清楚它与其他数据之间的关系。一旦找出关系,您可以选择合适的工具并将数据转换为结构化和排序存储的所需表单。
摘要
换句话说,Big Data的3D模型基于三个维度:可用数据你拥有;正确标记数据;和更快的处理。如果这三项都受到关注,那么可以轻松处理或分析您的数据以找出所需的任何内容。
以上解释了大数据的概念和3D模型。如果你对这个概念不熟悉,那么第二段中链接的文章将证明有额外的支持。
如果你想添加任何内容,请发表评论