对象存储

2020-01-11 13:50:28 17013

什么是对象存储?

对象存储通常称为基于对象的存储,是处理大量非结构化数据的数据存储体系结构。这是不符合或无法轻松组织到具有行和列的传统关系数据库的数据。今天的互联网通信数据基本上是非结构化的。这包括电子邮件、视频、照片、网页、音频文件、传感器数据以及其他类型的媒体和 Web 内容(文本或非文本)。此内容不断从社交媒体、搜索引擎、移动设备和”智能”设备流式传输。


市场研究公司 IDC 估计,到 2025 年,非结构化数据可能占全球所有数据的 80%。


企业发现高效(且经济)存储和管理这一前所未有的数据量具有挑战性。基于对象的存储已成为数据存档和备份的首选方法。它提供了传统基于文件或基于块的存储所无法扩展的可伸缩性级别。使用基于对象的存储,您可以按 TB (TB)、PB(PB)甚至更大的顺序存储和管理数据卷。


工作原理


对象是离散数据单位。没有文件夹、目录或复杂的层次结构,如基于文件的系统中。每个对象都是一个简单的自包含的存储库,包括数据、元数据(与对象关联的描述性信息)和唯一的标识 ID 号(而不是文件名和文件路径)。此信息使应用程序能够定位和访问该对象。


对象存储消除了具有文件夹和目录的分层文件系统的复杂性和可扩展性挑战。对象可以存储在本地,但通常驻留在云服务器上,可访问世界任何地方。


对象存储系统中的对象(数据)通过应用程序编程接口 (API) 访问。对象存储的本机 API 是基于 HTTP 的 RESTful API(也称为 RESTful Web 服务)。这些 API 查询对象的元数据,以便从任何位置、任何设备上通过 Internet 查找所需的对象(数据)。RESTful API 使用 HTTP 命令(如”PUT”或”POST”)来上载对象,使用”GET”来检索对象,使用”删除”来删除对象。

您可以将任意数量的静态文件存储在要由 API 调用的对象存储实例上。


对象存储,文件存储与块存储


存储方法已经发展,以满足不断变化的数据性质。数据可以是事务性的,以较小的卷收集,这些卷整齐地存储在服务器上的磁盘驱动器上的数据库中。基于文件的存储和基于块的存储非常适合这种类型的结构化数据,并且在某些情况下继续很好地工作。但是互联网改变了一切。组织难以管理不断增加的基于 Web 的数字内容(非结构化数据)的数量。基于对象的存储可以应对这一挑战。

您的公司可能有不同的存储需求,具体取决于 IT 运营的速度和性能要求。仔细查看基于文件、块和对象的存储方法,因为每种存储方法都有其自身的优点和缺点。您可能会发现,这些体系结构的组合将最好地满足您的数据存储需求。

文件存储

文件存储在文件夹中组织和存储数据。文件被命名,用元数据标记(通常是文件名、文件类型,以及创建和上次更新时),并在目录和子目录的层次结构下的文件夹中组织。您可以考虑文件存储,就像将物理纸质文件存储在文件柜中一样。每个抽屉(子目录)内有多个抽屉(目录)和贴有标签的文件夹。要在文件柜中查找特定文件夹,请拉出正确的抽屉并查看文件夹标签。同样,要访问文件存储系统中的数据,计算机系统只需要在其中找到它的路径(目录和子目录)。像这样的分层存储系统适用于相对较小、易于组织的数据量。但是,随着文件数量的增加,搜索和检索过程可能会变得繁琐且耗时。

块存储

块存储提供了基于文件的存储的替代方案,这种存储具有更高的效率和性能。块存储将文件分解为大小相等的数据块,并将这些数据块单独存储在唯一地址下。不需要文件夹结构。相反,您可以将块的集合存储在系统中的任何位置,以实现最高的效率。


要访问文件,服务器操作系统使用唯一地址将块拉回一起,将这些块组装到文件中。您将获得效率,因为系统不需要浏览目录和文件层次结构来访问数据块。块存储非常适合需要低延迟(最小延迟)、精细或更详细的数据访问以及一致性能的关键业务应用程序、事务数据库和虚拟机。

什么是对象存储数据库?

我们上面了解到,您可以使用简单的 API 调用来上载和检索对象存储系统中的文件。但是,应用程序还需要对象的元数据才能在存储中定位正确的对象。这是对象存储数据库发挥作用的地方。此数据库提供一个目录,该目录使用对象的元数据在分布式存储系统中查找适当的数据文件。

每个对象存储组都有一个包含两个表的对象存储数据库。一个表是对象目录,另一个表用于对象存储。

对象目录表包含有关每个对象(元数据)的描述性信息。此目录通过记录集合名称标识符、对象名称和其他相关信息来跟踪存储层次结构中的所有对象。

对象创建时间戳

集合名称标识符(名称 ID)、挂起操作数据和对象创建时间戳

对象名称和集合名称标识符

对象存储数据库中的第二个表是对象存储表,它包含数据内容/文件本身(对象)。数据(固定数字内容(如视频和图像文件或大型文档库)位于对象存储中,而元数据(有关数据的上下文信息,包括名称 ID)驻留在数据库/对象目录表中。

当应用程序”发布”文件时,它会创建元数据并将其存储在对象存储数据库中的对象目录表中,同时将文件”放入”对象存储表。若要在以后检索该文件,应用程序会查询元数据的对象目录/数据库,并使用该描述性、标识信息来查找或”获取”数据。

提交成功!非常感谢您的反馈,我们会继续努力做到更好!

这条文档是否有帮助解决问题?

非常抱歉未能帮助到您。为了给您提供更好的服务,我们很需要您进一步的反馈信息:

在文档使用中是否遇到以下问题: