Qumulo File System是Qumulo独有的跨越数据中心、私有云和公有云的软件定义分布式文件系统。 其软件专为混合云构建,使其能够在预先配置和预先合格的行业标准硬件平台上运行,并在本地跨多个公共云运行。 在我们的实验室中,我们有机会研究 Qumulo 的软件及其一些最重要的功能。 在这篇特别的评论中,我们来看看 Qumulo 的文件系统及其图形用户界面 (GUI)。
Qumulo File System是Qumulo独有的跨越数据中心、私有云和公有云的软件定义分布式文件系统。 其软件专为混合云构建,使其能够在预先配置和预先合格的行业标准硬件平台上运行,并在本地跨多个公共云运行。 在我们的实验室中,我们有机会研究 Qumulo 的软件及其一些最重要的功能。 在这篇特别的评论中,我们来看看 Qumulo 的文件系统及其图形用户界面 (GUI)。
为了进行创新,组织依赖于现代存储、数据基础架构、遗留和基于云的应用程序和服务、云存储,以及非结构化数据管理和平台。 然而,对于想要迁移到云或利用混合云模型的公司来说,非结构化数据正成为一个难题,因为这种数据会创建一个新的数据孤岛; 在大多数可用的云平台中。 IT 部门面临这样的后果,即管理两个不同文件系统中的工作负载常常不堪重负:一个在本地,一个在云中。
尽管如此,真正的问题不是云平台,也不是非结构化数据平台。 我们仍在使用不适合迁移到云的旧文件存储。 正如 Qumulo 强调的那样,IT 已经改变,但文件存储没有。 最后一个成功的文件存储架构是在 15 多年前创建的,那时云还没有蓬勃发展。 相比之下,现代文件存储应该是云就绪的:统一所有非结构化数据类型,扩展到数十亿个文件,跨越多个数据中心,以及云本身。 此外,通过实时分析和 API 驱动的控制提供可见性和自动化。
Qumulo:云就绪文件系统
Qumulo 将自己定位为一家不同类型的存储公司,声称拥有第一个文件系统来解决混合云工作负载并提供云原生文件数据服务。 借助该软件,该公司瞄准非结构化数据平台并为构建者和开发者提供应用程序和微服务。 Qumulo 文件系统软件可在公共云、私有云和混合云中使用。
Qumulo 的软件层包括:
- 平台。 当前的硬件平台包括 HPE 和 Fujitsu,以及公有云 AWS 和 GCP。 Qumulo 最近还宣布能够将数据从文件转移到对象,以便利用利用对象数据的云原生应用程序和服务。
- 操作系统。 基于标准的 Ubuntu Linux。
- 可扩展块存储 (SBS)。 Qumulo 的基础。 实现规模、便携性、保护和性能。
- 文件系统。 它支持可扩展的文件计数和高性能文件操作。 此外,它还提供对性能和容量的实时洞察。
- 数据服务。 使用企业级工具保护、保护和管理 Qumulo 平台中的数据。 该层包含五个功能:快照、复制、配额、审计和基于角色的访问控制 (RBAC)。
- 管理和可编程性。 支持使用 Qumulo 平台构建集成解决方案,管理员可以自动化和管理他们的数据服务。
- 数据访问和身份验证。 允许使用标准应用程序和操作系统访问数据,同时确保企业级安全性。 该层支持企业访问协议,包括 NFS、SMB 和 FTP。
我们这里的重点是文件系统,它基于以逻辑结构组织数据并支持具有大量文件的工作负载的概念。 文件系统使用呈现单个名称空间的分布式体系结构。 使用的平台是独立节点的无共享集群,每个节点提供容量和性能。 并且,各个节点始终相互协调,使得任何客户端都可以连接到任何节点并在命名空间中进行读写。 这个结构很有趣; 它旨在让创建者在数据生命周期中移动时在数据集上进行协作。 它还提供对性能和容量利用率的实时洞察,即使系统扩展到 PB 级和数十亿个文件。
Qumulo 文件系统将数据组织到目录中,并将数据呈现给 SMB 和 NFS 客户端,能够跨协议共享数据,让多个不同的用户和应用程序类型访问相同的数据。 该文件系统具有突出的独特属性:使用 B 树和内置实时数据分析引擎。
通过使用 B 树结构,Qumulo 可以扩展到数十亿个文件,而不会遇到其他系统普遍存在的问题。 B 树特别适用于读取和写入大量数据块的系统,因为它们是“浅”数据结构,可以在数据数量增加时最大限度地减少每个操作所需的 I/O 量。 这些结构非常适合文件系统和广泛的数据库索引。
Qumulo 文件系统的另一个关键部分是具有实时分析引擎的数据感知功能。 数据感知意味着对存储系统的多维可见性,提供有关系统内容、活动、用户等的强大洞察力。 借助 Qumulo 的实时分析,存储管理员可以快速监控存储使用情况和性能,包括吞吐量和延迟。 这种可见性使组织能够通过主动管理当前需求以及更好地预测未来存储需求来控制其非结构化数据,并降低总体运营和资本成本。 正如以下部分所述,Qumulo 网络用户界面将这种可见性带到了下一个系统管理级别。
凭借其软件架构和特定的文件系统,Qumulo 使组织能够实现以前仅在本地数据中心无法实现的业务目标。 Qumulo 的优势之一是在本地运行其文件系统,然后在云端运行完全相同的软件。 该公司是众所周知的横向扩展文件存储提供商。 现在,利用云的弹性以及云计算和云存储基础架构的规模,再加上 Qumulo 的软件,可以非常强大地来回移动数据,并轻松扩展或扩展数据中心。 例如,公司可以按原样使用他们的本地应用程序,将其移动到云中,并且它可以正常工作。 如果用户有他们想要利用云服务(如机器学习或人工智能)的文件数据,Qumulo 的 Shift 功能会将数据复制到云对象存储,以访问云原生应用程序创新。
随着组织将这些工作负载转移到云端,他们还希望了解其数据的执行情况。 Qumulo 的分析为硬件平台提供的相同体验在云中也能找到,提供完整的混合云体验。 无论公司将软件运行到物理设备还是云中,软件都是相同的,包括相同的 GUI 和功能。
有关特性和功能的更多详细信息,我们建议您访问 Qumulo 网站上的技术文档。
Qumulo 性能
性能配置
我们的 5 节点集群中的 Qumulo 节点配置包括 LACP 中的双 25GbE 端口,每个端口具有四个 480GB SATA SSD 和十二个 6TB SATA HDD。 对于我们的存储测试,我们为八台 Dell EMC PowerEdge R740xd 服务器配置了一个 NFS 命名空间,每个服务器都有一个分配给连接到 NFS 共享的 vSwitch 的 25G 端口。 然后,我们在 VMware 中使用了 16 个 CentOS LoadGen,每个都分配了两个 125GB 的虚拟磁盘,使我们在集群上总共占用了 4TB 的空间。
在对存储阵列进行基准测试时,应用程序测试是最好的,综合测试排在第二位。 虽然不能完美代表实际工作负载,但综合测试确实有助于为具有可重复性因素的存储设备建立基线,从而可以轻松地在竞争解决方案之间进行同类比较。 这些工作负载提供了一系列不同的测试配置文件,包括“四个角”测试、常见的数据库传输大小测试,以及来自不同 VDI 环境的跟踪捕获。 所有这些测试都利用通用的 vdBench 工作负载生成器,以及一个脚本引擎来自动化和捕获大型计算测试集群的结果。 这使我们能够在各种存储设备上重复相同的工作负载,包括闪存阵列和单个存储设备。
随着 Qumulo 存储阵列针对大块传输进行了优化,我们的测试集中在 64K、1024K 和 2048K 顺序传输上。
简介:
- 64K 顺序读取:100% 读取,32 线程,0-120% 迭代
- 64K 顺序写入:100% 写入,32 个线程,0-120% 迭代
- 1024K 顺序读取:100% 读取,32 线程,0-120% 迭代
- 1024K 顺序写入:100% 写入,32 个线程,0-120% 迭代
- 2048K 顺序读取:100% 读取,32 线程,0-120% 迭代
- 2048K 顺序写入:100% 写入,32 个线程,0-120% 迭代
首先是我们的 64K 顺序基准 74,619 IOPS 或 4.66GB/s,延迟为 11.3ms。
64K 写入的峰值性能约为 9K IOPS 或 555MB/s,延迟为 110ms。
接下来我们进行 1024K 测试。 对于读取,我们在 7,128 毫秒的延迟下看到了 7.13 IOPS 或 108GB/s 的峰值性能。
1024K 写入的峰值大约为 1,670 IOPS 或 1.6GB/s,延迟为 557 毫秒,然后下降了一些。
我们最终的顺序基准是我们的 2048K。 在读取性能方面,我们在 3,858 毫秒的延迟时看到了 7.7 IOPS 或 184GB/s 的峰值。
最后,在我们的 2048K 写入中,我们在 1,055 毫秒的延迟下看到了 2.1 IOPS 或 433GB/s 的峰值。
Qumulo 网页界面概览
在下一节中,我们将概述 Qumulo 的 Web 用户界面及其一些关键配置。 该公司为管理员提供此基于 Web 的 UI,以部署、管理和监控数据中心和云环境。
以管理员身份登录集群后,我们将直接进入仪表板页面。 在这一点上,我们立即意识到 Qumulo 提出的独特而现代的 Web UI。 这个网络用户界面包含一个直观的菜单,在选项卡中组织得很好; 我们在屏幕的左上角看到它,其中快速包含部署、管理和监控我们的基础架构所需的所有类别。 主菜单由仪表板、分析、共享、集群、API 和工具以及支持选项卡组成。 指向这些选项卡,UI 会显示一个下拉列表以访问 UI 提供的所有不同页面。 在右上角,用户可以看到当前的软件版本、时间(基于网络浏览器的客户端本地时间)和当前登录的用户。
尽管如此,在仪表板页面上,我们注意到一个有吸引力的 UI 布局,它有助于监控基础设施,我们可以在其中观察不同的关键区域,如集群概览、容量趋势、客户端活动,以及实时的集群活动。
我们特别喜欢仪表板区域中 UI 的一个概念是与其所有元素的动态交互。 例如,在Cluster Activity下,可以很容易地通过拖动来移动、扩展或缩小我们想要监控的24小时内的所需信息活动。 这里我们还有一些预设,周期为 1 分钟、5 分钟、1 小时,默认为 3 小时。 指标(IOPS 和吞吐量)将根据峰值数据进行相应调整。
在 Dashboard 页面上向下滚动,我们找到 Client Activity 区域。
现在,我们直接进入 Qumulo 脱颖而出的领域,即分析。 如前所述,Qumulo 允许管理员实时管理数据和用户。 在 Analytics > Integrated Analytics 下,我们可以看到左侧的信息窗格中填充了使用系统资源最多的客户端,并且目录和文件正在被积极地读取和写入。 单击特定目录或子目录后会显示此信息。
转到 Capacity Explorer 页面,仍然在 Analytics 选项卡下,我们可以看到容量在系统上的分布情况。 首先,我们大致了解目录的容量,从大到小列出。
通过单击一个目录,我们可以深入挖掘并以更详细的视角探索它们中的每一个。 例如,下图显示了名为“vmw”的目录中包含的子目录。
如果我们继续点击子目录,我们最终可以到达文件级别的详细信息。 这次,我们单击名为“netapp-centos01”的子目录。
分析下的下一页是容量趋势。 从这里,我们可以获得监控和管理集群的容量使用超时所需的所有详细信息。 这里的两个主要区域是容量历史和容量变化。 这些容量包括元数据、数据和快照(仅在容量更改中排除)。 可以按最近 72 小时、最近 30 天或最近 52 周的时间范围快速过滤容量的历史和变化。 这些都是很好的选项,可以帮助存储管理员可视化和管理集群以实现扩展,并探索重大的容量变化事件。
我们在分析选项卡下探索的下一个部分是活动,我们可以在其中找到吞吐量热点、IOPS 热点、客户端和路径。 IOPS 热点页面让我们能够识别存储系统中的每秒输入/输出热点。 该图显示了在文件和元数据的读/写操作方面最活跃的目录。 这些数据的详细程度可以使用图表右上角的滑块进行调整。 暂停显示的一个很好的选项也是可用的,从自动刷新单选按钮。
我们还可以监控客户的活动。 通过分析,我们可以了解哪些客户端在吞吐量和 IOPS 方面最为活跃。
而且,我们通过路径对活动进行云监控。
主菜单中的下一个选项卡是共享,在这里,我们分析的第一个页面是配额。 Qumulo 启用实时容量配额,让管理员指定允许给定目录用于文件的容量。 从这个页面,我们可以创建、编辑或删除配额。
接下来的两页是 NFS 导出和 SMB 共享,它们允许客户端共享存储在特定目录中的数据。 例如,在 NFS Exports 下,我们可以创建新的导出,以及编辑和删除它们。
主菜单中的下一个是 Cluster。 在 Cluster 菜单下,我们通常可以找到与集群和系统相关的各种配置和选项。 在第一页 Overview 上,我们有关于集群及其节点的重要容量信息。
通过单击其中一个节点,我们可以深入了解更具体的硬件细节。 例如,我们点击“sr-qumulo-1”节点可以发现相关的网络信息和驱动健康状态。
在集群菜单下,我们还可以找到关键的存储功能,例如快照和复制。 还有更多选项,包括网络配置、重命名集群、向集群添加新主机等等。 此外,设置 FTP 和 SMB 协议。 最后,在这个菜单上,我们可以管理身份验证和授权。 下图以“本地用户和组”页面为例。
从 APIs & Tools 选项卡,我们可以直接在 UI 中访问 Qumulo Core 页面。 在这里,我们可以为 Qumulo Core REST API 下载 python 客户端库包装器和 CLI。
菜单中的最后一个选项卡是支持,我们在这里找到的第一个页面是 Qumulo Care,这是一个基于云的监控服务,我们可以启用它来向 Qumulo 发送数据。 通过这种方式,Qumulo 团队可以更好地排除故障并加快任何与集群相关的问题。
最后,在菜单上,我们有软件升级页面。
结语
为了进行创新,组织依赖于非结构化数据平台和数据感知存储,而可用解决方案无法满足这些需求。 在这篇评论中,我们研究了 Qumulo 文件系统,该系统开发用于在所有环境中提供非结构化数据。 Qumulo 是数据感知存储和云文件数据服务的先驱之一,拥有独特的混合云软件定义解决方案。
在本文的最后一节中,我们了解了 Qumulo 的 Web UI。 过去,我们一直在概述一些最流行的服务器和存储设备的图形用户界面 (GUI),而这一次,我们很高兴能够概述 Qumulo 的全新 GUI。 乍一看,我们意识到这个 GUI 的优雅设计,出色的用户体验,以及管理员日常管理操作的简单明了。
总体而言,Qumulo 的软件为其客户提供了一套卓越的功能、监控和规划工具。 该软件简化了云之旅。 它通过直接迁移云迁移支持数据移动,同时提供强大的实时分析来检测并立即洞察我们宝贵数据的情况。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅