首页 企业版 谷歌通过更新 BigQuery 和 Dataflow 处理大数据

谷歌通过更新 BigQuery 和 Dataflow 处理大数据

by 亚当·阿姆斯特朗

大数据经常出现在数据管理中。 利用大数据可以引导企业获得各种见解,从而提高效率和盈利能力。 唯一的问题是,在资源管理和系统管理方面,使用大数据可能是一项艰巨的任务。 谷歌计划通过谷歌云平台以“云方式”处理大数据,并更新其 BigQuery 并引入云数据流。


大数据经常出现在数据管理中。 利用大数据可以引导企业获得各种见解,从而提高效率和盈利能力。 唯一的问题是,在资源管理和系统管理方面,使用大数据可能是一项艰巨的任务。 谷歌计划通过谷歌云平台以“云方式”处理大数据,并更新其 BigQuery 并引入云数据流。

Google Cloud Platform 提供了一组功能强大、可扩展且易于使用的大数据服务,因此客户可以通过云方式拥抱大数据。 第一个是谷歌云数据流,它提供可靠的、基于事件时间的流处理,默认情况下可用。 第二个是通过更新 Google 的 BigQuery,这是用于 SQL 分析的典型的云原生 API 驱动服务。 这些更新包括安全和性能功能,包括行级权限,现在默认摄取限制为 100,000 行/秒/表。

谷歌处理大数据的云方式旨在更快更好地洞察大数据,而无需担心底层基础设施。 这包括:

  • NoOps:“NoOps”是指平台为用户处理此类任务和优化,让他们腾出时间专注于理解和利用数据中的价值。
  • 成本效益:平台自动扩展和优化用户的基础设施消耗,并消除闲置集群等未使用的资源。 用户通过根据成本/收益分析调高或调低查询数量和处理延迟来管理成本。
  • 安全且轻松的协作:用户可以与组织内外的协作者共享 Google Cloud Storage 中的文件或 Google BigQuery 中的表中的数据集,而无需制作副本或授予数据库访问权限。

与 BigQuery 和 Cloud Dataflow 一起,Google 完善了其大数据,即 Google Cloud Pub/Sub 的云方式。 Pub/Sub 允许用户以低延迟实时处理数据。

可用性

Google BigQuery 现在可用,可以选择在欧洲区域的 Google Cloud Platforms 中存储数据,并且 Google Cloud Dataflow 处于测试阶段。

Google BigQuery

谷歌云数据流

讨论这个故事