近日,Cloudera宣布计划在今年夏天在基于Kubernetes的Red Hat OpenShift上提供基于Hadoop的数据管理平台的实例。 Cloudera首席产品官Arun Murthy说,Cloudera数据平台(CDP)私有云是对Amazon Web Services(AWS)和Microsoft上已经可用的平台实例的补充。 Murthy强调,此举目标是使IT团队能够在云或本地IT环境中部署基于CDP的数据仓库,并在混合云计算环境中移动数据。 由于Kubernetes的兴起,现在在云计算环境之间移动工作负载变得更加容易。但是,在云平台之间移动数据存在更大的问题。Murthy指出,CDP简化了云平台之间的数据移动,使IT团队可以保留元数据以及应维护的相关安全和治理控制。 他说,这很关键,因为在COVID-19大流行带来的经济衰退之后,许多IT组织都希望集中管理多个云以降低总成本。 Murthy说,Cloudera将根据需求增加对Kubernetes其他发行版的支持,并指出Red Hat OpenShift当前是在本地IT环境中部署的Kubernetes的主要发行版。 CDP基于Hadoop的两个发行版,这些发行版是去年年初Cloudera-Hortonworks合并后的结果。从那时起,Hadoop和Kubernetes在推动结合了机器和深度学习算法的人工智能应用程序的开发中发挥了关键作用。Hadoop提供了一种管理大量数据的方法,而Kubernetes精心策划的容器使使用微服务来构建和部署原本笨拙的单块AI应用程序成为可能。 当然,随着要聚合的数据量达到PB,“大数据”一词已变得有些陈词滥调。问题不在于存储和处理的数据量,还在于确保在正确的时间向正确的微服务提供正确的数据。实际上,数据集需要作为可被多个微服务访问的逻辑实体进行管理。 实际上,Cloudera已经在CDP之上提供了单独的数据仓库,机器学习以及数据管理和分析服务,以简化特定用例范围内的数据管理。 在Kubernetes支持的混合云计算时代,IT团队可能需要一段时间才能掌握所有数据管理的细微差别。但是,随着组织试图从其收集的数据中获取更多价值,他们将需要更灵活的方法来管理大量数据。随着敏捷开发方法和DevOps的兴起,创建和部署应用程序从未如此简单。相比之下,在太多组织中,为那些应用程序提供对所需数据的访问权限仍然很积极。 消息来自:https://containerjournal.com/topics/container-management/clouderas-data-management-platform-comes-to-openshift |