IBM Analytics Engine 为 Apache Spark 环境提供一项服务,可将计算层和存储层分离,以控制成本并实现大规模分析。IBM Analytics Engine 不是由双用途节点组成的永久集群,而是使用户能够将数据存储在对象存储层(例如 IBM Cloud Object Storage)中,并在需要时启动计算记录集群。为了增加灵活性和成本可预测性,基于用途的消耗适用于 Apache Spark 环境。
使用开创性的数据科学工具和更广泛的 Apache Spark 生态系统在符合 ODPi 标准的堆栈上构建。
根据应用程序的需求定义集群。选择适当的软件包、版本和集群大小。按需使用,并在应用程序完成作业后立即删除。
使用第三方分析库和软件包以及 IBM 自有的增强功能来配置集群。部署来自 IBM Cloud 服务的工作负载,如机器学习。
按需启动仅计算集群。由于集群中未存储任何数据,因此永远不需要升级集群。
按需配置更多 IBM Cloud Object Storage(或其他数据存储),无需为未使用的计算周期产生额外成本。
可通过 REST API 根据实时需求添加和删除数据节点。此外,由于计算集群中没有存储数据,因此开销成本仍然很低。
使用多层方法可以显著简化单个集群的安全实施,同时实现更细粒度的访问管理。
启动集群的目的是为了满足作业的需求,而不是强制作业符合单个软件包/版本的要求。软件的多个不同版本可以在不同集群中运行。
如果您正在使用 Apache Spark,但不确定需要多少资源,请配置一个仅在运行应用程序时消耗计算资源的 Serverless Spark 实例。仅需为所使用的资源付费。
在开放的多云数据和 AI 平台上收集、组织和分析数据。
智能数据和分析资产发现、编目和治理,推动人工智能应用程序的发展
获取为开发和部署高级分析应用程序提供环境的组合服务