云机器学习引擎 (CMLE) 是 Google Cloud Platform (GCP) 提供的一款功能强大的工具,用于以分布式和并行方式训练机器学习模型。但是,它不提供自动资源获取和配置,也不处理模型训练完成后的资源关闭。在本回答中,我们将考虑 CMLE 的细节、其功能以及手动资源管理的需要。
CMLE 旨在简化大规模训练和部署机器学习模型的过程。 它提供了一个托管环境,允许用户专注于模型开发而不是基础设施管理。 CMLE 利用 GCP 基础设施的强大功能将训练工作负载分配到多台机器上,从而缩短训练时间并处理大型数据集。
使用 CMLE 时,用户可以灵活选择培训工作所需的资源类型和数量。 他们可以根据自己的具体要求选择机器类型、工人数量和其他参数。 但是,CMLE 不会自动获取和配置这些资源。 用户有责任在开始培训工作之前提供必要的资源。
为了获取资源,用户可以利用GCP服务,例如Compute Engine或Kubernetes Engine。 这些服务提供了可扩展且灵活的基础设施来适应培训工作量。 用户可以创建虚拟机实例或容器,使用所需的软件依赖项配置它们,然后将它们用作 CMLE 中的工作程序。
训练作业完成后,CMLE 不会自动关闭用于训练的资源。 这是因为经过训练的模型可能需要部署并用于推理目的。 由用户决定何时以及如何终止资源以避免不必要的成本。
总而言之,CMLE 为并行机器学习模型训练提供了一个强大的平台。 但需要手动获取和配置资源,并且不处理训练结束后的资源关闭。 用户需要使用 Compute Engine 或 Kubernetes Engine 等 GCP 服务来配置必要的资源,并根据其特定要求管理其生命周期。
最近的其他问题和解答 机器学习的发展:
- 当内核分叉并且数据为私有时,分叉后的内核可以公开吗?如果可以,这是否不会侵犯隐私?
- 在机器学习中处理大型数据集有哪些限制?
- 机器学习可以提供一些对话帮助吗?
- 什么是 TensorFlow 游乐场?
- Eager 模式会妨碍 TensorFlow 的分布式计算功能吗?
- 谷歌云解决方案能否用于将计算与存储解耦,以便更有效地利用大数据训练机器学习模型?
- 是否可以在任意大的数据集上毫无问题地训练机器学习模型?
- 使用 CMLE 时,创建版本是否需要指定导出模型的来源?
- CMLE 能否从 Google Cloud 存储数据中读取并使用指定的训练模型进行推理?
- Tensorflow 可以用于深度神经网络 (DNN) 的训练和推理吗?
更多问题及解答:
- 领域: 人工智能
- 程序: EITC/AI/GCML Google云机器学习 (前往认证计划)
- 教训: 机器学习的发展 (去相关课程)
- 主题: GCP BigQuery和开放数据集 (转到相关主题)