在使用分布式 ML 模型训练时，可以利用 CMLE 模型部署的配置文件来定义训练中将使用多少台机器吗？

by 赫马·古纳塞卡兰 / 周二，14 2023月 / 发表于人工智能, EITC/AI/GCML Google云机器学习, Google Cloud AI平台, 在Cloud AI Platform上使用自定义容器训练模型

在Google Cloud AI Platform上使用分布式机器学习（ML）模型训练时，您确实可以利用CMLE（云机器学习引擎）模型部署的配置文件来定义训练中使用的机器数量。但是，无法直接定义将使用的机器类型。

在分布式 ML 模型训练中，CMLE 模型部署配置文件允许您指定训练的规模层。规模层决定了训练作业中使用的机器的数量和类型。扩展层选项范围从基本到自定义，每个层都有预定义数量的工作人员和参数服务器。通过选择适当的规模层，您可以控制用于训练的机器数量。

例如，如果您选择规模层 BASIC，它将使用单个工作线程且无参数服务器。另一方面，如果您选择规模层 STANDARD_1，它将使用一个工作线程和一个参数服务器。规模层 PREMIUM_1 使用 XNUMX 个工作线程和 XNUMX 个参数服务器，而规模层 CUSTOM 允许您显式指定工作线程和参数服务器的数量。

但是，虽然您可以定义机器的数量，但无法直接指定训练中使用的机器类型。使用的机器类型由规模层决定，并由 Google Cloud AI Platform 预定义。每个规模层都有一个与其关联的默认机器类型，该机器类型针对给定的规模层进行了优化。例如，BASIC 规模层使用 n1-standard-1 机器类型，而 STANDARD_1 规模层使用 n1-standard-4 机器类型。

如果您需要对训练中使用的机器类型进行更多控制，可以将自定义容器与 Cloud AI Platform 结合使用。使用自定义容器，您可以构建和部署自己的训练映像，这允许您指定训练所需的机器类型和其他依赖项。通过创建自定义容器，您可以灵活地定义适合您的培训需求的确切机器类型。

在 Google Cloud AI Platform 上使用分布式 ML 模型训练时，您可以通过 CMLE 模型部署配置文件定义用于训练的机器数量。但是，您无法直接指定所使用的机器类型，因为它由规模层决定。如果您需要对机器类型进行更多控制，您可以利用自定义容器来构建和部署您自己的训练映像。

最近的其他问题和解答 EITC/AI/GCML Google云机器学习:

查看 EITC/AI/GCML Google Cloud Machine Learning 中的更多问题和解答

EITCA学院

在使用分布式 ML 模型训练时，可以利用 CMLE 模型部署的配置文件来定义训练中将使用多少台机器吗？

最近的其他问题和解答 EITC/AI/GCML Google云机器学习:

更多问题及解答：

EITCA 学院是欧洲 IT 认证框架的一部分

EITCA 学院的资格 80% EITCI DSJC 补贴支持

EITCA学院

通过您的用户名或电子邮件地址登录到您的帐户

忘记您的资料？

创建一个帐户

在使用分布式 ML 模型训练时，可以利用 CMLE 模型部署的配置文件来定义训练中将使用多少台机器吗？

最近的其他问题和解答 EITC/AI/GCML Google云机器学习:

更多问题及解答：

EITCA 学院的资格 80% EITCI DSJC 补贴支持