监督学习和无监督学习是机器学习范式的两种基本类型,它们根据数据的性质和手头任务的目标服务于不同的目的。了解何时使用监督训练与无监督训练对于设计有效的机器学习模型至关重要。这两种方法之间的选择取决于标记数据的可用性、期望的结果以及数据集的底层结构。
监督学习是机器学习的一种,其中模型在标记数据集上进行训练。在监督学习中,算法通过提供训练示例来学习将输入数据映射到正确的输出。这些训练示例由输入输出对组成,其中输入数据伴有相应的正确输出或目标值。监督学习的目标是学习从输入变量到输出变量的映射函数,然后可以使用该映射函数对未见过的数据进行预测。
当期望的输出已知并且目标是学习输入和输出变量之间的关系时,通常使用监督学习。它通常应用于分类(其目标是预测新实例的类标签)和回归(其目标是预测连续值)等任务。例如,在监督学习场景中,您可以训练一个模型,根据电子邮件的内容和之前电子邮件的标记垃圾邮件/非垃圾邮件状态来预测电子邮件是否为垃圾邮件。
另一方面,无监督学习是机器学习的一种,其中模型是在未标记的数据集上进行训练的。在无监督学习中,算法从输入数据中学习模式和结构,而无需对正确输出进行明确的反馈。无监督学习的目标是探索数据的底层结构,发现隐藏的模式,并在不需要标记数据的情况下提取有意义的见解。
当目标是探索数据、发现隐藏模式并将相似的数据点分组在一起时,通常使用无监督学习。它通常应用于聚类等任务,其中的目标是根据相似的数据点的特征将相似的数据点分组为簇,以及降维,其中的目标是减少特征数量,同时保留数据中的基本信息。例如,在无监督学习场景中,您可以使用聚类根据客户的购买行为对客户进行分组,而无需事先了解客户细分。
监督学习和无监督学习之间的选择取决于几个因素。如果您有一个标记数据集并想要预测特定结果,那么监督学习是合适的选择。另一方面,如果你有一个未标记的数据集,并且想要探索数据结构或找到隐藏的模式,那么无监督学习更适合。在某些情况下,可以使用监督和无监督技术的组合(称为半监督学习)来充分利用这两种方法的优势。
在机器学习中使用监督训练还是无监督训练的决定取决于标记数据的可用性、任务的性质和期望的结果。了解监督学习和无监督学习之间的差异对于设计有效的机器学习模型至关重要,这些模型可以提取有意义的见解并从数据中做出准确的预测。
最近的其他问题和解答 EITC/AI/GCML Google云机器学习:
- 什么是文本转语音 (TTS) 以及它如何与人工智能配合使用?
- 在机器学习中处理大型数据集有哪些限制?
- 机器学习可以提供一些对话帮助吗?
- 什么是 TensorFlow 游乐场?
- 更大的数据集实际上意味着什么?
- 算法的超参数有哪些示例?
- 什么是集成学习?
- 如果选择的机器学习算法不合适怎么办?如何确保选择正确的算法?
- 机器学习模型在训练过程中是否需要监督?
- 基于神经网络的算法中使用的关键参数是什么?
查看 EITC/AI/GCML Google Cloud Machine Learning 中的更多问题和解答