如何在 PyTorch 中定义 CNN 的架构？

PyTorch 中卷积神经网络 (CNN) 的架构是指其各个组件的设计和排列，例如卷积层、池化层、全连接层和激活函数。该架构决定了网络如何处理和转换输入数据以产生有意义的输出。在这个答案中，我们将详细而全面地解释 PyTorch 中 CNN 的架构，重点关注其关键组件及其功能。

CNN 通常由按顺序排列的多个层组成。第一层通常是卷积层，它对输入数据执行卷积的基本操作。卷积涉及将一组可学习的过滤器（也称为内核）应用于输入数据以提取特征。每个过滤器在其权重和输入的局部感受野之间执行点积，生成特征图。这些特征图捕获输入数据的不同方面，例如边缘、纹理或图案。

在卷积层之后，非线性激活函数按元素应用于特征图。这将非线性引入网络，使其能够学习输入和输出之间的复杂关系。 CNN 中使用的常见激活函数包括 ReLU（修正线性单元）、sigmoid 和 tanh。 ReLU 由于其简单性和缓解梯度消失问题的有效性而被广泛使用。

在激活函数之后，通常采用池化层来减少特征图的空间维度，同时保留重要特征。池化操作（例如最大池化或平均池化）将特征图划分为不重叠的区域，并聚合每个区域内的值。这种下采样操作降低了网络的计算复杂性，并使其对输入的变化更加鲁棒。

卷积层、激活层和池化层通常会重复多次，以从输入数据中提取越来越抽象和高级的特征。这是通过增加每个卷积层中的滤波器数量或将多个卷积层堆叠在一起来实现的。网络的深度使其能够学习输入的分层表示，捕获低级和高级特征。

特征提取过程完成后，输出将被展平为一维向量并通过一个或多个全连接层。这些层将一层中的每个神经元连接到下一层中的每个神经元，从而允许学习复杂的关系。全连接层通常用于网络的最后层，将学习到的特征映射到所需的输出，例如图像分类任务中的类概率。

为了提高网络的性能和通用性，可以应用各种技术。正则化技术（例如 dropout 或批量归一化）可用于防止过度拟合并提高网络泛化到未见过的数据的能力。 Dropout 在训练期间随机将一部分神经元设置为零，迫使网络学习冗余表示。批量归一化对每一层的输入进行归一化，减少内部协变量偏移并加速训练过程。

PyTorch 中 CNN 的架构涵盖其组件的排列和设计，包括卷积层、激活函数、池化层和全连接层。这些组件协同工作，从输入数据中提取和学习有意义的特征，使网络能够做出准确的预测或分类。通过仔细设计架构并结合正则化等技术，可以提高网络的性能和泛化能力。