该示例中使用的神经网络的体系结构是具有三层的前馈神经网络:输入层、隐藏层和输出层。 输入层由 784 个单元组成,对应于输入图像中的像素数量。 输入层中的每个单元代表图像中像素的强度值。
隐藏层由128个单元组成,与输入层全连接。 隐藏层中的每个单元计算来自输入层的输入的加权和,并应用激活函数来产生输出。 在此示例中,隐藏层中使用的激活函数是修正线性单元(ReLU)函数。 ReLU 函数定义为 f(x) = max(0, x),其中 x 是单元输入的加权和。 ReLU 函数向网络引入了非线性,使其能够学习数据中的复杂模式和关系。
输出层由 10 个单元组成,每个单元代表分类问题中可能的类别之一。 输出层中的单元也完全连接到隐藏层中的单元。 与隐藏层类似,输出层中的每个单元计算隐藏层输入的加权和并应用激活函数。 在这个例子中,输出层使用的激活函数是softmax函数。 softmax 函数将输入的加权和转换为类别上的概率分布,其中概率之和等于 1。具有最高概率的单元表示输入图像的预测类别。
总而言之,该示例中使用的神经网络架构由 784 个单元的输入层、使用 ReLU 激活函数的 128 个单元的隐藏层以及使用 softmax 激活函数的 10 个单元的输出层组成。
最近的其他问题和解答 建立神经网络以执行分类:
- TensorFlow.js 中运行的机器学习模型是否需要使用异步学习功能?
- 模型是如何在 TensorFlow.js 中编译和训练的,分类交叉熵损失函数的作用是什么?
- 机器学习过程中学习率和epoch数有何意义?
- TensorFlow.js 中的训练数据如何拆分为训练集和测试集?
- TensorFlow.js 构建用于分类任务的神经网络的目的是什么?
更多问题及解答:
- 领域: 人工智能
- 程序: EITC/AI/TFF TensorFlow基础知识 (前往认证计划)
- 教训: 张量流.js (去相关课程)
- 主题: 建立神经网络以执行分类 (转到相关主题)
- 考试复习