返回课程
下一页
互动测验
测试你的知识!
1
在机器学习的背景下,自然语言处理(NLP)是什么?
A
这是一种处理彩色图像的方法
B
这是一组与文本相关的任务,如翻译和理解
C
这是一种用于排序数字的算法
D
这仅指语音识别
2
在用于预测下一个字符的双字符模型(bigramme)中,预测基于什么?
A
基于前三个字符
B
基于前一个字符
C
基于文本中的所有字符
D
不基于任何前字符,是随机的
3
为什么在双字符模型中,要在名字的开头和结尾添加特殊字符 '.'?
A
为了增加数据集的大小
B
为了表示标点符号
C
为了建模首字母和末字母的概率
D
为了替换元音字母
4
当 N 增大时,N-gram 计数方法的主要问题是什么?
A
参数数量呈指数级增长
B
精度自动降低
C
字符变得损坏
D
模型变得过快
5
与计数方法相比,使用带有全连接层的神经网络进行下一个字符预测的主要优点是什么?
A
它可以处理可变大小的上下文,而不会导致模型规模爆炸
B
它不需要任何训练数据
C
它总是预测最频繁的字母
D
它仅使用输入维度为 1 的简化版本
6
在 Bengio 等人启发的全连接模型中,嵌入矩阵 \( C \) 代表什么?
A
一种将字符编码为连续潜在空间的变换
B
字符频率的字典
C
用于过滤掉罕见字符的滤波器
D
卷积矩阵
7
与 sigmoid 函数相比,双曲正切函数(tanh)在隐藏层中的主要优势是什么?
A
它的输出总是正数
B
它有助于学习,因为输出以零为中心且梯度更大
C
它计算速度更快
D
它不需要计算梯度
8
使用循环神经网络(RNN)进行字符序列预测的主要动机是什么?
A
不指定固定的上下文大小,并保留所有先前上下文的记忆
B
允许在 GPU 上进行大规模并行化
C
仅使用最后一个字符进行预测
D
将参数数量减少到一个权重
9
经典 RNN 在处理长序列时遇到的主要问题是什么?
A
仅存在梯度爆炸问题
B
在长序列中传播信息的困难(梯度消失问题)
C
缺乏处理短序列的能力
D
它们只能处理固定长度的序列
10
与经典 RNN 相比,LSTM 层带来的主要创新是什么?
A
它用 sigmoid 函数替代了 softmax 函数
B
它引入了门结构(遗忘门、输入门、输出门)来管理短期和长期记忆
C
它仅使用卷积来处理序列
D
它直接在一步中预测整个序列
Score: 0/10
得分: 0/10