第2关：Pandas缺失值类型_python

任务描述

本关任务：根据所学知识完成右侧选择题。

相关知识

本关卡主要介绍Pandas自带的几个处理缺失值的工具的用法，该系列Pandas实训的缺失值主要有三种形式：null、NaN或NA。

选择处理缺失值的方法

一般情况下可以分为两种：一种方法是通过一个覆盖全局的掩码表示缺失值，另一种方法是用一个**标签值（sentinel value）**表示缺失值。

Pandas缺失值

综合考虑各种方法的优缺点，Pandas最终选择用标签方法表示缺失值，包括两种Python原有的缺失值：浮点数据类型的NaN值，以及 Python的None对象。

None：Python对象类型的缺失值
Pandas可以使用的第一种缺失值标签是None，它是一个Python单体对象，由于None是一个Python对象，所以不能作为任何NumPy / Pandas数组类型的缺失值，只能用于'object'数组类型（即由 Python对象构成的数组）。
1. np.array([1, None, 3, 4])
2. Out: array([1, None, 3, 4], dtype=object)
NaN：数值类型的缺失值
另一种缺失值的标签是NaN(全称Not a Number)，是一种按照IEEE浮点数标准设计、在任何系统中都兼容的特殊浮点数：
1. vals2 = np.array([1, np.nan, 3, 4])
2. vals2.dtype
3. Out: dtype('float64')
*注意：**NumPy会为这个数组选择一个原生浮点类型，这意味着和之前的 object类型数组不同，这个数组会被编译成C代码从而实现快速 *** 作。你可以把NaN看作是一个数据类病毒——它会将与它接触过的数据同化。**无论和NaN进行何种 *** 作，最终结果都是NaN**：
1. 1 + np.nan
2. 0 * np.nan #这两个的结果都为nan
虽然这些累计 *** 作的结果定义是合理的（即不会抛出异常），但是并非总是有效的：
1. vals2 = np.array([1, np.nan, 3, 4])
2. vals2.sum(), vals2.min(), vals2.max()
3. Out:(nan, nan, nan)
NumPy也提供了一些特殊的累计函数，它们可以忽略缺失值的影响：
1. np.nansum(vals2), np.nanmin(vals2), np.nanmax(vals2)
2. Out: (8.0, 1.0, 4.0)

谨记，NaN是一种特殊的浮点数，不是整数、字符串以及其他数据类型。

编程要求

本关无编程任务，要求完成右侧代码编辑区内相应的选择题。

测试说明

平台会对你的选择题答案结果进行测试，对比你的答案与实际正确的答案，只有所有答案全部正确才能进入下一关。

欢迎分享，转载请注明来源：内存溢出

第2关：Pandas缺失值类型