pandas将一列中重复值替换为空值(nan)

将一列中的重复值替换成nan(ffillna的逆运算,但ffillna之前的重复值也会被替换掉)

data['A'] = data.A.mask(data.A.diff().eq(0)) 	# 方法1
data['A'].mask(data['A'].shift(1) == data['A'])	# 方法2

diff()使用说明:
numpy.diff(a, n=1,axis=-1)
a 表示需要进行差分操作的数据
n 代表执行几次差值
axis:默认是-1。

在pandas中:
调用方法:
dataframe.diff(periods,axis)
dataframe:可以是直接对dataframe结构进行diff,也可以是Series,另外还可以是进行聚合或者其他操作之后的Series
periods:表示移动的幅度。它是任意整数,如果是想让数据统一向下移动n个periods,则n为正,如果是想让数据向上移动n个periods,则n为负
axis:表示参考轴。如果axis=0,则是进行行间的移动差分操作,如果axis=1,则进行列间的移动差分操作。

eq()说明:
operator.eq() 功能
operator.eq()函数是运算符模块的库函数,用于对两个值执行“等于运算”,如果第一个值等于第二个值,则返回True,否则返回False。