Dropna设置为True的 pandas Groupby生成错误输出

沃梦达教程 Python问题

2022-01-01

Pandas groupby with dropna set to True generating wrong output(Dropna设置为True的 pandas Groupby生成错误输出)

本文介绍了Dropna设置为True的 pandas Groupby生成错误输出的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

在以下代码片断中：

import pandas as pd
import numpy as np

df = pd.DataFrame(
    {
        "a": [1, 2, 3, 4, 5, 6, 7, 8, 9], 
        "b": [1, np.nan, 1, np.nan, 2, 1, 2, np.nan, 1]
    }
)
df_again = df.groupby("b", dropna=False).apply(lambda x: x)

我预期df和df_again相同。但它们不是：

现在，如果我将lambda表达式略微调整为"；，请参阅"；What With With by df.groupby("b", dropna=False).apply(lambda x: print(x))我实际上可以想象df中b是NaN的那部分也已处理。

我这里错过了什么？ (使用 pandas 1.3.1和Numpy 1.20.3)