How to add new column with min and max function in Pyspark and group by the data?(如何在Pyspark中添加带有MIN和MAX函数的新列,并按数据分组?)
问题描述
PySpark Dataframe:adbel DF
向数据框添加新列:
结果:
我正在尝试弄清楚如何将最小(日期)值保存在Start_Date中,将最大(日期)值保存在End_Date中,并按post_evar10和Type对最终数据帧进行分组。
我尝试过的内容:下面的代码可以工作,但想看看是否有更好的方法来这样做,并将数据限制在从START_DATE起60天
推荐答案
以下内容如何?
这篇关于如何在Pyspark中添加带有MIN和MAX函数的新列,并按数据分组?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!