Získat první a poslední výskyt duplicitní hodnoty

Question 1

Mám dataframe takhle

index    col1     col2    col3    col4
  0      11/20    11/26   abc     35
  1      11/21    11/24   xxx     30
  2      11/22    11/27   abc     20

Zde col3 má stejnou hodnotu (duplicitní na základě hodnoty). Já sum() col4 z řádků na základě col3 hodnotu.

Takže v tomto případě mám udělat

df = df.groupby(['col3'])[['col4']].sum()

Ale s tímto přístupem jsem se

index    col3    col4
  0      abc     55
  1      xxx     30

Chtěl bych být schopen uchovat první výskyt duplicitní hodnoty col1(11/20) a poslední výskyt col2(11/27), takže konečný produkt vypadá, jako by

index    col1     col2    col3    col4
  0      11/20    11/27   abc     55
  1      11/21    11/24   xxx     30

Question 2

Jeden způsob, jak pomocí pandas.DataFrame.groupby.agg:

new_df = df.groupby("col3", as_index=False).agg({"col1": "first",
                                                 "col2": "last",
                                                 "col4": "sum"})
print(new_df)

Výstup:

  col3   col1   col2  col4
0  abc  11/20  11/27    55
1  xxx  11/21  11/24    30

Question 3

Pandy poskytuje first a last shluky.

Chris · Answer 1 · 2021-11-24T05:27:44

Jeden způsob, jak pomocí pandas.DataFrame.groupby.agg:

new_df = df.groupby("col3", as_index=False).agg({"col1": "first",
                                                 "col2": "last",
                                                 "col4": "sum"})
print(new_df)

Výstup:

  col3   col1   col2  col4
0  abc  11/20  11/27    55
1  xxx  11/21  11/24    30

Převod col1/col2 na datetime a pomocí min/max by mohlo být robustnější, pokud jsme vždy chtěli, aby "první" (nejstarší) datum a "poslední" (poslední) datum. (Opět to závisí na use-case)

deepyaman · Answer 2 · 2021-11-24T05:28:04

Pandy poskytuje first a last shluky.

Získat první a poslední výskyt duplicitní hodnoty

Otázka

Nejlepší odpověď

V jiných jazycích

Tato stránka je v jiných jazycích

Populární v této kategorii

Oblíbené položky v této kategorii