Získat první a poslední výskyt duplicitní hodnoty

0

Otázka

Mám dataframe takhle

index    col1     col2    col3    col4
  0      11/20    11/26   abc     35
  1      11/21    11/24   xxx     30
  2      11/22    11/27   abc     20

Zde col3 má stejnou hodnotu (duplicitní na základě hodnoty). Já sum() col4 z řádků na základě col3 hodnotu.

Takže v tomto případě mám udělat

df = df.groupby(['col3'])[['col4']].sum()

Ale s tímto přístupem jsem se

index    col3    col4
  0      abc     55
  1      xxx     30

Chtěl bych být schopen uchovat první výskyt duplicitní hodnoty col1(11/20) a poslední výskyt col2(11/27), takže konečný produkt vypadá, jako by

index    col1     col2    col3    col4
  0      11/20    11/27   abc     55
  1      11/21    11/24   xxx     30

pandas python
2021-11-24 05:23:58
2

Nejlepší odpověď

2

Jeden způsob, jak pomocí pandas.DataFrame.groupby.agg:

new_df = df.groupby("col3", as_index=False).agg({"col1": "first",
                                                 "col2": "last",
                                                 "col4": "sum"})
print(new_df)

Výstup:

  col3   col1   col2  col4
0  abc  11/20  11/27    55
1  xxx  11/21  11/24    30
2021-11-24 05:27:44

Převod col1/col2 na datetime a pomocí min/max by mohlo být robustnější, pokud jsme vždy chtěli, aby "první" (nejstarší) datum a "poslední" (poslední) datum. (Opět to závisí na use-case)
Henry Ecker
0

Pandy poskytuje first a last shluky.

2021-11-24 05:28:04

V jiných jazycích

Tato stránka je v jiných jazycích

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................