Mám dataframe
takhle
index col1 col2 col3 col4
0 11/20 11/26 abc 35
1 11/21 11/24 xxx 30
2 11/22 11/27 abc 20
Zde col3
má stejnou hodnotu (duplicitní na základě hodnoty).
Já sum()
col4
z řádků na základě col3
hodnotu.
Takže v tomto případě mám udělat
df = df.groupby(['col3'])[['col4']].sum()
Ale s tímto přístupem jsem se
index col3 col4
0 abc 55
1 xxx 30
Chtěl bych být schopen uchovat první výskyt duplicitní hodnoty col1
(11/20) a poslední výskyt col2
(11/27), takže konečný produkt vypadá, jako by
index col1 col2 col3 col4
0 11/20 11/27 abc 55
1 11/21 11/24 xxx 30