Předpokládejme, že mám datový rámec takto:
df = pd.DataFrame({
'Column A': [12,12,12, 13, 15, 16, 141, 141, 141, 141],
'Column B':['Apple' ,'Apple' ,'Orange' ,'Apple' , np.nan, 'Orange', 'Apple', np.nan, 'Apple', 'Apple']})
Na základě těchto podmínek:
Pokud hodnoty ve sloupci jsou opakované pak spočítat slovo "Oranžové" ve Sloupci B a vložte jej do nového Sloupce C(například, tam jsou 3 řádky pro 12, počet "Oranžová" je 1 a tato 1 by měla být v nový sloupec C). Pro non-opakování řádků, stačí vložit odpovídající hodnoty.
Pokud hodnoty ve sloupci jsou opakované pak spočítat slovo "Apple", v Sloupci B a vložte jej do nového Sloupce D(například, tam jsou 3 řádky pro 12, hrabě z "Apple" je 2, a to 2 by měly být v nový sloupec D). Pro non-opakování řádků, stačí vložit odpovídající hodnoty.
Pro opakované a non-opakované řádky vzhledem k Sloupci A, je-Li slovo "Oranžová" je přítomen ve Sloupci B, napište " ano "else" Ne " ve Sloupci E.
Chtěl bych mít výstupní následující. Snažil jsem se v pythonu jupyter notebooku, může někdo prosím, pomozte mi získat výstup jako tento:
| Column A | Column B |Column C |Column D |Column E
----- | -------- | ---------|---------|---------|---------
0 | 12 | Apple |1 |2 |Yes
1 | 13 | Apple |0 |1 |No
2 | 15 | NaN |NaN |NaN |NaN
3 | 16 | Orange |1 |0 |Yes
4 | 141 | Apple |0 |3 |No
Díky předem:)