Srovnání datetime objekty - Python

0

Otázka

Mám datový soubor, který vypadá jako následující:

Date          item purchased
01-12-2018      Car
02-12-2018      Truck
03-12-2018      Car
04-12-2018      Bike

Jako součást čištění dat procesu, musím si ověřit, že data jsou v chronologickém pořadí. Tak jsem třeba zkontrolovat, že data v řadě se po dni v předchozí řadě. Pokud ne, potřebuji odstranit tento řádek. Jsem poučen, že nebude používat pandy knihovna.

Tak daleko, udělal jsem následující kroky tak daleko:



#If the file name is - 'Input_file'

from openpyxl import load_workbook
from datetime import datetime

#Reading the file 
wb = load_workbook(Input_file)
sheet = wb.active

#Reading the Date column in the file
Date_column = sheet['A']


#Reading each row and the date in each row to compare it with the previous row date
for x in range(len(Date_column)):
    Datenow = Date_column[x].value

    Datebef= Date_column[x-1].value
    
    Check = Datenow > Datebef

    print(Check)

Chyba je, když se snažím porovnat datetime objekty je :


TypeError: unsupported operand type(s) for -: 'str' and 'datetime.datetime'

Problém je, když jsem zkontrolovat typ sloupce datum, to vyjde na datetime.datetime ale jakmile jsem se pokusit porovnat oba datetime.datetime objekty, to mi říká, že jedním z nich je řetězec a jeden je datetime.datetime objekt. Zmatek je, pokud se obě hodnoty jsou čteny ze stejného sloupce, Jak člověk vychází jako řetězec a jeden je datetime.datetime.

Jak se mohu ujistit, hodnoty zůstávají jako datetime.datetime a můžu porovnat.

Díky

datetime openpyxl python
2021-11-24 00:38:46
1

Nejlepší odpověď

0

Můžete zkontrolovat datový typ buňky, než si to porovnat. Také, budete muset pečlivě přemýšlet o srovnání a pořadí odstranění řádků, protože si nemůže dělat, zatímco vy jít. Místo toho, budete muset vytvořit seznam řádků, které chcete odstranit, a je mazat v opačném pořadí.

Něco takového by mělo fungovat.

import datetime

previous_date = datetime.date(2017, 12, 31) # adjust as necessary
rows_to_delete = []

for row in ws.iter_rows(min_col=1, max_col=1, min_row=2):
    cell = row[0]
    if not isinstance(cell.value, datetime.date):
        continue
    if cell.value < previous_date:
        rows_to_delete.append(cell.row)
    previous_date = cell.value

for row in reversed(rows_to_delete):
   ws.delete_rows(row)
2021-11-25 10:38:07

V jiných jazycích

Tato stránka je v jiných jazycích

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................