Mám seznam v textovém souboru z adresy Url s některé nežádoucí texty jsem napsal regex, která bude splňovat mé potřeby a že je práce v pořádku, ale já jsem čelí problému, kde regex přidat do výstupního nežádoucí vzorků ["] níže příklady:
obsah souboru seznam adres Url:
http://www.example.com/52 (Status: 403) [Size: 919]
http://www.example.com/details (Status: 403) [Size: 919]
http://www.example.com/h (Status: 403) [Size: 919]
http://www.example.com/affiliate (Status: 403) [Size: 919]
http://www.example.com/56 (Status: 403) [Size: 919]
regulární výrazy, které jsem použil je: "^[://.a-zA-Z0-9-_]*"
výstup, jak je uvedeno níže:
['http://www.example.com/52']
['http://www.example.com/details']
['http://www.example.com/h']
['http://www.example.com/affiliate']
['http://www.example.com/56']
Potřebuji výstup jako následující:
http://www.example.com/52
http://www.example.com/details
http://www.example.com/h
http://www.example.com/affiliate
http://www.example.com/56
kód použitý pro tento program níže:
import re
with open("test.txt","r") as test:
for i in test:
x = re.findall("^[://.a-zA-Z0-9-_]*",i)
print(x)