Já jsem se snaží získat dovednosti z popisu práce. Ale nemohu si jedinečné slovo (každé slovo se opakuje). Například, slovo 'SQL' se opakuje 2 čas v řádku 5. Nemohu použít unikátní() pro Datovém stejně. Existuje nějaký způsob, jak zabránit opakování slova?
list1={'SQL','visualization','modeling','sql','mysql','python','oracle','sybase','mathematics','collection','statistics','tableau','etl','nosql','weka','r','communication','microsoft','excel','pattern', 'recognition','machine','processing','mining','strategy','big','predictive'}
df['skill'] =df['description'].apply(lambda x: ' '.join([item for item in x.split( ) if item in list1]))
df.head(10)