Použití stanford core nlp lemmatizace s rumunským jazykem?

0

Otázka

Existuje nějaký způsob, jak používat stanford core-nlp s rumunským jazykovým modelem? Vypadá to, že to nemá rumunského jazyka v základní knihovně, ale snažil jsem se stáhnout jazykový model z python knihovny: https://stanfordnlp.github.io/stanfordnlp/models.html a nějak importovat je do kódu v jazyce java (props.setProperty("pos.model","PATH...") ale oni dont se zdají být kompatibilní, dává erorr java.io.StreamCorruptedException: invalid stream header:.

Pokud používáte jádro-nlp není možné, jste si vědom jakékoli java lemmatizace knihovna, která podporuje rumunský?

java lemmatization nlp stanford-nlp
2021-11-22 11:20:02
1

Nejlepší odpověď

0

Algoritmy, datové struktury, a model soubory CoreNLP a Stanza (dříve stanfordnlp), jsou zcela odlišné. Tam není, a není pravděpodobné, že někdy být jakýkoli pohybující se modely mezi nimi v obou směrech.

Jediné, co vím, je, že Sněhová koule stemmer podporuje rumunské a je použitelný v Javě, jestli je to dostatečné:

2021-11-23 17:13:32

V jiných jazycích

Tato stránka je v jiných jazycích

Русский
..................................................................................................................
Italiano
..................................................................................................................
Polski
..................................................................................................................
Română
..................................................................................................................
한국어
..................................................................................................................
हिन्दी
..................................................................................................................
Français
..................................................................................................................
Türk
..................................................................................................................
Português
..................................................................................................................
ไทย
..................................................................................................................
中文
..................................................................................................................
Español
..................................................................................................................
Slovenský
..................................................................................................................