Tüvede moodustamine on sõna taandamine selle sõnatüveks, mis kinnitub järelliidetele ja eesliidetele või sõnade juurtele, mida nimetatakse lemmaks. Tüve kasutamine on oluline loomuliku keele mõistmisel (NLU) ja loomuliku keele töötlemisel (NLP).
Mis tuleneb NLP-s näitest?
Tüveline moodustamine on põhimõtteliselt sufiksi eemaldamine sõnast ja taandamine selle tüvisõnaks. Näiteks: "Lendav" on sõna ja selle järelliide on "ing", kui eemaldame sõna "Lendav" hulgast sõna "ing", saame põhisõna või tüvisõna, mis on "Lenda".
Mis kasu on tüvest?
Stemmingut kasutatakse teabeotsingusüsteemides, nagu otsingumootorid. Seda kasutatakse domeenisõnastiku määramiseks domeenianalüüsis.
Mis on tulenev lemmatiseerimine?
Tüved ja lemmatiseerimine on meetodid, mida otsingumootorid ja vestlusrobotid kasutavad sõna taga oleva tähenduse analüüsimiseks. Tüve moodustamine kasutab sõna tüve, samas kui lemmatiseerimine kasutab konteksti, milles sõna kasutatakse.
Mis on NLP-s lemmatiseerimine ja tuletamine?
Morfoloogiline analüüs eeldaks iga sõna õige lemma väljavõtmist. Näiteks lemmatiseerimine identifitseerib selgelt põhivormi 'hädas' ja 'häda', mis tähistab mingit tähendust, samas kui Stemming lõikab välja 'ed' osa ja teisendab selle 'hädaks', millel on vale tähendus ja kirjavead.