Vědecké publikace (články v časopisech, příspěvky na konferencích) ale také např. agenturní zprávy bývají často při vydání opatřeny několika klíčovými slovy, které velice stručně charakterizují jejich obsah nebo pouze oblast, které se týkají. Většinou bývají přiřazeny autorem nebo editorem publikace. V případě, že chybí, se můžeme pokusit přiřadit je automaticky na základě statistické analýzy dokumentu nebo celé kolekce. Úspěšné zpracování tohoto tématu spočívá v nastudování problematiky, aplikace vybraných metod a jejich vyhodnocení.
Seznam odborné literatury
Anette Hulth, Automatic Keyword Extraction: Combining Machine Learning and Natural Language Processing, 2008, VDM Verlag, Saarbrucken, Germany