Tématem práce je extrakce částí dokumentů, které co nejvíce charakterizují jejich obsah. Nemá však jít o izolovaná klíčová slova (nebo krátká slovní spojení), nýbrž o celé věty, které tak mohou tvořit jakýsi abstrakt dokumentu. Úspěšné zpracování tohoto tématu spočívá v nastudování problematiky, dále v implementaci a aplikaci vybraných metod, včetně jejich vyhodnocení.
Seznam odborné literatury
Inderjeet Mani: Automatic Summarization. John Benjamins, 2001.
Dragomir R. Radev, Vasileios Hatzivassiloglou, Kathleen R. McKeown: A Description of the CIDR System as Used for TDT-2. 1999.