velikost textu

Atribuce autorství básnických textů

Upozornění: Informace získané z popisných dat či souborů uložených v Repozitáři závěrečných prací nemohou být použity k výdělečným účelům nebo vydávány za studijní, vědeckou nebo jinou tvůrčí činnost jiné osoby než autora.
Název:
Atribuce autorství básnických textů
Název v angličtině:
Authorship Attribution of Poetic Texts
Typ:
Disertační práce
Autor:
Mgr. Petr Plecháč, Ph.D.
Školitel:
doc. Mgr. Václav Cvrček, Ph.D.
Oponenti:
Mgr. Jiří Milička, Ph.D.
Ján Mačutek
Id práce:
168801
Fakulta:
Filozofická fakulta (FF)
Pracoviště:
Ústav českého národního korpusu (21-UCNK)
Program studia:
Filologie (P7310)
Obor studia:
Matematická lingvistika (XMLI)
Přidělovaný titul:
Ph.D.
Datum obhajoby:
21. 11. 2019
Výsledek obhajoby:
Prospěl/a
Jazyk práce:
Čeština
Klíčová slova:
atribuce autorství|stylometrie|versologie|strojové učení|korpusová lingvistika
Klíčová slova v angličtině:
authorship attribution|stylometry|versification|machine learning|corpus linguistics
Abstrakt:
Název práce: Atribuce autorství básnických textů Autor: Mgr. Petr Plecháč, Ph.D. Katedra: Ústav českého národního korpusu Školitel: doc. Mgr. Václav Cvrček, Ph.D. ABSTRAKT Pro rozpoznávání autorství básnických textů nabízí současná stylometrie řadu metod za- ložených na analýze pestré škály textových rysů (např. frekvence slov, frekvence zna- kových n-gramů). Jeden podstatný aspekt těchto textů ovšem zůstává stranou, a to jejich stránka versologická. Tato práce proto na čtyřech korpusech básnických textů (českých, německých, španělských a anglických) analyzuje, do jaké míry lze versologické charakte- ristiky – jako např. četnosti rytmických konfigurací nebo četnosti různých typů rýmů – využít jako indikátor autorství básnického textu. Ukazujeme, že (1) úspěšnost versolo- gických modelů vysoce převyšuje hranici random baseline, (2) ojediněle převyšuje úspěšnost obvyklých lexikálních modelů a (3) kombinované versologicko-lexikální mode- ly vykazují téměř vždy vyšší úspěšnost než jednotlivé modely samy o sobě. V další části práce jsou versologické rysy využity pro atribuci dvou textů se sporným autorstvím: (1) veršované drama The Famous History of the Life of King Henry the Eigth poprvé otištěné pod jménem Williama Shakespeara, u nějž se ovšem před-pokládá i autorská účast Johna Fletchera, příp. dalších autorů a (2) básně publikované pod jménem Josefa Baráka, u nichž existuje hypotéza, že jejich skutečným autorem je Jan Neruda. KLÍČOVÁ SLOVA atribuce autorství, stylometrie, versologie, strojové učení, korpusová lingvistika
Abstract v angličtině:
Title: Authorship Attribution of Poetic Texts Author: Mgr. Petr Plecháč, Ph.D. Department: Institute of Czech National Corpus Supervisor: doc. Mgr. Václav Cvrček, Ph.D. ABSTRACT Contemporary stylometry offers a number of methods for authorship recognition of po- etic texts based on a variety of textual features (e.g. word frequencies, frequencies of character n-grams). However, it seems that one important aspect of these texts has been rather left aside – this aspect is versification. The thesis uses four corpora of poetic texts (Czech, German, Spanish, and English) in order to analyze to what extent versification features – such as frequencies of rhythmic patterns or frequencies of various types of rhymes – may be used as an indicator of authorship. We show that (1) versification-based models significantly outperform the random baseline, (2) in some cases versification- based models even outperform the traditionally used lexical models, (3) in most of the cases combination of both types of models outperforms the given models alone. Versifi- cation features are consequently employed for the purpose of attribution of two texts of doubted authorship: (1) the versified play The Famous History of the Life of King Henry the Eigth which was originally published under the name of William Shakespeare, but where many suppose that some parts were actually written by John Fletcher or even other authors, and (2) poems published under the name of Josef Barák where there is a hypothesis that their real author is Jan Neruda. KEYWORDS authorship attribution, stylometry, versification, machine learning, corpus linguistics
Dokumenty
Stáhnout Dokument Autor Typ Velikost
Stáhnout Text práce Mgr. Petr Plecháč, Ph.D. 9.93 MB
Stáhnout Abstrakt v českém jazyce Mgr. Petr Plecháč, Ph.D. 33 kB
Stáhnout Abstrakt anglicky Mgr. Petr Plecháč, Ph.D. 33 kB
Stáhnout Autoreferát / teze disertační práce Mgr. Petr Plecháč, Ph.D. 2.58 MB
Stáhnout Posudek vedoucího doc. Mgr. Václav Cvrček, Ph.D. 71 kB
Stáhnout Posudek oponenta Mgr. Jiří Milička, Ph.D. 193 kB
Stáhnout Posudek oponenta Ján Mačutek 523 kB
Stáhnout Záznam o průběhu obhajoby doc. RNDr. Vladimír Petkevič, CSc. 161 kB