Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Experimentální validace metrik lexikální diverzity
Thesis title in Czech: Experimentální validace metrik lexikální diverzity
Thesis title in English: Validation of Measures of Lexical Diversity
Key words: lexikální diverzita|metriky lexikální diverzity|opakování experimentu|kvantitativní lingvistika
English key words: lexical diversity|metrics of lexical diversity|repetition of the experiment|quantitative linguistics
Academic year of topic announcement: 2021/2022
Thesis type: Bachelor's thesis
Thesis language: čeština
Department: Institute of Linguistics (21-ULING)
Supervisor: PhDr. Jiří Milička, Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 02.11.2021
Date of assignment: 02.11.2021
Administrator's approval: not processed yet
Confirmed by Study dept. on: 03.01.2022
Date and time of defence: 10.02.2022 10:00
Date of electronic submission:03.01.2022
Date of proceeded defence: 10.02.2022
Submitted/finalized: committed by student and finalized
Opponents: Mgr. Michal Láznička, Ph.D.
 
 
 
Guidelines
Lexikální diverzita se v lingvistice dotýká mnoha oblastí (např. výuka L1 i L2, diagnostika afázie, forenzní lingvistika, kvantitativní lingvistika obecně). Její hodnoty zjišťujeme pomocí mnoha tradičních metrik, jako je počet typů, interval opakování stejných slov, sémantické propojení slov apod. Tyto metriky byly zavedeny, aniž by se zkoumalo, jak korelují se subjektivním hodnocením lexikální diverzity. První externí subjektivní evaluaci validity těchto metrik tak uskutečnili američtí lingvisté Kristopher Kyle, Scott A. Crosley a Scott Jarvis teprve nedávno. V experimentu, který popisují v článku z března roku 2021, nechali respondenty ohodnotit lexikální diverzitu cca šesti set textů a jejich hodnocení porovnali s indexy vypočítanými již zmiňovanými tradičními metrikami. Téma lexikální diverzity a jejího měření od vydání článku v lingvistické komunitě velmi rezonuje. Cílem práce je zopakovat experiment Scotta Jarvise a kol. pro češtinu.
Postup práce bude následující: (i) výběr vhodných textů pro analýzu, (ii) oslovení respondentů a ohodnocení textů, (iii) vyhodnocení mezianotátorské shody (Jarvis a kol. v článku uvádějí vysokou shodu), (iv) výpočet hodnot tradičních indexů lexikální diverzity u ohodnocených textů, (v) porovnání výsledků pomocí Jarvisovy metodologie, vizualizace korelací na grafech.
References
Jarvis, S. (2013). Capturing the Diversity in Lexical Diversity: Lexical Diversity. Language Learning, 63, 87–106. https://doi.org/10.1111/j.1467-9922.2012.00739.x
Jarvis, S., & Daller, H. (Ed.). (2013). Vocabulary knowledge: Human ratings and automated measures. John Benjamins Publishing Company.
Koizumi, R., & In’nami, Y. (2012). Effects of text length on lexical diversity measures: Using short texts with less than 200 tokens. System, 40(4), 554–564. doi:10.1016/j.system.2012.10.012
Kristopher Kyle, Scott A. Crossley & Scott Jarvis (2021). Assessing the Validity of Lexical Diversity Indices Using Direct Judgements, Language Assessment Quarterly, 18:2, 154-170, DOI: 10.1080/15434303.2020.1844205
McCarthy, P. M., & Jarvis, S. (2010). MTLD, vocd-D, and HD-D: A validation study of sophisticated approaches to lexical diversity assessment. Behavior Research Methods, 42(2), 381–392. doi:10.3758/BRM.42.2.381
Tweedie, F. J., & Baayen, R. H. (1998). How variable may a constant be? Measures of lexical richness in perspective. Computers and the Humanities, 32(5), 323–352. doi:10.1023/A:1001749303137
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html