Experimentální validace metrik lexikální diverzity
Thesis title in Czech: | Experimentální validace metrik lexikální diverzity |
---|---|
Thesis title in English: | Validation of Measures of Lexical Diversity |
Key words: | lexikální diverzita|metriky lexikální diverzity|opakování experimentu|kvantitativní lingvistika |
English key words: | lexical diversity|metrics of lexical diversity|repetition of the experiment|quantitative linguistics |
Academic year of topic announcement: | 2021/2022 |
Thesis type: | Bachelor's thesis |
Thesis language: | čeština |
Department: | Institute of Linguistics (21-ULING) |
Supervisor: | PhDr. Jiří Milička, Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 02.11.2021 |
Date of assignment: | 02.11.2021 |
Administrator's approval: | not processed yet |
Confirmed by Study dept. on: | 03.01.2022 |
Date and time of defence: | 10.02.2022 10:00 |
Date of electronic submission: | 03.01.2022 |
Date of proceeded defence: | 10.02.2022 |
Submitted/finalized: | committed by student and finalized |
Opponents: | Mgr. Michal Láznička, Ph.D. |
Guidelines |
Lexikální diverzita se v lingvistice dotýká mnoha oblastí (např. výuka L1 i L2, diagnostika afázie, forenzní lingvistika, kvantitativní lingvistika obecně). Její hodnoty zjišťujeme pomocí mnoha tradičních metrik, jako je počet typů, interval opakování stejných slov, sémantické propojení slov apod. Tyto metriky byly zavedeny, aniž by se zkoumalo, jak korelují se subjektivním hodnocením lexikální diverzity. První externí subjektivní evaluaci validity těchto metrik tak uskutečnili američtí lingvisté Kristopher Kyle, Scott A. Crosley a Scott Jarvis teprve nedávno. V experimentu, který popisují v článku z března roku 2021, nechali respondenty ohodnotit lexikální diverzitu cca šesti set textů a jejich hodnocení porovnali s indexy vypočítanými již zmiňovanými tradičními metrikami. Téma lexikální diverzity a jejího měření od vydání článku v lingvistické komunitě velmi rezonuje. Cílem práce je zopakovat experiment Scotta Jarvise a kol. pro češtinu.
Postup práce bude následující: (i) výběr vhodných textů pro analýzu, (ii) oslovení respondentů a ohodnocení textů, (iii) vyhodnocení mezianotátorské shody (Jarvis a kol. v článku uvádějí vysokou shodu), (iv) výpočet hodnot tradičních indexů lexikální diverzity u ohodnocených textů, (v) porovnání výsledků pomocí Jarvisovy metodologie, vizualizace korelací na grafech. |
References |
Jarvis, S. (2013). Capturing the Diversity in Lexical Diversity: Lexical Diversity. Language Learning, 63, 87–106. https://doi.org/10.1111/j.1467-9922.2012.00739.x
Jarvis, S., & Daller, H. (Ed.). (2013). Vocabulary knowledge: Human ratings and automated measures. John Benjamins Publishing Company. Koizumi, R., & In’nami, Y. (2012). Effects of text length on lexical diversity measures: Using short texts with less than 200 tokens. System, 40(4), 554–564. doi:10.1016/j.system.2012.10.012 Kristopher Kyle, Scott A. Crossley & Scott Jarvis (2021). Assessing the Validity of Lexical Diversity Indices Using Direct Judgements, Language Assessment Quarterly, 18:2, 154-170, DOI: 10.1080/15434303.2020.1844205 McCarthy, P. M., & Jarvis, S. (2010). MTLD, vocd-D, and HD-D: A validation study of sophisticated approaches to lexical diversity assessment. Behavior Research Methods, 42(2), 381–392. doi:10.3758/BRM.42.2.381 Tweedie, F. J., & Baayen, R. H. (1998). How variable may a constant be? Measures of lexical richness in perspective. Computers and the Humanities, 32(5), 323–352. doi:10.1023/A:1001749303137 |