Experimentální validace metrik lexikální diverzity
Název práce v češtině: | Experimentální validace metrik lexikální diverzity |
---|---|
Název v anglickém jazyce: | Validation of Measures of Lexical Diversity |
Klíčová slova: | lexikální diverzita|metriky lexikální diverzity|opakování experimentu|kvantitativní lingvistika |
Klíčová slova anglicky: | lexical diversity|metrics of lexical diversity|repetition of the experiment|quantitative linguistics |
Akademický rok vypsání: | 2021/2022 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Ústav obecné lingvistiky (21-ULING) |
Vedoucí / školitel: | PhDr. Jiří Milička, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 02.11.2021 |
Datum zadání: | 02.11.2021 |
Schválení administrátorem: | zatím neschvalováno |
Datum potvrzení stud. oddělením: | 03.01.2022 |
Datum a čas obhajoby: | 10.02.2022 10:00 |
Datum odevzdání elektronické podoby: | 03.01.2022 |
Datum proběhlé obhajoby: | 10.02.2022 |
Odevzdaná/finalizovaná: | odevzdaná studentem a finalizovaná |
Oponenti: | Mgr. Michal Láznička, Ph.D. |
Zásady pro vypracování |
Lexikální diverzita se v lingvistice dotýká mnoha oblastí (např. výuka L1 i L2, diagnostika afázie, forenzní lingvistika, kvantitativní lingvistika obecně). Její hodnoty zjišťujeme pomocí mnoha tradičních metrik, jako je počet typů, interval opakování stejných slov, sémantické propojení slov apod. Tyto metriky byly zavedeny, aniž by se zkoumalo, jak korelují se subjektivním hodnocením lexikální diverzity. První externí subjektivní evaluaci validity těchto metrik tak uskutečnili američtí lingvisté Kristopher Kyle, Scott A. Crosley a Scott Jarvis teprve nedávno. V experimentu, který popisují v článku z března roku 2021, nechali respondenty ohodnotit lexikální diverzitu cca šesti set textů a jejich hodnocení porovnali s indexy vypočítanými již zmiňovanými tradičními metrikami. Téma lexikální diverzity a jejího měření od vydání článku v lingvistické komunitě velmi rezonuje. Cílem práce je zopakovat experiment Scotta Jarvise a kol. pro češtinu.
Postup práce bude následující: (i) výběr vhodných textů pro analýzu, (ii) oslovení respondentů a ohodnocení textů, (iii) vyhodnocení mezianotátorské shody (Jarvis a kol. v článku uvádějí vysokou shodu), (iv) výpočet hodnot tradičních indexů lexikální diverzity u ohodnocených textů, (v) porovnání výsledků pomocí Jarvisovy metodologie, vizualizace korelací na grafech. |
Seznam odborné literatury |
Jarvis, S. (2013). Capturing the Diversity in Lexical Diversity: Lexical Diversity. Language Learning, 63, 87–106. https://doi.org/10.1111/j.1467-9922.2012.00739.x
Jarvis, S., & Daller, H. (Ed.). (2013). Vocabulary knowledge: Human ratings and automated measures. John Benjamins Publishing Company. Koizumi, R., & In’nami, Y. (2012). Effects of text length on lexical diversity measures: Using short texts with less than 200 tokens. System, 40(4), 554–564. doi:10.1016/j.system.2012.10.012 Kristopher Kyle, Scott A. Crossley & Scott Jarvis (2021). Assessing the Validity of Lexical Diversity Indices Using Direct Judgements, Language Assessment Quarterly, 18:2, 154-170, DOI: 10.1080/15434303.2020.1844205 McCarthy, P. M., & Jarvis, S. (2010). MTLD, vocd-D, and HD-D: A validation study of sophisticated approaches to lexical diversity assessment. Behavior Research Methods, 42(2), 381–392. doi:10.3758/BRM.42.2.381 Tweedie, F. J., & Baayen, R. H. (1998). How variable may a constant be? Measures of lexical richness in perspective. Computers and the Humanities, 32(5), 323–352. doi:10.1023/A:1001749303137 |