Srovnání nejfrekventovanějších lemmat v psané a mluvené češtině
Thesis title in Czech: | Srovnání nejfrekventovanějších lemmat v psané a mluvené češtině |
---|---|
Thesis title in English: | Comparison of the most frequent lemmas in written and spoken Czech |
Key words: | mluvený jazyk|psaný jazyk|korpusový výzkum|frekvence|lexikální analýza |
English key words: | spoken language|written language|corpus-based research|frequency|lexical analysis |
Academic year of topic announcement: | 2021/2022 |
Thesis type: | diploma thesis |
Thesis language: | čeština |
Department: | Institute of Czech Language and Theory of Communication (21-UCJTK) |
Supervisor: | Mgr. Dominika Kováříková, M.A., Ph.D. |
Author: | hidden - assigned and confirmed by the Study Dept. |
Date of registration: | 06.04.2022 |
Date of assignment: | 13.04.2022 |
Administrator's approval: | not processed yet |
Confirmed by Study dept. on: | 02.09.2022 |
Date and time of defence: | 06.02.2023 08:45 |
Date of electronic submission: | 28.12.2022 |
Date of proceeded defence: | 06.02.2023 |
Submitted/finalized: | committed by student and finalized |
Opponents: | doc. Mgr. Robert Adam, Ph.D. |
Guidelines |
Cílem diplomové práce je vyhledat, popsat a především srovnat nejfrekventovanější lemmata v korpusech psané a mluvené češtiny. Frekvenční špička (malá skupina nejfrekventovanějších lemmat) má vždy zcela zásadní podíl na textech v daném korpusu. Prvním úkolem bude tedy zjistit, jaké procento textů tvoří frekvenční špička (v tomto případě 25 nejfrekventovanějších lemmat) v korpusu neformální mluvené češtiny Ortofon a ve vyváženém korpusu současné psané češtiny SYN2020. Porovnání frekvenčních špiček přinese zajímavé poznatky o obou těchto typech textů; vzhledem k tomu, že jde převážně o funkční slova, bude třeba se zaměřit zvláště na to, jaké konkrétní funce v těchto textech nejčastěji plní (a tedy i jaké funkce je třeba naplňovat). Studentka bude mít za úkol zjistit, která lemmata se vyskytují na nejvyšších frekvenčních pozicích v obou typech textů a která jsou typická jen pro jeden z těchto typů. Nejběžnější významy a funkce těchto lemmat potom porovná s lexikografickým popisem v dostupných slovnících češtiny. Pokud to bude třeba, porovná také tři hlavní textové typy v rámci psané češtiny (beletrie, žurnalistika a oborové texty) a zjistí, zda se některý z nich od mluvené češtiny liší více (nebo méně) než ostatní. V teoretické části se studentka zaměří mj. na literaturu věnovanou základní slovní zásobě, a to včetně prakticky zaměřených publikací, jako jsou slovníky (alfabetické i frekvenční). |
References |
ADAMOVIČOVÁ, A.: Čeština v korpusech. In Přednášky z 60. běhu Letní školy slovanských studií. Praha: Filozofická fakulta UK, 2017, s. 44–60. CVRČEK, V. a kol.: Mluvnice současné češtiny 1. Praha: Karolinum, 2015. ČERMÁK, F.: Lexis in spoken and written language. Slovo a slovesnost 54, č. 3, 1993, s. 173–177. ČERMÁK, F.: Frekvenční slovník mluvené češtiny. Praha: Karolinum, 2007. ČERMÁK, F. – KŘEN M. a kol.: Frekvenční slovník češtiny. Praha: NLN, 2004. ČERMÁKOVÁ, A. – KOPŘIVOVÁ, K.: Korpusový výzkum mluveného jazyka na příkladu češtiny a angličtiny: současný stav. Slovo a slovesnost 79, č. 3, 2018, s. 217–240. ČERMÁKOVÁ, A. – JÍLKOVÁ, L. – KOMRSKOVÁ, Z. – KOPŘIVOVÁ, M. – POUKAROVÁ, P.: Diskurzní markery. In Hoffmannová, J. – Homoláč, J. – Mrázková, K. (eds.): Syntax mluvené češtiny. Praha: Academia, 2019, s. 244–351. HOFFMANNOVÁ, J. a kol.: Stylistika mluvené a psané češtiny. Praha: Academia, 2016. HOFFMANNOVÁ, J.: „Malá slova“ a jejich podíl na stylu mluvených projevů. Stylistyka 26, 2017, s. 173–181. HOFFMANNOVÁ, J. – KOMRSKOVÁ, Z. – POUKAROVÁ, P.: Reprodukce řeči/myšlení v mluvených projevech jako předmět korpusového výzkumu. Korpus – gramatika – axiologie 15, 2017, s. 3–25. JELÍNEK, J. – BEČKA, J. V. – TĚŠITELOVÁ, M.: Frekvence slov, slovních druhů a tvarů v českém jazyce. Praha: SPN, 1961. KLIMEŠOVÁ, P. – KOMRSKOVÁ, Z. – KOPŘIVOVÁ, M. – LUKEŠ, D.: Slovo to v mluvených korpusech ČNK, jeho prefixace a reduplikace. Časopis pro moderní filologii 97, č. 1, 2015, s. 21–30. KOPŘIVOVÁ, M. – WACLAWIČOVÁ, M. (eds.): Čeština v mluveném korpusu. Praha: NLN, 2008. LEECH, G. – RAYSON, P. – WILSON, A.: Word Frequencies in Written and Spoken English: based on the British National Corpus. London: Longman, 2001. MACKIEWICZ, J.: Volubility, Variation, and Most Frequent Words. In Mackiewicz, J.: Writing Center Talk over Time. New York: Routledge, 2018, s. 61–71. MÜLLEROVÁ, O.: Výskyt a funkce slova no v českých textech prostě sdělovacího stylu. Stylistyka 5, 1996, s. 222–229. NATION, P.: A study of the most frequent word families in the British National Corpus. In Bogaards, P. – Laufer, B. (eds.): Vocabulary in a Second Language: Selection, acquisition, and testing. Amsterdam: Benjamins, 2004, s. 3–13. NATION, P. – WARING, R.: Vocabulary size, text coverage and word lists. In Schmitt, N. – McCarthy, M. (eds.): Vocabulary: Description, Acquisition and Pedagogy. Cambridge: Cambridge University, 1997, s. 6–19. |