Thesis (Selection of subject)Thesis (Selection of subject)(version: 368)
Thesis details
   Login via CAS
Srovnání nejfrekventovanějších lemmat v psané a mluvené češtině
Thesis title in Czech: Srovnání nejfrekventovanějších lemmat v psané a mluvené češtině
Thesis title in English: Comparison of the most frequent lemmas in written and spoken Czech
Key words: mluvený jazyk|psaný jazyk|korpusový výzkum|frekvence|lexikální analýza
English key words: spoken language|written language|corpus-based research|frequency|lexical analysis
Academic year of topic announcement: 2021/2022
Thesis type: diploma thesis
Thesis language: čeština
Department: Institute of Czech Language and Theory of Communication (21-UCJTK)
Supervisor: Mgr. Dominika Kováříková, M.A., Ph.D.
Author: hidden - assigned and confirmed by the Study Dept.
Date of registration: 06.04.2022
Date of assignment: 13.04.2022
Administrator's approval: not processed yet
Confirmed by Study dept. on: 02.09.2022
Date and time of defence: 06.02.2023 08:45
Date of electronic submission:28.12.2022
Date of proceeded defence: 06.02.2023
Submitted/finalized: committed by student and finalized
Opponents: doc. Mgr. Robert Adam, Ph.D.
 
 
 
Guidelines
Cílem diplomové práce je vyhledat, popsat a především srovnat nejfrekventovanější lemmata v korpusech psané a mluvené češtiny. Frekvenční špička (malá skupina nejfrekventovanějších lemmat) má vždy zcela zásadní podíl na textech v daném korpusu. Prvním úkolem bude tedy zjistit, jaké procento textů tvoří frekvenční špička (v tomto případě 25 nejfrekventovanějších lemmat) v korpusu neformální mluvené češtiny Ortofon a ve vyváženém korpusu současné psané češtiny SYN2020. Porovnání frekvenčních špiček přinese zajímavé poznatky o obou těchto typech textů; vzhledem k tomu, že jde převážně o funkční slova, bude třeba se zaměřit zvláště na to, jaké konkrétní funce v těchto textech nejčastěji plní (a tedy i jaké funkce je třeba naplňovat). Studentka bude mít za úkol zjistit, která lemmata se vyskytují na nejvyšších frekvenčních pozicích v obou typech textů a která jsou typická jen pro jeden z těchto typů. Nejběžnější významy a funkce těchto lemmat potom porovná s lexikografickým popisem v dostupných slovnících češtiny. Pokud to bude třeba, porovná také tři hlavní textové typy v rámci psané češtiny (beletrie, žurnalistika a oborové texty) a zjistí, zda se některý z nich od mluvené češtiny liší více (nebo méně) než ostatní. V teoretické části se studentka zaměří mj. na literaturu věnovanou základní slovní zásobě, a to včetně prakticky zaměřených publikací, jako jsou slovníky (alfabetické i frekvenční).
References
ADAMOVIČOVÁ, A.: Čeština v korpusech. In Přednášky z 60. běhu Letní školy slovanských studií. Praha: Filozofická fakulta UK, 2017, s. 44–60.
CVRČEK, V. a kol.: Mluvnice současné češtiny 1. Praha: Karolinum, 2015.
ČERMÁK, F.: Lexis in spoken and written language. Slovo a slovesnost 54, č. 3, 1993, s. 173–177.
ČERMÁK, F.: Frekvenční slovník mluvené češtiny. Praha: Karolinum, 2007.
ČERMÁK, F. – KŘEN M. a kol.: Frekvenční slovník češtiny. Praha: NLN, 2004.
ČERMÁKOVÁ, A. – KOPŘIVOVÁ, K.: Korpusový výzkum mluveného jazyka na příkladu češtiny a angličtiny: současný stav. Slovo a slovesnost 79, č. 3, 2018, s. 217–240.
ČERMÁKOVÁ, A. – JÍLKOVÁ, L. – KOMRSKOVÁ, Z. – KOPŘIVOVÁ, M. – POUKAROVÁ, P.: Diskurzní markery. In Hoffmannová, J. – Homoláč, J. – Mrázková, K. (eds.): Syntax mluvené češtiny. Praha: Academia, 2019, s. 244–351.
HOFFMANNOVÁ, J. a kol.: Stylistika mluvené a psané češtiny. Praha: Academia, 2016.
HOFFMANNOVÁ, J.: „Malá slova“ a jejich podíl na stylu mluvených projevů. Stylistyka 26, 2017, s. 173–181.
HOFFMANNOVÁ, J. – KOMRSKOVÁ, Z. – POUKAROVÁ, P.: Reprodukce řeči/myšlení v mluvených projevech jako předmět korpusového výzkumu. Korpus – gramatika – axiologie 15, 2017, s. 3–25.
JELÍNEK, J. – BEČKA, J. V. – TĚŠITELOVÁ, M.: Frekvence slov, slovních druhů a tvarů v českém jazyce. Praha: SPN, 1961.
KLIMEŠOVÁ, P. – KOMRSKOVÁ, Z. – KOPŘIVOVÁ, M. – LUKEŠ, D.: Slovo to v mluvených korpusech ČNK, jeho prefixace a reduplikace. Časopis pro moderní filologii 97, č. 1, 2015, s. 21–30.
KOPŘIVOVÁ, M. – WACLAWIČOVÁ, M. (eds.): Čeština v mluveném korpusu. Praha: NLN, 2008.
LEECH, G. – RAYSON, P. – WILSON, A.: Word Frequencies in Written and Spoken English: based on the British National Corpus. London: Longman, 2001.
MACKIEWICZ, J.: Volubility, Variation, and Most Frequent Words. In Mackiewicz, J.: Writing Center Talk over Time. New York: Routledge, 2018, s. 61–71.
MÜLLEROVÁ, O.: Výskyt a funkce slova no v českých textech prostě sdělovacího stylu. Stylistyka 5, 1996, s. 222–229.
NATION, P.: A study of the most frequent word families in the British National Corpus. In Bogaards, P. – Laufer, B. (eds.): Vocabulary in a Second Language: Selection, acquisition, and testing. Amsterdam: Benjamins, 2004, s. 3–13.
NATION, P. – WARING, R.: Vocabulary size, text coverage and word lists. In Schmitt, N. – McCarthy, M. (eds.): Vocabulary: Description, Acquisition and Pedagogy. Cambridge: Cambridge University, 1997, s. 6–19.
 
Charles University | Information system of Charles University | http://www.cuni.cz/UKEN-329.html