Témata prací (Výběr práce)

Váš prohlížeč nepodporuje JavaScript nebo je jeho podpora vypnutá. Některé funkce nemusejí být dostupné.

The individual textual profile: a corpus-based study of idiolect

Název práce v češtině:	Individuální textový profil: korpusově založený výzkum idiolektu
Název v anglickém jazyce:	The individual textual profile: a corpus-based study of idiolect
Klíčová slova:	Idiolekt, individuální textový profil, Obama, klíčová slova, korpusy
Klíčová slova anglicky:	Idiolect, individual textual profile, Obama, keywords, corpus, corpus-driven
Akademický rok vypsání:	2009/2010
Typ práce:	diplomová práce
Jazyk práce:	angličtina
Ústav:	Ústav anglického jazyka a didaktiky (21-UAJD)
Vedoucí / školitel:	doc. PhDr. Markéta Malá, Ph.D.
Řešitel:	skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení:	19.10.2010
Datum zadání:	19.10.2010
Schválení administrátorem:	zatím neschvalováno
Datum a čas obhajoby:	10.09.2012 00:00
Datum odevzdání elektronické podoby:	16.08.2012
Datum proběhlé obhajoby:	10.09.2012
Odevzdaná/finalizovaná:	odevzdaná studentem a finalizovaná
Oponenti:	prof. PhDr. Aleš Klégr

Zásady pro vypracování

Diplomová práce se zaměří na nepříliš probádanou oblast korpusové lingvistiky – identifikaci rysů idiolektu.Cíle práce jsou převážně metodologické: autor shromáždí dostatečně velký korpus projevů jednoho státníka (B. Obama) a pomocí korpusově založených metod popíše styl těchto projevů na pozadí referenčního korpusu. Prvním krokem budou metody typu „corpus-driven“, tj. autor bude přistupovat k textu bez předchozích hypotéz a prozkoumá specifické kolokace vyskytující se v korpusu. Bude studovat distribuci n-gramů, frekvenční data a klíčová slova v textu. Poznatky z této fáze výzkumu autorovi umožní vytipovat oblasti, které podrobněji popíše z hlediska kolokací („prozodie“) a disperze v textu (metody typu „corpus-based“). Dosavadní výzkum popsaný v literatuře naznačuje, že oba přístupy mohou přispět k popisu charakteristických rysů idiolektu. Čekáme, že klíčová slova odhalí (kromě vlastních jmen, která nejsou z hlediska idiolektu podstatná) statisticky významné gramatické výrazy (spojovací výrazy, modální slovesa ap.) a plnovýznamová slova, která pomohou formulovat dotazy pro druhou etapu zkoumání (lze očekávat např. individuální preference ve volbě intenzifikátorů a „hedges“). Studium n-gramů může odhalit specifické distribuční „vzorce“ obsahující jak lexikální tak gramatická slova. Z hlediska frekvenčního bude sledován také poměr lemat a počtu slov („type/token ratio“). Zatímco výsledkyprvní části práce budou převážně kvantitativní, druhá část se zaměří na funkční rozbor sledovaných jevů.I přes relativně malou velikost zkoumaného korpusu doufáme, že diplomová práce otestuje různé metody popisu idiolektu a poukáže na jejich širší aplikovatelnost, ale i omezení.

Seznam odborné literatury

Biber, D. (2006). University Language. A corpus-based study of spoken and written registers. Amsterdam and Philadelphia: John Benjamins Publishing Company.
Biber, D. et al. (1999). Longmann Grammar of Spoken and Written English. Harlow: Longman.
Biber, D., Barbieri, F. (2007). ‘Lexical bundles in university spoken and written registers.’ English for Specific Purposes, Vol 26, Issue 3, pp. 283-304 (2007)
Culpeper, J. (2009). ‘Keyness - Words, parts-of-speech and semantic categories in the character-talk of Shakespeare’s Romeo and Juliet.’ International Journal of Corpus Linguistics 14:1 (2009), 29–59.
Dunning, T. (1993). ‘Accurate methods for the statistics of surprise and coincidence.’ Computational Linguistics 19.1 (Mar. 1993), 61-74.
Baker, P., Hardie, A., McEnery, T. (2006). Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press. (In the text referred to as Glossary)
Haugen, E. (1972) [1960]. “From idiolect to language”. In E. Scherabon Firchow, K. Grimstad, N. Hasselmo & W. A. O’Neil (Eds.), Studies by Einar Haugen. Presented on the Occasion of his 65th Birthday. The Hague/Paris: Mouton, 415–421.
Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge: Cambridge University Press
Hunston, S. (2008). Starting with the small words – Patterns, lexis and semantic sequences. In International Journal of Corpus Linguistics 13:3 (2008), 271–295.
Lee, D. (2008). Corpora and discourse analysis. In Advances in Discourse Studies. Oxon: Routledge.
McEnery, T., Wilson, A. (2004). Corpus Linguistics: An Introduction. Edinburgh: Edinburgh University Press.
Manning, Christopher D., Schütze, H. (1999). Foundations of Statistical Natural Language Processing. Boston: MIT Press
Mollin, S. (2009). Sandra Mollin: “I entirely understand” is a Blairism - The methodology of identifying idiolectal collocations. In International Journal of Corpus Linguistics 14:3 (2009), 367–392.
Oakes, Michael P. (1998), Statistics for Corpus Linguistics. In International Journal of Applied Linguistics Volume 10, Issue 2, pages 269–274, December 2000
Quirk et al. (1985): Comprehensive Grammar of the English Langauge. New York: Longman.
Scott, M., Tribble, C. (2006). Textual Patterns – Key words and corpus analysis in language education. Amsterdam/Philadelphia: John Benjamins Publishing Company
Scott, M. (2010). Problems in investigating keyness, or clearing the undergrowth and marking out trails… In Keyness in Texts, ed. Marina Bondi and Mike Scott. Amsterdam/Philadelphia: John Benjamins Publishing Company
Semino, E. and Swindlehurst (1996) Metaphor and Mind Style in Ken Kesey's One Flew Over the Cuckoo's Nest. In Style, 30, 1, 143-166.
Stefanowitsch, A., Gries S. (2003). Collostructions: Investigating the Interaction of Words and Constructions. In International Journal of Corpus Linguistics 8:2 (2003), 209-243.
Stubbs, M. (2010). Three concepts of keywords. In Keyness in Texts, ed. Marina Bondi and Mike Scott. Amsterdam/Philadelphia: John Benjamins Publishing Company
Wierzbicka, A. (1997). Understanding cultures through their key words: English, Russian, Polish, German, and Japanese. New York: Oxford University Press.
Xiao, Z., McEnery, T. (2005): Two Approaches to Genre Analysis. In Journal of English Linguistics, Vol. 33 / No. 1, March 2005 62-82