The individual textual profile: a corpus-based study of idiolect
Název práce v češtině: | Individuální textový profil: korpusově založený výzkum idiolektu |
---|---|
Název v anglickém jazyce: | The individual textual profile: a corpus-based study of idiolect |
Klíčová slova: | Idiolekt, individuální textový profil, Obama, klíčová slova, korpusy |
Klíčová slova anglicky: | Idiolect, individual textual profile, Obama, keywords, corpus, corpus-driven |
Akademický rok vypsání: | 2009/2010 |
Typ práce: | diplomová práce |
Jazyk práce: | angličtina |
Ústav: | Ústav anglického jazyka a didaktiky (21-UAJD) |
Vedoucí / školitel: | doc. PhDr. Markéta Malá, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 19.10.2010 |
Datum zadání: | 19.10.2010 |
Schválení administrátorem: | zatím neschvalováno |
Datum a čas obhajoby: | 10.09.2012 00:00 |
Datum odevzdání elektronické podoby: | 16.08.2012 |
Datum proběhlé obhajoby: | 10.09.2012 |
Odevzdaná/finalizovaná: | odevzdaná studentem a finalizovaná |
Oponenti: | prof. PhDr. Aleš Klégr |
Zásady pro vypracování |
Diplomová práce se zaměří na nepříliš probádanou oblast korpusové lingvistiky – identifikaci rysů idiolektu.Cíle práce jsou převážně metodologické: autor shromáždí dostatečně velký korpus projevů jednoho státníka (B. Obama) a pomocí korpusově založených metod popíše styl těchto projevů na pozadí referenčního korpusu. Prvním krokem budou metody typu „corpus-driven“, tj. autor bude přistupovat k textu bez předchozích hypotéz a prozkoumá specifické kolokace vyskytující se v korpusu. Bude studovat distribuci n-gramů, frekvenční data a klíčová slova v textu. Poznatky z této fáze výzkumu autorovi umožní vytipovat oblasti, které podrobněji popíše z hlediska kolokací („prozodie“) a disperze v textu (metody typu „corpus-based“). Dosavadní výzkum popsaný v literatuře naznačuje, že oba přístupy mohou přispět k popisu charakteristických rysů idiolektu. Čekáme, že klíčová slova odhalí (kromě vlastních jmen, která nejsou z hlediska idiolektu podstatná) statisticky významné gramatické výrazy (spojovací výrazy, modální slovesa ap.) a plnovýznamová slova, která pomohou formulovat dotazy pro druhou etapu zkoumání (lze očekávat např. individuální preference ve volbě intenzifikátorů a „hedges“). Studium n-gramů může odhalit specifické distribuční „vzorce“ obsahující jak lexikální tak gramatická slova. Z hlediska frekvenčního bude sledován také poměr lemat a počtu slov („type/token ratio“). Zatímco výsledkyprvní části práce budou převážně kvantitativní, druhá část se zaměří na funkční rozbor sledovaných jevů.I přes relativně malou velikost zkoumaného korpusu doufáme, že diplomová práce otestuje různé metody popisu idiolektu a poukáže na jejich širší aplikovatelnost, ale i omezení. |
Seznam odborné literatury |
Biber, D. (2006). University Language. A corpus-based study of spoken and written registers. Amsterdam and Philadelphia: John Benjamins Publishing Company. Biber, D. et al. (1999). Longmann Grammar of Spoken and Written English. Harlow: Longman. Biber, D., Barbieri, F. (2007). ‘Lexical bundles in university spoken and written registers.’ English for Specific Purposes, Vol 26, Issue 3, pp. 283-304 (2007) Culpeper, J. (2009). ‘Keyness - Words, parts-of-speech and semantic categories in the character-talk of Shakespeare’s Romeo and Juliet.’ International Journal of Corpus Linguistics 14:1 (2009), 29–59. Dunning, T. (1993). ‘Accurate methods for the statistics of surprise and coincidence.’ Computational Linguistics 19.1 (Mar. 1993), 61-74. Baker, P., Hardie, A., McEnery, T. (2006). Glossary of Corpus Linguistics. Edinburgh: Edinburgh University Press. (In the text referred to as Glossary) Haugen, E. (1972) [1960]. “From idiolect to language”. In E. Scherabon Firchow, K. Grimstad, N. Hasselmo & W. A. O’Neil (Eds.), Studies by Einar Haugen. Presented on the Occasion of his 65th Birthday. The Hague/Paris: Mouton, 415–421. Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge: Cambridge University Press Hunston, S. (2008). Starting with the small words – Patterns, lexis and semantic sequences. In International Journal of Corpus Linguistics 13:3 (2008), 271–295. Lee, D. (2008). Corpora and discourse analysis. In Advances in Discourse Studies. Oxon: Routledge. McEnery, T., Wilson, A. (2004). Corpus Linguistics: An Introduction. Edinburgh: Edinburgh University Press. Manning, Christopher D., Schütze, H. (1999). Foundations of Statistical Natural Language Processing. Boston: MIT Press Mollin, S. (2009). Sandra Mollin: “I entirely understand” is a Blairism - The methodology of identifying idiolectal collocations. In International Journal of Corpus Linguistics 14:3 (2009), 367–392. Oakes, Michael P. (1998), Statistics for Corpus Linguistics. In International Journal of Applied Linguistics Volume 10, Issue 2, pages 269–274, December 2000 Quirk et al. (1985): Comprehensive Grammar of the English Langauge. New York: Longman. Scott, M., Tribble, C. (2006). Textual Patterns – Key words and corpus analysis in language education. Amsterdam/Philadelphia: John Benjamins Publishing Company Scott, M. (2010). Problems in investigating keyness, or clearing the undergrowth and marking out trails… In Keyness in Texts, ed. Marina Bondi and Mike Scott. Amsterdam/Philadelphia: John Benjamins Publishing Company Semino, E. and Swindlehurst (1996) Metaphor and Mind Style in Ken Kesey's One Flew Over the Cuckoo's Nest. In Style, 30, 1, 143-166. Stefanowitsch, A., Gries S. (2003). Collostructions: Investigating the Interaction of Words and Constructions. In International Journal of Corpus Linguistics 8:2 (2003), 209-243. Stubbs, M. (2010). Three concepts of keywords. In Keyness in Texts, ed. Marina Bondi and Mike Scott. Amsterdam/Philadelphia: John Benjamins Publishing Company Wierzbicka, A. (1997). Understanding cultures through their key words: English, Russian, Polish, German, and Japanese. New York: Oxford University Press. Xiao, Z., McEnery, T. (2005): Two Approaches to Genre Analysis. In Journal of English Linguistics, Vol. 33 / No. 1, March 2005 62-82 |