Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Analýza biografických vyprávění pamětníků s užitím počítačové textové analýzy
Název práce v češtině: Analýza biografických vyprávění pamětníků s užitím počítačové textové analýzy
Název v anglickém jazyce: Analysis of biographical narratives using computer-assisted text analysis
Klíčová slova: metodologie, počítačová textová analýza, mnohorozměrné škálování, biografická analýza, normalizace, disidenti, komunističtí funkcionáři
Klíčová slova anglicky: methodology, computer-assisted text analysis, multidimensional scaling, biographical analysis, normalization, dissidents, Communist functionaries
Akademický rok vypsání: 2010/2011
Typ práce: diplomová práce
Jazyk práce: čeština
Ústav: Katedra sociologie (23-KS)
Vedoucí / školitel: doc. Mgr. Martin Hájek, Ph.D.
Řešitel: skrytý - zadáno vedoucím/školitelem
Datum přihlášení: 07.06.2011
Datum zadání: 07.06.2011
Datum a čas obhajoby: 25.06.2012 00:00
Místo konání obhajoby: Jinonice FSV ISS
Datum odevzdání elektronické podoby:17.05.2012
Datum proběhlé obhajoby: 25.06.2012
Oponenti: PhDr. Ing. Petr Soukup, Ph.D.
 
 
 
Zásady pro vypracování
Vymezení výzkumného problému a metoda zkoumání

Tématem diplomové práce bude využití počítačové textové analýzy (CATA) na přepisy biografických vyprávění tří skupin aktérů: disidentů, komunistických funkcionářů a „obyčejných lidí“. Rozhovory se zaměřují na život aktérů v Československu před rokem 1989. Autor zamýšlí v práci zejména demonstrovat využití metody počítačové textové analýzy v sociologii a nastínit specifika, možnosti a meze tohoto přístupu. To bude doplněno analýzou tří zmíněných textových korpusů.
Výsledkem analýzy bude identifikace klíčových slov konceptů a analýza jejich blízkosti skrze zkoumání frekvence spoluvýskytů těchto slov v rámci stanovené kontextové jednotky. Data budou následně zobrazena a analyzována pomocí metody mnohorozměrného škálování. Datová matice bude dále analyzována pomocí metody analýzy sítí (social network analysis), která umožňuje dané koncepty popsat pomocí dalších charakteristik.
V rámci analýzy budou nejprve určena klíčová slova s nejvyšší frekvencí výskytu (tj. frekvenční analýza, s užitím softwaru TextStat). Výběr slov bude zčásti arbitrární, neboť je třeba, aby do analýzy vstoupila pouze slova, která sama o sobě nesou význam. Bude vytvořen slovník pro každý korpus, kdy budou sloučeny různé tvary slov (např. pády) pod jeden koncept. Zároveň zde budou odděleny synonymní výrazy (např. stát jako podstatné jméno a stát jako sloveso).
Následně bude využit software COOA, který zjistí frekvence spoluvýskytů konceptů v rámci kontextové jednotky (např. odstavec). Výstupem bude datová matice, která bude dále statisticky zkoumána s užitím mnohorozměrného škálování (SPSS), případně analýzy sítí (např. UCINET).
Dalším cílem analýzy je pokusit se roztřídit koncepty do skupiny (např. aktéři vs. instituce). Tyto skupiny budou stanoveny na základě výsledků úvodní frekvenční analýzy všech tří korpusů. Skupiny je pak možné analyzovat buď společně (jeden výstup pro všechny koncepty s grafickým odlišením skupin), nebo odděleně (různé výstupy pro jednotlivé skupiny konceptů).
Cílem této analýzy je odhalit klíčové koncepty, které tvoří diskurs vyprávění o komunistickém režimu, a identifikovat rozdíly v uspořádání těchto konceptů u jednotlivých skupin aktérů. Metody síťové analýzy mají pomoci lépe odhadnout postavení těchto konceptů v rámci „diskursivních sítí“ a poukázat na centralitu postavení konceptů, tendenci vyskytovat se v různých kontextech či vytvářet významové clustery.


Současný stav poznání

Počítačová textová analýza je v současnosti doménou zejména korpusové lingvistiky a programování internetových vyhledávačů. V sociologii a jiných společenských vědách je tato analýza obvykle využívána v jednodušších formách a koncepty jsou zde často kódovány manuálně (např. v programu Atlas-ti). V poslední době využil pokročilejších a automatizovaných variant CATA Martin Hájek, vedoucí této práce, v rámci projektu Instituce v životních příbězích. Jeho data má v úmyslu analyzovat i tato diplomová práce. K tomu účelu Martin Hájek vyvinul i program COOA, který umožňuje tento způsob analýzy.
Seznam odborné literatury
ALEXA, Mellina. Computer-assisted text analysis methodology in the social sciences. ZUMA –Arbeitsbericht 97/07. Mannheim: ZUMA, 1997.
COX, Trevor F.; COX, Micheal A. A. Multidimensional Scaling. Boca Raton : Chapman & Hall/CRC, 2001. xi, 308 s. ISBN 1-58488-094-5.
HÁJEK, M. Proměny dimenze soukromého a veřejného v biografických vyprávěních pamětníků. In: Sborník z konference „1989-2009: Společnost. Dějiny. Politika“ A. Gjuričová (ed.). Praha, 2009.
HÁJEK, Martin. Počítačová textová analýza metodou sledování spoluvýskytů slov. Data a výzkum - SDA Info. 2010, 4, 1, s. 19-37.
Krippendorff, K. Content analysis: An introduction to its methodology. Thousand Oaks, CA: Sage, 2004.
MOHR, John W. 1998. Measuring Meaning Structures. Annual Review of Sociology, 1998, 24, s. 345–70.
NORUŠIS, Marija J. SPSS 14.0 advanced statistical procedures companion. Upper Saddle River : Prentice Hall : SPSS, 2005. xiii, 366 s. ISBN 0-13-174700-2.
POPPING, Roel. Computer-assisted Text Analysis. London : Sage, 2000. x, 229 s. ISBN 0-7619-5378-7.
ROBERTS, Carl W. Text Analysis for the Social Sciences : Methods for Drawing Statistical Inferences from Texts and Transcripts. Mahwah : Erlbaum, 1997. ix, 316 s. ISBN 0-8058-1734-4.
VANĚK, Miroslav. Obyčejní lidé--?! : pohled do života tzv. mlčící většiny : životopisná vyprávění příslušníků dělnických profesí a inteligence. Praha : Academia, 2009. 1304 s. ISBN 978-80-200-1791-8.
WEST, Mark D. Theory, Method, and Practice in Computer Content Analysis . Westport, Connecticut : Ablex Publishing, 2001. 199 s. Dostupné z WWW: <http://www.questia.com/PM.qst?a=o&d=102154188>. ISBN 1-56750-502-3.
Předběžná náplň práce
Předpokládaná struktura práce

1. Úvod
2. Metodologie počítačové textové analýzy
i. definice
ii. typy počítačové analýzy
iii. oblasti využití
iv. možnosti a meze využití metody v sociologii
3. Využití metody v praxi
i. definice problému
ii. sběr dat a jejich popis
4. Analytická část
5. Diskuze výsledků
6. Závěr
 
Univerzita Karlova | Informační systém UK