Témata prací (Výběr práce)Témata prací (Výběr práce)(verze: 368)
Detail práce
   Přihlásit přes CAS
Predikce vývoje ceny ropy na základě textových zpravodajských informací
Název práce v češtině: Predikce vývoje ceny ropy na základě textových zpravodajských informací
Název v anglickém jazyce: Crude Oil Price Forecast based on Text News
Klíčová slova: předpověď, cena ropy, strojové učení, klasifikace textů, maxent
Klíčová slova anglicky: forecast, crude oil price, machine learning, text classification, maxent
Akademický rok vypsání: 2010/2011
Typ práce: bakalářská práce
Jazyk práce: čeština
Ústav: Ústav formální a aplikované lingvistiky (32-UFAL)
Vedoucí / školitel: doc. RNDr. Ondřej Bojar, Ph.D.
Řešitel: skrytý - zadáno a potvrzeno stud. odd.
Datum přihlášení: 10.11.2010
Datum zadání: 10.11.2010
Datum a čas obhajoby: 18.06.2012 00:00
Datum odevzdání elektronické podoby:21.05.2012
Datum odevzdání tištěné podoby:25.05.2012
Datum proběhlé obhajoby: 18.06.2012
Oponenti: doc. Ing. Zdeněk Žabokrtský, Ph.D.
 
 
 
Zásady pro vypracování
Cílem bakalářské práce je navrhnout a implementovat systém, který na základě textové informace (finanční zpravodajství) bude predikovat následující vývoj ceny ropy. K tomuto úkolu budou použity techniky strojového učení (např. klasifikátor typu maximum entropy) a dostupná automatická jazyková analýza. Podstata práce spočívá v návrhu vhodných příznaků, které lze v textu automaticky vyhledat a které mají šanci přispět k úspěšnosti predikce. Ačkoli volba konkrétní úlohy, tj. predikce ceny ropy, není zcela zásadní, má nepochybně vliv na to, jaké příznaky budou užitečnější.

Nedílnou součástí práce je systém vyhodnotit na sebraném delším úseku vývoje cen ropy a archivu odpovídajících zpráv z předešlého období. Část těchto dat bude použita pro ruční návrh vhodných příznaků, trénování modelu a jeho předběžné vyhodnocení. Finální vyhodnocení však musí být provedeno na textech, které ani autor předtím nečetl.
Seznam odborné literatury
Zdeněk Žabokrtský, Ondřej Bojar: TectoMT, Developer's Guide. ÚFAL/CKL Technical Report TR-2008-38.

Christopher D. Manning, Hinrich Schütze. Foundations of Statistical Natural Language Processing. Cambridge, Mass.: MIT Press, 1999.

 
Univerzita Karlova | Informační systém UK