Predikce vývoje ceny ropy na základě textových zpravodajských informací
Název práce v češtině: | Predikce vývoje ceny ropy na základě textových zpravodajských informací |
---|---|
Název v anglickém jazyce: | Crude Oil Price Forecast based on Text News |
Klíčová slova: | předpověď, cena ropy, strojové učení, klasifikace textů, maxent |
Klíčová slova anglicky: | forecast, crude oil price, machine learning, text classification, maxent |
Akademický rok vypsání: | 2010/2011 |
Typ práce: | bakalářská práce |
Jazyk práce: | čeština |
Ústav: | Ústav formální a aplikované lingvistiky (32-UFAL) |
Vedoucí / školitel: | doc. RNDr. Ondřej Bojar, Ph.D. |
Řešitel: | skrytý - zadáno a potvrzeno stud. odd. |
Datum přihlášení: | 10.11.2010 |
Datum zadání: | 10.11.2010 |
Datum a čas obhajoby: | 18.06.2012 00:00 |
Datum odevzdání elektronické podoby: | 21.05.2012 |
Datum odevzdání tištěné podoby: | 25.05.2012 |
Datum proběhlé obhajoby: | 18.06.2012 |
Oponenti: | doc. Ing. Zdeněk Žabokrtský, Ph.D. |
Zásady pro vypracování |
Cílem bakalářské práce je navrhnout a implementovat systém, který na základě textové informace (finanční zpravodajství) bude predikovat následující vývoj ceny ropy. K tomuto úkolu budou použity techniky strojového učení (např. klasifikátor typu maximum entropy) a dostupná automatická jazyková analýza. Podstata práce spočívá v návrhu vhodných příznaků, které lze v textu automaticky vyhledat a které mají šanci přispět k úspěšnosti predikce. Ačkoli volba konkrétní úlohy, tj. predikce ceny ropy, není zcela zásadní, má nepochybně vliv na to, jaké příznaky budou užitečnější.
Nedílnou součástí práce je systém vyhodnotit na sebraném delším úseku vývoje cen ropy a archivu odpovídajících zpráv z předešlého období. Část těchto dat bude použita pro ruční návrh vhodných příznaků, trénování modelu a jeho předběžné vyhodnocení. Finální vyhodnocení však musí být provedeno na textech, které ani autor předtím nečetl. |
Seznam odborné literatury |
Zdeněk Žabokrtský, Ondřej Bojar: TectoMT, Developer's Guide. ÚFAL/CKL Technical Report TR-2008-38.
Christopher D. Manning, Hinrich Schütze. Foundations of Statistical Natural Language Processing. Cambridge, Mass.: MIT Press, 1999. |