Real estate price modelling with a focus on location attributes
Modelování cen nemovitostí se zaměřením na vlastnosti lokality
diplomová práce (OBHÁJENO)
Zobrazit/ otevřít
Trvalý odkaz
http://hdl.handle.net/20.500.11956/121317Identifikátory
SIS: 213877
Kolekce
- Kvalifikační práce [17123]
Autor
Vedoucí práce
Oponent práce
Hejlová, Hana
Fakulta / součást
Fakulta sociálních věd
Obor
Ekonomie a finance
Katedra / ústav / klinika
Institut ekonomických studií
Datum obhajoby
16. 9. 2020
Nakladatel
Univerzita Karlova, Fakulta sociálních vědJazyk
Angličtina
Známka
Výborně
Klíčová slova (česky)
ceny bydlení, strojové učení, hedonický model, prostorová analýza, geograficky vážená regreseKlíčová slova (anglicky)
housing prices, machine learning, hedonic price model, spatial analysis, geographically weighted regressionPráce představuje několik metod modelování cen nemovitostí vhodných pro predikci cen bydlení nebo pro zkoumání vztahů mezi cenou a jejími určujícími faktory. Srovnali jsme konvenční lineární regresi se stromovými metodami strojového učení. Srovnávací analýza datové sady 28 019 bytů v Praze naznačuje, že regresní stromy (zejména náhodné lesy) poskytují vyšší přesnost při predikci cen. Dalším cílem této práce bylo prozkoumat účinky vlastností lokality (zejména její dostupnost a kvalita životního prostředí) na ceny blízkých bytů. K řešení prostorových interakcí v geografických datech jsme použili tři prostorově orientované modely, abychom dosáhli spolehlivějších výsledků. Lokální analýza provedená s geograficky váženou regresí odhalila prostorové interakce a popsala rozdílnost cenových faktorů v závislosti na lokalitě. V některých oblastech je zvýšení vzdálenosti od nejbližší stanice metra a nejbližšího parku spojeno se snížením cen bytů o 644 Kč/m2 a 916 Kč/m2 . Tato zjištění jsou zvláště důležitá pro byty v blízkosti stanic nové linky metra, která je v současné době ve výstavbě.
The thesis introduces several methods of real estate price modelling suitable either for prediction of the housing prices or for exploring the relationships between the price and its determinants. We compared the conventional linear regression approach to the tree-based methods of machine learning. The comparison analysis on the dataset of 28 019 apartments in Prague suggests that regression trees (especially the Random forest) yield a higher accuracy in the price prediction. Another objective was to examine the effects of location attributes (especially its accessibility and environmental quality) on the prices of nearby apartments. To address the spatial interactions in the geographical data, we employed three spatially conscious models to achieve more reliable results. The local analysis performed with the geographically weighted regression confirmed the presence of spatial heterogeneity and described the price effects relative to the location. In some areas, an increase of 100 meters in distance from the nearest metro station and the nearest park are associated with a decrease in the apartment prices by 644 CZK/m2 and 916 CZK/m2 , respectively. These findings are especially important for the apartments near the stations of the new metro line, which is currently in construction.