Identification of locational influence on real property values using data mining methods

Autor: Michael Barry, Andrew Hunter, Edson Augusto Melanda
Rok vydání: 2016
Předmět:
Zdroj: Cybergeo (2016)
ISSN: 1278-3366
DOI: 10.4000/cybergeo.27493
Popis: The value of real estate is an important matter for municipal authorities, since property tax is one of their main budget sources. Its estimation tends to be a complex process, owing to the diversity of factors affecting it. One of those factors is property location, which embraces the geographic relationship between the property and the surrounding local amenities. Hedonic modelling is frequently applied to estimate the value of a property; to consider the influence of property location within such models, the region under analysis is usually divided into homogeneous areas. This division can introduce a bias (a particular vision) related to the modifiable areal unit problem. Our intent in this paper is to apply data mining techniques to address a possible valuer bias, a particular valuer’s vision, in the current City of Calgary assessment model. Employing the decision tree technique, one locational attribute (Sub-Neighbourhood) was represented by the (x, y) coordinates of the properties, with approximately 96% correct classification with respect to their City of Calgary sub-neighbourhood designation. By adopting the regression tree technique, we show that it is possible to explain approximately 73% variability of the Sale Price attribute, using only the attribute Sub-Neighbourhood or the (x, y) coordinates as input. In general, the results showed a consistent relationship between property value and location. Additionally, the sale price patterns of actual properties do not conform strictly to the politico-administrative units adopted by the city. Those patterns usually cross the unit boundaries limits or are mixed inside a unit. Our results suggest that using a property’s spatial coordinates, instead of political-administrative subdivisions, to express its location, would lead to more accurate results and not incur the possibility of bias. La valeur de l'immobilier est une question importante pour les autorités municipales, puisque l'impôt foncier est une de leurs principales sources budgétaires. Son estimation est un processus complexe, en raison de la diversité des facteurs qui l'affectent. Un de ces facteurs est l'emplacement de la propriété, qui englobe la relation géographique entre l'établissement et les commodités environnantes. La modélisation hédonique est fréquemment utilisée pour estimer la valeur d'une propriété, en mesurant l'influence de l'emplacement de la propriété. La région étudiée est habituellement divisée en zones homogènes. Cette division peut introduire un biais (une vision particulière) lié au problème de l'unité territoriale modifiable. Notre intention dans cet article est d'appliquer des techniques d'exploration de données pour répondre à un possible biais expert, (une vision d’expert particulier), dans le modèle actuel d'évaluation de la ville de Calgary. Selon la technique d'arbre de décision, un attribut de localisation (sous-quartier) représenté par les coordonnées (x, y) des propriétés correspond à environ 96% de classifications correctes par rapport à leur désignation parmi les sous-quartiers de Calgary. En adoptant la technique des arbres de régression, nous montrons qu'il est possible d'expliquer environ 73% de variabilité de l'attribut prix de vente, en utilisant uniquement l'attribut sous-quartier ou le (x, y) des coordonnées en entrée. En général, les résultats ont montré une relation cohérente entre la valeur de la propriété et l'emplacement. Cependant, la configuration des prix des propriétés réelles ne correspond pas strictement aux unités politico-administratives adoptées par la ville. Ces structures recoupent parfois les limites des unités administratives ou sont mélangées à l'intérieur d'une unité. Nos résultats suggèrent que l'utilisation des coordonnées d'une propriété spatiale, au lieu des subdivisions politico-administratives, pour rendre compte de son emplacement, conduirait à des résultats plus précis sans encourir le risque de partialité.
Databáze: OpenAIRE