Celem pracy dyplomowej jest przeprowadzenie analizy danych pochodzących z ogłoszeń sprzedaży nieruchomości we Włoszech, a także zastosowanie uczenia maszynowego do predykcji cen domów i mieszkań z wykorzystaniem narzędzi Spark oraz Microsoft Power BI.
Dzięki zastosowaniu narzędzi Microsoft Power BI oraz Spark przedstawiono jak ceny nieruchomości zmieniają się w czasie oraz jakie czynniki najbardziej wpływają na cenę włoskich nieruchomości. Dodatkowo zastosowano uczenie maszynowe do predykcji cen mieszkań we Włoszech. Przetestowano kilka algorytmów uczenia maszynowego, ale najlepszym z nich okazało się wzmocnienie gradientowe (ang. gradient boosting), które osiągnęło wynik około 82 procent.
The aim of the diploma thesis is to analyze data from the real estate market in Italy, as well as to apply machine learning algorithms to predict apartment prices using Spark and Microsoft Power BI technologies.
Thanks to the use of Microsoft Power BI and Spark tools, it was presented how prices change over time and what factors most influence the prices in the Italian real estate market. Additionally, machine learning was used to predict apartments’ prices in Italy. Several machine learning algorithms were tested, but gradient boosting proved to be the best, achieving a result of around 82 percent.