Algorytmy sztucznej inteligencji pozwalają na rozwiązywanie złożonych i pracochłonnych
zadań oraz usprawniając istniejące procesy decyzyjne. W poniższej pracy sprawdzono, czy przy
użyciu metod uczenia maszynowego oraz głębokiego można zautomatyzować proces
generalizacji reprezentacji prognozy pogody. Celem pracy było opracowanie algorytmu, który
na podstawie wartości parametrów meteorologicznych przypisze obserwacji kod ikony pogody
najlepiej obrazującej warunki pogodowe.
Pierwsze podejście do problemu klasyfikacji obejmowało sformułowanie reguł klasyfikacji
oraz wytrenowanie trzech modeli uczenia maszynowego – określającego występowanie burzy,
mgły oraz stopnia natężenia opadu. Drugi sposób zakładał wytrenowanie jednego modelu,
określającego kod stanu pogody (odpowiadający reprezentacji graficznej) obejmujący
wszystkie zjawiska modelowane w pierwszym podejściu. W tym celu skorzystano z metody
uczenia głębokiego – sieci neuronowej
Przy modelowaniu zjawisk burzy oraz mgły sprawdzono pięć algorytmów uczenia
maszynowego. W obu zagadnieniach najwyższą dokładność oraz stabilność predykcji
wykazały modele gradient boostingu. Przy modelowaniu występowania mgły charakterystyka
modelu była nieco słabsza, co wskazuje na większą złożoność tego zjawiska względem burzy.
Wieloklasowy problem kategoryzacji względem intensywności opadów okazał się
najtrudniejszy do poprawnego modelowania – jedynie model maszyny wektorów nośnych
z wystarczającą dokładnością przypisywał obserwacje do klasy odpowiadającej najwyższej
intensywności, jednak ogólną mocą predykcyjną ustępował modelowi gradient boostingu.
Celem poprawy jakości predykcji zasugerowano wykorzystanie połączenia tych dwóch modeli.
W drugim podejściu wykorzystano model sztucznej sieci neuronowej o architekturze
wielowarstwowego perceptronu. Wyuczona sieć charakteryzowała się dobrą wartością
dokładności predykcji. Sprawdzono także, czy dołączenie informacji wyniesionych z modelu
uczenia nienadzorowanego może mieć korzystny wpływ na proces uczenia oraz na skuteczność
sieci neuronowej.
Przeprowadzone modelowanie i analiza wyników pokazały, że na podstawie danych
z przypisanymi klasami jest możliwe utworzenie algorytmu, który trafnie przypisze obserwację
do odpowiedniej klasy korzystając zarówno z metod uczenia maszynowego, jak i z uczenia
głębokiego. Podejście zakładające wyuczenie oddzielnych modeli do modelowania
pojedynczych zjawisk okazało się być odporne na braki w reprezentacji danej klasy w danych,
w przeciwieństwie do sieci neuronowej, która do całościowej klasyfikacji stanu pogody
wymaga odpowiednio licznej reprezentacji każdej z docelowych klas. Wyniki i wnioski
przedstawione w pracy mogą pomóc przy przygotowaniu modelu (modeli) nauczonych
i operujących na danych z numerycznej prognozy pogody, które następnie mogą zostać
wykorzystane w dostarczeniu graficznej, uogólnionej prognozy pogody.
Artificial intelligence algorithms allow to solve complex and time-consuming tasks and improve existing decision-making processes. In this thesis, it was verified whether the process of generalization of weather forecast representation can be automated using machine learning and deep learning methods. The aim of this study was to develop an algorithm that, based on the values of meteorological parameters, assigns an observation a weather icon code which best represents the weather conditions.
The first approach to the classification problem was to define classification rules and to train three machine learning models – determining the occurrence of storm, fog and the precipitation intensity. The second way was to train a single model, defining the weather condition code (corresponding to the graphical representation) covering all the phenomena from the first approach. For this purpose, the deep learning method, a neural network, was used.
To model the phenomena of storm and fog, five machine learning algorithms were tested. In both cases, the highest accuracy and stability of prediction was demonstrated by the gradient boosting models. In the case of modelling the occurrence of fog, the characteristics of the model were slightly lower, which indicates a higher complexity of this phenomenon in comparison to the storm.
The multi-class classification of precipitation intensity turned out to be the most difficult to model accurately – only the support vector machine model assigned the observations to the class corresponding to the highest intensity with sufficient accuracy, but considering the overall predictive power the gradient boosting model outperformed the SVM model. In order to improve the quality of prediction, a combination of these two models was suggested.
In the second approach, an artificial neural network model of a multilayer perceptron architecture was used. The trained network was characterized by a good value of prediction accuracy. It was also checked whether the addition of information obtained from the unsupervised learning model may have had a beneficial effect on the learning process and the effectiveness of the neural network.
The analysis of the results proved that, using the training data with assigned classes, it is possible to create an algorithm that will accurately assign an observation to the appropriate class using both machine learning and deep learning methods.
The approach consisted of learning separate models for modelling individual phenomena turned out to be resistant to deficiencies in the representation of a given class in the data, in contrast to the neural network, which requires a sufficiently large representation of each of the target classes in order to completely classify the weather condition.
The results and conclusions presented in this thesis may support the development of the model operating on the data from the numerical weather forecast, which further may be used to provide with a graphical, generalized weather forecast.