Niniejsza praca magisterska jest odpowiedzią na problem postawiony przez Urząd Ochrony Konkurencji i Konsumentów, jakim było wykonanie oprogramowania wykorzystującego sztuczną inteligencję do analizy tekstowej wzorców umów stosowanych w obrocie konsumenckim pod kątem wyszukiwania niedozwolonych klauzul we wzorcach umów w relacji między klientem indywidualnym, a przedsiębiorstwem. W celu rozwiązania powyższego problemu wykorzystałam algorytm o nazwie: Maszyna wektorów nośnych lub maszyna wektorów podpierających (ang. Support Vector Machine, SVM).
Po zaimplementowaniu algorytmu maszyny wektorów nośnych jako klasyfikatora i wykorzystania go w celu przeanalizowania dostarczonych przez UOKiK danych, otrzymane wyniki, które ukazywały skuteczność estymatora na poziomie powyżej 80%. Sam algorytm okazał się dostatecznie dobrym narzędziem do rozwiązania tego typu problemów klasyfikacji. W kolejnych rozdziałach opiszę: sposób działania algorytmu maszyny wektorów nośnych, sposób adaptacji go do wybranego problemu klasyfikacji tekstowej oraz przedstawię otrzymane przeze mnie wyniki, jednocześnie zwracając uwagę na wpływ moich rezultatów na przyszłe prace badawcze, a także na możliwości rozwiązywania podobnych problemów oraz wpływu automatyzacji przetwarzania języka naturalnego na społeczeństwo.
This master’s thesis is a response to the problem posed by Urząd Ochrony Konkurencji I Konsumentów, which was the implementation of software using artificial intelligence for text analysis of contract templates used in consumer trade in terms for the detection of unfair terms in contract templates in the relationship between an individual client and a company. In order to solve the above problem, I used an algorithm called: Support Vector Machine (SVM).
After implementing the support vector machine algorithm as a classifier and using it to analyze the data provided by UOKiK, the obtained results showed the effectiveness of the estimator at the level of over 80%. The algorithm itself turned out to be a good enough tool to solve these types of classification problems. In the following chapters, I will describe: how the support vector machine algorithm works, how to adapt it to the selected problem of textual classification and I will present the results I obtained while paying attention to the impact of my results on future research, as well as the possibility of solving similar problems and the impact of processing automation. natural language on society.