Bioinformatyka jest interdyscyplinarną dziedziną wykorzystującą wiedzę z zakresu biologii wspieraną przez metody matematyczne oraz obliczeniowe w celu lepszego zrozumienia danych biologicznych, które często przez swoją objętość oraz złożoność potrafią stanowić analityczne wyzwanie. Niniejsza praca skoncentrowana jest na zastosowaniu głębokich sieci neuronowych
w celu analizy sekwencji DNA, w szczególności skupiając się na badaniu intensywności wiązania czynników transkrypcyjnych mających kluczową rolę w procesach takich jak ekspresja genów czy replikacja chromosomów. Badania prowadzone w tym zakresie mogą w przyszłości pomóc w zwalczaniu chorób oraz znajdowaniu ich przyczyny. Na potrzeby pracy stworzono i przetestowano różne architektury modeli na danych z eksperymentów mikromacierzy PBM,
które pochodzą z konkursu ”DREAM5 – TF-DNA Motif Recognition Challenge”. Pozwoliło to na odpowiednie zwalidowanie i porównanie skuteczności zaproponowanych modeli sieci neuronowych z klasycznymi metodami uczenia maszynowego zastosowanymi przez uczestników konkursu.
Bioinformatics is an interdisciplinary field that uses knowledge in the field of biology supported by mathematical and computational methods in order to better understand biological data, which can often be an analytical challenge due to the volume and complexity. This work focuses on the use of deep neural networks to analyze DNA sequences, in particular focusing on the binding intensity of transcription factors that play a key role in processes such as gene expression and chromosome replication. Research in this area may help in the future to fight diseases and find their root causes. For the purposes of the study, various model architectures were created and tested on data from PBM microarray experiments, which come from the „DREAM5 – TF-DNA Motif Recognition Challenge” competition. This allowed for the proper validation and comparison of the effectiveness of proposed neural network models with the classic machine learning methods used by the competition participants.