Protein interaction prediction on PHI networks using graph convolution networks

Autor: Koca, Mehmet Burak, Karadeniz, İlknur, Nourani, Esmaeil, Sevilgen, Fatih Erdoğan
Přispěvatelé: Işık Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Işık University, Faculty of Engineering, Department of Computer Engineering, Karadeniz, İlknur
Jazyk: turečtina
Rok vydání: 2021
Předmět:
Popis: Proteinler yaşamsal faaliyetlerin gerçekleşmesinde kritik rol oynayan biyolojik moleküllerdir. Konak canlı proteinleri ile patojen proteinleri arasındaki etkileşimler patojenkonak etkileşim (PHI) ağlarını oluşturmaktadır. Bu iki parçalı etkileşim ağları patojenin hangi yaşamsal faaliyetleri etkilediğini belirlemede ve dolayısıyla sebep olabileceği hastalıkların tespitinde büyük öneme sahiptir. Proteinler arası etkileşimlerin laboratuvar ortamında tespiti hem zaman alıcı hem de maliyetlidir. Deneysel olarak saptanabilen etkileşim sayısının kısıtlı olması ve bazı etkileşimlerin gözden kaçması hesaplamalı tahmin yöntemlerinin geliştirilmesine önayak olmaktadır. Bu çalışmada PHI ağlarında protein etkileşim tahmini yapmayı sağlayan çizge evrişim ağı (GCN) tabanlı bir yöntem sunulmaktadır. Gözetimsiz olarak eğitilen GCN modeli (GraphSAGE) topolojik bilginin yanı sıra temel öznitelik olarak amino asit dizilimlerini kullanmaktadır. Bu çalışma bildiğimiz kadarıyla PHI ağlarında GCN tabanlı etkileşim tahmini sağlayan ilk çalışmadır. Deneysel sonuçlar geliştirilen modelin kıyaslama için kullanılan PHI veri seti üzerinde yüksek performanslı algoritmalardan %10 daha iyi performans göstererek %96 oranında doğrulukla etkileşim tahmini yaptığını göstermektedir. Proteins are biological molecules that play a critical role in vital biological processes. Interactions between pathogen proteins and host proteins form pathogen-host interaction (PHI) networks. These bipartite interaction networks have great importance in determining which vital activities are affected by the pathogen and the diseases it may cause. Experimental detection of the protein interactions in wet labs is both timeconsuming and costly. The limited number of experimentally detectable interactions and overlook of some potential interactions lead to development of computational methods. In this study, a graph convolution network (GCN) based method is presented that enables to predict protein-protein interactions in PHI networks. The unsupervised trained GCN model (GraphSAGE) uses amino acid sequences as node features as well as the topological information. This is the first study to the best of our knowledge which provides GCN models to do protein-protein interaction prediction in PHI networks. The experimental results show that the developed model performs 10% better than the state-of-art algorithms on the benchmark PHI dataset and it predicts interactions with 96% accuracy. Publisher's Version
Databáze: OpenAIRE