Jurnal Internasional Pemilihan template CDR non-H3 dalam pemodelan antibodi melalui pembelajaran mesin

Download Jurnal Disini

Antibodi adalah protein yang dihasilkan oleh sistem kekebalan adaptif untuk mengenali dan menangkal sejumlah besar patogen melalui pengikatan spesifik. Pengikatan adaptif ini dimediasi oleh keragaman struktural dalam enam loop penentu komplementer (CDR) loop (H1, H2, H3, L1, L2 dan L3), yang juga membuat pemodelan struktural yang akurat dari CDR menantang. Kedua pendekatan homologi dan de novo telah digunakan; sampai saat ini, yang pertama telah mencapai akurasi yang lebih besar untuk loop non-H3. Performa yang lebih baik dari pemodelan homologi pada CDR non-H3 adalah karena sebagian besar loop CDR non-H3 dengan panjang dan jenis yang sama dapat dikelompokkan ke dalam beberapa gugus struktural. Kebanyakan suite pemodelan antibodi memanfaatkan pemodelan homologi untuk CDR non-H3, hanya berbeda dalam algoritma penyelarasan dan bagaimana / jika mereka menggunakan gugus struktural. Sementara RosettaAntibody dan SAbPred tidak secara eksplisit menetapkan urutan CDR query ke cluster, dua pendekatan lainnya, PIGS dan Kotai Antibody Builder, memanfaatkan aturan berbasis-urutan untuk menetapkan urutan CDR ke cluster. Sementara aturan urutan yang dikuratori secara manual dapat mengidentifikasi kerangka struktural yang lebih baik, karena kurasi mereka membutuhkan pencarian literatur yang luas dan upaya manusia, mereka tertinggal di belakang pengendapan struktur antibodi baru dan jarang diperbarui. Dalam studi ini, kami mengusulkan pendekatan pembelajaran mesin (Gradient Boosting Machine [GBM]) untuk mempelajari kelompok struktural CDR non-H3 dari urutan saja. Kami berpendapat metode GBM memberikan kesederhanaan dalam pemilihan fitur dan integrasi langsung data baru dibandingkan dengan kurasi aturan urutan manual. Kami membandingkan hasil klasifikasi menggunakan metode GBM dengan RosettaAntibody dalam skema lintas-validasi berulang 3 kali lipat pada database antibodi klaster-beranotasi PyIgClassify dan kami mengamati peningkatan dalam akurasi klasifikasi dari 78,8 ± 0,2% menjadi 85,1 ± 0,2%. Kami menemukan model GBM dapat mengurangi kesalahan dalam misclassifications keanggotaan klaster tertentu jika cluster yang terlibat memiliki data yang relatif melimpah. Berdasarkan faktor yang diidentifikasi, kami menyarankan metode yang dapat memperkaya kelas struktural dengan data yang jarang dapat lebih meningkatkan ketepatan prediksi dalam studi masa depan.

Download Jurnal Disini
Jurnal

Pemilihan template CDR non-H3 dalam pemodelan antibodi melalui pembelajaran mesin