Jurnal Internasional Pemilihan template CDR non-H3 dalam pemodelan antibodi melalui pembelajaran mesin

Download Jurnal Disini

Antibodi adalah protein yang dihasilkan oleh sistem imun adaptif untuk mengenali dan menangkal sejumlah besar patogen melalui pengikatan spesifik. Ikatan adaptif ini dimediasi oleh keanekaragaman struktural dalam enam loop daerah penentu komplementer (CDR) (H1, H2, H3, L1, L2 dan L3), yang juga membuat pemodelan struktural akurat dari tantangan CDR. Kedua pendekatan pemodelan homologi dan de novo telah digunakan; sampai saat ini, yang pertama telah mencapai akurasi yang lebih besar untuk loop non-H3. Pemodelan homologi CDR non-H3 lebih akurat karena loop CDR non-H3 dengan panjang dan jenis yang sama dapat dikelompokkan ke dalam beberapa kluster struktural. Sebagian besar suite pemodelan antibodi menggunakan pemodelan homologi untuk CDR non-H3, hanya berbeda dalam algoritma penyelarasan dan bagaimana / jika mereka menggunakan cluster struktural. Sementara RosettaAntibody dan SAbPred tidak secara eksplisit menetapkan urutan CDR kueri untuk cluster, dua pendekatan lain, PIGS dan Kotai Antibody Builder, menggunakan aturan berbasis urutan untuk menetapkan urutan CDR ke cluster. Sementara aturan urutan yang dikuratori secara manual dapat mengidentifikasi template struktural yang lebih baik, karena kurasi mereka membutuhkan pencarian literatur yang luas dan upaya manusia, mereka tertinggal di belakang pengendapan struktur antibodi baru dan jarang diperbarui. Dalam penelitian ini, kami mengusulkan pendekatan pembelajaran mesin (Gradient Boosting Machine [GBM]) untuk mempelajari kelompok struktural CDR non-H3 dari urutan saja. Metode GBM menyederhanakan pemilihan fitur dan dapat dengan mudah mengintegrasikan data baru, dibandingkan dengan kurasi aturan urutan manual. Kami membandingkan hasil klasifikasi menggunakan metode GBM dengan RosettaAntibody dalam skema 3-repeat 10-fold cross-validation (CV) pada database antibodi cluster-beranotasi PyIgClassify dan kami mengamati peningkatan akurasi klasifikasi loop terkait dari 84,5% ± 0,24% hingga 88,16% ± 0,056%. Model GBM mengurangi kesalahan dalam kesalahan klasifikasi keanggotaan klaster spesifik ketika kelompok yang terlibat memiliki data yang relatif berlimpah. Berdasarkan faktor-faktor yang diidentifikasi, kami menyarankan metode yang dapat memperkaya kelas struktural dengan data jarang untuk lebih meningkatkan akurasi prediksi dalam studi masa depan.

Download Jurnal Disini
Jurnal

Pemilihan template CDR non-H3 dalam pemodelan antibodi melalui pembelajaran mesin