Jurnal Internasional Komputasi produk vektor matriks jarang menggunakan kernel berbasis blok tanpa nol padding pada prosesor dengan instruksi AVX-512

Download Jurnal Disini

Produk matriks-vektor jarang (SpMV) adalah operasi fundamental dalam banyak aplikasi ilmiah dari berbagai bidang. Komunitas High Performance Computing (HPC) telah terus-menerus menginvestasikan banyak upaya untuk menyediakan kernel SpMV yang efisien pada arsitektur CPU modern. Meskipun telah terbukti bahwa kernel berbasis blok membantu untuk mencapai kinerja tinggi, mereka sulit digunakan dalam praktek karena padding nol yang mereka butuhkan. Dalam makalah ini, kami mengusulkan kernel baru menggunakan set instruksi AVX-512, yang memungkinkan untuk menggunakan skema pemblokiran tanpa nol padding dalam penyimpanan memori matriks. Kami mendeskripsikan format matriks sparse berbasis masker dan kernel SpMV mereka yang sesuai sangat dioptimalkan dalam bahasa assembly. Mempertimbangkan bahwa ukuran pemblokiran yang optimal bergantung pada matriks, kami juga menyediakan metode untuk memprediksi kernel terbaik yang akan digunakan menggunakan interpolasi sederhana dari hasil dari eksekusi sebelumnya. Kami membandingkan kinerja pendekatan kami dengan kernel CSR MKL Intel dan paket open source CSR5 pada satu set matriks benchmark standar. Kami menunjukkan bahwa kami dapat mencapai peningkatan yang signifikan dalam banyak kasus, baik untuk berurutan maupun untuk eksekusi paralel. Akhirnya, kami menyediakan kode yang sesuai di pustaka sumber terbuka, yang disebut SPC5.

Download Jurnal Disini
Jurnal

Komputasi produk vektor matriks jarang menggunakan kernel berbasis blok tanpa nol padding pada prosesor dengan instruksi AVX-512

Leave a reply "Jurnal Internasional Komputasi produk vektor matriks jarang menggunakan kernel berbasis blok tanpa nol padding pada prosesor dengan instruksi AVX-512"

Author: 
    author