Jurnal Internasional Random Forest sebagai kerangka kerja generik untuk pemodelan prediktif dari variabel spasial dan spatio-temporal

Download Jurnal Disini

Hutan acak dan teknik Machine Learning serupa sudah digunakan untuk menghasilkan prediksi spasial, tetapi lokasi spasial poin (geografi) sering diabaikan dalam proses pemodelan. Korelasi otomatis spasial, terutama jika masih ada dalam residu lintas-validasi, menunjukkan bahwa prediksi mungkin bias, dan ini suboptimal. Makalah ini menyajikan hutan acak untuk kerangka prediksi spasial (RFsp) di mana jarak penyangga dari titik pengamatan digunakan sebagai variabel penjelas, sehingga menggabungkan efek kedekatan geografis ke dalam proses prediksi. Kerangka RFsp diilustrasikan dengan contoh-contoh yang menggunakan dataset buku teks dan menerapkan prediksi spasial dan spatio-temporal ke numerik, biner, kategori, multivariat dan spatiotemporal variabel. Kinerja kerangka RFsp dibandingkan dengan teknik kriging state-of-the-art menggunakan 5 kali lipat lintas-validasi dengan refitting. Hasilnya menunjukkan bahwa RFsp dapat memperoleh prediksi yang sama akurat dan tidak bias sebagai versi kriging yang berbeda. Keuntungan menggunakan RFsp atas kriging adalah bahwa ia tidak memerlukan asumsi statistik yang kaku tentang distribusi dan stasioneritas dari variabel target, itu lebih fleksibel untuk menggabungkan, menggabungkan dan memperluas kovariat dari berbagai jenis, dan mungkin menghasilkan peta yang lebih informatif yang mencirikan kesalahan prediksi . RFsp tampaknya sangat menarik untuk membangun model prediksi spasial multivariat yang dapat digunakan sebagai 'mesin pengetahuan' di berbagai bidang geosains. Beberapa kelemahan RFsp adalah intensitas komputasi yang tumbuh secara eksponensial dengan peningkatan data kalibrasi dan kovariat, sensitivitas prediksi untuk memasukkan kualitas data dan masalah ekstrapolasi. Kunci keberhasilan kerangka RFsp mungkin adalah kualitas data pelatihan – terutama kualitas sampling spasial (untuk meminimalkan masalah ekstrapolasi dan semua jenis bias dalam data), dan kualitas validasi model (untuk memastikan bahwa akurasi tidak dipengaruhi oleh overfitting ). Untuk banyak set data, terutama yang memiliki lebih sedikit jumlah poin dan kovariat serta hubungan dekat-ke-linear, geostatistik berbasis model masih dapat menghasilkan prediksi yang lebih akurat daripada RFsp.

Download Jurnal Disini
Jurnal

Random Forest sebagai kerangka kerja generik untuk pemodelan prediktif dari variabel spasial dan spatio-temporal

Leave a reply "Jurnal Internasional Random Forest sebagai kerangka kerja generik untuk pemodelan prediktif dari variabel spasial dan spatio-temporal"

Author: 
    author