Pembelajaran mesin adalah satu set kaedah yang digunakan untuk membuat program komputer yang boleh belajar dari pemerhatian dan membuat ramalan. Pembelajaran mesin menggunakan algoritma, regresi, dan sains yang berkaitan untuk memahami data. Algoritma ini secara umumnya boleh dianggap sebagai model dan rangkaian statistik.
Pembelajaran yang mendalam adalah subset kaedah pembelajaran mesin. Data dikutip melalui pelbagai lapisan rangkaian pembelajaran mendalam supaya rangkaian dapat membuat kesimpulan dan membuat keputusan mengenai data. Kaedah pembelajaran mendalam membolehkan ketepatan yang besar pada dataset besar, tetapi ciri-ciri ini membuat pembelajaran mendalam lebih banyak sumber-intensif daripada pembelajaran mesin klasik.
Selama beberapa dekad, pembelajaran mesin telah digunakan sebagai satu kaedah untuk mencapai kecerdasan buatan dalam mesin. Pada terasnya, bidang pembelajaran mesin difokuskan pada mewujudkan komputer yang boleh belajar dan membuat keputusan, yang menjadikan pembelajaran mesin sesuai dengan penyelidikan kecerdasan buatan. Walau bagaimanapun, tidak semua model pembelajaran mesin dimaksudkan untuk membangunkan kecerdasan buatan "benar" yang sempurna atau melebihi kecerdasan manusia. Sebaliknya, model sering direka untuk meneliti masalah tertentu dan terhad.
Pembelajaran yang mendalam dicadangkan pada peringkat awal perbincangan pembelajaran mesin, tetapi beberapa penyelidik mengejar kaedah pembelajaran yang mendalam kerana keperluan pengkomputeran dalam pembelajaran jauh lebih besar daripada pembelajaran mesin klasik. Walau bagaimanapun, kekuatan komputer komputasi telah meningkat dengan pesat sejak tahun 2000, yang membolehkan penyelidik membuat peningkatan besar dalam pembelajaran mesin dan pembinaan kecerdasan buatan. Oleh kerana model pembelajaran mendalam berskala dengan data yang meningkat, pembelajaran mendalam mempunyai potensi untuk mengatasi halangan penting dalam mewujudkan kecerdasan buatan sejati.
Pembelajaran mesin dan pengajaran mendalam adalah kedua algoritma. Dalam pembelajaran mesin klasik, penyelidik menggunakan jumlah data yang agak kecil dan menentukan ciri-ciri yang paling penting dalam data yang diperlukan oleh algoritma untuk membuat ramalan. Kaedah ini dipanggil kejuruteraan ciri. Contohnya, jika program pembelajaran mesin diajar untuk mengenali imej kapal terbang, para pengaturcara akan membuat algoritma yang membolehkan program mengenali bentuk, warna, dan saiz biasa kapal terbang komersil. Dengan maklumat ini, program pembelajaran mesin akan membuat ramalan sama ada imej itu dibentangkan dengan kapal terbang yang termasuk.
Pembelajaran mendalam secara umum dibezakan daripada pembelajaran mesin klasik oleh banyak lapisan membuat keputusan. Rangkaian pembelajaran mendalam sering dianggap sebagai "kotak hitam" kerana data dikutip melalui pelbagai lapisan rangkaian yang masing-masing membuat pemerhatian. Ini dapat membuat keputusan lebih sukar difahami daripada hasil pembelajaran mesin klasik. Bilangan lapisan yang tepat atau langkah dalam membuat keputusan bergantung kepada jenis dan kerumitan model yang dipilih.
Pembelajaran mesin secara tradisinya menggunakan dataset kecil dari mana untuk belajar dan membuat ramalan. Dengan sedikit data, penyelidik dapat menentukan ciri-ciri yang tepat yang akan membantu program pembelajaran mesin memahami dan belajar dari data. Walau bagaimanapun, jika program itu berjalan pada maklumat yang tidak dapat dikelaskan berdasarkan algoritma yang sedia ada, para penyelidik biasanya perlu menganalisis data bermasalah secara manual dan mencipta ciri baru. Oleh karena itu, pembelajaran mesin klasik tidak biasanya menyebar dengan baik dengan jumlah data yang besar, tetapi dapat meminimalkan kesalahan pada dataset yang lebih kecil.
Pembelajaran yang mendalam sangat sesuai untuk dataset besar, dan model sering memerlukan dataset besar untuk menjadi berguna. Oleh kerana kerumitan rangkaian pembelajaran mendalam, rangkaian memerlukan sejumlah besar data latihan dan data tambahan untuk menguji rangkaian selepas latihan. Pada masa ini penyelidik menyempurnakan rangkaian pembelajaran mendalam yang boleh menjadi lebih cekap dan menggunakan dataset yang lebih kecil.
Pembelajaran mesin mempunyai keperluan prestasi komputer yang berubah-ubah. Terdapat banyak model yang boleh dijalankan pada komputer peribadi purata. Semakin tinggi kaedah statistik dan matematik mendapat, semakin sukar bagi komputer untuk memproses data dengan cepat.
Pembelajaran yang mendalam cenderung sangat berintensifkan sumber. Mengasingkan maklumat yang banyak melalui pelbagai lapisan membuat keputusan memerlukan banyak kuasa pengiraan. Apabila komputer menjadi lebih cepat, pembelajaran mendalam semakin mudah diakses.
Secara tradisional, pembelajaran mesin mempunyai beberapa batasan yang lazim dan signifikan. Berlebihan adalah masalah statistik yang dapat mempengaruhi algoritma pembelajaran mesin. Algoritma pembelajaran mesin mengandungi sejumlah "ralat" apabila menganalisis dan meramalkan data. Algoritma ini sepatutnya menunjukkan hubungan antara pembolehubah yang berkaitan, tetapi dalam overfitting, ia mula menangkap ralat juga, yang membawa kepada model "noisier" atau tidak tepat. Model pembelajaran mesin juga boleh menjadi berat sebelah ke arah kegairahan data yang mereka telah dilatih, suatu masalah yang amat jelas apabila penyelidik melatih algoritma pada keseluruhan dataset yang ada dan bukannya menyimpan sebahagian daripada data untuk menguji algoritma terhadap.
Pembelajaran yang mendalam mempunyai kesulitan statistik yang sama seperti pembelajaran mesin klasik, serta beberapa isu unik. Bagi banyak masalah, tidak ada data yang tersedia untuk melatih rangkaian pembelajaran yang cukup tepat. Ia sering kos-larangan atau tidak mungkin untuk mengumpulkan lebih banyak data atau mensimulasikan masalah dunia nyata, yang menghadkan pelbagai topik semasa pembelajaran yang mendalam dapat digunakan untuk.
Pembelajaran mesin dan pembelajaran mendalam kedua-duanya menerangkan kaedah mengajar komputer untuk belajar dan membuat keputusan. Pembelajaran yang mendalam adalah subset pembelajaran mesin klasik, dan beberapa penyelewengan penting membuat pembelajaran mendalam dan pembelajaran mesin yang sesuai untuk aplikasi yang berlainan.