Kedua-dua pembelajaran dalam dan peneguhan sangat dikaitkan dengan kekuatan pengkomputeran kecerdasan buatan (AI). Mereka adalah fungsi pembelajaran mesin autonomi yang membuka jalan bagi komputer untuk mewujudkan prinsip mereka sendiri dalam menghasilkan penyelesaian. Kedua-dua jenis pembelajaran ini mungkin juga wujud bersama dalam beberapa program. Umumnya, pembelajaran mendalam menggunakan data semasa semasa pembelajaran penguatkuasaan menggunakan kaedah percubaan dan kesalahan dalam memikirkan ramalan. Perbincangan berikut akan menerangkan perbezaan tersebut.
Pembelajaran yang mendalam juga dikenali sebagai pembelajaran berstruktur yang mendalam atau pembelajaran hierarki. Ini pertama kali diperkenalkan pada tahun 1986 oleh Rina Dechter, profesor sains komputer. Ia menggunakan maklumat semasa dalam algoritma pengajaran untuk mencari corak berkaitan yang penting dalam data ramalan. Sistem sedemikian menggunakan pelbagai peringkat rangkaian saraf tiruan yang serupa dengan solek neuron otak manusia. Dengan bantuan pautan kompleks, algoritma mungkin dapat memproses berjuta-juta maklumat dan zon pada ramalan yang lebih spesifik.
Pembelajaran semacam ini boleh digunakan apabila pemaju akan mahukan perisian untuk melihat warna ungu pada pelbagai gambar. Program ini kemudian akan diberi makan dengan beberapa imej (oleh itu, pembelajaran "mendalam") dengan dan tanpa warna violet. Melalui clustering, program ini akan dapat mengenal pasti corak dan belajar apabila membenderkan warna sebagai ungu. Pengalaman mendalam digunakan dalam pelbagai program pengiktirafan seperti analisis imej dan tugas ramalan seperti dalam ramalan siri masa.
Pembelajaran peneguhan secara amnya memaparkan ramalan melalui percubaan dan kesilapan. Mengenai sejarahnya dari perspektif AI, ia telah dibangunkan pada akhir 1980-an; ia berdasarkan kepada eksperimen haiwan, konsep kawalan optimum, dan kaedah temporal-perbezaan. Di samping pembelajaran yang diselia dan tidak dapat dikawal, pengukuhan adalah salah satu paradigma asas dalam pembelajaran mesin. Seperti namanya, algoritma dilatih melalui ganjaran.
Sebagai contoh, AI dibangunkan untuk bermain dengan manusia dalam permainan mudah alih tertentu. Setiap kali kehilangan AI, algoritma akan disemak semula untuk memaksimumkan skornya. Oleh itu, teknik seperti ini belajar dari kesilapannya. Selepas pelbagai kitaran, AI telah berkembang dan telah menjadi lebih baik dalam menewaskan pemain manusia. Pembelajaran peneguhan diterapkan dalam pelbagai teknologi canggih seperti meningkatkan robotik, pertambangan teks, dan penjagaan kesihatan.
Pembelajaran yang mendalam dapat melaksanakan tingkah laku sasaran dengan menganalisis data yang ada dan menerapkan apa yang dipelajari kepada satu set maklumat baru. Sebaliknya, pembelajaran tetulang mampu mengubah tindak balasnya dengan menyesuaikan maklum balas yang berterusan.
Pembelajaran mendalam berfungsi dengan data yang sedia ada kerana penting dalam melatih algoritma. Bagi pembelajaran tetulang, ia adalah sifat penerokaan dan ia boleh dibangunkan tanpa set data semasa kerana ia belajar melalui percubaan dan kesilapan.
Pembelajaran yang mendalam digunakan dalam imej dan pengiktirafan pertuturan, pretraining rangkaian mendalam, dan tugas pengurangan dimensi. Sebagai perbandingan, pembelajaran tetulang digunakan dalam berinteraksi dengan rangsangan luar dengan kawalan optimum seperti robotik, penjadualan lif, telekomunikasi, permainan komputer, dan penjagaan kesihatan AI.
Pembelajaran yang mendalam juga dikenali sebagai pembelajaran hierarki atau pembelajaran berstruktur yang mendalam manakala pembelajaran penguatkuasaan tidak mempunyai istilah yang diketahui umum.
Pembelajaran yang mendalam adalah salah satu daripada banyak kaedah pembelajaran mesin. Sebaliknya, pembelajaran tetulang adalah bidang pembelajaran mesin; ia adalah salah satu daripada tiga paradigma asas.
Berbanding dengan pembelajaran yang mendalam, pembelajaran penguatkuasaan lebih dekat kepada kemampuan otak manusia kerana kecerdasan semacam ini dapat diperbaiki melalui maklum balas. Pembelajaran yang mendalam adalah terutamanya untuk pengiktirafan dan ia kurang dikaitkan dengan interaksi.
Pembelajaran mendalam mula diperkenalkan pada tahun 1986 oleh Rina Dechter sementara pembelajaran peneguhan dibangunkan pada akhir tahun 1980-an berdasarkan konsep eksperimen haiwan, kawalan optimum, dan kaedah temporal-perbezaan.