Pembelajaran yang diselia dan pembelajaran tanpa pengawasan adalah dua konsep utama pembelajaran mesin. Pembelajaran yang Diawasi adalah tugas Pembelajaran Mesin untuk mempelajari fungsi yang memetakan input ke output berdasarkan contoh input-output pasangan. Learning Unsupervised adalah tugas Pembelajaran Mesin untuk menyimpulkan fungsi untuk menggambarkan struktur tersembunyi daripada data yang tidak dilabel. The perbezaan utama antara pembelajaran mesin yang diselia dan tidak diselia itu pembelajaran diawasi menggunakan data berlabel sementara pembelajaran tanpa pengawasan menggunakan data tanpa label.
Pembelajaran Mesin adalah bidang Sains Komputer yang memberikan kemampuan untuk sistem komputer untuk belajar dari data tanpa diprogram secara jelas. Ia membolehkan untuk menganalisis data dan untuk meramalkan corak di dalamnya. Terdapat banyak aplikasi pembelajaran mesin. Sebahagian daripada mereka adalah pengiktirafan muka, pengiktirafan isyarat dan pengecaman pertuturan. Terdapat pelbagai algoritma yang berkaitan dengan pembelajaran mesin. Sesetengah daripada mereka adalah regresi, klasifikasi dan kluster. Bahasa pengaturcaraan yang paling biasa untuk membangunkan aplikasi pembelajaran berasaskan mesin adalah R dan Python. Bahasa-bahasa lain seperti Java, C ++ dan Matlab juga boleh digunakan.
1. Gambaran Keseluruhan dan Perbezaan Utama
2. Apakah Pembelajaran yang Diawasi
3. Apakah Pembelajaran Tidak Bertalian?
4. Kesamaan Antara Pembelajaran Mesin yang Diawasi dan Tidak Ditugaskan
5. Perbandingan Sampingan Sampingan - Kawalan Kendiri vs Pembelajaran Tidak Terurus dalam Borang Tabular
6. Ringkasan
Dalam sistem berasaskan pembelajaran mesin, model berfungsi mengikut algoritma. Dalam pembelajaran yang diselia, model diawasi. Pertama, ia perlu melatih model. Dengan pengetahuan yang diperoleh, ia dapat meramalkan jawapan untuk masa depan. Model ini dilatih menggunakan dataset berlabel. Apabila data daripada sampel diberikan kepada sistem, ia dapat meramalkan hasilnya. Berikut ialah ekstrak kecil dari dataset IRIS yang popular.
Menurut jadual di atas, panjang Sepal, lebar Sepal, Panjang Patel, Lapisan Patel dan Spesies dipanggil atribut. Lajur dikenali sebagai ciri. Satu baris mempunyai data untuk semua atribut. Oleh itu, satu baris dipanggil pemerhatian. Data boleh sama ada angka atau kategori. Model ini diberi pemerhatian dengan nama spesies sepadan sebagai input. Apabila pemerhatian baru diberikan, model harus meramalkan jenis spesis yang dimiliki olehnya.
Dalam pembelajaran yang diselia, terdapat algoritma untuk klasifikasi dan regresi. Klasifikasi adalah proses mengklasifikasikan data berlabel. Model ini mewujudkan sempadan yang memisahkan kategori data. Apabila data baru diberikan kepada model, ia boleh mengkategorikan berdasarkan pada mana titik wujud. K-Nearest Neighbours (KNN) adalah model klasifikasi. Bergantung pada nilai k, kategori diputuskan. Sebagai contoh, apabila k ialah 5, jika titik data tertentu adalah hampir lapan titik data dalam kategori A dan enam titik data dalam kategori B, maka titik data akan dikelaskan sebagai A.
Regresi adalah proses meramalkan trend data sebelumnya untuk meramalkan hasil data baru. Dalam regresi, output boleh terdiri daripada satu atau lebih pemboleh ubah berterusan. Ramalan dilakukan menggunakan garis yang merangkumi kebanyakan titik data. Model regresi yang paling sederhana adalah regresi linier. Ia pantas dan tidak memerlukan parameter penalaan seperti dalam KNN. Sekiranya data menunjukkan trend parabola, maka model regresi linier tidak sesuai.
Ini adalah beberapa contoh algoritma pembelajaran yang diselia. Umumnya, hasil yang dihasilkan daripada kaedah pembelajaran yang diselia lebih tepat dan boleh dipercayai kerana data masukan diketahui dan dilabelkan. Oleh itu, mesin perlu menganalisis hanya corak tersembunyi.
Dalam pembelajaran tanpa pengawasan, model tidak diselia. Model ini sendiri, untuk meramalkan hasilnya. Ia menggunakan algoritma pembelajaran mesin untuk membuat kesimpulan pada data tanpa label. Umumnya, algoritma pembelajaran yang tidak terjejas lebih sukar daripada algoritma pembelajaran yang diawasi kerana terdapat sedikit maklumat. Clustering adalah jenis pembelajaran tanpa pengawasan. Ia boleh digunakan untuk mengelompokkan data yang tidak diketahui menggunakan algoritma. K-mean dan kluster berasaskan ketumpatan adalah dua algoritma klustering.
algoritma k-mean, tempat k centroid secara rawak untuk setiap cluster. Kemudian setiap titik data diberikan kepada centroid terdekat. Jarak Euclidean digunakan untuk mengira jarak dari titik data ke centroid. Titik data diklasifikasikan kepada kumpulan. Kedudukan untuk centroids k dikira semula. Kedudukan centroid baru ditentukan oleh min semua mata dalam kumpulan. Sekali lagi setiap titik data diberikan kepada centroid terdekat. Proses ini berulang sehingga sentroid tidak lagi berubah. k-mean adalah algoritma kluster yang cepat, tetapi tiada permulaan tertentu bagi titik clustering. Juga terdapat variasi model kluster yang tinggi berdasarkan permulaan titik cluster.
Satu lagi algoritma kluster adalah Clustering berdasarkan kepadatan. Ia juga dikenali sebagai Aplikasi Clustering Spatial Based Density dengan bunyi bising. Ia berfungsi dengan mendefinisikan kluster sebagai set maksimum ketumpatan titik yang berkaitan. Mereka adalah dua parameter yang digunakan untuk clustering berasaskan kepadatan. Mereka adalah Ɛ (epsilon) dan mata minimum. Ɛ ialah radius maksimum kejiranan. Titik minimum adalah bilangan mata minimum dalam kejiranan Ɛ untuk menentukan kluster. Ini adalah beberapa contoh clustering yang jatuh ke dalam pembelajaran tanpa pengawasan.
Secara umumnya, keputusan yang dihasilkan daripada algoritma pembelajaran yang tidak terjejas tidak begitu tepat dan boleh dipercayai kerana mesin tersebut harus menentukan dan label data input sebelum menentukan corak dan fungsi tersembunyi.
Dibantu oleh Pembelajaran Mesin Tanpa Kawalan | |
Pembelajaran yang Diawasi adalah tugas Pembelajaran Mesin untuk mempelajari fungsi yang memetakan input ke output berdasarkan contoh pasangan input-output. | Learning Unsupervised adalah tugas Pembelajaran Mesin untuk menyimpulkan fungsi untuk menggambarkan struktur tersembunyi dari data tanpa label. |
Fungsi Utama | |
Dalam pembelajaran di bawah seliaan, model meramalkan hasil berdasarkan data input berlabel. | Dalam pembelajaran tanpa pengawasan, model meramalkan hasilnya tanpa data berlabel dengan mengenal pasti coraknya sendiri. |
Ketepatan Keputusan | |
Keputusan yang dihasilkan daripada kaedah pembelajaran yang diselia lebih tepat dan boleh dipercayai. | Hasil yang dihasilkan daripada kaedah pembelajaran yang tidak terjejas tidak begitu tepat dan boleh dipercayai. |
Algoritma utama | |
Terdapat algoritma untuk regresi dan klasifikasi dalam pembelajaran di bawah seliaan. | Terdapat algoritma untuk clustering dalam pembelajaran tanpa pengawasan. |
Pembelajaran yang Diawasi dan Pembelajaran Tak Bertanggungjawab adalah dua jenis Pembelajaran Mesin. Pembelajaran yang Diawasi adalah tugas Pembelajaran Mesin untuk mempelajari fungsi yang memetakan input ke output berdasarkan contoh pasangan input-output. Learning Unsupervised adalah tugas Pembelajaran Mesin untuk menyimpulkan fungsi untuk menggambarkan struktur tersembunyi dari data tanpa label. Perbezaan antara pembelajaran mesin yang diselia dan tidak diselia adalah pembelajaran yang diawasi menggunakan data berlabel sementara cenderung tanpa pengawasan menggunakan data tanpa label.
1.TheBigDataUniversity. Pembelajaran Mesin - Pengawasan VS Tanpa Pengawasan Pembelajaran, Kelas Kognitif, 13 Mac 2017. Boleh didapati di sini
2. "Pembelajaran Tidak Bertalian." Wikipedia, Yayasan Wikimedia, 20 Mac 2018. Boleh didapati di sini
3. "Pembelajaran yang Diawasi." Wikipedia, Yayasan Wikimedia, 15 Mac 2018. Boleh didapati di sini
1.'2729781 'oleh GDJ (Domain Awam) melalui pixabay