Perkembangan teknologi kecerdasan buatan telah sangat masif digunakan diberbagai bidang. Tujuan dari teknologi tersebut adalah untuk meringankan pekerjaan manusia dan juga untuk otomatisasi pekerjaan. Adanya kecerdaan buatan memungkinkan pekerjaan yang semula dilakukan oleh manusia, sekarang dapat dilakukan oleh mesin. Beberapa pekerjaan seperti penjaga pembayaran toll dan resepsionis, sekarang digantikan oleh mesin pembayaran toll dan email.
Prisip kerja kecerdasan buatan meniru cara otak manusia dalam berifikir. Teknologi ini mampu belajar dari kesalahan, sehingga apabila semakin banyak berlatih maka tingkat kesalahan akan semakin berkurang. Kecerdasan buatan memiliki beberapa cabang ilmu seperti machine learning dan deep learning. Machine learning merupakan bagian dari kecerdasan buatan, sedangkan deep learning adalah bagian dari machine learning.
Sehingga dapat disimpulkan bahwa deep learning adalah bagian terdalam dari kecerdasan buatan. Deep learning digunakan pada kasus-kasus yang memiliki jumlah data yang banyak dan memiliki beragam pola. Salah satu contoh kasus penggunaan deep learning adalah pengenalan objek pada citra. Alasan digunakannya deep learning dalam pengenalan objek dikarenakan citra memiliki berbedaan bentuk dan pola sehingga sulit mendapatkan hasil yang baik apabila hanya menggunakan algoritma machine learning sederhana.
Algoritma deep learning banyak dimaanfaatkan untuk topik riset mengenai computer vision. Teknologi computer vision memungkinan mesin/komputer seperti memiliki mata yaitu dapat melihat dan mengartikan data visual dari lingkungan yang dilihatnya. Algoritma deep learning yang banyak dipakai untuk riset computer vision adalah convolutional neural network (CNN).
Cara kerja dari CNN adalah dengan menggerakan filter atau kernel dengan ukuran tertentu pada sebuah gambar atau video. Setelah kernel selesai melakukan scan ke seluruh gambar maka komputer akan mendapatkan informasi baru dari hasil perkalian dan penjumlahan dari kernel yang digunakan. Sebab sejatinya sebuah citra itu hanyalah sekumpulan piksel yang terdiri dari angka-angka. Citra grayscale terdiri dari piksel dengan jangkauan 0-255, sedangkan citra berwarna terdiri dari gabungan 3 warna dasar yaitu Red, Green, Blue.
Arsitektur algoritma CNN terdiri dari dua komponen, yaitu ekstraksi fitur dan komponen klasifikasi. Proses ekstraksi fitur diawali dengan melakukan operasi konvolusi keseluruh piksel yang terdapat pada citra. Algoritma CNN menggunakan filter atau kernel untuk melakukan konvolusi pada data input dan kemudian menggunakannya untuk pemetaan fitur. Operasi konvolusi dilakukan dengan menggeser filter di atas input. Perkalian matriks dilakukan di setiap lokasi dan hasilnya dijumlahkan ke dalam peta fitur. Berbagai operasi konvolusi dilakukan pada data input menggunakan berbagai filter. Hasilnya juga disimpan di berbagai peta fitur. Namun pada akhirnya, semua peta fitur ini diambil dan digabungkan sebagai hasil akhir dari lapisan konvolusi.
Seperti jaringan saraf lainnya, CNN menggunakan fungsi aktivasi untuk membuat output non-linear. Pada CNN, output dari operasi convolutional melewati fungsi aktivasi. Salah satunya menggunakan fitur aktivasi ReLU. Setelah lapisan convolutional, lapisan pooling biasanya ditambahkan di antara lapisan CNN. Fungsi pooling adalah untuk secara terus menerus mengurangi dimensi dan mengurangi jumlah parameter dan perhitungan dalam jaringan. Ini mengurangi waktu pelatihan dan mengurangi overfitting (keadaan dimana model terlalu baik dalam memprediksi data latih, sehingga salah ketika memprediksi data baru).
Implementasi dari computer vision yang dapat digunakan untuk otomatisasi pekerjaan antara lain sebagai berikut.
- Mendeteksi plat nomor kendaraan otomatis melalui kamera CCTV. Hal ini tentunya dapat membantu pekerjaan polisi untuk mencatat pelanggaran yang terjadi di jalan raya atau jalan tol
- Diagnosa penyakit kulit melalui foto kamera smartphone. Teknologi computer vision sangat membantu sekali di bidang kesehatan. Melalui kamera smartphone masyarakat dapat mengetahui penyakit kulit yang dideritanya. Caranya adalah dengan memfoto pada bagian kulit yang gatal, maka secara otomatis sistem dapat menentukan jenis penyakit kulit yang diderita pengguna
- Absensi perkantoran menggunakan pengenalan wajah. Di era pandemi Covid-19 saat ini, penggunaan absensi sidik jari sudah ditiadakan. Sebab dapat menjadi media penyabaran Covid-19. Oleh karena itu, pada instansi perkantoran maupun daerah, sudah banyak yang berganti ke absensi wajah. Mesin dapat mengenali pola wajah dan menentukan keaslian pemilik wajah dengan menggunakan algoritma computer vision.
Kesimpulannya teknologi deep learning bidang computer vision dapat digunakan untuk otomatisasi pekerjaan. Data yang diolah dari teknologi computer visian berupa gambar dan video. Gambar dan video dapat dimanipulasi menggunakan kernel yang telah ditentukan. Untuk membuat model deep learning akurat, diperlukan banyak data dan algoritma klasifikasi yang sesuai. Akhir kata, semoga sedikit penjelasan terkait computer vision ini dapat bermanfaat bagi pembacara, utamanya instruktur. Inspirasi dan ide tulisan diambil dari referensi video yang ada di youtube (https://www.youtube.com/watch?v=-4E2-0sxVUM).