Kamis, 12 November 2009

Computer Vision

Komputer visi adalah ilmu dan teknologi mesin yang melihat. Sebagai suatu disiplin ilmu, visi komputer berkaitan dengan teori untuk membangun sistem buatan yang memperoleh informasi dari gambar. Data gambar dapat mengambil banyak bentuk, seperti urutan video, dilihat dari beberapa kamera, atau multi-dimensi data dari scanner medis.

Sebagai teknologi disiplin, visi komputer berusaha untuk menerapkan teori dan model untuk pembangunan sistem visi komputer. Contoh aplikasi visi komputer mencakup sistem untuk:

* Pengendalian proses (misalnya, sebuah robot industri atau kendaraan otonom).
* Mendeteksi peristiwa (misalnya, untuk pengawasan visual atau orang menghitung).
* Mengorganisir informasi (misalnya, untuk pengindeksan database foto dan gambar urutan).
* Modeling benda atau lingkungan (misalnya, industri inspeksi, analisis gambar medis / topografis).
* Interaksi (misalnya, sebagai input ke perangkat untuk interaksi manusia komputer).

Visi komputer juga dapat digambarkan sebagai pelengkap (tapi tidak harus lawan) penglihatan biologis. Biologis visi, persepsi visual manusia dan berbagai hewan yang dipelajari, sehingga dalam model tentang bagaimana sistem ini beroperasi dalam hal proses-proses fisiologis. Komputer visi, di sisi lain, kajian dan menjelaskan sistem penglihatan buatan yang diimplementasikan dalam perangkat lunak dan / atau perangkat keras. Interdisipliner pertukaran antara biologis dan visi komputer telah terbukti semakin bermanfaat bagi kedua bidang.

Sub-domain visi komputer termasuk adegan rekonstruksi, acara deteksi, pelacakan video, pengenalan obyek, belajar, pengindeksan, gerak estimasi, dan gambar restorasi.


Bidang visi komputer dapat dikategorikan sebagai dewasa dan beragam. Meskipun karya sebelumnya ada, tidak sampai akhir 1970-an yang lebih terfokus studi lapangan dimulai ketika komputer bisa mengelola pengolahan kumpulan data besar seperti foto. Namun, penelitian ini biasanya berasal dari berbagai bidang lain, dan akibatnya tidak ada standar perumusan "masalah visi komputer". Juga, dan untuk tingkat yang lebih besar, tidak ada rumusan standar bagaimana masalah penglihatan komputer seharusnya diselesaikan. Sebaliknya, ada yang berlimpah metode untuk memecahkan berbagai komputer yang terdefinisi dengan baik visi tugas, di mana seringkali metode tugas sangat spesifik dan jarang dapat digeneralisasi atas berbagai aplikasi. Banyak metode dan aplikasi masih di negara bagian penelitian dasar, tetapi lebih dan lebih metode yang telah menemukan cara mereka ke dalam produk komersial, di mana mereka sering merupakan bagian dari sistem yang lebih besar yang dapat menyelesaikan tugas-tugas yang rumit (misalnya, di daerah gambar medis, atau pengawasan mutu dan pengukuran dalam proses industri). Dalam visi komputer paling praktis aplikasi, komputer yang sudah diprogram untuk menyelesaikan tugas tertentu, tetapi didasarkan pada metode pembelajaran sekarang semakin umum.

Hubungan antara visi komputer dan berbagai bidang lain

Sebuah bagian penting dari kecerdasan buatan berkaitan dengan perencanaan otonom atau musyawarah untuk sistem yang dapat melakukan tindakan mekanis seperti robot yang bergerak melalui beberapa lingkungan. Jenis ini biasanya memerlukan pengolahan data input yang disediakan oleh sistem visi komputer, bertindak sebagai sensor dan visi tingkat tinggi menyediakan informasi tentang lingkungan dan robot. Bagian lain yang kadang-kadang digambarkan sebagai milik dan kecerdasan buatan yang digunakan dalam kaitannya dengan visi komputer adalah pengenalan pola dan teknik pembelajaran. Sebagai akibatnya, visi komputer kadang-kadang dilihat sebagai bagian dari bidang kecerdasan buatan atau bidang ilmu komputer secara umum.

Fisika adalah bidang lain yang sangat terkait dengan visi komputer. Sebuah bagian penting dari visi komputer berkaitan dengan metode-metode yang memerlukan pemahaman menyeluruh proses di mana radiasi elektromagnetik, biasanya dalam terlihat atau infra-merah yang rentang, dipantulkan oleh permukaan benda dan akhirnya diukur oleh sensor gambar untuk menghasilkan data gambar. Proses ini didasarkan pada optik dan fisika solid-state. Sensor gambar yang lebih canggih bahkan memerlukan mekanika kuantum untuk memberikan pemahaman yang lengkap dari proses pembentukan gambar. Selain itu, berbagai masalah pengukuran di fisika dapat diatasi dengan menggunakan visi komputer, misalnya gerak dalam cairan. Akibatnya, visi komputer juga dapat dilihat sebagai perluasan dari fisika.

Bidang ketiga yang memainkan peran penting adalah neurobiologi, khususnya studi tentang sistem visi biologis. Selama abad terakhir, telah ada studi yang ekstensif mata, neuron, dan struktur otak yang ditujukan untuk pemrosesan rangsangan visual pada manusia dan berbagai hewan. Hal ini mengakibatkan kasar, namun rumit, deskripsi tentang bagaimana "sesungguhnya" sistem visi beroperasi dalam rangka untuk menyelesaikan tugas-tugas yang terkait visi tertentu. Hasil ini telah menyebabkan komputer subfield dalam visi di mana sistem buatan yang dirancang untuk meniru perilaku pengolahan dan sistem biologi, pada tingkat kerumitan yang berbeda. Juga, beberapa metode pembelajaran berbasis komputer yang dikembangkan dalam visi memiliki latar belakang dalam biologi.

Bidang lain yang terkait dengan visi komputer adalah pemrosesan sinyal. Banyak metode untuk memproses variabel satu-sinyal, biasanya waktu sinyal, dapat diperpanjang dengan cara alami untuk pengolahan sinyal dua variabel atau multi-variabel sinyal dalam visi komputer. Namun, karena sifat spesifik gambar ada banyak metode yang dikembangkan dalam visi komputer yang tidak memiliki mitra dalam pemrosesan sinyal satu-variabel. Sebuah karakter yang berbeda dari metode ini adalah kenyataan bahwa mereka yang non-linear, bersama-sama dengan multi-dimensi dari sinyal, mendefinisikan sebuah subfield dalam pemrosesan sinyal sebagai bagian dari visi komputer.

Samping yang disebutkan di atas pandangan tentang visi komputer, banyak topik penelitian yang terkait juga dapat dipelajari dari matematika murni sudut pandang. Sebagai contoh, banyak metode dalam visi komputer didasarkan pada statistik, pengoptimalan atau geometri. Akhirnya, suatu bagian penting dari lapangan dikhususkan untuk aspek pelaksanaan visi komputer; bagaimana metode yang ada dapat diwujudkan dalam berbagai kombinasi perangkat lunak dan perangkat keras, atau bagaimana metode-metode ini dapat dimodifikasi untuk mendapatkan kecepatan pemrosesan tanpa kehilangan terlalu banyak kinerja .

Kolom yang paling erat kaitannya dengan visi komputer adalah pengolahan gambar, gambar mesin analisis dan visi. Ada tumpang tindih yang signifikan dalam berbagai teknik dan aplikasi yang menutupi ini. Ini berarti bahwa teknik-teknik dasar yang digunakan dan dikembangkan dalam bidang ini kurang lebih sama, sesuatu yang dapat diartikan sebagai hanya ada satu field dengan nama yang berbeda. Di sisi lain, tampaknya sangat diperlukan bagi kelompok-kelompok penelitian, jurnal ilmiah, konferensi dan perusahaan untuk menampilkan atau pasar diri sebagai milik khusus untuk salah satu bidang tersebut, dan karena itu, berbagai penokohan yang membedakan masing-masing bidang dari yang lain telah disajikan.

Penokohan berikut muncul relevan, tetapi seharusnya tidak dianggap sebagai diterima secara universal:

* Pemrosesan gambar dan analisis gambar cenderung berfokus pada gambar 2D, bagaimana mentransformasikan satu gambar yang lain, misalnya dengan bijaksana pixel operasi seperti kontras tambahan, operasi lokal seperti tepi kebisingan ekstraksi atau penghapusan, atau transformasi geometris seperti memutar gambar. Karakterisasi ini menyiratkan bahwa pengolahan gambar / analisis asumsi tidak memerlukan atau menghasilkan penafsiran tentang isi gambar.

* Komputer visi cenderung untuk berfokus pada adegan 3D diproyeksikan ke satu atau beberapa gambar, misalnya, bagaimana merekonstruksi struktur atau informasi lain tentang adegan 3D dari satu atau beberapa gambar. Visi komputer sering bergantung pada lebih atau kurang kompleks asumsi tentang adegan yang digambarkan dalam gambar.

* Mesin visi cenderung berfokus pada aplikasi, terutama di bidang manufaktur, misalnya, robot otonom berbasis visi dan visi berbasis sistem inspeksi atau pengukuran. Ini berarti bahwa teknologi sensor gambar dan teori kontrol seringkali terintegrasi dengan pengolahan data gambar untuk mengendalikan robot dan yang real-time processing ditekankan dengan cara yang efisien implementasi di hardware dan software. Hal ini juga menyiratkan bahwa kondisi-kondisi eksternal seperti pencahayaan dapat dan sering lebih terkontrol dalam visi mesin daripada di komputer umum visi, yang dapat memungkinkan penggunaan algoritma yang berbeda.

* Ada juga field yang disebut pencitraan yang terutama berfokus pada proses untuk menghasilkan gambar, tapi kadang-kadang juga berhubungan dengan pengolahan dan analisis citra. Sebagai contoh, pencitraan medis berisi banyak bekerja pada analisis data gambar dalam aplikasi medis.

* Akhirnya, pengenalan pola merupakan bidang yang menggunakan berbagai metode untuk mengekstrak informasi dari sinyal pada umumnya, terutama didasarkan pada pendekatan statistik. Sebuah bagian penting dari bidang ini dikhususkan untuk menerapkan metode ini untuk data gambar.

Sebagai konsekuensi dari keadaan ini adalah bahwa seseorang dapat bekerja di laboratorium berkaitan dengan salah satu dari bidang-bidang ini, menerapkan metode-metode dari lapangan kedua untuk memecahkan masalah dalam bidang ketiga, dan menampilkan hasil pada sebuah konferensi yang berhubungan dengan bidang yang keempat .
Aplikasi untuk komputer visi

Salah satu yang paling menonjol adalah bidang aplikasi komputer medis visi atau pemrosesan gambar medis. Daerah ini dicirikan oleh ekstraksi informasi dari data gambar untuk tujuan membuat diagnosis medis pasien. Secara umum, data gambar dalam bentuk gambar mikroskop, foto sinar-X, angiografi gambar, ultrasonik gambar, dan gambar tomografi. Contoh informasi yang dapat diekstraksi dari data gambar tersebut mendeteksi tumor, arteriosclerosis atau perubahan memfitnah. Ini juga dapat organ pengukuran dimensi, aliran darah, dll daerah Aplikasi ini juga mendukung penelitian medis dengan menyediakan informasi baru, misalnya, tentang struktur otak, atau tentang kualitas perawatan medis.

Aplikasi kedua daerah dalam visi komputer di industri, kadang-kadang disebut visi mesin, di mana informasi yang diekstraksi untuk tujuan mendukung proses manufaktur. Salah satu contohnya adalah pengendalian kualitas di mana detail atau produk akhir diperiksa secara otomatis untuk menemukan cacat. Contoh lain adalah pengukuran posisi dan orientasi detail yang harus diambil oleh lengan robot.

Aplikasi militer mungkin salah satu daerah terbesar untuk visi komputer. Contoh yang jelas deteksi musuh tentara atau kendaraan dan rudal bimbingan. Lebih maju bimbingan sistem untuk mengirimkan rudal rudal ke wilayah bukan target spesifik, dan target seleksi dibuat ketika rudal mencapai daerah didasarkan pada data gambar yang diperoleh secara lokal. Konsep-konsep militer modern, seperti "kesadaran medan perang", menyiratkan bahwa berbagai sensor, termasuk sensor gambar, menyediakan set kaya informasi tentang sebuah adegan tempur yang dapat digunakan untuk mendukung keputusan strategis. Dalam kasus ini, otomatis pemrosesan data digunakan untuk mengurangi kompleksitas dan untuk memadukan informasi dari berbagai sensor untuk meningkatkan kehandalan.
Konsep artis Rover di Mars, contoh dari tanah tak berawak berbasis kendaraan. Perhatikan kamera stereo terpasang di atas Rover. (kredit: Maas Digital LLC)

Salah satu area aplikasi yang lebih baru adalah kendaraan otonom, yang meliputi submersibles, tanah berbasis kendaraan (robot dengan roda kecil, mobil atau truk), kendaraan udara, dan kendaraan udara tanpa awak (Unmaned Aaerial Vehicle). Tingkat otonomi berkisar dari sepenuhnya otonom (berawak) kendaraan untuk kendaraan di mana visi sistem berbasis komputer mendukung driver atau pilot dalam berbagai situasi. Sepenuhnya otonom kendaraan biasanya menggunakan visi komputer untuk navigasi, yakni untuk mengetahui di mana itu, atau untuk menghasilkan sebuah peta dari lingkungan (SLAM) dan untuk mendeteksi rintangan. Juga dapat digunakan untuk mendeteksi aktivitas spesifik tugas tertentu, e. g., sebuah UAV mencari kebakaran hutan. Contoh sistem pendukung sistem peringatan kendala dalam mobil, dan sistem untuk pendaratan pesawat otonom. Beberapa produsen mobil telah menunjukkan otonom sistem untuk mengemudi mobil, tapi teknologi ini masih belum mencapai tingkat di mana dapat diletakkan di pasar. Ada banyak contoh dari kendaraan otonom militer mulai dari rudal canggih, untuk UAV untuk misi pengintaian atau rudal bimbingan. Eksplorasi ruang angkasa sudah sedang dibuat dengan otonom kendaraan yang menggunakan visi komputer, e. g., NASA's Mars Exploration Rover.

Wilayah aplikasi lain meliputi:

* Dukungan penciptaan efek visual untuk bioskop dan siaran, misalnya, kamera pelacakan (matchmoving).
* Surveillance.

Khas tugas komputer visi

Masing-masing dari area aplikasi yang dijelaskan di atas menggunakan visi komputer berbagai tugas; lebih atau kurang baik masalah pengukuran didefinisikan atau masalah pemrosesan, yang dapat dipecahkan dengan menggunakan berbagai metode. Beberapa contoh tugas-tugas khas visi komputer

Masalah klasik dalam visi komputer, mesin pengolahan gambar dan visi adalah untuk menentukan apakah atau tidak berisi data gambar objek tertentu, fitur, atau kegiatan. Tugas ini biasanya dapat diselesaikan kokoh dan tanpa upaya manusia, tetapi masih belum dipecahkan secara memuaskan dalam visi komputer untuk kasus umum: sewenang-wenang obyek dalam situasi yang sewenang-wenang. Metode yang ada untuk mengatasi masalah ini dapat di memecahkannya terbaik hanya untuk objek tertentu, seperti obyek geometris yang sederhana (misalnya, polyhedrons), wajah manusia, dicetak atau tulisan tangan karakter, atau kendaraan, dan dalam situasi tertentu, biasanya digambarkan dalam syarat-syarat yang terdefinisi dengan baik pencahayaan, latar belakang, dan pose dari objek relatif terhadap kamera.

Varietas yang berbeda dari masalah pengakuan dijelaskan dalam literatur:

* Objek pengakuan : satu atau beberapa telah ditetapkan sebelumnya atau belajar kelas benda-benda atau objek dapat dikenali, biasanya bersama-sama dengan mereka dalam posisi 2D atau 3D pose gambar dalam adegan.


* Identifikasi : Sebuah contoh individu objek diakui. Contoh: identifikasi orang tertentu wajah atau sidik jari, atau identifikasi kendaraan tertentu.


* Deteksi : data gambar dipindai untuk kondisi tertentu. Contoh: deteksi kemungkinan sel atau jaringan abnormal dalam gambar medis atau mendeteksi kendaraan di jalan tol otomatis sistem. Deteksi yang didasarkan pada relatif sederhana dan cepat perhitungan kadang-kadang digunakan untuk mencari daerah yang lebih kecil dari gambar menarik data yang dapat dianalisa lebih lanjut oleh lebih menuntut komputasi teknik untuk menghasilkan sebuah interpretasi yang benar.

Beberapa tugas khusus berdasarkan pengakuan ada, seperti:

* Konten gambar berbasis Pengambilan: menemukan semua gambar dalam rangkaian gambar yang lebih besar yang memiliki konten spesifik. Konten dapat ditetapkan dengan berbagai cara, misalnya dalam hal kesamaan relatif gambar target (beri aku semua gambar yang mirip dengan gambar X), atau dalam hal tingkat tinggi dengan kriteria pencarian yang diberikan sebagai input teks (beri aku semua gambar yang berisi banyak rumah, yang diambil selama musim dingin, dan tidak punya mobil di dalamnya).


* Pose estimasi: memperkirakan posisi atau orientasi obyek tertentu relatif terhadap kamera. Contoh aplikasi untuk teknik ini akan membantu lengan robot dalam mengambil objek dari ban berjalan di jalur perakitan situasi.


* Optical character recognition (OCR): mengidentifikasi karakter dalam gambar-gambar yang dicetak atau teks tulisan tangan, biasanya dengan tujuan untuk pengkodean teks dalam format yang lebih setuju untuk mengedit atau pengindeksan (misalnya ASCII).

Motion

Beberapa tugas yang berhubungan dengan gerak estimasi, di mana urutan gambar diproses untuk menghasilkan perkiraan kecepatan baik di setiap titik dalam gambar atau dalam adegan 3D. Contoh tugas-tugas seperti:

* Egomotion: menentukan gerakan kaku 3D kamera.
* Pelacakan: mengikuti gerakan objek (misalnya, kendaraan atau manusia).

Scene rekonstruksi

Diberikan satu atau (biasanya) lebih dari sebuah adegan gambar, atau video, adegan rekonstruksi bertujuan komputasi model 3D TKP. Dalam kasus yang paling sederhana model dapat menjadi serangkaian titik-titik 3D. Metode yang lebih canggih menghasilkan sebuah model permukaan 3D lengkap.


Gambar restorasi

Tujuan pemulihan citra adalah penghilangan bunyi (sensor suara, gambar blur, dll) dari gambar. Pendekatan yang paling sederhana untuk menghilangkan kebisingan adalah berbagai jenis penyaring seperti low-pass filter atau filter median. Metode yang lebih canggih mengasumsikan model bagaimana struktur gambar lokal tampak seperti, sebuah model yang membedakan mereka dari kebisingan. Dengan pertama-tama menganalisis data gambar dalam bentuk struktur gambar lokal, seperti garis atau tepi, dan kemudian mengendalikan penyaringan berdasarkan informasi lokal dari langkah analisis, tingkat yang lebih baik penghapusan kebisingan biasanya diperoleh dibandingkan dengan pendekatan sederhana.


Komputer visi sistem

Organisasi sistem visi komputer sangat tergantung aplikasi. Beberapa sistem aplikasi yang berdiri sendiri yang menyelesaikan pengukuran tertentu atau masalah deteksi, sementara yang lain merupakan sub-sistem yang desain yang lebih besar, misalnya, juga mengandung sub-sistem untuk mengontrol mekanik aktuator, perencanaan, informasi database, man - mesin interface, dll Implementasi sistem visi komputer juga tergantung pada fungsi adalah jika telah ditetapkan sebelumnya atau jika beberapa bagian dari itu dapat dipelajari atau diubah selama operasi. Namun ada, fungsi-fungsi khas yang terdapat di banyak komputer sistem penglihatan.

* Berkas akuisisi: Sebuah gambar digital yang dihasilkan oleh satu atau beberapa sensor gambar, yang, selain berbagai jenis kamera yang sensitif terhadap cahaya, termasuk sensor jarak, perangkat tomografi, radar, ultra-sonik kamera, dll Tergantung pada jenis sensor, data gambar yang dihasilkan adalah gambar 2D biasa, 3D volume, atau urutan gambar. Nilai pixel biasanya sesuai dengan intensitas cahaya dalam satu atau beberapa band spektral (warna abu-abu foto atau gambar), tetapi juga dapat terkait dengan berbagai tindakan fisik, seperti kedalaman, penyerapan atau reflectance dari sonik atau gelombang elektromagnetik, atau resonansi magnetik nuklir.


* Pre-processing: Sebelum metode visi komputer dapat diterapkan ke data gambar dalam rangka untuk mengambil beberapa potongan informasi yang spesifik, biasanya diperlukan untuk memproses data dalam rangka untuk memastikan bahwa memenuhi asumsi-asumsi tertentu yang ditunjukkan oleh metode. Contoh :


o Re-sampling dalam rangka untuk memastikan bahwa sistem koordinat gambar benar.
o Kebisingan pengurangan dalam rangka untuk memastikan bahwa suara sensor tidak mem perkenalkan informasi palsu.
o Kontras tambahan untuk memastikan bahwa informasi yang relevan dapat dideteksi.
o Scale-ruang representasi untuk meningkatkan struktur citra pada skala yang sesuai secara lokal.


* Fitur ekstraksi: fitur gambar pada berbagai tingkat kompleksitas yang diekstraksi dari data gambar. Contoh-contoh khas fitur seperti :
o Garis, tepi dan punggung.
o Localized poin kepentingan seperti sudut, gumpalan atau poin.

Fitur lebih kompleks mungkin berhubungan dengan tekstur, bentuk atau gerakan.

* Deteksi / segmentasi: Pada titik tertentu dalam memproses keputusan dibuat tentang gambar mana yang poin atau wilayah dari gambar yang relevan untuk diproses lebih lanjut. Contoh
o Pemilihan set tertentu bunga poin
o Segmentasi satu atau beberapa daerah citra yang berisi objek kepentingan tertentu.


* Tingkat tinggi pengolahan: Pada tahap ini input kecil biasanya set data, misalnya satu set poin atau wilayah gambar yang dianggap mengandung objek tertentu. Pengolahan yang tersisa berurusan dengan, misalnya:

o Verifikasi bahwa data model memuaskan dan aplikasi berbasis asumsi spesifik.
o aplikasi Estimasi parameter tertentu, seperti obyek berpose atau ukuran objek.
o Klasifikasi objek yang terdeteksi ke dalam kategori yang berbeda.

Source :
http://en.wikipedia.org/wiki/Computer_vision

0 comments: