Računala, Informacione tehnologije

Moderne računarske vizije. Zadaci i Computer Vision tehnologiju. Programiranje Computer Vision u Pythonu

Kako naučiti kompjuter da razumiju ono što je prikazano na slici ili slike? Ovo izgleda jednostavno, ali za kompjuter ovo je samo matrica koja se sastoji od nula i jedinica iz koje želite da izdvojite važne informacije.

Ono što je kompjuterski vid? To je sposobnost da "vidi" svoj kompjuter

Vizija - je važan izvor informacija za osobe koristeći ga, dobijamo, prema različitim procjenama veličine od 70 do 90% svih informacija. I, naravno, ako želimo stvoriti pametan automobil, moramo implementirati iste veštine i kompjuter.

Problem računarskog vida može se sasvim jasno naznačeno. Ono što je "vidi"? Podrazumijeva se da kada postoje samo gledajući. To je zaključio razlike računarske vizije i ljudskog vida. Vizija za nas - to je izvor znanja o svijetu, kao i izvor metričkih informacija - to jest, sposobnost da se razumiju udaljenosti i veličine.

Semantički kernel image

Gledajući sliku, možemo ga opisati niz atributa, da se tako izrazim, da izvuče semantičke informacije.

Na primjer, gledajući ovu sliku, možemo reći da je na otvorenom. Ono što je gradski saobraćaj. Da postoje automobili. možemo pretpostaviti da je to jugoistočne Azije o konfiguraciji zgrade i hijeroglife. Portret Mao Zedong shvatiti da je ovo u Pekingu, a ako je neko video uživo video ili je sam bio tamo, pretpostavljam da je to poznati trgu Tiananmen.

Ono što možemo reći više o slici, smatrajući ga? Možemo prepoznati objekte na slici, da kažem, da postoje ljudi ovdje bliže - ograda. Evo suncobrani, plakata da zgrade. Ovo su primjeri klase je veoma važno objekata, koji su uključeni u potragu za trenutak.

Ipak možemo naučiti neke od karakteristika ili atribute objekata. Na primjer, ovdje možemo utvrditi da se ne radi o portret običnih kineskih, naime, Mao Zedong.

Prema vozilo može se utvrditi da je objekat u pokretu, a to je teško, da se ne deformiše tokom pokreta. O zastave može se reći da je objekte, oni su također u pokretu, ali oni nisu teško, stalno deformisana. I na sceni je vetar, što se može utvrditi razvijanjem zastava, a može čak i odrediti smjer vjetra, na primjer, puše s lijeva na desno.

Udaljenostima i dužine u računarske vizije

Vrlo važno je metričkih informacija o Computer Vision nauke. To je sve vrste udaljenosti. Na primjer, za rover je posebno važno jer su ekipe od Zemlje oko 20 minuta i odgovoriti koliko. U skladu s tim, veza tamo i nazad - 40 minuta. A ako napravimo plan za kretanje komande na Zemlji, morate uzeti u obzir.

Uspješno integrirana tehnologija računarske vizije u video igrama. Prema video, možete izgraditi trodimenzionalne modele objekata, ljudi, a fotografije na korisnik može vratiti trodimenzionalnih modela gradova. I onda hodati po njima.

computer vision - prilično širokom rasponu. To je usko isprepletena s raznim drugim naukama. Dio Computer Vision Snima na području za obradu slike, a ponekad i izdvaja računarskog vida, istorijski.

Analiza, prepoznavanje oblika - put ka stvaranju superiorne inteligencije

Razmotrimo ove koncepte odvojeno.

Obrada slika - ovo je područje algoritama, u kojem je ulaz i izlaz - slika, a mi imamo ga da radi nešto.

Analiza slika - je područje računarske vizije, koja se fokusira na rad sa dvodimenzionalnim sliku i donosi zaključke iz ovoga.

Pattern Recognition - apstraktni matematički disciplina koja prepoznaje podatke u obliku vektora. To je, na samom ulazu - vektor a mi imamo neke veze s tim. Gdje je vektor, nismo toliko važno znati.

Computer Vision - to prvobitno je trebalo obnoviti strukturu dvodimenzionalne slike. Danas je ovo područje je postao širi i može se tumačiti kao prihvatanje svih fizičkih objekata odluka, na osnovu slike. To jest, to je zadatak umjetne inteligencije.

Paralelno sa kompjuterskim vizije u potpuno drugačijem polju, u geodeziji, fotogrametrije je evoluirao - mjerenje udaljenosti između objekata na dvodimenzionalne slike.

Roboti mogu "vidjeti"

I na kraju - ovo je stroj viziju. Pod vizija mašinu znači viziju robota. To je odluka nekih problema u proizvodnji. Možemo reći da je kompjuter vizija - jedna velika nauka. Ona kombinira neke druge nauke dijela. I kada je računar viziju dobija neku posebnu aplikaciju, ona se pretvara u viziju mašinu.

Computer Vision regija ima masu praktičnih aplikacija. To je povezano sa automatizaciju proizvodnje. Na preduzeća postaju efikasniji zamijeniti ručni rad od strane stroja. Uređaj ne umore, ne spava, ona je imala nepravilan raspored rada, ona je spremna da radi 365 dana u godini. Dakle, koristeći rad mašina, možemo dobiti zajamčena rezultat na određeno vrijeme, a to je prilično zanimljivo. Svi zadaci imaju jasnu upotrebu za računarske vizije sistema. I ne postoji ništa bolje nego da odmah vidjeti rezultate na slici samo u fazi proračuna.

Na pragu svijeta umjetne inteligencije

Plus području - to je teško! Značajan dio mozga odgovoran za vid, a vjeruje se da ako vas naučiti računalo da "vidi", koja je, upotreba računarske vizije puna, to je jedan od ciljeva punim umjetne inteligencije. Ako ne možemo riješiti problem na ljudskom nivou, najvjerovatnije u isto vrijeme, mi ćemo riješiti problem AI. To je jako dobro! Ili ne vrlo dobar, ako pogledate, "Terminator 2".

Zašto je vizija - to je teško? Budući da je slika istog objekta može varirati u velikoj mjeri ovisno o eksternim faktorima. U zavisnosti od objekta posmatranja boda izgledati drugačije.

Na primjer, jedan te isti lik, snimljene iz različitih uglova. A ono što je najzanimljivije u slici može biti jedno oko, dva oka i po. I ovisno o kontekstu (ako ovu sliku čovjeka u majici sa obojenim očima), oko može biti više od dva.

Računar i dalje ne razumiju, ali to "vidi"

Još jedan faktor koji otežava - to je rasvjeta. Istu scenu s različitim rasvjeta će izgledati drugačije. veličina objekta može varirati. Osim toga, objekti bilo koje klase. Kako možeš reći o čovjeku koji svoju visinu od 2 metra? Ništa. Ljudski rast i može biti 2,3 m, i 80 cm. Kao i kod drugih vrsta objekata, međutim, su objekti iste klase.

Posebno žive predmeti prolaze kroz razne sojeva. Kosa ljudi, sportista, životinje. Pogledajte slike konja radi, utvrditi što se događa s njihovim griva i rep je jednostavno nemoguće. A preklapanja objekata u sliku? Ako ste gurnuti kompjuter slike, čak i najmoćniji stroj nailaze na poteškoće dati pravu odluku.

Sljedeći prikaz - to je maska. Neki objekti, životinje maskirana kao životnu sredinu, i prilično vješto. A isto tačke i bojanje. Bez obzira na to, mi ih vidimo, iako ne uvijek izdaleka.

Još jedan problem - pokret. Objekti u pokretu nezamislivo podvrgnuti deformacije.

Mnogi su objekti vrlo varijabilna. Evo, na primjer, u dve fotografije ispod objekte "stolice".

I na tom možete sjesti. Ali da podučava mašinu, tako da se različite stvari u obliku, boji, materijal, sve je objekat "stolica" - je vrlo teško. Ovo je izazov. Integrirati metode kompjuterske vizije - da nauči mašinu shvatiti, analizirati, nagađati.

Integracija računarskog vida u različitim platformama

Masa kompjuterske vizije počela da prodire još 2001. godine, kada je napravio prvi detektor lice. Uspjeli smo dva autora: Viola, Jones. To je bio prvi brz i pouzdan dovoljno algoritam, koji je pokazao moć metode učenja za rublje.

Sada Computer Vision imati dovoljno nove praktične primjene - prepoznavanje ljudskog lica.

Ali da prepozna čovjeka kao u filmovima - nasumice uglova, različitim uvjetima osvjetljenja - to je nemoguće. Ali da se riješi problem, ili onaj koji je različiti ljudi sa različitim osvjetljenja ili u nekoj drugoj pozi, slično kao na fotografiji u pasoš, moguće je s visokim stupnjem povjerenja.

a zahtjevi pasoš fotografija uglavnom zbog karakteristika algoritama za prepoznavanje lica.

Na primjer, ako imate biometrijski pasoš, u nekim modernim aerodromima, možete koristiti automatski sistem kontrole pasoša.

Neriješenih problema računarskog vida - sposobnost da prepozna bilo koji tekst

Možda je neko koristi OCR sistema. Jedan od tih - a Fine Reader, je vrlo popularan u RuNet sistemu. Postoje mnogi oblici gdje popunite podatke, oni su savršeno skenirati, informacije se sistem prepoznao vrlo dobro. Ali uz bilo koji tekst na slici situacija je mnogo gora. Ovaj problem još uvijek nije riješen.

Igre koje uključuju Computer Vision, snimanje pokreta

Poseban veliki prostor - je stvaranje trodimenzionalnih modela i Snimanje pokreta (koji je prilično uspješno implementiran u kompjuterskim igricama). Prvi program, koji koristi računarske vizije - sistem interakcije sa računarom koristeći pokrete. Kada je stvorena da je mnogo otvorenih stvari.

Algoritam je dizajniran jednostavno, ali konfigurirati bilo potrebno da se stvori generator sintetičkih slika ljudi da se milion slika. Superkompjuter sa njima da izaberu parametre algoritma, za koje je on sada radi dobro.

To je milion slika i danas vremena prebrojivi superkompjuter moguće napraviti algoritam koji troši 12% kapaciteta jednog procesora i omogućava osobi da sagleda položaj u realnom vremenu. Ovaj Microsoft Kinect sistem (2010).

Pretraga slika po sadržaju omogućava vam da upload slike na sistem, a rezultati će dati sve slike sa istim sadržajem i napravio iz istog ugla.

Primjeri Computer Vision: trodimenzionalni i dvodimenzionalni mape, sada su s njim. Karte za navigaciju vozila redovno se ažuriraju u skladu sa DVR.

Tu je i baza podataka sa milijardama geografski označene fotografije. Preuzimanjem slika u bazi podataka, možete odrediti gdje je napravljen, pa čak i neke perspektive. Naravno, pod uslovom da je mjesto je dovoljno da popularna u jednom trenutku turiste i napravio niz fotografija područja su bili tamo.

roboti su svuda

Robotika u ovom trenutku, svuda, bez na bilo koji način. Sada postoje vozila koja imaju posebne kamere koje prepoznaju pješake i putokazi za prijenos komande vozača (ovo na neki način kompjuterski program za pregled, pomaže vozača). I tu je potpuno automatizovan robotska vozila, ali oni se ne mogu osloniti isključivo na sistem video kameru bez upotrebe velike količine dodatnih informacija.

Moderni kamera - ovo je obscura analogni fotoaparat

Pričajmo o digitalne slike. Moderni digitalni fotoaparati su raspoređeni na principu camera obscura. Samo umjesto otvor kroz koji svjetlost ulazi u zrak i projektuje na zadnjem zidu komore kola temu, imamo poseban optički sistem koji se zove objektiv. Svoj cilj je prikupiti veliki svjetlosni snop i pretvoriti ga tako da svi zraci prošli kroz virtualni trenutku kako bi se dobili projekcije i čine sliku na filmu ili matrice.

Moderni digitalni fotoaparati (matrica) je sastavljen od pojedinačnih elemenata - piksela. Svaki piksel može mjeriti energiju svjetlosti koja je incident na ukupno piksela, i donijeti jedan broj izlaz. Stoga, u digitalni fotoaparat, dobijamo umjesto seta svjetlosti mjerenja svjetline slike, uhvaćen u jednoj piksela - računar vidno polje. Stoga, kada je slika vidimo se ne teče linije i jasne konture, a mrežu obojenih kvadrata u različitim bojama - piksela.

U nastavku možete vidjeti prve digitalne slike u svijetu.

Ali na ovoj slici nije? Boja. Što je boja?

Psihološki percepciji boje

Boja - to je ono što vidimo. Boju jedna te ista stvar za ljude i mačke će biti drugačije. Budući da smo (ljudi) i životinjske optički sistem - vizija je drugačija. Dakle, boja - to je psihološki kvalitet naše vizije koja se javlja kada posmatranje objekata i svjetlo. A ne fizički u vlasništvu objekta i svjetlo. Boja - je rezultat interakcije lakših elemenata, i scena našeg vizuelnog sistema.

Programiranje Computer Vision u Python koristeći bibliotekama

Ako ste odlučili da se uključe ozbiljno u proučavanju računarske vizije, treba odmah pripremiti za niz poteškoća, ova nauka nije najlakši i krije brojne zamke. Ali, "Programiranje Computer Vision na Python" autorstva Jan Erik Solema - knjigu koja opisuje sve najviše jednostavnim jezikom. Ovdje će se upoznati s metodama prepoznavanja različitih objekata u 3D, uče da rade sa stereo sliku, virtualne stvarnosti i mnoge druge aplikacije računarskog vida. U knjizi su dovoljno primjera u Pythonu. Ali objašnjenja su predstavljene, da tako kažem, generalizovati, tako da se ne preopteretiti previše istraživanja i čvrste podatke. Rad pogodan za studente, amatere i entuzijaste. Preuzmite ovu knjigu i drugima o Computer Vision (u pdf formatu) može biti u mreži.

U ovom trenutku, postoje open source biblioteku računarske vizije algoritama i obradu slika i numeričkih algoritama OpenCV. To se provodi u većini modernih programskih jezika, je open source. Ako govorimo o Computer Vision, Python koristi kao programski jezik, ima i podršku biblioteke, pored toga, da je u stalnom razvoju i ima veliku zajednicu.

Kompanija "Microsoft" pruža usluge Api-mogućnosti da trenira neuronske mreže da radi sa slikama ljudi. Tu je i mogućnost da se prijave Computer Vision, Python koristi kao programski jezik.

Računala, Informacione tehnologije

Moderne računarske vizije. Zadaci i Computer Vision tehnologiju. Programiranje Computer Vision u Pythonu

Ono što je kompjuterski vid? To je sposobnost da "vidi" svoj kompjuter

Semantički kernel image

Udaljenostima i dužine u računarske vizije

Analiza, prepoznavanje oblika - put ka stvaranju superiorne inteligencije

Roboti mogu "vidjeti"

Na pragu svijeta umjetne inteligencije

Računar i dalje ne razumiju, ali to "vidi"

Integracija računarskog vida u različitim platformama

Neriješenih problema računarskog vida - sposobnost da prepozna bilo koji tekst

Igre koje uključuju Computer Vision, snimanje pokreta

roboti su svuda

Moderni kamera - ovo je obscura analogni fotoaparat

Psihološki percepciji boje

Programiranje Computer Vision u Python koristeći bibliotekama

Similar articles

Računala

Računala

Računala

Računala

Računala

Računala

Trending Now

Hrane i pića

Zakon

Prostota

Umjetnost i zabava

Tehnologije

Zakon

Newest

Prostota

Putujući

Dom i porodica

Zdravlje

Marketing

Hrane i pića