Kiedy wsiadasz do kolejki miejskiej, ktoś cię potrąca. Dopiero w trakcie jazdy orientujesz się, że ten ktoś wyciągnął ci portfel. Na następnej stacji wypadasz z wagonu i biegniesz na najbliższy posterunek. Na szczęście policjanci szybko odnajdują kieszonkowca na nagraniu ze stacji metra. Program komputerowy w kilka sekund pokazuje, jak się nazywa i gdzie mieszka oraz jakie wykroczenia do tej pory popełnił. Funkcjonariusze są w stanie sprawdzić nawet, na co się leczy, jakie wpisy umieszcza na portalach społecznościowych oraz... pokazać go na żywo, śledzonego przez tysiące kamer znajdujących się w mieście.
Nie mija 10 minut, a twój portfel jest w rękach policji – podobnie jak kieszonkowiec. Złapali go funkcjonariusze wyposażeni w okulary rzeczywistości rozszerzonej, rozpoznające twarze przestępców zapisane w policyjnej bazie.
Podróż za jeden uśmiech
Powyższy opis działania policji brzmi jak wyjęty z filmu science fiction dziejącego się w mieście przyszłości. Niestety, to już rzeczywistość. Tyle, że w Chinach. Tamtejsi stróże prawa rzeczywiście mają dostęp do tysięcy kamer skanujących przestrzeń miejską, a zaawansowane algorytmy rozpoznające twarze pozwalają błyskawicznie zidentyfikować i śledzić właściwie każdego. To zresztą tylko mała część ogromnego projektu. Chiny są na dobrej drodze, aby stać się pierwszym smartpaństwem świata.
Chińska kultura i prawo stawiają porządek wyżej niż wolność jednostki, dlatego firmy z branży nowych technologii, takie jak Megvii czy SenseTime, mogą rozbudowywać swoje systemy rozpoznawania twarzy bez protestów obrońców prawa do prywatności. Pomaga im też dostęp do rządowej bazy zdjęć ponad 1,3 miliarda obywateli. To wszystko sprawia, że postęp w tej dziedzinie dokonuje się w Państwie Środka szybciej niż gdziekolwiek indziej.
Dziś swojej twarzy można użyć do zapłaty za bilet na stacji kolejowej albo za obiad w KFC. Wystarczy uśmiechnąć się do terminala, niekiedy powiedzieć kilka słów (aby maszyna wiedziała, że ma do czynienia z żywym człowiekiem, a nie przystawionym przez oszusta do kamery zdjęciem), a system automatycznie pobierze pieniądze z konta. Kamery monitoringu wyposażone w systemy rozpoznawania twarzy czyhają też na niektórych przejściach dla pieszych, a kiedy ktoś przebiegnie na czerwonym świetle, po chwili otrzymuje SMS-a z informacją o mandacie. Mało tego: jego zdjęcie, a nawet imię i nazwisko pojawiają się na wielkim telebimie przy skrzyżowaniu. Również w niektórych szaletach miejskich trzeba spojrzeć w cyfrowe oko – maszyna wydająca papier toaletowy kontroluje, czy dana osoba nie pobierała go już przed chwilą. Ale o tym, jak precyzyjna i nieomylna jest ta technologia, świadczy o wiele poważniejsze zastosowanie: twarzy można dziś używać w Chinach nawet do autoryzowania pożyczki zaciąganej w banku internetowym. Ta technologiczna rewolucja ma jednak także drugie, dużo mroczniejsze oblicze.
Jak to działa?
Widząc twarz, oprogramowanie rzutuje na nią siatkę liczącą od kilkudziesięciu do nawet 240 punktów, określających kształt, wielkość i położenie oczu, kości policzkowych, nosa, ust itd. Mierząc odległości od tych punktów, tworzy unikatowy dla każdego człowieka „odcisk twarzy” (ang. faceprint). Prosi jeszcze o powiedzenie paru słów albo poruszenie głową – to sprawia, że nie da się oszukać maszyny za pomocą zdjęcia. Potem wystarczy, że program porówna cyfrowy opis ludzkiego oblicza z bazą danych. Cel chińskiego rządu: możliwość rozpoznania dowolnego obywatela w ciągu trzech sekund. Nic dziwnego, że firma Megvii otrzymała dostęp do rządowych zasobów zdjęć niemal wszystkich mieszkańców Państwa Środka. SenseTime chwali się z kolei bazą 12 miliardów zdjęć i filmów. To bardzo ważne, bowiem aby sztuczna inteligencja nauczyła się – na zasadzie deep learningu – rozpoznawać twarze, kluczowe jest dla niej posiadanie jak największego zasobu danych.