Całkiem niedawno, bo 11 maja, minęło dwadzieścia siedem lat od dnia, gdy ówczesny mistrz świata w szachach, Garri Kasparow, przegrał w tę szlachetną grę z systemem komputerowym Deep Blue, zaprojektowanym przez firmę IBM. Był to pierwszy taki przypadek w dziejach szachów (i komputerów).

Szachista zapewne nie był zadowolony z takiego obrotu sprawy, trzeba jednak przyznać, że pojedynek ten miał niemałe znaczenie psychologiczne – pokazał, że maszyna może skutecznie rywalizować z człowiekiem w dziedzinie wymagającej umiejętności przewidywania i podejmowania strategicznych decyzji oraz że może się „uczyć”.

 

Co to jest uczenie maszynowe?

 

Właśnie, uczyć. Tylko co to oznacza w przypadku maszyny? W ujęciu formalnym uczenie maszynowe jest dziedziną sztucznej inteligencji, zajmującą się tworzeniem algorytmów i modeli, które umieją wykrywać wzorce, wyciągać wnioski i podejmować decyzje na podstawie danych, bez konieczności bezpośredniego programowania systemu pod kątem takich działań. Innymi słowy chodzi o to, aby po dostarczeniu systemowi odpowiednio dużej puli danych był on w stanie prawidłowo zinterpretować inne dane tego samego rodzaju, z którymi nie miał wcześniej do czynienia.

 

Łatwo to sobie wyobrazić na przykładzie rozpoznawania obrazu. Jeśli chcemy nauczyć maszynę wykrywania na zdjęciu lub ilustracji konkretnego obiektu, takiego jak rower lub samochód, powinniśmy przygotować zbiór danych wejściowych w postaci obrazów przedstawiających rowery i samochody, a następnie wytrenować system, dostarczając mu ich wraz z odpowiednimi opisami („rower”, „samochód”). Na tej podstawie system może zacząć rozpoznawać rowery i samochody na innych obrazach, spoza puli danych treningowych

 

Opisane przed chwilą podejście, w którym trenujemy system przy użyciu danych opatrzonych opisami (etykietami), nosi nazwę uczenia nadzorowanego. Ponieważ jest to metoda stosunkowo czaso– i pracochłonna, opracowano jej prostszy wariant, nazwany uczeniem nadzorowanym częściowo, w którym nie każda informacja w zbiorze danych treningowych jest połączona z opisem. Zwykle jest on stosowany wtedy, gdy danych wejściowych jest zbyt dużo, by opatrywanie ich wszystkich etykietami było racjonalne i ekonomicznie uzasadnione, a zależy nam przede wszystkim na dostrzeganiu przez system pewnych ogólnych wzorców lub schematów.

 

Spośród pozostałych metod uczenia maszynowego warto wymienić uczenie nienadzorowane oraz uczenie ze wzmocnieniem. W tym pierwszym przypadku, czego nietrudno się domyślić, algorytm jest trenowany na danych pozbawionych etykiet i musi sam szukać określonych prawidłowości. Wracając do przykładu z pojazdami, system mógłby w ten sposób „nauczyć się” odróżniać obrazy rowerów od obrazów samochodów, lecz nie potrafiłby nazwać żadnego z tych obiektów. Szczególnie interesujące jest ostatnie z wymienionych podejść, które polega na uczeniu się maszyny metodą prób i błędów, poprzez interakcje z otoczeniem i otrzymywanie „kar” lub „nagród” za nieskuteczne lub skuteczne wykonywanie działań. Rozwiązania tego rodzaju są stosowane między innymi w systemach optymalizujących poruszanie się robotów. Przykładem jest czworonożny, przypominający psa robot Spot firmy Boston Dynamics, który został wyposażony w algorytmy uczenia ze wzmocnieniem. (Polecam obejrzenie filmów przedstawiających w akcji Spota i jego dwunożnego kolegę, Atlasa, którego rozwijana do niedawna, hydrauliczna wersja, została właśnie odesłana na robocią emeryturę).

 

Zastosowania uczenia maszynowego

 

Na ten temat można byłoby napisać osobny, obszerny wpis, a nawet książkę, systemy uczenia maszynowego stopniowo przenikają bowiem do wielu obszarów naszego życia.

 

  1. Duże modele językowe, takie jak ChatGPT. Nie istniałyby one, gdyby nie pewna szczególna forma uczenia maszynowego, nazwana uczeniem głębokim (ang. deep learning). Uczenie maszynowe stanowi też jeden z filarów systemów rozpoznawania mowy oraz generatorów obrazów, takich jak Midjourney, pozwalających tworzyć obrazy na podstawie podanych opisów tekstowych (tak zwanych promptów).
  2. Finanse. Dzięki wyjątkowej zdolności do wykrywania schematów w obszernych zbiorach danych, systemy tego rodzaju są wykorzystywane do prognozowania cen akcji, wykrywania oszustw – na przykład prania brudnych pieniędzy – i zarządzania portfelami aktywów.
  3. Opieka medyczna jest następną dziedziną, w której przydaje się zadziwiająca niekiedy zdolność algorytmów uczenia maszynowego do wykrywania wzorców bardzo trudnych do zauważenia człowiekowi. Analizując na przykład dane dostarczone przez diagnostykę obrazową, takie jak zdjęcia rentgenowskie czy obrazy uzyskane metodą rezonansu magnetycznego, wirtualny pomocnik lekarza może wychwycić anomalie i wczesne oznaki chorób, zanim jeszcze w pełni się one rozwiną, zaś wczesna diagnoza bardzo często zwiększa szanse na skuteczną terapię.
  4. Transport. Możliwości uczenia maszynowego pod tym względem są bardzo duże, począwszy od optymalizacji trasy przejazdu na podstawie danych o warunkach drogowych i natężeniu ruchu, przez sterowanie sygnalizacją świetlną, a na coraz szerzej testowanych modelach pojazdów autonomicznych skończywszy.
  5. To zastosowanie nie każdemu może być w smak, lecz omawiana technika jest szeroko wykorzystywana w marketingu. Coraz częściej to od naszych preferencji i zachowań – choćby w internecie – zależy, jaki rodzaj reklamy zobaczymy. Jest też i druga strona tego medalu: systemy antyspamowe, które także opierają się na algorytmach uczenia maszynowego, można wytrenować tak, by dostawać jak najmniej niepożądanych informacji.

 

Tę listę można wydłużać, ponieważ uczenie maszynowe znajduje coraz więcej zastosowań, w dziedzinach takich jak obsługa klienta, automatyczne tłumaczenie tekstu, analiza dużych zbiorów danych, optymalizowanie procesów produkcyjnych i tak dalej.

 

Ograniczenia uczenia maszynowego

 

Czy ta niezwykła technika ma jakieś ograniczenia? Oczywiście. Systemy oparte na mechanizmach uczenia maszynowego są w pełni uzależnione od jakości i ilości danych, które im dostarczymy. Choć mogą zaskakiwać i zdumiewać dokonywaniem nieoczywistych spostrzeżeń, tak naprawdę same niczego nie wymyślą! (Przynajmniej na razie…). Zbiór danych treningowych, który jest niewystarczający lub skażony błędami, skutkuje niewłaściwymi wynikami. Z tego samego powodu systemy te są podatne na manipulacje oraz powielanie uprzedzeń i pomyłek zawartych w danych, na podstawie których się uczą.

 

Według szacunków niektórych firm analitycznych, szybkie tempo upowszechniania się różnorodnych systemów „inteligentnych” – w wielu przypadkach bazujących na mechanizmach uczenia maszynowego – już do 2030 roku może doprowadzić do poważnych zawirowań na rynku pracy; w niektórych krajach zagrożone jest nawet co czwarte stanowisko, przy czym w opinii wielu ekspertów może chodzić nawet o zawody uważane za kreatywne. Jest się czego bać? Czas pokaże, niewykluczone jednak, że stoimy u progu kolejnego etapu technicznej rewolucji, który niesie ze sobą wspaniałe możliwości rozwoju, ale i zagrożenia.