Uczenie maszynowe nadzorowane i nienadzorowane. Uczenie przez wzmacnianie

Uczenie nadzorowane

Jak najłatwiej zrozumieć, o co chodzi w uczeniu nadzorowanym?

Wyobraź sobie, że masz sprawdzian w szkole. Każde z pytań ma zestaw odpowiedzi a), b), c), d). Tylko jedna odpowiedź jest poprawna. Twoim zadaniem jest wybrać właściwe odpowiedzi.

Kiedy skończysz – nauczyciel sprawdza, czy Twoje odpowiedzi są poprawne (np. porównuje je z kluczem) i udziela Ci informacji zwrotnej. Dzięki temu przy następnym sprawdzianie możesz wykorzystać zdobytą wiedzę i udzielić więcej poprawnych odpowiedzi.

Im więcej razy dostaniesz informację zwrotną od nauczyciela, tym lepsze będą Twoje odpowiedzi. Ty się uczysz, a nauczyciel Cię nadzoruje.

Dokładnie w ten sam sposób działa uczenie nadzorowane. Program komputerowy dostaje zestaw danych wejściowych (pytań na sprawdzianie), na podstawie których wybiera dla tych danych odpowiednią kategorię (wybiera jedną z odpowiedzi a, b, c, d). Jego wybór jest porównywany z prawidłowymi odpowiedziami. Program dostaje informację zwrotną, poprawia odpowiednie współczynniki i dostaje kolejny zestaw danych wejściowych. I tak w kółko, aż się nauczy.

Uczenie nienadzorowane

Uczenie nienadzorowane można porównać do odkrywcy, który wkracza do nowego świata. Wszystko jest dla niego nowe. Obserwując różne cechy napotykanych obiektów zauważa pewne podobieństwa. Na podstawie podobnyhch cech grupuje te obiekty. Tak ludzie robili na przykład z klasyfikacją zwierząt i roślin. Do obserwowanej przyrody dorabiali teorię. I tak właśnie komputery do obserwowanych danych dorabiają teorię.

Uczenie przez wzmacnianie

Czymś pośrednim jest uczenie przez wzmacnianie. Naukowiec sam wyciąga wnioski z własnych obserwacji, ale na końcu, po dłuższym czasie, dowiaduje się, czy jego wnioski były słuszne. Tutaj lepszą analogią jest gra w szachy. Szachista sam dobiera każdy ruch podczas rozgrywki, ale na końcu dowiaduje się, czy wygrał, czy przegrał. Być może większość ruchów wykonał prawidłowo, ale ta jedna pomyłka zaważyła na sukcesie lub porażce. Szachista wyciąga wnioski na przyszłość i w kolejnej partii wykonuje inne ruchy. I znów na końcu dowiaduje się, czy wygrał, czy przegrał. Może potem analizować swoją partię wstecz i w ten sposób się uczyć.

Uczenie maszynowe nadzorowane i nienadzorowane. Uczenie przez wzmacnianie

Komentarze

Dodaj komentarz Anuluj pisanie odpowiedzi