Na czym polega uczenie maszynowe?

Uczenie maszynowe to swoisty rodzaj sztucznej inteligencji (AI), który sprawia, że system „uczy się” dzięki wykorzystaniu danych, a nie jest programowany przez człowieka. Uczenie maszynowe nie jest jednak prostym procesem. Algorytmy wczytują dane treningowe, dzięki czemu można potem wygenerować bardziej precyzyjne modele opierające się na danych. Model uczenia maszynowego powstaje w wyniku wytrenowania algorytmu uczenia maszynowego za pomocą danych. Po takim treningu model, któremu dostarczy się dane wejściowe, wygeneruje dane wynikowe. Przykładowo, z algorytmu predykcyjnego powstanie model predykcyjny. Jeżeli modelowi predykcyjnemu dostarczy się następnie dane, wygeneruje on prognozę opartą na danych, które posłużyły do jego treningu.

Ilustracja dla uczenia maszynowego

Uczenie iteracyjne

Dzięki uczeniu maszynowemu na zestawach danych mogą trenować modele, których jeszcze nie wdrożono. Niektóre modele uczenia maszynowego działają w trybie online i ciągłym. Proces iteracji modeli online prowadzi do ulepszenia typów powiązań, które są tworzone między elementami danych. Człowiek może łatwo przeoczyć te wzorce i powiązania ze względu na ich złożoność i rozmiar. Wytrenowany model może następnie uczyć się na podstawie danych w czasie rzeczywistym. Poprawa dokładności to efekt procesu treningowego i automatyzacji, które są częścią uczenia maszynowego.

Wielkie zbiory danych a uczenie maszynowe

W uczeniu maszynowym ważne jest, by w procesie „uczenia się” wykorzystywany był odpowiedni zestaw danych. Organizacja nie potrzebuje wielkiego zbioru danych, by korzystać z technik uczenia maszynowego. Zbiór taki może jednak zwiększyć dokładność modeli uczenia maszynowego. W wypadku wielkich zbiorów danych informacje można zwirtualizować, tak by przechowywać je w jak najbardziej wydajnej i ekonomicznej formie — w chmurze lub środowisku lokalnym. Oprócz tego wzrost szybkości i niezawodności sieci sprawił, że zniknęły inne ograniczenia fizyczne uniemożliwiające sprawne zarządzanie ogromnymi ilościami danych. Wystarczy dodać do tego zmiany w cenach i zaawansowaniu pamięci komputerów, by zrozumieć, że firmy mogą wykorzystywać dane na sposoby, które jeszcze pięć lat temu były nie do pomyślenia.

Różne koncepcje uczenia maszynowego

Techniki uczenia maszynowego są potrzebne do zwiększania dokładności modeli predykcyjnych. W zależności od charakteru rozwiązywanego problemu biznesowego możliwe jest zastosowanie różnych podejść, o których wyborze powinien decydować rodzaj i rozmiar danych. W tej części omówimy różne kategorie uczenia maszynowego.

Uczenie nadzorowane

Do uczenia nadzorowanego potrzebne jest zbudowanie zestawu danych i zrozumienie sposobu, w jaki dane są klasyfikowane. Uczenie nadzorowane ma za zadanie wyszukiwać w danych wzorce, które mogą być wykorzystywane w procesach analitycznych. Takie dane mają charakterystyczne cechy, które określają ich znaczenie. Można na przykład zbudować aplikację wykorzystującą uczenie maszynowe, która na podstawie obrazów i pisemnych opisów rozróżnia miliony zwierząt.

Uczenie nienadzorowane

Uczenie nienadzorowane jest stosowane, gdy problem wymaga przetworzenia ogromnej ilości nieoznaczonych danych. Przykładowo, aplikacje społecznościowe, takie jak Twitter, Instagram lub Snapchat, dysponują ogromnymi ilościami nieoznaczonych danych. Zrozumienie znaczenia danych wymaga zastosowania algorytmów, które klasyfikują dane na postawie znalezionych wzorców lub skupień. W ramach uczenia nienadzorowanego przeprowadzany jest proces iteracyjny polegający na przeanalizowaniu danych bez udziału człowieka. Ma on zastosowanie w narzędziach do wykrywania spamu. Wiadomości e-mail, zarówno te potrzebne, jak i spam, mają zbyt wiele zmiennych, by analityk był w stanie oznaczyć niechcianą korespondencję masową. Zamiast niego do wykrywania zbędnych wiadomości wykorzystywane są klasyfikatory uczenia maszynowego, których działanie opiera się na tworzeniu klastrów i powiązań.

Uczenie przez wzmacnianie

Uczenie przez wzmacnianie to behawioralny model uczenia się. W rezultacie analizy danych algorytm otrzymuje informację zwrotną, która prowadzi użytkownika do uzyskania najlepszego wyniku. Uczenie przez wzmacnianie różni się od innych rodzajów uczenia maszynowego tym, że system nie jest trenowany za pomocą przykładowego zestawu danych. Zamiast tego system uczy się metodą prób i błędów. Z tego powodu sekwencja właściwych decyzji spowoduje wzmocnienie procesu, ponieważ stanowi on najlepsze rozwiązanie danego problemu.

Głębokie uczenie

Głębokie uczenie to specyficzna metoda uczenia maszynowego, która łączy sieci neuronowe w kolejne warstwy, by metodą iteracji uczyć się na podstawie danych. Głębokie uczenie sprawdza się szczególnie dobrze przy szukaniu wzorców w nieustrukturyzowanych danych. Złożone sieci neuronowe głębokiego uczenia są projektowane tak, by działały podobnie do ludzkiego mózgu, co pozwala trenować komputery pod kątem radzenia sobie z trudnymi do zdefiniowania abstrakcjami i problemami. Przeciętny pięciolatek z łatwością rozróżnia twarz swojego opiekuna od twarzy mijanego strażnika. Komputer natomiast musi wykonać wiele zadań, by rozpoznać kto, jest kim. Sieci neuronowe i głębokie uczenie wykorzystuje się często w aplikacjach do rozpoznawania obrazów lub mowy bądź wykorzystujących wizję komputerową.

Grafika dla uczenia maszynowego

Wykorzystanie uczenia maszynowego w biznesie

Uczenie maszynowe może przynieść korzyści firmom, które próbują korzystać z wielkich zbiorów danych, i pomóc im w zrozumieniu subtelnych zmian w zachowaniach, preferencjach oraz zadowoleniu klientów. Liderzy biznesowi zaczynają zdawać sobie sprawę z tego, że w ich organizacjach dzieje się wiele, a do zrozumienia branży nie wystarczy zadanie pytania. O sukcesie lub porażce nie decyduje to, co już się wie, ale dostęp do ukrytych w danych informacji o wzorcach i anomaliach.

Jak to wszystko się ze sobą łączy

Zaletą uczenia maszynowego jest to, że umożliwia wykorzystywanie algorytmów i modeli do przewidywania wyników. Cała sztuka polega na zadbaniu o to, by analitycy danych korzystali z właściwych algorytmów, importowali najbardziej przydatne dane (dokładne i oczyszczone) i używali najlepszych modeli. Jeśli te wszystkie warunki są spełnione, można trenować w trybie ciągłym modele, które będą uczyć się na podstawie własnych wyników. Dzięki automatyzacji procesu tworzenia, trenowania i testowania modeli powstają dokładniejsze prognozy, które ułatwiają przeprowadzenie transformacji biznesowej.

Sztuczna inteligencja

Produkty

IBM Watson Studio

Rozwiązanie do wdrożenia w środowisku lokalnym, chmurze prywatnej lub publicznej, oferujące przeznaczoną do pracy grupowej platformę uczenia maszynowego, która zapewnia zespołom najlepsze narzędzia Open Source do badania danych, tworzenia modeli i wdrażania rozwiązań do obsługi danych.

IBM Machine Learning for z/OS

Rozwiązanie do wdrożenia w środowisku lokalnym, które pozwala wydobyć z danych przedsiębiorstwa ukrytą wartość za pomocą uczenia maszynowego. Korzystając z niego, można szybko przesyłać i przekształcać informacje, by przy użyciu danych na platformie IBM z Systems® tworzyć i wdrażać modele samouczące się oraz nimi zarządzać.

IBM SPSS® Modeler

Wyposażona w interfejs graficzny platforma analizy danych dla użytkowników o różnym poziomie zaawansowania, która pozwala na elastyczne przeprowadzanie analiz dzięki wielu różnym algorytmom i funkcjom, takim jak analizy tekstu, analizy geoprzestrzenne i optymalizacja.

IBM Watson Explorer

Oparta na uczeniu maszynowym platforma do analizy treści i wyszukiwania kognitywnego, która udostępnia użytkownikowi cenne informacje uzyskiwane ze wszystkich danych i ułatwia osiąganie lepszych wyników biznesowych.

Przykładowe wdrożenia

Ahus zyskuje dzięki platformie Watson Explorer nowe cenne informacje i może oferować lepszą opiekę medyczną.

Wykorzystując platformę Watson Explorer, Szpital Uniwersytecki w Akershus (Ahus) analizuje wspólnie z firmą Capgemini tysiące protokołów z badań radiologicznych, by mieć pewność, że pracownicy przestrzegają sprawdzonych praktyk, i utrzymywać wysoki poziom opieki medycznej.

Dzięki analizie tekstu w czasie rzeczywistym centra zgłoszeniowe sprawniej obsługują klientów

Z pomocą oferowanej przez platformę IBM Watson Explorer funkcji przetwarzania języka naturalnego w czasie rzeczywistym Mizuho Bank Ltd. z powodzeniem prowadzi interakcje z klientami i zapewnia im szybszą obsługę.

Zasoby

Obejrzyj prezentację z komentarzem, by zobaczyć, jak za pomocą rozwiązania IBM Watson Studio zbudować model uczenia maszynowego, który pozwoli przewidzieć odejście klientów.

Zobacz inne kursy dotyczące aplikacji wykorzystujących uczenie maszynowe i głębokie.

Już teraz wypróbuj bezpłatnie usługę Watson Studio