Uczenie maszynowe

menu icon

Uczenie maszynowe

To wprowadzenie do uczenia maszynowego stanowi przegląd jego historii, ważnych definicji, zastosowań i związanym z nim wątpliwości.

Czym jest uczenie maszynowe?

Uczenie maszynowe to gałąź sztucznej inteligencji i informatyki, która koncentruje się na wykorzystaniu danych i algorytmów do naśladowania sposobu, w jaki ludzie uczą się, stopniowo poprawiając dokładność.

IBM ma bogate doświadczenie w pracy z uczeniem maszynowym. Arthur Samuel jest uznawany za autora terminu „uczenie maszynowe”, który wykorzystał w jednym ze swych badań (PDF, 481 kB) (odsyłacz prowadzi poza serwis IBM) na temat warcabów. Robert Nealey, samozwańczy mistrz warcabów, przegrał z komputerem IBM 7094 w 1962 roku. W porównaniu z dzisiejszymi możliwościami ten wyczyn wydaje się trywialny, jest jednak uważany za kamień milowy w dziedzinie sztucznej inteligencji. W ciągu następnych dziesięcioleci rozwój technologiczny w obrębie pamięci masowych i mocy obliczeniowej umożliwił powstanie innowacyjnych produktów, które znamy i uwielbiamy, takich jak aparat rekomendacji Netflixa czy samochody autonomiczne.

Uczenie maszynowe jest ważnym elementem rozwijającej się dziedziny analityki wielkich zbiorów danych. Wykorzystując metody statystyczne, szkoli się algorytmy do klasyfikowania lub przewidywania w trakcie dostarczania kluczowych spostrzeżeń w ramach projektów eksploracji danych. Te spostrzeżenia są następnie wykorzystywane przy podejmowaniu decyzji dotyczących aplikacji i firm, co świetnie wpływa na kluczowe wskaźniki wzrostu. W miarę jak wielkie zbiory danych będą wciąż rozszerzać się i rosnąć, zapotrzebowanie rynkowe na analityków danych będzie się zwiększać, wraz z koniecznością pomocy przy identyfikowaniu najistotniejszych pytań biznesowych, a następnie danych, które na nie odpowiedzą.

Uczenie maszynowe a głębokie uczenie a sieci neuronowe

Ponieważ terminy „głębokie uczenie” i „uczenie maszynowe” są zwykle używane zamiennie, warto zwrócić uwagę na drobne dzielące je różnice. Uczenie maszynowe, głębokie uczenie i sieci neuronowe są poddziedzinami sztucznej inteligencji. Dokładniej mówiąc — głębokie uczenie jednak stanowi poddziedzinę uczenia maszynowego, a sieci neuronowe są poddziedziną głębokiego uczenia.

Różnica między uczeniem głębokim a maszynowym polega na sposobie, w jaki każdy algorytm się uczy. Głębokie uczenie automatyzuje znaczny zakres procesu ekstrakcji cech, eliminując część wymaganej ręcznej interwencji człowieka i umożliwiając wykorzystanie większych zestawów danych. O głębokim uczeniu można myśleć jako o „skalowalnym uczeniu maszynowym”, jak zauważył Lex Fridman w wykładzie z MIT (00:30) (odsyłacz prowadzi poza serwis IBM). Klasyczne, tj. „niegłębokie" uczenie maszynowe jest bardziej zależne od interwencji człowieka. Eksperci określają zestaw cech, aby zrozumieć różnice między danymi wejściowymi. Zwykle do uczenia wymagane są bardziej ustrukturyzowane dane.

„Głębokie” uczenie maszynowe może wykorzystywać zestawy danych z etykietami w ramach tzw. uczenia nadzorowanego na potrzeby informowania algorytmu, ale nie wymaga zestawu danych z etykietami. Może bazować na nieustrukturyzowanych danych w nieprzetworzonej formie (np. tekście, obrazach) i automatycznie określać zestaw cech, które rozróżniają kategorie danych. W przeciwieństwie do uczenia maszynowego do przetwarzania danych nie wymaga ono interwencji człowieka, co pozwala skalować uczenie maszynowe na bardziej interesujące sposoby. Głębokie uczenie i sieci neuronowe są przede wszystkim uznawane za przyspieszające postęp w takich obszarach jak rozpoznawanie obrazów, przetwarzanie języka naturalnego oraz rozpoznawanie mowy.

Sieci neuronowe lub sztuczne sieci neuronowe składają się z warstw węzłów obejmujących warstwę wejściową, jedną lub więcej warstw ukrytych oraz warstwę wyjściową. Każdy węzeł (sztuczny neuron) łączy się z innym i ma powiązaną wagę oraz próg. Jeśli wyjście dowolnego pojedynczego węzła przekracza określoną wartość progową, węzeł ten jest aktywowany podczas wysyłania danych do kolejnej warstwy sieci. W przeciwnym razie żadne dane nie są przekazywane do następnej warstwy sieci. Słowo „głębokie” w kontekście głębokiego uczenia odnosi się właśnie do poziomów warstw w sieci neuronowej. Sieć neuronowa składająca się z więcej niż trzech warstw — włącznie z warstwą wejściową i wyjściową — może być uznana za algorytm głębokiego uczenia lub głęboką sieć neuronową. Sieć neuronowa, która ma tylko dwie lub trzy warstwy, to zaledwie podstawowa sieć neuronowa.

Przeczytaj artykuł na blogu „AI, uczenie maszynowe, głębokie uczenie i sieci neuronowe: jaka jest różnica?”, aby lepiej poznać związek pomiędzy różnymi koncepcjami.

Jak działa uczenie maszynowe

Uniwersytet UC Berkeley (odsyłacz prowadzi poza serwis IBM) dzieli system uczenia się algorytmu uczenia maszynowego na trzy główne części.

  1. Proces decyzyjny: Ogólnie algorytmy uczenia maszynowego są używane do predykcji lub klasyfikacji. W oparciu o pewne dane wejściowe, z etykietami lub bez nich, algorytm szacuje wzorzec występujący w danych.
  2. Funkcja błędu: Funkcja błędu służy do oceny predykcji modelu. Jeśli istnieją znane przykłady, funkcja błędu może dokonać porównania w celu oceny dokładności modelu.
  3. Proces optymalizacji modelu: Jeśli model może być lepiej dopasowany do punktów danych w zbiorze przeznaczonym do szkolenia, wówczas wagi są korygowane w celu zmniejszenia rozbieżności między znanym przykładem a oszacowaniem modelu. Algorytm będzie powtarzał tę ocenę i optymalizację procesu, aktualizując wagi autonomicznie aż do osiągnięcia progu dokładności.

Metody uczenia maszynowego

Klasyfikatory uczenia maszynowego zaliczają się do trzech kategorii podstawowych.

Nadzorowane uczenie maszynowe

Uczenie nadzorowane, znane również jako nadzorowane uczenie maszynowe, do uczenia algorytmów wykorzystuje zbiory danych z etykietami, które umożliwiają dokładne klasyfikowanie danych lub przewidywanie wyników. W miarę jak dane wejściowe są wprowadzane do modelu, koryguje on swoje wagi do czasu, aż model zostanie odpowiednio dopasowany. Odbywa się to w ramach procesu walidacji krzyżowej w celu zapewnienia, że model nie zostanie nadmiernie lub niedostatecznie dopasowany. Uczenie nadzorowane pomaga organizacjom na dużą skalę rozwiązywać rzeczywiste problemy, takie jak klasyfikowanie spamu do oddzielnego folderu ze skrzynki odbiorczej. Niektóre metody stosowane w uczeniu nadzorowanym obejmują między innymi sieci neuronowe, naiwny klasyfikator bayesowski, regresję liniową, regresję logistyczną, las losowy i algorytm SVM.

Nienadzorowane uczenie maszynowe

Uczenie nienadzorowane, znane również jako nienadzorowane uczenie maszynowe, wykorzystuje algorytmy uczenia maszynowego do analizowania i grupowania zbiorów danych bez etykiet. Algorytmy te wykrywają ukryte wzorce lub zgrupowania danych bez konieczności interwencji człowieka. Zdolność tego sposobu uczenia do odkrywania podobieństw i różnic w informacjach sprawia, że jest to idealne rozwiązanie do eksploracyjnej analizy danych, strategii sprzedaży wiązanej, segmentacji klientów oraz rozpoznawania obrazów i wzorców. Służy ono również do redukcji liczby cech w modelu poprzez proces redukcji wymiarów, gdzie dwa główne podejścia to analiza komponentów głównych i dekompozycja wartości osobliwych. Inne algorytmy stosowane w uczeniu nienadzorowanym obejmują między innymi sieci neuronowe, grupowanie k-średnich i metody grupowania probabilistycznego.

Uczenie częściowo nadzorowane

Uczenie częściowo nadzorowane oferuje dobrą równowagę pomiędzy uczeniem nadzorowanym i nienadzorowanym. Podczas uczenia wykorzystuje mniejszy zbiór danych z etykietami, aby kierować klasyfikacją i wyodrębnianiem cech z większego zbioru danych bez etykiet. Uczenie częściowo nadzorowane pozwala rozwiązać problem posiadania niewystarczająco oznaczonych danych (lub braku środków na wystarczające oznaczenie danych) i umożliwia opracowanie algorytmu uczenia nadzorowanego.

Aby poznać szczegółowe różnice pomiędzy metodami, należy sprawdzić część „Uczenie nadzorowane i nienadzorowane: jaka jest różnica?

Uczenie przez wzmacnianie

Uczenie przez wzmacnianie jest modelem behawioralnym uczenia maszynowego podobnym do uczenia nadzorowanego, ale algorytm nie jest szkolony z wykorzystaniem przykładowych danych. Model pozwala uczyć się na zasadzie prób i błędów. Sekwencja udanych wyników służy do opracowywania najlepszych zaleceń i procedur, aby rozwiązać dany problem.

Dobrym przykładem jest superkomputer IBM Watson®, który wygrał w grze telewizyjnej Jeopardy! w 2011 roku. System został oparty na metodzie uczenia przez wzmacnianie, która pozwalała skutecznie decydować o udzielaniu odpowiedzi (ewentualnie zadawaniu pytania) odnośnie tego, który kwadrat z tablicy wybrać i ile postawić — zwłaszcza w przypadku zakładów podwójnych.

Dowiedz się więcej o uczeniu przez wzmacnianie.

Przypadki zastosowania technologii uczenia maszynowego

Oto tylko kilka przykładów uczenia maszynowego, z którymi można się spotkać każdego dnia:

Rozpoznawanie mowy: nazywane również automatycznym rozpoznawaniem mowy (ASR), komputerowym rozpoznawaniem mowy i technologią przetwarzania mowy na tekst. Jest to funkcja wykorzystująca przetwarzanie języka naturalnego (NLP) do przekształcania ludzkiej mowy na format pisemny. Wiele urządzeń przenośnych zawiera w swoich systemach funkcję rozpoznawanie mowy na potrzeby przeprowadzenia wyszukiwania głosowego, np. Siri, lub zapewnienia większej dostępności usługi wiadomości tekstowych.

Obsługa klienta: internetowe chatboty zastępują ludzi w kontakcie z klientem. Odpowiadają na często zadawane pytania dotyczące wielu tematów, takich jak wysyłka, lub udzielają spersonalizowanych porad, prowadząc sprzedaż wiązaną produktów lub sugerując rozmiary dla użytkowników. Zmieniają sposób myślenia o zaangażowaniu klientów w serwisach WWW i na platformach mediów społecznościowych. Przykłady obejmują boty do obsługi przesyłania wiadomości w serwisach handlu elektronicznego z wirtualnymi agentami, aplikacje do obsługi wiadomości, takie jak Slack i Facebook Messenger, oraz zadania zwykle wykonywane przez asystentów wirtualnych i głosowych.

Widzenie komputerowe: ta technologia sztucznej inteligencji umożliwia komputerom i systemom uzyskiwanie istotnych informacji z cyfrowych obrazów, filmów i innych wizualnych danych wejściowych, a także podejmowanie działań na podstawie tych danych. Ta zdolność do dostarczania rekomendacji odróżnia tę technologię od systemu rozpoznawania obrazów. Dzięki zastosowaniu sieci neuronowych widzenie komputerowe znajduje zastosowanie w znakowaniu zdjęć w mediach społecznościowych, obrazowaniu radiologicznym w służbie zdrowia i pojazdach autonomicznych w przemyśle motoryzacyjnym.

Mechanizmy rekomendacji: wykorzystując historyczne dane o zachowaniach konsumpcyjnych, algorytmy sztucznej inteligencji pomagają w odkryciu trendów, co można wykorzystać do opracowania bardziej efektywnych strategii sprzedaży wiązanej. Sprzedawcy internetowi wykorzystują to do rekomendowania klientom odpowiednich towarów dodatkowych podczas dokonywania zakupów.

Zautomatyzowany handel akcjami: zaprojektowane w celu optymalizacji portfeli akcji, wykorzystujące sztuczną inteligencję platformy transakcyjne o wysokiej częstotliwości obsługi transakcji wykonują tysiące, a nawet miliony transakcji dziennie bez interwencji człowieka.

Wyzwania związane z uczeniem maszynowym

W miarę rozwoju technologia uczenia maszynowego coraz bardziej ułatwia nam życie. Wdrażanie mechanizmów uczenia maszynowego w firmach wzbudza też jednak szereg wątpliwości etycznych związanych z technologiami AI. Niektóre z nich to:

Technologiczna osobliwość

Ten temat przyciąga dużą uwagę opinii publicznej, jednak wielu badaczy nie przejmuje się ideą sztucznej inteligencji, która przewyższy ludzką w niedalekiej przyszłości. Jest ona również określana mianem superinteligencji, którą Nick Bostrum określa jako „każdy intelekt, który znacznie przewyższa najtęższe ludzkie umysły w praktycznie każdej dziedzinie, włączając w to kreatywność naukową, ogólną mądrość i umiejętności społeczne”. Pomimo tego, że pojawienie się silnej sztucznej inteligencji czy superinteligencji w społeczeństwie jest odległą koncepcją, idea ta nasuwa kilka interesujących pytań w kontekście wykorzystywania systemów autonomicznych, na przykład w motoryzacji. Jest mało prawdopodobne, że samochód bez kierowcy nigdy nie weźmie udziału w wypadku samochodowym. Czyja będzie to jednak wina i kto poniesie odpowiedzialność w takich okolicznościach? Czy powinniśmy nadal rozwijać pojazdy autonomiczne, czy też lepiej ograniczać integrację tej technologii i stworzyć jedynie półautonomiczne pojazdy, które promują bezpieczeństwo wśród kierowców? Tych decyzji jeszcze nie podjęto, ale rozwój nowej, innowacyjnej technologii AI wywołuje tego typu debaty etyczne.

Wpływ sztucznej inteligencji na pracę

Duża część uwagi opinii publicznej skupia się na utracie pracy w związku z rozwojem sztucznej inteligencji, jednak obawy te powinny zostać sformułowane w inny sposób. Wraz z pojawianiem się nowych, przełomowych technologii obserwujemy zapotrzebowanie na konkretne zmiany w zawodach. Na przykład, gdy spojrzymy na przemysł motoryzacyjny, wielu producentów, takich jak GM, zmienia profil działalności, aby skupić się bardziej na produkcji pojazdów elektrycznych i w ten sposób dostosować się do inicjatyw ekologicznych. Przemysł energetyczny nie znika, ale źródło energii przenosi się z gospodarki paliwowej na elektryczną. Sztuczna inteligencja powinna być postrzegana podobnie. Spowoduje ona przesunięcie zapotrzebowania na miejsca pracy do innych obszarów. Konieczne będzie wsparcie osób, które pomogą zarządzać tymi systemami, ponieważ danych przybywa i zmieniają się one każdego dnia. Nie zniknie zapotrzebowanie na zasoby, które zajmą się bardziej złożonymi problemami w branżach najbardziej narażonych na zmiany popytu na pracę, takich jak obsługa klienta. Ważnym aspektem sztucznej inteligencji i jej wpływu na rynek pracy będzie pomoc jednostkom w przejściu na te nowe obszary popytu rynkowego.

Ochrona prywatności

Prywatność jest przedmiotem dyskusji w kontekście ochrony danych osobowych i bezpieczeństwa danych. W ostatnich latach ustawodawcy pracowali nad rozwianiem związanych z nimi obaw. Przykładowo w 2016 roku opracowano przepisy RODO mające na celu ochronę danych osobowych obywateli Unii Europejskiej i Europejskiego Obszaru Gospodarczego, co dało ludziom większą kontrolę nad ich danymi. W Stanach Zjednoczonych poszczególne stany opracowują dokumenty, takie jak California Consumer Privacy Act (CCPA), które wymagają od przedsiębiorstw informowania konsumentów o gromadzeniu ich danych. Te nowo uchwalane przepisy zmusiły firmy do przemyślenia sposobu, w jaki przechowują i wykorzystują dane osobowe. W rezultacie inwestycje w bezpieczeństwo stają się coraz większym priorytetem dla przedsiębiorstw, które dążą do eliminacji wszelkich słabych punktów oraz możliwości inwigilacji, hakowania i cyberataków.

Uprzedzenia i dyskryminacja

Przypadki uprzedzeń i dyskryminacji w niektórych inteligentnych systemach wzbudziły wiele pytań etycznych dotyczących stosowania sztucznej inteligencji. W jaki sposób możemy zabezpieczyć się przed uprzedzeniami i dyskryminacją, gdy same dane szkoleniowe mogą prowadzić do uprzedzeń? Chociaż firmy podejmujące działania w kierunku automatyzacji zwykle kierują się dobrymi intencjami, Reuters (odsyłacz prowadzi poza serwis IBM) podkreśla niektóre z nieprzewidzianych konsekwencji włączenia sztucznej inteligencji do procesu zatrudniania. Próbując zautomatyzować i uprościć proces, firma Amazon niezamierzenie wykazywała się uprzedzeniami na tle płci w przypadku wolnych stanowisk technicznych. Ostatecznie projekt musiał zostać zamknięty. Gdy informacje o podobnych zdarzeniach zaczęły wypływać na światło dzienne, Harvard Business Review (odsyłacz prowadzi poza serwis IBM) poruszył inne kwestie związane z wykorzystaniem sztucznej inteligencji do zatrudniania, takie jak to, które dane powinny być używane podczas oceniania kandydata na stanowisko.

Uprzedzenia i dyskryminacja nie ograniczają się tylko do kadr. Można je spotkać w wielu zastosowaniach, od oprogramowania do rozpoznawania twarzy po algorytmy wykorzystywane w mediach społecznościowych.

W miarę rosnącej świadomości ryzyka związanego ze sztuczną inteligencją przedsiębiorstwa coraz bardziej angażują się w dyskusję na temat etyki i wartości sztucznej inteligencji. Na przykład w ubiegłym roku Arvind Krishna, dyrektor generalny IBM, poinformował, że IBM kończy pracę nad produktami ogólnego przeznaczenia do rozpoznawania i analizowania twarzy, podkreślając, że „IBM stanowczo sprzeciwia się technologiom, w tym technologii rozpoznawania twarzy oferowanej przez innych dostawców, które służą do masowej inwigilacji, profilowania rasowego, łamania podstawowych praw i wolności człowieka lub jakiegokolwiek celu niezgodnego z naszymi wartościami i zasadami zaufania i przejrzystości i nie będzie stosować takich technologii”.

Więcej informacji na ten temat znajduje się na blogu poświęconym strategii IBM, w którym opisano punkt widzenia firmy na temat „podejścia polegającego na precyzyjnej regulacji nadzoru nad eksportem technologii rozpoznawania twarzy”.

Odpowiedzialność

Ze względu na brak znaczących przepisów regulujących działania sztucznej inteligencji, nie istnieje żaden realny mechanizm egzekwowania stosowania etycznej AI. Obecnie zachętą dla przedsiębiorstw do przestrzegania tych wytycznych są negatywne skutki, jakie nieetyczne systemy sztucznej inteligencji mają na wyniki finansowe. Aby wypełnić tę lukę, etycy i badacze opracowali ramy etyczne, które pozwalają zarządzać tworzeniem i dystrybucją modeli sztucznej inteligencji w społeczeństwie. Jednak w tej chwili są one jedynie wskazówkami, a badanie (odsyłacz prowadzi poza serwis IBM) (PDF, 984 kB) pokazuje, że połączenie rozproszonej odpowiedzialności i braku przewidywania potencjalnych konsekwencji nie sprzyja staraniu o zapobieganie szkodom dla społeczeństwa.

Więcej na temat stanowiska IBM w kwestii etycznej AI można przeczytać tutaj.

Uczenie maszynowe i chmura IBM Cloud

IBM Watson Machine Learning obsługuje pełen cykl życia uczenia maszynowego. Program jest dostępny w wielu wersjach, które pozwalają tworzyć modele uczenia maszynowego, aby wykorzystać aktywne dane, oraz wdrażać te modele w hybrydowym środowisku wielochmurowym.

IBM Watson Machine Learning on IBM Cloud Pak for Data pomaga analitykom danych i zespołom ds. AI przyspieszyć rozwijanie mechanizmów AI oraz wdrażać je na wszystkich platformach danych i sztucznej inteligencji stworzonych z myślą o chmurze. IBM Watson Machine Learning Cloud, usługa zarządzana dostępna w środowisku IBM Cloud, oferuje najszybszą metodę przenoszenia modeli z fazy testowej do produkcyjnej. Mniejszym zespołom planującym wykorzystanie uczenia maszynowego IBM Watson Machine Learning Server oferuje prostą instalację w dowolnej chmurze prywatnej lub publicznej.

Aby rozpocząć, zarejestruj się, uzyskaj identyfikator IBM i załóż konto IBM Cloud.