Sztuczny neuron jest podstawowym budulcem sieci neuronowej. Odbiera sygnały wejściowe z innych neuronów lub źródeł zewnętrznych i stosuje funkcję do obliczenia sygnału wyjściowego. Sygnał wyjściowy może zostać wysłany do innych neuronów lub użyty jako ostateczne wyjście sieci. Sieci neuronowe składają się z połączonych ze sobą warstw neuronów, z których każda pełni inną funkcję. Warstwa wejściowa odbiera zewnętrzne dane wejściowe, podczas gdy warstwa wyjściowa generuje ostateczne wyjście sieci. Warstwy ukryte pomiędzy nimi wykonują transformacje na danych wejściowych.
Głębokie uczenie różni się od tradycyjnych sieci neuronowych tym, że ma wiele warstw ukrytych neuronów. Pozwala to na modelowanie złożonych relacji między danymi wejściowymi i wyjściowymi. Głębokość sieci jest tym, co nadaje uczeniu głębokiemu jego nazwę. Algorytmy głębokiego uczenia mogą uczyć się hierarchicznych reprezentacji danych, przy czym każda warstwa uczy się reprezentować bardziej abstrakcyjne cechy danych wejściowych.
Warstwa kontekstu w sieci Elmana służy do modelowania danych sekwencyjnych. Śledzi ona poprzednie wejścia i wyjścia sieci i wykorzystuje je jako kontekst dla bieżącego wejścia. Pozwala to sieci na modelowanie czasowych zależności w danych. Sieć Elmana jest rodzajem rekurencyjnej sieci neuronowej, która jest klasą sieci neuronowych, które mogą przetwarzać sekwencje danych wejściowych.
Uczenie nadzorowane to rodzaj uczenia, w którym sieć jest trenowana na oznaczonych danych. Sieć otrzymuje pary wejść/wyjść i uczy się mapować wejścia na wyjścia. Celem jest zminimalizowanie różnicy między wyjściem sieci a prawdziwym wyjściem dla każdego wejścia. Z drugiej strony, uczenie bez nadzoru jest rodzajem uczenia się, w którym sieć otrzymuje tylko dane wejściowe. Celem jest znalezienie wzorców i struktury w danych bez wyraźnego nadzoru.
Podsumowując, głębokie uczenie jest potężnym narzędziem, które zrewolucjonizowało dziedzinę uczenia maszynowego. Wykorzystuje ono sztuczne sieci neuronowe z wieloma warstwami do modelowania złożonych relacji między danymi wejściowymi i wyjściowymi. Warstwa kontekstowa w sieci Elmana służy do modelowania danych sekwencyjnych, podczas gdy uczenie nadzorowane i nienadzorowane to dwa rodzaje uczenia stosowane w sieciach neuronowych. Dzięki zdolności do uczenia się hierarchicznych reprezentacji danych, głębokie uczenie otworzyło nowe możliwości w takich dziedzinach jak rozpoznawanie obrazów, rozpoznawanie mowy i przetwarzanie języka naturalnego.
Skrót AI oznacza sztuczną inteligencję.