1.2 Что собой представляет глубокое обучение? Что значимо для работы системы?
Что собой представляет глубокое обучение?
Глубокое обучение, или DL (Deep learning), относится к более интенсивной версии машинного обучения. Помните один скрытый слой в искусственной нейронной сети? В DL существует ряд слоев
Нейронные сети глубокого обучения не только более сложны, но именно здесь существует надежда (и страх), что алгоритмы взлетят и начнут обучаться сами по себе. Там, где технология находится сейчас, будь то базовое машинное обучение или DL, алгоритмы все еще зависят от получения входных данных от людей (т.е. из внешних источников).
Что значимо для работы системы?
Для обучения нейронной сети требуется подготовка входных данных, без которых создание или распознание чего-либо просто невозможно. Сначала необходимо позаботиться о сборе данных.
Для обучения требуется большое количество примеров, чтобы система была в состоянии понимать закономерности. К примеру, если задача нейросети состоит в обретении способности различения рукописных букв «А» и «Б», требуется загрузка сотен или даже тысяч файлов с изображениями соответствующих букв.
Для обучения нейросетей необходимо человеческое участие.
В одном из сценариев специалистом делается выбор необходимых данных и производится загрузка их в систему, самостоятельно затем их анализирующую. В другом сценарии человеком задаются алгоритмы и исправляются сделанные роботом ошибки.
К примеру, проанализировав рукописные «А» и «Б», система в итоге выдала числовое значение (в задачу входило нахождение «Б»). Чем число больше, тем нейронная сеть более уверена в правильности данного варианта. Людям ответ известен, и если обнаруживается ошибка, ими осуществляется корректировка параметров в системе и дается команда произвести пересчет.
1.3 Слои базовой нейронной сети
Ниже дано сильно упрощенное описание трех слоев базовой нейросети
Слой входной
Слоем входным получаются из внешнего мира данные. Они подвергаются анализу, распределяются и передаются на следующий уровень.
Слой выходной
Слой выходной – дающий окончательный результат.
Слой скрытый
Слой скрытый (таких слоев может быть несколько) – отвечающий за обработку информации из слоя первого и иных скрытых слоев. Обеспечивается извлечение конкретных признаков.