Всё о секретах программного обеспечения и онлайновых сервисов

Как работает машинное обучение: самое простое объяснение

В настоящее время на рынке IT наблюдается бурное развитие продуктов и сервисов, использующих технологии машинного обучения и системы искусственного интеллекта (ИИ) на базе нейронных сетей. Разработки и исследования в этой области ведут Intel, AMD, NVIDIA, IBM, ARM, Google, Facebook, «Яндекс», Baidu, ABBYY, Cognitive Technologies и многие другие компании, понимающие, что без поиска новых перспективных направлений преуспеть и занять лидирующие позиции на современном IT-рынке не то чтобы проблематично, а попросту невозможно.

Вне всяких сомнений, машинное обучение и искусственный интеллект — очень интересные технологии, за ними будущее. Но как они работают, какие математические модели положены в их основу? Максимально просто и доходчиво на этот вопрос попытались ответить специалисты «Лаборатории Касперского», затронувшие тему ИИ на проходившей недавно презентации обновлённой линейки продуктов, обеспечивающих защиту широкого круга вычислительных устройств домашних пользователей.

Как работает машинное обучение: самое простое объяснение

Для понимания принципов работы машинного обучения рассмотрим конкретный пример. Предположим, нам нужно научить компьютер отличать осмысленный текст от неосмысленного, белиберды. Как реализовать такой алгоритм?

Как работает машинное обучение: самое простое объяснение

Очень просто — необходимо создать математическую модель, являющуюся основой основ машинного обучения и искусственного интеллекта. Для этого мы подсчитаем частоты встречаемости каждых пар букв в обоих текстах. Например, в нашем «настоящем» тексте в фразе «Могу творить, могу и натворить!» пара букв «МО» встречается 2 раза, «АТ» — один раз и так далее.

Как работает машинное обучение: самое простое объяснение

На следующем шаге нам потребуется построить модель русского языка. Для этого мы посчитаем, какие сочетания букв встречаются в одном из отрывков романа Льва Николаевича Толстого «Война и мир». Получилось, что самым часто используемым в русском языке буквосочетанием является «ТО», а самым редким — «ТЖ».

Как работает машинное обучение: самое простое объяснение

Далее подсчитываем показатель правдоподобности текста для наших примеров, используя полученные на предыдущем шаге результаты. Для нормальных фраз правдоподобность получается высокой, потому что в них буквосочетания нормальные, которые часто встречаются в русском языке, а для белиберды этот показатель близок к нулю.

Как работает машинное обучение: самое простое объяснение

После этого важно определить границу между хорошими и плохими текстами, руководствуясь которой машина будет понимать и определять качество анализируемых данных. Для этого надо провести машинное обучение и «скормить» созданной математической модели много хороших и плохих примеров — в результате система сама определит границу, которая будет выступать в качестве реперной точки для ИИ-алгоритма.

Как работает машинное обучение: самое простое объяснение

Именно в так в простейшем представлении и работает машинное обучение. Таков базовый принцип работы любой системы искусственного интеллекта.