М

Машинное обучение

Машинное обучение — раздел искусственного интеллекта, где алгоритмы учатся на данных и улучшают свои предсказания без явного программирования каждого правила.

Что это

Машинное обучение (Machine Learning, ML) — это подход к созданию программ, при котором система не получает жёстко прописанных правил, а сама выявляет закономерности из данных и на их основе делает предсказания или принимает решения. Например, вместо того чтобы вручную описать все признаки спама, разработчик показывает модели тысячи писем с пометками «спам» и «не спам» — и алгоритм сам учится их различать. Термин ввёл Артур Сэмюэл в 1959 году, описывая программу для игры в шашки, которая становилась сильнее по мере игры.

Зачем это нужно

Многие задачи слишком сложны для ручного программирования: распознавание лиц на фото, перевод текста, прогнозирование спроса на товар. Написать исчерпывающий набор правил для каждой из них практически невозможно — слишком много переменных и исключений. Машинное обучение решает это иначе: алгоритм обучается на примерах и обобщает их. С ростом вычислительных мощностей и объёмов данных после 2010-х годов ML из академической области превратился в промышленный инструмент — сегодня его используют банки, медицина, ретейл, логистика и десятки других отраслей.

Как это работает

Процесс машинного обучения обычно состоит из нескольких этапов: сбор и подготовка данных, выбор модели, обучение, оценка качества и применение. Существуют три основных подхода в зависимости от того, как размечены данные.

  • Обучение с учителем (Supervised Learning) — модель тренируется на размеченных данных: каждому входу соответствует правильный ответ. Пример: предсказание цены квартиры по площади и району.
  • Обучение без учителя (Unsupervised Learning) — данные не размечены, алгоритм ищет скрытую структуру. Пример: кластеризация покупателей по поведению для сегментации аудитории.
  • Обучение с подкреплением (Reinforcement Learning) — агент взаимодействует со средой и получает награду или штраф за действия. Пример: AlphaGo от DeepMind, победивший чемпиона мира по го в 2016 году.
  • В процессе обучения модель минимизирует ошибку — разницу между своим предсказанием и правильным ответом — с помощью алгоритмов оптимизации, например градиентного спуска.

Примеры применения

  • Финансы: скоринг заёмщиков в банках — модель оценивает вероятность дефолта по истории платежей, доходу и десяткам других признаков.
  • Медицина: анализ снимков МРТ и КТ для выявления опухолей — алгоритмы достигают точности, сопоставимой с опытными радиологами.
  • Стриминг: рекомендательные системы Netflix и Spotify подбирают контент на основе истории просмотров и поведения похожих пользователей.
  • Ретейл: прогнозирование спроса в Wildberries и Ozon позволяет заранее перераспределять товары между складами и снижать издержки.
  • Кибербезопасность: обнаружение аномалий в сетевом трафике — ML-модели замечают нетипичное поведение быстрее, чем правила сигнатурного анализа.

Связанные понятия

  • Искусственный интеллект (ИИ) — более широкое понятие; машинное обучение является его подмножеством.
  • Глубокое обучение (Deep Learning) — подраздел ML, использующий многослойные нейронные сети; особенно эффективен для работы с изображениями, текстом и звуком.
  • Нейронная сеть — архитектура модели, вдохновлённая строением мозга; основа большинства современных ML-систем.
  • Датасет — размеченный или неразмеченный набор данных, на котором обучается модель.
  • Переобучение (Overfitting) — ситуация, когда модель слишком точно подстраивается под обучающие данные и плохо работает на новых.

Частые мифы

Главный миф — что ML «думает» или «понимает» как человек. На самом деле модель находит статистические паттерны в числах и не имеет никакого смысла за ними. Второй распространённый миф: чем больше данных, тем лучше результат. Качество данных важнее количества — зашумленная или предвзятая выборка даст ненадёжную модель, сколько бы примеров в ней ни было. Наконец, ML — не универсальный инструмент: для задач с чёткими правилами и небольшим объёмом данных классическое программирование часто работает быстрее и надёжнее.

Другие термины на букву «М»

Модульное обучение
Модульное обучение — подход, при котором учебный курс разбивается на самостоятельные блоки (модули),...
Методические рекомендации
Методические рекомендации — документ, который объясняет, как правильно выполнять конкретную задачу,...
Микрообучение
Микрообучение — формат подачи учебного материала короткими порциями длиной 2–10 минут, сфокусированн...
Маркетинговая стратегия
Маркетинговая стратегия — план действий компании по привлечению и удержанию клиентов, который опреде...
Медиация
Медиация — добровольная процедура урегулирования споров с участием нейтрального посредника, который...
Межевание
Межевание — процедура определения и юридического закрепления границ земельного участка на местности...
Межевой план
Межевой план — документ, который фиксирует границы земельного участка на местности и служит основани...