Машинное обучение – просто о сложном
19 ноября 2016
Рубрика: Обзоры и мнения, Технологии.
Автор: .

mash_19_11_2016

Что такое машинное обучение? Если вы где-нибудь встречали словосочетание «машинное обучение» (МО), вы, наверное, сразу думали об обучении роботов или вообще о робототехнике.

Итак, что же такое машинное обучение? Машинное обучение — это быстроразвивающаяся наука об обработке больших данных, обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, спо­собных обучаться. Классическая задача машинного обучения такова: в компьютер вводятся данные и результаты обработки этих данных (это называется обучающей выборкой), и задача составить алгоритм, который найдет взаимосвязь между ними. Алгоритму далее дают тестовую выборку, только с данными, и измеряют точность результатов. Чем больше данных, тем точнее и эффективнее будет алгоритм. В машинном обучении вообще все завязано на данных. Алгоритмы машинного обучения обрабатывают большие данные и получают из них знания.

mash_19_11_2016_01

Где используют машинное обучение?

С каждым годом количество данных растет по экспоненте. За один день в городе Церне научные сотрудники, зани­мающиеся исследованиями процессов, происходящих в большом адронном коллайдере, получают данные, количество которых сравнимо с данными всего Интернета! На ручную обработку всех этих данных ушли бы века, но тут к нам подоспевает на помощь машинное обучение и ученые при этом отделяют до 75% полезной информации. Вы каждый день встречаетесь с машинным обучением, когда проверяете почту, большая часть которой была отфильтрована алгоритмами машинного обучения, выбираете, какой же фильм посмотреть на любимом сайте, отбиваетесь от назойливой рекламы от google на всевозможных сайтах и когда тот же google с полуслова понимает ваш запрос и выдает результаты за микросекунды. С помощью машинного обучения Facebook решает, какие новости вам показывать, а Twitter подбирает подходящие твиты. При помощи машинного обучения был разработан автомобиль без водителя. Amazon — один из крупнейших интернет-магазинов, использует алгоритмы машинного обучения для рекомендации пользователям того или иного товара. Все крупные компании начинают пользоваться машинным обучением для распознавания своей целевой аудитории. Машинное обучение используют и в медицине. Иногда даже врачам с большим опытом работы сложно сориентироваться во множестве симптомов, а алгоритмам машинного обучения уже удается с легкостью ставить многие диагнозы. Также в фармацевтике для определения, какого воздействия ожидать от определенного лекарства, пользуются машинным обучением.

При помощи машинного обучения даже можно предсказывать события наперед. Его уже используют, например, в прогнозе погоды.

mash_19_11_2016_02

Школы машинного обучения

В процессе развития науки возникло пять основных школ машинного обучения. Все школы по-своему достигли вершин в машинном обучении. Каждая из них имеет свой теоретически универсальный обучающийся алгоритм. Универсально обучающийся алгоритм — это такой алгоритм, который в теории может быть применим к решению любых задач. Однако, на практике каждый из этих алгоритмов хорош для одних задач, но не очень подходит для других. Это такие школы, как:

  1. Символисты, которые черпают идеи из философии и логики.
  2. Коннекционисты вдохновляются нейробиологией — наукой о том, как устроен наш мозг.
  3. Эволюционисты симулируют эволюцию на компьютерах и обращаются к генетике и эволюционной биологии.
  4. Сторонники байесовского подхода полагают, что обучение — это разновидность вероятностного подхода.
  5. Аналогисты уверены, что мир соткан из аналогий и все наше обучение сводится к ним.

Возникает вопрос: а можно ли их объединить в один универсальный обучающийся алгоритм, или, как говорит Педро Домингос, «Верховный алгоритм»? Этой проблемой занимается множество ученых в сфере машинного обучения. Верховный алгоритм сумеет извлечь из данных вообще все знания — знание прошлого, настоящего и будущего. Изобретение этого алгоритма станет одним из величайших прорывов в истории науки. Оно ускорит прогресс буквально во всем, изменит мир так, как мы едва можем себе сегодня представить.

Что надо знать, чтобы стать датасайнтистом

mash_19_11_2016_03

Датасайнтист (от анл. «data scien­tist» — ученый по данным) — это ученый, занимающийся обработкой данных и машинным обучением. Основой этой науки являются: математическая статистика, высшая математика, параллельные алгоритмы, программная инженерия, теория вероятностей, обработка «больших данных» и математический анализ. Чтобы использовать эти знания на практике, нужно знать программирование. В основном в машинном обучении используются языки программирования R и Python. Выбор языка — это дело вкуса, но новичкам всегда рекомендуют Python, так как синтаксис языка очень прост и легок в обучении. Python — это интерпретируемый язык программирования, что означает — компьютер выполняет программы, написанные на этом языке так как есть, не переводя их на другой язык. Это отличает этот язык от компилируемых, программы, написанные на которых, требуют предварительного перевода на машинный код, понятный компьютеру. Существуют много курсов по машинному обучению в Интернете, да и литературы тоже достаточно.

mash_19_11_2016_04

Перспективы развития машинного обучения

Машинное обучение уже используют практически во всех сферах нашей жизни. Анализ рынка труда показывает, что машинное обучение будет одной из самых востребованных профессий в двадцать первом веке. Как писал Педро Домингос в своей книге «Верховный алгоритм», если когда-нибудь изобретут верховный алгоритм, то можно будет, например, создать «цифровое зеркало» человека. Идея цифрового зеркала такова: программа на компьютере соберет всю информацию из Интернета о вас, все аккаунты социальных сетей, фото, видео, текстовую информацию и создаст вашу цифровую копию. Эту копию вы сможете носить на флешке и дополнять по мере необходимости. Эта копия может ожить и поговорить с вами, вы у нее можете спросить обо всем, что вас интересует в вас самих. И некоторые ответы могут вам и не понравиться. Эта копия даже может помочь вам стать лучше. Кроме самосовершенствования, есть много идей как использовать ваше цифровое зеркало. Оно посетит все сайты кадровых агентств, проведет миллионы со­беседований с цифровыми зеркалами работодателей и составит для вас список самых подходящих вакансий, что сэко­номит вам уйму времени. Оно может так­же сэкономить ваше время при выборе наиболее подходящих книг, одежды, электроники и других необходимых товаров. Цифровое зеркало проведет за вас тысячи свиданий на сайте знакомств с цифровыми зеркалами других пользователей и поможет найти вашу вторую половинку, так как будет знать ваши вкусы и предпочтения. Цифровое зеркало — это только одно из открытий, которое может сделать машинное обучение. Существуют теории о том, что в каждом доме будут беспрестанно трудиться роботы-помощники, которые будут запрограммированы с помощью машинного обучения. Они смогут готовить за вас еду, присматривать за вашим ребенком, выполнять все дела по дому.

Вывод

Машинное обучение является наукой о данных и их обработке. Эта наука используется во многих сферах нашей жизни. Она базируется на пяти основных школах обучения и является синтезом таких наук, как математическая статистика, высшая математика, параллельные алгоритмы, программная инженерия, теория вероятностей, обработка «больших данных» и математический анализ. Перспективы развития машинного обучения почти безграничны. С уверенностью можно сказать, что профессия датасайнтиста будет одной из самых востребованных в ближайшем будущем. Надеемся, что данная статья смогла вызвать у вас интерес к этой науке и профессии, дала общее направление ее изучения.

Авторы: Рустам Тургунов, Вахид Хамидов

Orphus system
Подписывайтесь на канал infoCOM.UZ в Telegram, чтобы первыми узнавать об ИКТ новостях Узбекистана
В Telegram
В WhatsApp
В Одноклассники
ВКонтакте