В последнее время всё больше людей предпочитают учится онлайн. Сегодня возможно осуществить обучение Machine Learning дистанционно.

Для тех, кто делает первые шаги, Data Science — это область, которая кажется слишком абстрактной и сложной и, следовательно, зарезервирована только для профессионалов. Правда, однако, что профессионал в этой области — это просто тот, кто имеет больше знаний о статистике, чем средний программист и больше знаний о программировании, чем средний статистик.

Давайте изобразим это на простом примере. Предположим, что какая-то компания нанимает специалиста для изучения поведения потребителей в своих магазинах. Для этого она предоставляет нам данные в виде Excel с 30 отзывами, в которых каждый клиент дал оценку удовлетворенности и лояльности.

Наша цель — группировать клиентов, которые ведут себя аналогичным образом. Это позволит нам упростить данные и сделать выводы для создания идей, которые могут повысить уровень удовлетворенности и лояльности потребителей. Как использовать данные?

Их стоит упорядочить, чтобы получить прозрачность.

Сначала это может показаться сложным, но по сути дело в том, чтобы знать, какие функции для чего применяются, и знать основные команды Python.

Не нужно выдающегося ума для предварительной сегрегации данных.

По общему признанию, слишком поверхностный анализ, и роль Data Science заключается в том, чтобы “видеть больше”. Для этого используются алгоритмы машинного обучения. В этом помогают такие инструменты, как Jupyter, потому что они позволяют легко реализовать и использовать данные Machine Learning.

Опять же, с помощью нескольких простых команд вводится очень популярное обучение без присмотра-k-средних (от англ. k-means). Для этого алгоритма мы должны заранее определить, на сколько групп мы хотим разделить нашу коллекцию, предположим, например, четыре группы. Что мы получаем?

Машина разделила коллекцию на группы, которым опытный Data Scientist может дать интересные и четкие ярлыки. В этом случае вы должны определить их следующим образом:

  • Alienated — клиенты, которым не хватает лояльности и неудовлетворенности;
  • Roamers — «странники», то есть клиенты удовлетворенные, но мало лояльные;
  • Supporters — клиенты, которые лояльны, но покупки не делают их удовлетворенными;
  • Fans — лояльные клиенты, отличающиеся высокой удовлетворенностью.