Профессии будущего: Data science, Data analytics и Machine learning


18:29, 6  марта  2021
Многие амбициозные, активные люди из ИТ-индустрии заявляют о своей готовности заниматься «наукой о данных» или «аналитикой данных» и даже «машинным обучением». В настоящее время это очень модные концепции, и, вероятно, многие люди выберут этот карьерный путь. Поэтому стоит разобраться, что означают эти названия и как выглядит работа на соответствующих должностях.
Профессии будущего: Data science, Data analytics и Machine learning

Многие амбициозные, активные люди из ИТ-индустрии заявляют о своей готовности заниматься «наукой о данных» или «аналитикой данных» и даже «машинным обучением». В настоящее время это очень модные концепции, и, вероятно, многие люди выберут этот карьерный путь. Поэтому стоит разобраться, что означают эти названия и как выглядит работа на соответствующих должностях.

Следует начать с того, как понимать термины Data Science и Data Analytics, потому что они иногда понимаются неправильно. Если добавить к ним машинное обучение, у многих действительно могут возникнуть некоторые сомнения.

Аналитика данных

Data Analytics занимается анализом существующих данных (это важно!), И в настоящее время они растут с астрономической скоростью. К сожалению, данные поступают из разных источников, имеют разные форматы и разное качество. Следовательно, большая часть аналитической работы начинается еще до самого анализа! Его цель — обнаружить простые зависимости между конкретными данными и представить эту информацию таким образом, чтобы она была удобочитаемой для бизнеса. Именно бизнес является основным получателем обрабатываемых данных, потому что хорошее знание взаимосвязей между бизнес-событиями позволяет их эффективно использовать и тем самым достигать успеха в бизнесе, какими бы они ни были, потому что речь идет не только о финансовых успехах.

Наука о данных

реклама

Между тем, Data Science — это более широкая концепция, построенная на основе Data Analytics, но продвигающаяся в будущее к более активному поиску зависимостей и управлению процессом, построенным на этих зависимостях. Сегодня многие решают начать обучение data science с нуля. Специалист по Data Science должен будет лучше разбираться в данных. Интересно, что для их понимания недостаточно знаний в области ИТ. Специалист может оперативно описать происходящее на бирже, посоветовать, как изменить производственный процесс или помочь выиграть выборы. Математические и статистические навыки также становятся очень важными. Вот где разница между Data Analytics и Data Science становится наиболее заметной.

В Data Science обычно используются научные методы для поиска зависимостей, которые часто хорошо скрыты в данных. Бывает, что программист бизнес-приложений задается вопросом, зачем он в жизни изучал высшую математику. В конце концов, чтобы создать приложение для бухгалтерского учета, склада и интернет-магазина, все, что нужно, это ... знание сложения, вычитания, иногда деления и работы с процентами. К чему вся остальная высшая математика? Такие вопросы не должны беспокоить специалиста по Data Science. Дисперсия, ковариация, среднее значение, медиана, квантиль, стандартное отклонение, среднеквадратическая ошибка — это концепции, которые специалист должен использовать ежедневно. Вероятно, это преувеличение, но Data Scientist — это что-то вроде «человека эпохи Возрождения», который знает несколько разных областей.

С одной стороны, он должен знать ИТ-отрасль в целом, потому что специалист по данным должен уметь решать свои проблемы программно.

Машинное обучение

реклама

Теперь, когда данные тщательно изучены, можно сделать еще один шаг. Бизнес может запросить данные, которых на данный момент не существует. Это то, что делает машинное обучение. Но на карту поставлено не только предсказание будущего. Если специалиста спрашивают, какой урон нанесет брошенный в окно камень, это не совсем тот вопрос, на который следует отвечать с помощью машинного обучения. Гораздо лучше будет применить физические законы, которые, учитывая известную массу камня, толщину стекла, силу броска и т.д., точно ответят на вопрос о том, что произойдет.

Машинное обучение также не связано с прогнозированием погоды — здесь используются специальные алгоритмы, которые, однако, могут решить только одну конкретную проблему. Машинное обучение строит свои алгоритмы для угадывания неизвестных значений на основе уже существующих данных. Используя информацию, возвращаемую Data Science, специалисты могут построить модель зависимостей, которая позволяет предсказывать результаты для новых входящих данных с определенной вероятностью. В машинном обучении пользователи имеют дело с тем, что было обнаружено на этапе работы Data Scientist, но специалисты забывают о самих данных, остаются только зависимости, которые называются моделью в целом.

Читайте также

Комментарии

Загрузка комментариев...