Сравнение бизнес-аналитиков и специалистов Data Science

№105-1,

экономические науки

В данной статье приводится сравнительная характеристика бизнес-аналитиков (а также традиционных аналитиков) и специалистов в области Data Science. В работе нашли отражение различные аспекты текущей ситуации и будущих перспектив данных специалистов, например, список необходимых навыков и знаний. Также используются результаты различных исследований, а также данные крупных статистических порталов.

Похожие материалы

В 2012 году американский журнал The Harvard Business Review назвал профессию специалиста в области Data Science («наука о данных») «самой привлекательной профессией 21-го века» [1]. Более того, компания McKinsey [2] еще в 2011 году давала оценку, что к 2018 году одни только Соединенные Штаты могут столкнуться с нехваткой от 140 000 до 190 000 человек в сфере Data Science. Все это говорит о заметном росте интереса в специалистах данной области.

Возникает очевидный вопрос: возможно, на сегодняшний день аналитика и наука о данных переживают пик популярности, но почему именно сейчас?

На то есть много причин. Можно обратиться к сторонникам анализа данных, например, Нейт Сильвер, американский статистик и автор книги «Moneyball», в которой он доказывает, что бейсбол — всего лишь игра цифр игра статистики. Помимо этого, Сильвер успешно спрогнозировал победителя президентских выборов 2012 года во всех 50 штатах США [3]. Также показателен пример крупных компаний, активно использующих данные, таких как Netflix, Google и Facebook. В наши дни люди, ориентированные на изучение данных, успешно применяют свои навыки даже в игровых телевизионных шоу, таких как «Jeopardy!» («Рискуй») (американский аналог российской телевизионной игры-викторины «Своя игра»). Участник этой игры, Артур Чу, выиграл свыше 300 тысяч долларов, используя теорию игр и анализ данных [4]. Возможно, это достаточно вдохновляюще, если вы изучаете Data Science или проявляете интерес к этой области.

В век Big Data анализ больших массивов данных не только важен для качества продукта, но и может стать источником для инноваций. Для получения необходимой информации и лучшего ее понимания, компании нанимают различных специалистов — в том числе бизнес-аналитиков и специалистов Data Science.

Бизнес-аналитики исследуют и получают полезную информацию из структурированных и неструктурированных источников, дабы объяснить события прошлого, настоящего и будущего и определить наилучшие аналитические модели и подходы, чтобы представить и объяснить их бизнес-аудитории.

Деятельность специалистов Data Science охватывает проектирование, разработка и применение алгоритмов статистического программирования, поддерживающих инструменты для принятия бизнес-решений; а также включает управление большими объемами данных и создание визуализации, помогающей восприятию информации.

Также рассмотрим представителей данных областей в контексте их образования. Так, по результатам исследования сайта O*NET Online большинство бизнес-аналитиков приходят из разных областей (бизнес, финансы, экономика, информационные технологии, политология, история, психология) [5], в то время как специалисты Data Science, как правило, приходят из сфер IT, математики и технологий [6]. Среди бизнес-аналитиков 70% имеют диплом бакалавра, 30% — магистры [5]. У специалистов Data Science 28% составляют бакалавры, 48% — магистры, а докторскую степень имеют 20% от общего числа [6].

И бизнес-аналитики, и специалисты Data Science — эксперты в области использования данных для обоснования принятия решений, однако они по-разному применяют свои навыки, используя при этом схожие инструменты. В 2012 году журнал Forbes составил перечень качеств, навыков и компетенций представителей данных профессий в том или ином направлении, которые перечислены ниже [7].

Принятие решений. Бизнес-аналитики вносят изменения путем трансформации данных, полученных из междисциплинарного анализа, в данные, которые полезны для принятия бизнес-решений. Специалисты Data Science открывают возможности добычи данных и написания алгоритмов машинного обучения для принятия бизнес-решений.

Решение прикладных задач. В перечень функций бизнес-аналитиков включают определение задач бизнеса и перевод статистического анализа в data-driven бизнес-аналитику (т.е. бизнес-аналитику на основе фактических данных). Среди умений специалиста Data Science выделяют создание основы анализа, при помощи которого могут решаться прикладные задачи бизнеса.

Анализ данных. Бизнес-аналитики занимаются исследованием, интерпретацией и визуализацией исходных данных при помощи предиктивного, прескриптивного и дескриптивного анализа с целью облегчения ее восприятия. В то же время, в список компетенций специалистов Data Science входит управление большими многомерными наборами данных с использованием таких методов, как линейный дискриминантный анализ и выборка мультилинейной регрессии.

Аналитическое моделирование. Среди компетенций бизнес-аналитиков выделяют понимание, интеграцию и выбор решений для использования при моделировании данных. В свою очередь, специалист Data Science должен быть программистом с опытом работы с определенными статистическими данными, а также навыками работы с такими статистическими инструментами и языками программирования SAS, SQL, SPSS, Python и Knime.

Управление базами данных. В контексте работы с базами данных бизнес-аналитик в первую очередь ответственен за определение и подстройку требований для различных типов данных с использованием таких инструментов, как Teradata, Oracle и Hadoop. Специалист Data Science непосредственно проектирует и структурирует базы данных с использованием уже перечисленных инструментов Teradata, Oracle и Hadoop.

Важный вопрос при сравнении данных профессий заключается в определении сфер деятельности, в которых присутствуют бизнес-аналитики и специалисты Data Science. Так, американский статистический портал U.S. Bureau of Labor Statistics предлагает следующее соотношение для бизнес-аналитиков [8]:

  1. Финансы и страхование — 28%
  2. Профессиональные, научные и технические услуги — 22%
  3. Управление компаниями и предприятиями — 9%
  4. Производство — 9%
  5. Федеральное правительство — 5%

Соотношение специалистов Data Science выглядит немного иначе [9]:

  1. Федеральное правительство — 28%
  2. Проектирование компьютерных систем и сопутствующие услуги — 20%
  3. Исследование и разработка в области физических, инженерных и биологических наук — 17%
  4. Колледжи, университеты и школы профессионального обучения — 8%
  5. Разработчики ПО — 6%

Тот же портал приводит интересные цифры в контексте текущей ситуации и перспектив на рынке труда. На 2016 год общее количество рабочих мест в области бизнес-аналитики составляло 114 тысяч (прогноз роста занятости в ближайшие 10 лет — 27% при новых рабочих местах в количестве 31 300). В Data Science общее количество рабочих мест составляло 28 тысяч (прогноз роста занятости в ближайшие 10 лет — 19% при новых рабочих местах в количестве 5 400).

Все вышеперечисленные исследования и данные доказывают растущую заинтересованность в исследовании больших объемов данных, для которых требуются различные специализированные инструменты. Тем не менее, традиционным аналитикам для работы со структурированными наборами данных достаточно Microsoft Excel и, в некоторой степени, Access. Эти специалисты, как правило, являются специалистами начального уровня, зачастую имеющими степень бакалавра в области бизнеса, экономики или в смежных областях. Они также много взаимодействуют со многими заинтересованными сторонами внутри организации.

В отличие от традиционных аналитиков, специалисты Data Science обычно пишут дипломную или диссертационную работу в области теории вероятности, статистики, моделирования данных или математики. Они обрабатывают принципиально более сложные данные, то есть неструктурированные. Для этого им необходимо осваивать такие инструменты, как R, Hadoop или NoSQL.

Обладая глубокими знаниями и большими вычислительными ресурсами, специалисты Data Science могут ответить на важнейшие вопросы, такие как «Что я могу сделать с этим большим объемом данными?». Вместо того, чтобы просто описать то, что произошло в прошлом, они могут пойти еще дальше. Они могут создавать сложные математические или прогностические модели, которые потенциально могут спрогнозировать, что может произойти и по каким причинам.

По правде говоря, границы между аналитиками и специалистами Data Science могут быть немного размытыми. Возникает вопрос, как определить разницу между ними?

Рассмотрим следующие моменты. Во-первых, специалисты Data Science более склонны работать над проблемами макроуровня, например, здравоохранение. Аналитики же работают с заинтересованными сторонами для определения источников данных и построения аналитических моделей в конкретной области бизнеса. Важно отметить, что организациям, возможно, не так уж и необходимо использовать Data Science. Excel, Access и другой подобный инструментарий могут раскрыть бизнес-идеи с помощью структурированных наборов данных.

Во-вторых, от большинства бизнес-аналитиков традиционно не ожидают проведения глубокого анализа данных и проведения регрессионного анализа. Интересно, что крупные корпорации осознают возрастающую важность этих навыков. В свою очередь, большинство специалистов Data Science не могут обойтись одним Excel. Тем не менее, у лучших аналитиков и специалистов Data Science есть одна общая черта: они чрезвычайно любопытны и определенно преуспели в изучении данных.

Независимо от названия, способность анализировать и делать прогнозы на основе все более сложных наборов данных будет иметь неоценимое значение в обозримом будущем. Так что можно с уверенностью утверждать, что эра больших данных наступила.

Список литературы

  1. Davenport T., Patil D. Data Scientist: The Sexiest Job of the 21st Century [Электронный ресурс] // Harvard Business Review. 30.10.2012. URL: https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century/ (дата обращения: 05.06.2019)
  2. Brown B., Bughin J. Big Data The Next Frontier For Innovation [Электронный ресурс] // McKinsey Digital. 30.05.2011. URL: https://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the-next-frontier-for-innovation/ (дата обращения: 05.06.2019)
  3. Опалев С. Кто такой Нейт Сильвер и почему он победил на американских выборах? [Электронный ресурс] // Republic. 12.11.2012. URL: https://republic.ru/posts/l/851068 (дата обращения: 05.06.2019)
  4. Levenson E. Jeopardy's New Game-Theory Devotee Is One to Keep an Eye On [Электронный ресурс] // The Atlantic. 31.01.2014. URL: https://www.theatlantic.com/entertainment/archive/2014/01/jeopardys-newest-star-proves-optimal-strategy-really-unfriendly/357609/ (дата обращения: 05.06.2019)
  5. Report: Operations Research Analysts [Электронный ресурс] // O*NET Online. URL: https://www.onetonline.org/link/summary/15-2031.00 (дата обращения: 05.06.2019)
  6. Report: Statisticians [Электронный ресурс] // O*NET Online. URL: https://www.onetonline.org/link/summary/15-2041.00 (дата обращения: 05.06.2019)
  7. Jain P. 3 Steps To Identify The Data Science Training You Need [Электронный ресурс] // Forbes.com. 05.09.2012. URL: https://www.forbes.com/sites/piyankajain/2012/09/05/3-steps-to-id-analytics-training-need/ (дата обращения: 05.06.2019)
  8. Operations Research Analysts [Электронный ресурс] // U.S. Bureau of Labor Statistics URL: https://www.bls.gov/ooh/math/operations-research-analysts.htm (дата обращения: 05.06.2019)
  9. Computer and Information Research Scientists [Электронный ресурс] // U.S. Bureau of Labor Statistics URL: https://www.bls.gov/ooh/computer-and-information-technology/computer-and-information-research-scientists.htm (дата обращения: 05.06.2019)