Работающих с большим объемом данных специалистов ищет все больше украинских компаний.


Data Scientist называют одной из самых перспективных и высокооплачиваемых IT-профессий в Украине. Таких специалистов ищет все больше украинских компаний. Среди них банки, сотовые операторы и продуктовые сети, однако количество вакансий все еще можно пересчитать по пальцам.


«КП» в Украине» вместе с самими «дата сайентистами» и работодателями подтверждала и развеивала мифы вокруг этой профессии.


Data Scientist извлекает данные и делает прогнозы


В конце лета специализированный сайт DOU (Developers.Org.Ua) сравнил зарплаты украинских айтишников и обнаружил, что Data Scientist — самая популярная IT-специальность у студентов. Также «дата сайентисты» имеют самую высокую зарплату «на входе», то есть без опыта работы. Среди самых популярных запросов в Google со словами «Data Scientist» — «зарплата в Украине», «курсы в Киеве» и «дата сайнс в бизнесе». Заинтересованность на лицо.


В поисках счастливчика, который уже работает «дата сайентистом» и, возможно, получает зарплату, которая и не снилась «слугам народа», мы выходим на Александра Кондуфорова. В харьковской компании AltexSoft, имеющей офисы в США, он занимает должность Data Science Competence Lead, что можно перевести как глава направления Data Science — анализа данных и извлечения ценной информации. Первым делом просим, чтобы он объяснил нам, гуманитариям, почему у мира возникла необходимость в новой специальности.


— Сегодня человечество генерирует гигантское количество электронных данных: посты в соцсетях и блогах, новости, фотографии, видео, данные геолокации телефонов, акселерометров умных часов и многое другое. Компании и организации используют базы, где складывается вся информация об их бизнесе и операционной деятельности, множественные документы. Этих данных уже давно слишком много, чтобы люди могли вручную их обрабатывать, — говорит он.


В 2012 году, когда в Украине о науке о данных почти не говорили, журнал Harvard Business Review Гарвардской школы бизнеса назвал Data Scientist самой сексуальной профессией XXI века. Мол, в другом человеке нас привлекают уникальные качества, столь же уникальные, как люди с этой специальностью. Уже в 2019-м журнал подсчитал, что мировые компании тратят миллиарды на людей, которые извлекают полезные знания из большого объема данных и умеют делать прогнозы на их основании. По данным журнала Forbes, в Facebook более 1200 человек работают на позиции Data Scientist, в IBM — более 2500.


Именно с помощью науки о больших данных Facebook, Youtube, Netflix анализируют наши интересы и предлагают наиболее интересный контент, Siri понимает речь и поддерживают разговор, Amazon советует товары и удешевляет стоимость доставки товаров по всему миру, а банки рассчитывают риски при выдаче кредитов.






Александр Кондуфоров начал заниматься  Data Science одним из первых в Украине, в 2013 году. Фото: личный архив


Data Scientist ищут «Водафон» и Приват, но зарплату не раскрывают


Data Scientist – профессия на грани IT, искусственного интеллекта и аналитики, и у украинских работодателей зачастую разное представление о том, какую работу должен выполнять специалист. Компании могут подразумевать под Data Scientist аналитиков данных, которые есть на рынке уже пару десятилетий; программистов, применяющих машинное обучение; ученых и исследователей, которые создают и улучшают алгоритмы, применяемые потом другими специалистами.


Судя по описаниям вакансий Data Scientist, украинские работодатели хотят, чтобы специалисты анализировали поведение клиентов и прогнозировали его. Data Scientist, помимо IT-компаний, этой осенью искали Vodafone, ПриватБанк, Альфа-Банк, ДТЕК, Аптека Низких Цен и Червоний маркет. Однако ни один работодатель не указал на сайтах по поиску работы, сколько готов платить редким специалистам.


В Vodafone Data Scientist называют аналитиками больших данных, очевидно, приравнивая к ним еще и Big Data Analyst. Должность появилась 2018 году, рассказали «КП» в Украине» в пресс-службе сотового оператора. Сейчас в компании 12 человек работают на позиции Data Scientist. Среди их задач — определение абонентов, склонных к оттоку, и их удержание, улучшение эффективности допродаж, оценка риска и борьба с мошенничеством.


Vodafone также предоставляет услугу по анализу больших данных другим компаниям. Бизнесу обещают описать портрет целевой аудитории, организовать таргетированную рекламу, принять решение, где лучше открыть новый магазин, найти потенциальных покупателей и удержать клиентов, а также оценить риск невозврата кредита.


— DS-специалисты могут рассчитывать на рыночный уровень компенсации, — уклончиво ответил на вопрос о зарплате Сергей Курсон, эксперт по внешним отношениям компании.


В Украине зарплаты дата сайентистов пока не выбиваются по сравнению с другими айтишниками, чей заработок и так выше среднего в стране, говорит Александр Кондуфоров. Младшие IT-специалисты зарабатывают от 500 до 1000 долларов, опытные – от 2000. На западе Data Scientist может получать на 10% больше других айтишников из-за дефицита специалистов и выйти на заработок в 180 тысяч долларов в год. Это почти 4,5 миллионов гривен в год и более 370 тысяч в месяц.


В «ПриватБанке» более двадцати Data Scientists, рассказали «КП» в Украине». Специалисты могут рассчитывать на рыночную оплату труда – от 1500 долларов.


— Это, безусловно, хороший показатель. Если провести сравнение среди IT-специалистов банка, то Data Science-специалисты зарабатывают на уровне Java DEV (создает корпоративные системы для обработки данных, — авт.), database DEV (разработчик баз данных), DevOps (занимается продвижением ПО), — говорит руководитель направления трудовых ресурсов (HR) ПриватБанка Ольга Хлынина.


В банке уверяют, что сейчас у них работают более двух десятков «специалистов Data Science». Среди их задач – анализ оттока клиентов и прогноз рисков при выдаче кредитов.


— Банк долгое время занимался построением скор-карт (набор характеристик потенциального заемщика, — Авт.) вручную, далее был период построения скоринговых моделей с помощью SAS (программное обеспечение, — Авт.). Сейчас банк разрабатывает модели с использованием Python, R (языки программирования, — Авт.), — рассказала Ольга Хлынина.


Примеры Vodafone и Привата — скорее исключения, и подавляющее большинство украинских дата-сайентистов работают на западных клиентов — США, страны Западной Европы, Японию, Австралию. У AltexSoft в Соединенных Штатах два отдела продаж, а разработчики живут в Харькове, Кременчуге и Львове. Среди Data Science-кейсов украинской компании — работа с клиентом из области медицины и сайтом по продаже авиабилетов.


— Мы сделали мобильное приложение с алгоритмом определения различных расстройств сна и вычисления цикла сна на основании звука, записываемого телефоном. Для другого клиента, вебсайт которого занимается поиском и продажей авиабилетов онлайн, мы делали предсказание цен на авиабилеты и персональную рекомендацию наиболее релевантных рейсов покупателям, основываясь на их предпочтениях. Еще для одного клиента из автостраховой индустрии мы обучили предсказательный алгоритм, оценивающий стоимость страховки без участия человека с достаточно высокой точностью, — рассказывает Александр Кондуфоров.


Он поясняет пользу Data Science на примере приложения для сна. Следить за нарушениями можно и в лаборатории, но это неудобно и дорого. С помощью новых технологий телефон может записывать нарушения сна, например, храп, а приложение — анализировать, когда именно и как часто они происходят.


— Мы начали решение задачи с анализа данных и их разметки. Под разметкой в данном случае понимается прослушивание реальных звуковых записей, определение нужных звуков “на слух” и фиксацию временных отметок, в которые данные звуки происходят. Дальше мы сделали предобработку данных и начали экспериментировать с архитектурой нейросети для детекции звуков. После довольно большого количества экспериментов мы подобрали сеть, которая давала наилучшую точность. Следующим шагом стало внедрение кода алгоритма и сети в мобильное приложение. Параллельно команда мобильных разработчиков создала само приложение под две основных платформы — iOS и Android, дизайнеры спроектировали его интерфейс, а инженеры по качеству его протестировали. В результате получилось мобильное приложение, которым сейчас пользуется несколько сотен тысяч человек по всему миру.


На курсах расскажут то, что вы можете изучить в интернете самостоятельно


Желающим стать Data Scientist наш эксперт советует идти в сильный технический вуз на специальность, связанную с прикладной математикой или искусственным интеллектом. Желающим переквалифицироваться техническим специалистам и айтишникам стоит пройти онлайн-курсы зарубежных университетов — Стэнфорда, MIT или других мировых топ-вузов. А вот с различными курсами в Украине нужно быть осторожным – спрос на IT-образование большой, а действительно хороших преподавателей мало.


— На рынке очень много школ, где, в лучшем случае, перескажут без понимания всё то, что вы можете изучить в интернете самостоятельно. Учиться стоит идти лишь к тем преподавателям, которые сами занимаются Data Science на практике уже много лет, а не просто преподают его в вузе, — говорит Александр Кондуфоров.


Сам он учился в Харьковском национальном университете радиоэлектроники, работал программистом, а Data Science начал изучать в начале 2010-х, когда во всем мире начался бурный рост интереса к искусственному интеллекту и появились онлайн-курсы. Последние шесть лет AltexSoft проводит самую крупную DataScience конференцию в Украине — AI Ukraine, куда приезжают слушатели и докладчики из стран Европы, США и Канады.


Диджитализация – одна из «фишек» новой власти, но о Data Science речь не идет


В будущем Data Science продолжат использовать для замены рутинной ручной и интеллектуальной работы алгоритмами и роботами, считает Александр Кондуфоров.


В Украине внедрений пока мало. Диджитализация – одна из «фишек» новой власти, но речь идет об упрощении бюрократии. Однако в теории Data Scientists могли бы послужить на пользу государству. Например, для анализа законов, регулирования налоговой сферы, борьбы с преступностью, диагностики заболеваний, анализа трудовой миграции.


— Уровень внедрения IT технологий в государстве сильно запаздывает по сравнению с бизнесом, поэтому во многих местах надо сначала начать с простых внедрений, а уже потом задумываться над более сложными и дорогими — искусственным интеллектом и Data Science, — заключает Александр Кондуфоров.


Несмотря на претензии на цифровое государство, в президентской кампании Зеленского также вряд ли использовались новейшие технологии, в которых в свое время обвиняли Дональда Трампа. То, что делала Cambridge Analitica для президента США или во время кампании Brexit, — это довольно сложная персонализированная реклама, направленная на конкретные регионы и типажи людей. В Украине телевидение до сих пор играет роль основного источника информации, но команда Зеленского смогла успешно использовать Интернет для продвижения, и привлекла большое количество молодой аудитории. Но это опять же обычные политтехнологии и маркетинг, а не Data Science.