Чем на самом деле занимаются Data Scientists? Рассказывают люди, перешедшие в эту сферу

Основные обязанности

Четких требований к специалистам нет, часть работы занимает аналитика и сбор данных. Но не нужно их путать с аналитиками, это совершенно разные профессии.

Очень мало профессионалов, которые отлично понимают все перечисленные дисциплины: математику, логику, машинное обучение, статистику экономику и программирование.

Основные должностные обязанности Data scientist заключаются в следующем:

  1. Выяснить, что нужно заказчику и подобрать самый эффективный вариант решения проблемы.
  2. Собрать, обработать, изучить весь массив данных.
  3. Владеть языками программирования для составления различных моделей.
  4. Проанализировать целевую аудиторию и ее поведение.
  5. Решать различные задачи для повышения уровня доходов.
  6. Программировать и тренировать различные модели машинного обучения.
  7. Исключать возможные риски и предлагать варианты минимизации негативных последствий.
  8. Внедрять полученную модель для подтверждения гипотез.
  9. Подготавливать презентации и отчеты по различным этапам работы.

Если аналитик оперирует только однотипными данными, то Data scientist принимает во внимание все детали, предлагает гипотезы и создает рабочую модель.

Что происходит на рынке data science

Компетенции молодых специалистов отражают положение на рынке труда. Здесь спрос существенно превышает предложение, поэтому отчаявшиеся работодатели часто действительно готовы брать на работу совсем зеленых специалистов и доращивать их под себя. Вариант рабочий, но подходит лишь в том случае, если в команде уже есть опытный тимлид, который возьмет на себя обучение джуниора.

Самые свежие вакансии с кратким описанием требований к кандидату

Итак, начинающий специалист может рассчитывать на зарплату от 60 000 рублей. Востребованность и высокую оплату подтверждают следующие вырезки только с одного сайта с вакансиями:

Почему мы подключили экспресс-доставку

Экспресс-доставка помогает выиграть покупателю от нескольких часов до пары дней. Хозяйка, у которой сломался блендер, быстро получит новый и приготовит ужин вовремя. Дизайнер, у которого сломался ноутбук, продолжит работу в тот же день, а не будет ждать доставки два-три дня. За срочность люди готовы заплатить. Исходя из этого, мы решили добавить экспресс-доставку к своему магазину.

Сначала мы сделали экспресс-доставку своими силами, но аудитория интернет-магазина пользовалась услугой неохотно. Результат оказался сильно ниже, чем нам хотелось. Люди, которые уже покупают на сайте, готовы ждать. Но ведь где-то есть те, кому нужно срочно? И тут появилась возможность подключиться к экспресс-доставке на Яндекс.Маркете.

Что должны знать сайентисты и инженеры

Профильное образование для обоих специалистов — Computer Science.

Любой специалист по данным — дата-сайентист или аналитик — должен уметь доказывать корректность своих выводов. Для этого не обойтись без знания статистики и связанной со статистикой базовой математики.

Машинное обучение и инструменты анализа данных незаменимы в современном мире. Если привычные инструменты недоступны, нужно иметь навыки быстрого изучения новых инструментов, создания простых скриптов для автоматизации задач.

Важно отметить, что специалист по работе с данными должен эффективно донести результаты анализа. В этом ему поможет визуализация данных или результатов проведённых исследований и проверки гипотез. Специалисты должны уметь создавать диаграммы и графики, использовать инструменты визуализации, понимать и разъяснять данные из дашбордов.

Для инженера данных на первый план выходят три направления.

Алгоритмы и структуры данных. Важно набить руку в написании кода и использовании основных структур и алгоритмов:

Базы и хранилища данных, Business IntelligenceHadoop и Big Data

. Данных становится всё больше, и на горизонте 3‒5 лет эти технологии станут необходимы каждому инженеру. Плюс:

Машинное обучение

будет использоваться повсеместно, и важно понимать, какие бизнес-задачи оно поможет решить. Не обязательно уметь делать модели (с этим справятся дата-сайентисты), но нужно разбираться в их применении и соответствующим требованиям.

Что нужно учесть при работе с экспресс-доставкой

При работе с экспресс-доставкой мы столкнулись с небольшими трудностями, но быстро их решили.

Курьеры не знали, как найти наш магазин. Когда они приезжали к нам, то сразу же звонили в колл-центр, чтобы найти парковку, вход, нужный офис и тому подобное. Оказалось, что курьеры не видят названия магазина. У них есть только номер заказа, его содержание и адрес магазина — так, как он заполнен в личном кабинете.

Чтобы исправить ситуацию, мы прописали все необходимые данные для курьеров в личных кабинетах с экспресс-доставкой. Указали название магазина, где парковка, как работает, куда идти. Звонки от курьеров остались, но их стало заметно меньше, и колл-центр вернулся в нормальный режим работы.

Претензии к упаковке товара. Поначалу мы просто собирали заказ, упаковывали его и передавали курьеру. Но если клиент пожалуется на «поврежденный товар», то претензию получит магазин. У нас так и вышло.

Чтобы защитить себя от таких ситуаций, мы добавили видео- и фотофиксацию процесса упаковки и передачи товара курьеру. Для этого просто поставили камеры в рабочей зоне.

Курьеры могут забрать не свой заказ. Мы выдавали товар только по номеру заказа и в один из дней получили несколько уведомлений от Маркета, что клиентам доставлены не те товары. Выяснилось, что один из курьеров забрал не свое. Дальше по цепочке еще несколько заказов оказались обработаны неверно.

Чтобы таких ошибок больше не было, наши менеджеры всегда спрашивают у курьеров, что должно быть в заказе. Если и номер, и содержание заказа совпадают, то заказ выдаем. Если нет, то находим, что должно быть в заказе на самом деле, и выдаем курьеру корректный товар. Больше претензий к составу заказа у нас не было.

Что почитать по профессии

Есть огромный перечень специальной литературы, которые пригодится в работе и учебе. Профессионал должен всегда держать руку на пульсе и быть в курсе новостей.

  • «Теоретический минимум по Big Data. Все что нужно знать о больших данных» Анналин Ын, Кеннет Су. Книга написана легко и интересно для всех любопытствующих и начинающих. Даны пояснения, чем занимается эта дисциплина, основные понятия и приемы работы.
  • «Все лгут. Поисковики, Big Data и интернет знают о вас все» Сет Стивенс-Давидовиц. Книга о том, как при помощи больших данных можно узнать все о современном обществе. Изложены основные 5-10 фактов о работе по сбору информации.
  • «Аналитика и Data Science. Для не-аналитиков и даже 100% гуманитариев» Никита Сергеев. Интересная книга об аналитике данных, которая поможет разобраться в сложных терминах. Подходит для новичков и помогает систематизировать знания в этой области.
  • «Работа с данными в любой сфере» Кирилл Еременко. Практическое руководство и увлекательное путешествие в мир данных. Автор рассказывает об основных методах, алгоритмах и приемах.
  • «Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP» В.В. Степаненко, А.А. Барсегян, И.И. Холод, М.С. Куприянов. Книга предназначена для студентов. В ней кратко излагаются основные направления в области разработки систем.

Полезные лайфхаки:Как стать веб-разработчиком, Как выбрать направление в программировании, Как программировать игры.

Что должен уметь data scientist

Что должен уметь data scientist
studioloco / Shutterstock

Ключевой навык — задавать правильные сложные вопросы. Чтобы овладеть им, специалист должен понимать боли и проблемы бизнеса, говорить с ним на одном языке, чтобы получать нужную информацию.

Каждый вопрос рождает несколько гипотез — выводов, которые можно проверить с помощью данных. Если вопрос сформулирован верно, data scientist сможет построить модель для проверки гипотезы и протестировать её, получить результаты и применить их в бизнесе.

Среди технических навыков на первое место выходит Python — мощный язык программирования с понятным и логичным синтаксисом. Чтобы разбираться в нём, не нужно быть опытным программистом или хотя бы «технарём». Достаточно уметь вызывать нужную функцию и задавать её параметры.

Где учиться, чтобы найти работу в data science

На рынке много хороших курсов по Data Science и получить первоначальное образование не проблема. Но важно понимать направленность этого образования. Если у кандидата уже есть мощный технический бэкграунд, то интенсивные курсы — то что надо. Человек освоит инструменты, придет на место и быстро вработается, потому что уже умеет думать как математик, видеть проблему и формулировать задачи. Если такого бэкграунда нет, то после курса будет хороший исполнитель, но с ограниченными возможностями для роста.

Если перед вами стоит краткосрочная задача смены профессии или поиска работы в этой специальности, то тогда вам подходят какие-то систематические курсы, которые короткие и быстро дают минимальный набор технических навыков, чтобы вы смогли претендовать на начальную позицию в этой области.

Иван Ямщиков
Академический директор онлайн-магистратуры «Наука о данных»

Проблема курсов именно в том, что они дают быстрый, но минимальный разгон. Человек буквально влетает в профессию и быстро достигает потолка. Чтобы прийти в профессию надолго, нужно сразу заложить хорошую основу в виде более долгосрочной программы, например, в магистратуре.

Высшее образование подходит, когда вы понимаете, что эта область интересна вам долгосрочно. Вы не стремитесь выйти на работу как можно скорее. И не хотите, чтобы у вас был карьерный потолок, также не хотите столкнуться с проблемой недостатка знаний, навыков, недостатка понимания общей экосистемы, с помощью которой развиваются инновационные продукты. Для этого нужно именно высшее образование, которое формирует не только необходимый набор технических навыков, но и структурирует по-другому ваше мышление и помогает сформировать некоторое видение вашей карьеры на более долгосрочную перспективу.

Предлагаем ознакомиться  Работать нужно головой: зачем компании переходят на четырехдневную рабочую неделю

Иван Ямщиков
Академический директор онлайн-магистратуры «Наука о данных»

Отсутствие карьерного потолка — главное преимущество магистерской программы. За два года специалист получает мощную теоретическую базу. Вот так выглядит уже первый семестр в программе Data Science НИТУ «МИСиС»:

При этом можно параллельно получать и практический опыт на работе. Ничто не мешает устроиться на позицию джуниора, как только студент освоит нужные инструменты. Вот только, в отличие от выпускника курсов, магистр не останавливает на этом свое обучение, а продолжает углубляться в профессию. В будущем это позволяет развиваться в Data Science без ограничений.

Что поможет сайентистам и инженерам в карьерном росте

Появилось достаточно много новых инструментов по работе с данными. И мало кто одинаково хорошо разбирается во всех. 

Многие компании не готовы нанимать сотрудников без опыта работы. Однако кандидаты с минимальной базой и знанием основ популярных инструментов могут получить нужный опыт, если будут обучаться и развиваться самостоятельно.

Бонус для читателей

Если вас заинтересовала возможность построить карьеру в новой и перспективной области, но вы не готовы принять решение здесь и сейчас, Skillbox предоставляет возможность начать обучение и ознакомиться с 2 модулями программы бесплатно.

Вы освоите основы языка Python для анализа данных, а также сможете начать работать в Jupyter Notebook. Для своих студентов в Skillbox предусмотрели удобные условия по рассрочке оплаты за обучение – оплата курсов возможна через год после начала занятий.

Вакансии и зарплата, перспективы профессии

Эта профессия достаточно молодая, но уже востребована на рынке. Количество данных растет в геометрической прогрессии и требует нестандартного подхода к обработке. Традиционное машинное обучение не срабатывает, нужен совершенно другой подход.

Специалистов разного уровня недостаточно, спрос на их услуги очень высок. Но важно понимать, что выйти на достойную оплату труда за несколько месяцев для Data scientist невозможно. Но для старта в профессии достаточно иметь отличную математическую базу, навыки программирование и знать алгоритмы.

Для абсолютных новичков

Насколько погружение в Data Science с нуля может показаться пугающим минусом, настолько оно может оказаться большим плюсом на практике. У новичков в любой профессии есть огромное преимущество, которое заключается в их высокой мотивированности и желании стремительно погрузиться в новое.

Для специалистов из смежных областей

Если вы хотите перейти в науку о данных из смежных областей, вроде математики и статистики, физики, программирования и компьютерных наук, у вас есть большое преимущество. Имеющиеся навыки и опыт работы позволят вам намного быстрее погрузиться в новую специализацию.

При выборе специализации Data Science, не спешите сразу к ней переходить. Изучите смежные с вашей нынешней профессией сферы – это может облегчить смену рода занятий. Например, математику будет лучше освоить алгоритмы машинного обучения и Deep Learning, а разработчику программного обеспечения не составит труда перейти к анализу данных.

Доход инженеров по обработке данных

В международной практике

начальная зарплата обычно составляет $100 000 в год и значительно увеличивается с опытом, по данным Glassdoor. Кроме того, компании часто предоставляют опционы на акции и 5‒15% годовых бонусов.

В России в начале карьеры зарплата обычно не меньше 50 тыс. рублей в регионах и 80 тыс. в Москве. На этом этапе не требуется опыт, кроме пройденного обучения.

Через 1‒2 года работы — вилка 90‒100 тыс. рублей.

Вилка увеличивается до 120‒160 тыс. через 2‒5 лет. Добавляются такие факторы, как специализация прошлых компаний, размер проектов, работа с big data и прочее.

После 5 лет работы легче искать вакансии в смежных отделах или откликаться на такие узкоспециализированные позиции, как:

Как всему этому научиться

Чтобы овладеть всем этим на уровне, достаточном для поиска работы, не придётся получать второе высшее образование: хватит и курса «Профессия Data Scientist» от Skillbox. С первого занятия вы будете постигать азы работы с Python, а позднее овладеете и языком R, который специально создавался для статистической обработки данных. Вы научитесь работать с несколькими Python‑библиотеками, освоите различные базы данных PostgreSQL, SQLite3 и MongoDB.

Аналитика больших данных неразрывно связана с машинным обучением и нейронными сетями. Поэтому в курс включены ещё и фреймворки для обучения нейросетей Tensorflow и Keras, а также множество практических задач по созданию моделей для компьютерного зрения и лингвистики.

По окончании курса вы также сможете строить дашборды и интерактивную графику, чтобы наглядно представить результаты работы. В финале вы реализуете собственный проект — построите рекомендательную систему, которую можно будет добавить в портфолио. И всё это — под руководством опытных наставников.

Таким образом, всего через полтора года вы будете знать и уметь гораздо больше, чем средний кандидат на позицию дата‑сайентиста. И даже сможете записать полтора года обучения на курсе в свой стаж работы с большими данными. А значит, уже на старте претендовать на более высокую зарплату.

Освойте профессию будущего

Как мы подключали экспресс-доставку и как это можно сделать сейчас

Первый магазин мы подключили в марте 2021 года. На тот момент подключить экспресс-доставку в личном кабинете самостоятельно было нельзя. Нужная настройка отсутствовала. Поэтому на протяжении всего процесса подключения нам помогал личный менеджер из Яндекс.Маркета.

Сейчас сделать магазин с экспресс-доставкой можно и без помощи службы поддержки. Чтобы подключить магазин к экспресс-доставке самостоятельно, нужно создать отдельный личный кабинет по модели FBS.

До конца августа тарифы такие: 2% за продажу, 1% за эквайринг, 125 рублей за доставку товара.

Чтобы работать с экспресс-доставкой, выберите забор товара курьерами-партнерами Яндекс.Доставки с вашего склада

Процесс практически ничем не отличается от создания любого другого личного кабинета. Нужно пройти регистрацию, подписать договор, загрузить товары и настроить склад. С учетом модерации Яндекс.Маркета у нас процесс занял четыре рабочих дня. На случай трудностей Яндекс.Маркет подготовил подробную инструкцию.

Как проходят собеседования

На западе выпускники программ профессионального обучения проходят первое собеседование в среднем через 5 недель после окончания обучения. Около 85% находят работу через 3 месяца.

Процесс прохождения собеседований на вакансии инженера данных и дата-сайентиста практически не различается. Обычно состоит из пяти этапов.

Резюме. Кандидатам с непрофильным предыдущим опытом (например, из маркетинга) необходимо для каждой компании подготовить подробное сопроводительное письмо или иметь рекомендации от представителя этой компании.

Технический скрининг. Проходит, как правило, по телефону. Состоит из одного-двух сложных и столько же простых вопросов, касающихся текущего стека работодателя.

HR-интервью. Может проходить по телефону. На этом этапе кандидата проверяют на общую адекватность и способность общаться.

Техническое собеседование. Чаще всего проходит очно. В разных компаниях уровень позиций в штатном расписании отличается, и называться позиции могут по-разному. Поэтому на этом этапе проверяют именно технические знания.

Собеседование с техническим директором / главным архитектором. Инженер и сайентист — стратегические позиции, а для многих компаний к тому же новые. Важно, чтобы потенциальный коллега понравился руководителю и совпадал с ним во взглядах.

Как стать data scientist: лучшее обучение

Следует помнить, что востребованным специалистом не получится стать при самостоятельном изучении всех дисциплин. В любом случае необходимо пройти профессиональные курсы.

Не нужно выбирать краткосрочное обучение. Ведь невозможно за несколько месяцев стать профессионалом даже начального уровня и получать достойную оплату своего труда.

Отличный курс для новичков с любым уровнем начальных знаний – «Data scientist» от Skillfaktory. Именно здесь обучение построено таким образом, что на каждом этапе погружения в профессию новичок работает с реальными задачами от партнеров.

Обучение длится 24 месяца, то есть два семестра по 6 месяцев. За это время новичок достигает уровень Junior с портфолио из 8-и кейсов различных тематик.

Следующие 2 семестра – специализация по выбору. За 12 месяцев студент наполняет свое портфолио еще пятью успешными кейсами. В результате обучения и работы над реальными задачами достигает уровня Middle.

После завершения обучения каждый выпускник обладает знаниями и навыками достигнутого уровня. Может претендовать на соответствующую оплату своего труда.

Особенность обучения на этом курсе в том, что каждый студент в ходе решения задачи может обратиться к куратору. Это помогает оперативно получить ответ на вопрос и поддержку.

За время обучения каждый студент получает 2 года стажа по специальности и профессиональное портфолио уровня Middle. Это значительно экономит время и дает быстрый старт в карьере.

Кого ждут работодатели

Любой работодатель хотел бы, чтобы его джуниоры работали без постоянного контроля и могли развиваться под руководством тимлида. Для этого новичок должен сразу владеть нужными инструментами, чтобы решать текущие задачи, и обладать достаточной теоретической базой, чтобы постепенно предлагать собственные решения и подступаться к более сложным задачам.

С инструментами у новичков на рынке все достаточно хорошо. Краткосрочные курсы позволяют быстро освоить их и приступить к работе.

Предлагаем ознакомиться  Претензия застройщику — ОЗПП «ПотребАльянс»

Коротко о главном

Достаточно новая профессия Data scientist прочно входит в список востребованных. Специалист легко оперирует большой базой различных данных и находит решение сложных бизнес-задач.

Как стать востребованным специалистом высокого уровня и что для этого нужно? Достаточно обладать аналитическим складом ума и пройти обучение.

Навыки и образование

Одним из распространенных заблуждений является мнение, будто для работы в Data Science необходима степень в компьютерных науках или математике. Вам не нужно стремиться получить степень магистра. Для работы с алгоритмами машинного обучения и Deep Learning действительно могут понадобиться знание математического анализа, линейной алгебры и теории вероятностей, но это не означает, что вы не сумеете получить навыки самостоятельно.

Владение различными инструментами управления данными, а также умение учиться намного важнее, чем формальное образование. Если верить описаниям актуальных вакансий, наиболее востребованными навыками и инструментами для Data Scientist являются следующие:

  • Основы статистики и прикладной математики. Ознакомьтесь с предыдущими статьями о знаниях по математике и статистике, которые нужны специалисту по анализу данных.
  • Программирование на Python или R (выбору языка посвящена статья «От «R против Python» к «R и Python»»);
  • Владение инструментами для задач Data science. Для специалистов, которые работают в Python, это библиотеки Pandas, NumPy, Matplotlib или Plotly и scikit-learn (подробнее в статье «11 популярных библиотек Python для Data Science»);
  • Очистка и предварительная обработка данных, анализ и визуализация данных;
  • Навыки машинного обучения и моделирования (подробнее в материале «Осваиваем Python и машинное обучение с помощью Kaggle»);
  • Написание SQL-запросов (подробнее в статье-гайде по работе с SQL в Data Science);
  • Soft skills: навыки решения проблем, коммуникативные навыки, командная работа, инновационное мышление, навыки наблюдения, критическое мышление;
  • Тонкости рабочего процесса и навыки совместной работы (Git, командная строка/bash и т. д.). Подробнее о работе над проектами в GitHub и распределении ролей в команде.

Направления развития в профессии

Data scientist всегда работает в команде, состоящей из аналитиков и инженеров данных. Каждый специалист занимается только одним направлением:

  • Data engineer – инженер данных, отвечает за создание и поддержку инфраструктуры, обеспечивая сбор, хранение и управление потоками данных в реальном времени.
  • Chief data officer – директор по данным, управляет жизненным циклом данных так, чтобы каждый специалист получал нужную информацию в подходящем виде и приемлемом качестве. Контролирует работу других специалистов.
  • Data mining – аналитик данных, который обрабатывает исходные данные и предоставляет их в компактном виде.
  • Text mining – аналитик текстов, который обрабатывает и разделяет тексты на категории, извлекая информацию и обрабатывая изменения.

От редакции нетологии


Если присматриваетесь к профессии Data Engineer или Data Scientist, приглашаем изучить программы наших курсов:

Полезные качества для дата-инженера и дата-сайентиста

Желание и умение учиться

. Необязательно сразу гнаться за опытом или менять работу ради нового инструмента, но нужно быть готовым переключиться на новую область.

Стремление к автоматизации рутинных процессов. Это важно не только для продуктивности, но и для поддержания высокого качества данных и скорости их доставки до потребителя.

Внимательность и понимание «что там под капотом» у процессов. Быстрее решит задачу тот специалист, у которого есть насмотренность и доскональное знание процессов.

Кроме отличного знания алгоритмов, структур данных и пайплайнов, нужно научиться мыслить продуктами — видеть архитектуру и бизнес-решение как единую картину. 

Например, полезно взять любой известный сервис и придумать для него базу данных. Затем подумать, как разработать ETL и DW, которые наполнят её данными, какие будут потребители и что им важно знать о данных, а также как покупатели взаимодействуют с приложениями: для поиска работы и знакомств, прокат автомобилей, приложение для подкастов, образовательная платформа.

Позиции аналитика, дата-сайентиста и инженера очень близки, поэтому переходить из одного направления в другое можно быстрее, чем из других сфер.

В любом случае, обладателям любого ИТ-бэкграунда будет проще, чем тем, у кого его нет. В среднем взрослые мотивированные люди переучиваются и меняют работу каждые 1,5‒2 года. Легче это даётся тем, кто учится в группе и с наставником, по сравнению с теми, кто опирается лишь на открытые источники.

Привет, я data scientist в «тинькофф»

Честный отзыв о профессии Data Scientist, рассказ о карьерном пути и советы для новичков

Глеб Синяков закончил МФТИ и пошел на работу аналитиком-разработчиком в «Тинькофф». Уже имея академическое образование, он продолжает учиться и берет курсы по математике и другим фундаментальным дисциплинам. Войти в профессию не сложно, уверен Глеб, но нужно интересоваться данными и быть усидчивым.

В Data Science несколько разных профессий. Есть, собственно, Data Scientist: те, кто хорошо понимают математику, модели данных и руководят аналитикой. А есть ML-инженеры: их задача — писать код для моделей машинного обучения. ML-инженерами становятся бывшие программисты: им надоедает заниматься каким-нибудь Java и они идут в Data Science. Среди профессионалов есть и те, к кому ML приходит сам. Например, специалисты по биоинформатике начинают учить науку о данных, чтобы решать задачи в своем деле.

Мне повезло попасть на работу в Data Scienсe после специальных кафедр технического вуза. На самом деле наука о данных — еще слишком новая для российского высшего образования область. В профессию попадают люди с самым разным бэкграундом. Есть те, кто переучиваются после технических вузов или работы программистом в других областях.

Я работаю аналитиком-разработчиком, занимаюсь системой автоматического мониторинга данных компании «Тинькофф» с помощью машинного обучения. Банковские продукты компании генерируют много данных: они помогают отслеживать эффективность бизнес-процессов, например изменения доходности по вкладам или продаж страховок. Обычно за каждым из процессов следят аналитики. Моя задача — помочь им автоматизировать этот процесс, чтобы они могли получать своевременные оповещения, если в их данных что-то пошло не так. Так аналитики могут увидеть нестандартное поведение своих параметров и изменить свои процессы.

Моя специализация — временные ряды. По сути, это зависимости разных величин во времени. Эти данные можно анализировать с помощью математических моделей, чтобы спрогнозировать будущие значения. Например, так прогнозируют спрос на товары в супермаркетах. Если знать статистику продаж творога в прошлые годы, этой весной можно выложить на полки нужное покупателям количество пачек с высокой точностью. В «Тинькофф» по тому же принципу мы предсказываем продажи продуктов экосистемы.

Я закончил МФТИ: сначала учился на факультете физической и квантовой электроники. После бакалавриата я попал в научную организацию, которая занимается фотоприемниками, приборами для регистрации оптических сигналов. Там я не видел больших перспектив, поэтому решил сменить направление. Это довольно стандартная история для Data Scientistиз российских технических вузов, вроде МФТИ. В российской науке, к сожалению, нет больших перспектив, а работать простым кодером для многих скучно. Поэтому я пошел в Data Science: в этой области есть баланс интереса и перспектив.

В магистратуре я перешел на факультет инноваций и высоких технологий. На этом факультете «Тинькофф» открыл первый набор на кафедру финансовых технологий. После конкурса я попал туда на работу. Я выбирал между разными крупными IT-компаниями: в «Тинькофф» к тому моменту уже была полноценная работа с технологиями.

Когда я только пришел на работу, мне хотелось применять как можно больше новых технологий и подходов. На самом деле это не всегда полезно. Например, мне нужно было смоделировать поведение данных по одному из банковских продуктов. У разных методов прогнозирования разная точность: среди моделей нужно выбирать наиболее быструю и точную. По неопытности я потратил много времени, чтобы создать сложную модель, а в итоге получил то же качество, что и у самых простых.

Это достаточно стандартная ошибка новичков: многие сразу хотят сделать что-то сложное и интересное там, где это не нужно. Так я понял, что лучше вести разработку от простого к сложному. Не усложняйте свои задачи до тех пор, пока работают быстрые проверенные методы.

Обычно я встаю где-то с 7 до 10 утра, делаю завтрак и кофе в любимой гейзерной кофеварке. Если встаю рано, то использую утро для задач с максимальной концентрацией: например, чтения статьи на Хабре или Archive. До 10:30 я разбираю рабочую и личную почту и обдумываю задачи на день.

В 10:30 у нас ежедневный созвон с командой — после него я подключаюсь к VPN и начинается работа. В зависимости от загрузки я работаю до 5-8 вечера. Например, сейчас я работаю над классификатором временных рядов — это поможет выявить сезонность в банковских данных.

Вечером я преподаю Python по Zoom, а если занятий нет, езжу на тренировки по сноуборду в комплекс Снеж.ком — он всего в пяти минутах от моего дома. Если хватает времени, то сам прохожу разные курсы или читаю что-нибудь актуальное по работе, чтобы не отставать от жизни. С самодисциплиной по вечерам не очень, поэтому, к сожалению, на учебу время есть редко. Перед сном обычно залипаю в интернете или доделываю какие-то задачи. В выходные четкого расписания нет. C утра катаюсь, а днем и вечером могу делать что угодно: работать, учиться, гулять или кодить что-нибудь для себя.

Предлагаем ознакомиться  Справка об отсутствии кредитов в банке: как получить, зачем нужна

В нашей индустрии все постоянно занимаются самообразованием. Новые технологии и фреймворки (наборы инструментов для быстрой разработки) проще освоить самому на практике, а вот фундаментальные вещи со временем забываются. Например, недавно я взял курс по теории вероятностей, чтобы освежить знания из института.

К тому же после нескольких лет работы в Data Science нужно выбирать специализацию. На этом этапе ты уже понимаешь основные подходы к данным и углубляешься в какую-то область, например, обработку естественного языка (NLP) или компьютерное зрение.

Также я преподаю сам: уже 2,5 обучаю студентов Python, веду семинары по временным рядам для сотрудников «Сбербанка», помогал с кейсами для курса SkillFactory по Data Science. Мне нравится учить и понимать, как думают другие люди и какими вопросами задаются. К тому же многие приходят в IT после больших успехов в своих профессиональных областях. Мне очень интересно помочь им применить программирование для решения их задач.

Например, один ученик работает аналитиком в известном интернет-магазине. У них была проблема с работниками склада — они часто увольнялись после нескольких месяцев работы. На курсах мы взяли его данные и построили модель, которая предсказывает вероятность увольнения соискателя в течении полугода по его социально-демографическим характеристикам.

В профессию можно попасть и с нулевыми знаниями. Для этого нужно обладать двумя вещами: по-настоящему интересоваться данными и иметь высокую самодисциплину. Если с этим все в порядке, нужно просто брать курсы и учиться. Для классического пути в Data Science нужно знать несколько вещей: Python, математику (линейная алгебра, теория вероятности и статистика, матанализ) и пройти курс по ML.

Мало кто знает все это на отлично, да и не во всех компаниях это требуется. Хорошее освоение трех вещей если не гарантирует, то сильно увеличивает шансы найти первую работу. По времени это занимает минимум полгода для тех, кто пришел из технических областей. Совсем с нуля все можно выучить минимум за год. После этого уже можно подаваться на позиции стажера или джуниора.

Курс 

Data Science с нуля 

Освойте самую востребованную профессию 2021 года! Только реальные знание и навыки, поддержка менторов и помощь в трудоустройстве. Дополнительная скидка 5% по промокоду BLOG.

Узнать больше

Я работаю в «Тинькофф» уже три с половиной года. В нашей компании много задач для сайентистов и почти нет ограничений по развитию. Наука о данных — достаточно универсальная область. По сути тебе не важно какими данными ты занимаешься: о торговле продуктами или о поведении пользователей в интернете. Для всех задач есть одинаковая база: математика и программирование. Зная базовые вещи уже можно углубляться в конкретные области, например, компьютерное зрение или обработку естественного языка.

Большинство задач в индустрии довольно стандартные, они ориентированы прежде всего на бизнес-результат. Поэтому в какой-то момент каждому специалисту хочется начать делать что-то свое параллельно основной работе. Я, например, хотел бы привнести что-то новое в open-source (программы и технологии для разработчиков), но пока своих значимых кейсов нет.

Мне нравится создавать технологии, которые автоматизируют ручную работу. Например, известная в машинном обучении библиотека scikit-learn поделила профессию на «до» и «после»: у разработчиков появились инструменты для быстрой работы с алгоритмами ML.

Еще мне хотелось бы углубиться в другие области машинного обучения. Я занимаюсь временными рядами, обычно в этой специализации лучше работают классические модели. И хочу поглубже копнуть в Deep Learning — глубинное обучение, где нейросети способны решать очень сложные задачи. Именно в этой области сейчас происходят наиболее интересные в машинном обучении вещи.

Курс 

Полный курс по Data Science

Освойте востребованную профессию с нуля за 12 месяцев и станьте уверенным junior-специалистом.

Получить скидку Промокод “BLOG10” 5% скидки

Противоречия

Чтобы ответить на вопрос «стоит ли игра свеч?», нужно учесть и минусы профессии Data Scientists. Наука о данных быстро развивается, а это означает, что вам необходимо всегда оставаться в курсе последних достижений и лучших практик. Действующему специалисту придется постоянно следить за последними технологиями и разработками, быстро учиться и самостоятельно осваивать новые темы.

Если взвесив все плюсы и минусы вы решили, что Data Science точно для вас, обратите внимание на курс «Профессия‌ ‌Data‌ ‌Scientist‌»: обучение на специалиста по Data Science онлайн от Skillbox. Он предназначен для начинающих программистов и аналитиков, а также для желающих кардинально сменить профессию.

Цель курса – дать студентам знания и навыки, которые могут понадобиться в реальной работе Data Scientist. Программа включает основательную математическую подготовку, занятия по Python, R и SQL, а также по аналитике и машинному обучению.

***

Сколько зарабатывает специалист по анализу данных

Сейчас передовые компании собирают big data, зная, что любые траты на её анализ и на зарплату соответствующих специалистов оправданы. Ведь это поможет быстро найти и устранить проблемы, улучшить качество обслуживания, запустить новые перспективные проекты.

Поскольку это новая сфера, специалисты по data science — на вес золота. По итогам масштабного исследования зарплат аналитиков различных направлений в Москве оказалось, что самые высокие доходы, даже в начале карьерного пути, — именно у специалистов по data science.

На действительно высокую оплату своего труда начинающий data scientist может рассчитывать и за границей. Так, средняя зарплата начинающего специалиста в этой сфере в США составляет 68 054 доллара в год. После вычета всех налогов это более 4000 долларов в месяц.

Сколько стоит обучение

Дорогое обучение data science останавливает многих будущих специалистов, особенно сейчас, когда экономика нестабильна, а мир всё ещё борется с пандемией. Зато у Skillbox — антикризисные цены и оплата частями. До 31 августа вы можете записаться на курс «Профессия Data Scientist» со скидкой 40%, первые полгода учиться бесплатно, а после платить за своё обучение всего 4500 рублей в месяц. 

Ещё один бонус для прошедших курс — два месяца изучения английского в школе EnglishDom. Интерактивные онлайн‑уроки помогут вам улучшить свой уровень — работодатели это оценят.

Профессия будет актуальна и через 15 лет — во всех направлениях бизнеса и в любой стране мира. Начать свой путь в ней вам тоже поможет Skillbox: по завершении 75% курса вы получите сопровождение личного карьерного консультанта, который поможет подготовиться к собеседованиям в компаниях — партнёрах этой образовательной платформы.

Сферы применения data scientist

В настоящее время формирование и обработка баз данных есть в любой сфере деятельности. В реальной жизни специалист может найти применение своих знаний в следующих отраслях:

Чего мы достигли в работе с экспресс-доставкой за четыре месяца

Аудитория магазина выросла на 40%. Экспресс-доставка в июне составила 40% от всех заказов на Маркете. При этом почти все заказы поступили от новых клиентов. То есть экспресс-доставка работает как отдельный канал продаж со своей аудиторией. Наибольший прирост мы получили в Москве.

Средний чек за покупку вырос на 15%. Как правило, заказы с экспресс-доставкой на 15% дороже, чем обычные. Мы объясняем это тем, что за время готовы платить более состоятельные люди, поэтому и стоимость их покупок выше.

С помощью экспресс-доставки клиенты чаще всего заказывают дорогую электронику, например новые Айфоны или Самсунги.

Уменьшилось количество проблем с возвратами. Если клиент не выкупил товар с экспресс-доставкой, то курьер вернет его в магазин в тот же день. Так товар не болтается по складам и транспортным компаниям, а значит, меньше подвержен механическим повреждениям.

Экспресс-доставка — хорошая возможность привлечь новую аудиторию, повысить продажи и увеличить средний чек. Сервис довольно легко подключить в личном кабинете: 3–4 рабочих дня — и у вас все готово к работе.

Если услуга не сработает для вашего магазина, то попытка ничего не стоила, кроме нескольких часов. А если придут новые покупатели, то выиграете и в деньгах, и по числу довольных клиентов.

Чем занимается data scientist

Главная задача этого специалиста — сделать полезные практические выводы, располагая только набором данных и умея их анализировать.

Data scientist работает с большими данными — огромными массивами информации, которые получают из самых разных источников. Например:

  • в промышленности — с датчиков внутри механизмов: они измеряют температуру, давление, скорость производства продукции;
  • в интернете — по поведению пользователей: сколько человек посетили определённую страницу, сколько времени они здесь провели, на какие кнопки нажимали, по каким объявлениям переходили.

Располагая всеми эти данными, data scientist знает, как выстроить прогноз, и поможет принять верное решение: продавать акции или нет, запускать ли рекламу и если да, то какую, и так далее. Именно он способен оценить, насколько эффективно работает компания, что ей нужно улучшить, в каких направлениях выгоднее всего развиваться.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *