» » Как выучиться на Data Scientist: наиболее востребованные технические навыки

 

Как выучиться на Data Scientist: наиболее востребованные технические навыки

Автор: admin от 22-05-2020, 20:01, посмотрело: 639

Какие технические знания становятся наиболее популярными у работодателей, а какие теряют свою популярность.



Как выучиться на Data Scientist: наиболее востребованные технические навыки



В своей первоначальной статье 2018-го года я рассматривал спрос на общие навыки – статистику и коммуникацию. Также я рассматривал спрос на Python и язык программирования R. Технологии создания программного обеспечения меняются намного быстрее, чем спрос на общие навыки, поэтому в этот обновленный анализ я включаю только технологии.



Я искал ключевые слова, которые появлялись в списках вакансий на должность «Data Scientist» в США на таких сайтах как SimplyHired, Indeed, Monster и LinkedIn. В этот раз я решил написать код, чтобы изучить все списки вместо того, чтобы искать вручную. Это решение оказалось очень успешным для SimplyHired, Indeed и Monster. Я использовал Requests и Beautiful Soup из библиотеки Python HTTP. Код с анализом вы можете увидеть в моем отчете на GitHub.



Продираться через LinkedIn оказалось в разы сложнее. Необходимо пройти процесс авторизации, чтобы просматривать точное количество списков вакансий. Я решил использовать Selenium для просмотра страниц без графического интерфейса пользователя. В сентябре 2019 года Верховный суд США выиграл дело против LinkedIn, тем самым позволив очистить данные сайта. Тем не менее, я не смог получить доступ к своей учетной записи после нескольких попыток входа. Возможно, эта проблема возникла из-за ограничения скорости. Апдейт: Я все же смог войти, но боюсь, что меня заблокируют при повторной попытке.

исследований. Python сильно обогнал R в качестве языка программирования. Как бы там ни было, R продолжает быть очень популярным, появляясь в 55% объявлений. Не отчаивайтесь, если владеете R, но также задумайтесь об изучении Python, если хотите получить более востребованный навык.



Многие продукты Apache, включая Pig, Hive, Hadoop и Spark теряют свою популярность. Pig опустился на пять позиций в рейтинге – гораздо больше по сравнению с любыми другими технологиями. Spark и Hadoop по-прежнему широко востребованы, но, опираясь на мои выводы, можно увидеть тенденцию движения к технологиям Big-Data.



Статистические пакеты прикладных программ MATLAB и SAS сильно потеряли в популярности. MATLAB опустился на четыре строки в рейтинге, а SAS опустился с шестого на восьмое место. В обоих языках наблюдается значительное процентное снижение по сравнению со средними показателями 2018 года.



Совет



В этом списке очень много технологий. Конечно же, знать все вам не нужно. Не зря же мифического data scientist называют единорогом.



Мой совет следующий – если вы начинаете работать в этой области, концентрируйтесь на технологиях, пользующихся спросом.



Сосредоточьтесь.

На.

Изучении.

Одной.

Технологии.

За.

Раз.



(Это отличный совет, хотя я и сам не всегда его придерживался. )



Вот в таком порядке я рекомендую учиться:




  • Выучите Python для общего программирования.

  • Для преобразования данных изучите Pandas. Я полагаю, что компания, нанимающая на вакансию data scientist со знанием Python будет также ожидать от кандидатов знания Pandas и Scikit-learn. Scikit-learn как раз появились в списке, а Pandas почти пробили путь наверх. Вместе с изучением Pandas вы также выучите визуализацию в Matplotlib и немного NumPy.

  • Изучите машинное обучение с помощью Scikit-learn. Также я рекомендую книгу «Introduction to Machine Leaning with Python».

  • Изучите SQL для эффективного отправления запросов в соответствующие базы данных.

  • Изучите Tableau для визуализации данных. Вероятно, это самая интересная и простая для восприятия технология из всего списка.

  • Освойте облачные платформы. AWS – хороший выбор из-за его доли на рынке. Microsoft Azure – также отличный вариант. Хоть он и не так популярен, я все равно неравнодушен к Google Cloud, потому что мне нравится их пользовательский интерфейс и фокус на машинное обучение. Если вы хотите ознакомиться с возможностями приема, преобразования и хранения данных на Google Cloud, можете прочитать мою статью о том, как стать сертифицированным профессиональным Data Engineer на Google Cloud.

  • Изучите технологию глубокого обучения. Наибольшим спросом пользуется TensorFlow. Книга Франсуа Шолле «Deep Learning with Python» прекрасно объясняет Keras и принципы глубокого обучения. Keras сейчас тесно взаимодействует с TensorFlow, так что это отличное начало. PyTorch также развивается. Чтобы больше узнать об этой теме, ознакомьтесь с моим анализом.



  • Это мои общие советы по обучению. Приспособьте их под свои цели или же забейте и делайте то, что хотите сами.





    Как выучиться на Data Scientist: наиболее востребованные технические навыки

    Узнайте подробности, как получить востребованную профессию с нуля или Level Up по навыкам и зарплате, пройдя онлайн-курсы SkillFactory:







    Читать еще





    Источник: Хабр / Интересные публикации

    Категория: Программирование

    Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь.
    Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

    Добавление комментария

    Имя:*
    E-Mail:
    Комментарий:
    Полужирный Наклонный текст Подчеркнутый текст Зачеркнутый текст | Выравнивание по левому краю По центру Выравнивание по правому краю | Вставка смайликов Выбор цвета | Скрытый текст Вставка цитаты Преобразовать выбранный текст из транслитерации в кириллицу Вставка спойлера
    Введите два слова, показанных на изображении: *