15 Dec

онлайн-курсы: data science, Kali linux и проч

Давно не писала про онлайн-курсы, а ведь в этом году я снова поучилась немного.
 
С крупными системами онлайн-обучения вроде Coursera успели произойти большие изменения. Полученные на них знания избавились от статуса маргинального “обучения в интернете”,  IT-мир так и вообще привык к тому, что человек учится сам удаленно. А значит порталы стали более формальными и за курсы стало необходимо платить гораздо чаще, чем прежде. Также везде появились “специализации”, т.е. линейки курсов, необходимые, чтобы человек мог считаться специалистом в какой-то области.  Порталам удобно навязывать специализации,  т.к. за них больше платят, поэтому навигация на Coursera стала неудобной, и я перешла на другие платформы, где постепенно появляется та же проблема.  При этом я охотно плачу за курс, если цена небольшая и курс меня штырит, у меня верифицированный статус. Но сейчас я больше всего люблю Edx за интерфейс и немного Udemy за их полную безбашенность. Там никогда не знаешь, на что наткнешься.
 
Вот краткий обзор курсов, жирным выделила очень удачные.
 
Data Science на языке R от HarvardX на Edx  – это линейка из семи курсов, из которых я прошла пока 3.5. Все они были информативными, но мне больше нравятся те, где есть интеграция с практической платформой DataCamp. Вот она меня покорила по полной схеме, потому что выполнять там задания очень удобно + там целая сеть своих курсов и свое комьюнити дата саентистов всех мастей.

 
Нормальный курс для тех, кто хочет начать программировать на R.  Я до того, как его взять, баловалась со swirl,  где R сам учит тебя работать с R, поэтому большая часть концепций была мне известна.  Когда я работала с SAP HANA, там был встроенный R движок для визуализации, но я им пренебрегала, потому что R мало кто знал,  и работала с HANA SQL + у меня в целом бэкграунд больше смещен на базы данных/управление, поэтому особенности интерпретации работы с данными в R меня искренне восхитили. Мне хотелось закрыть этот пробел – и курс как раз для этого.
 
Курс состоит из лекций и целой орды практических задачек на Datacamp, так что это хороший старт.
 
 
Курс полностью посвящен работе с ggplot2, самым распространенным инструментом для построения графиков и нахождения закономерностей в данных с помощью визуализации в R. Практика тут тоже на DataCamp – и это прямо очень удачно и доходчиво сделано. Много интересных заданий на датасетах со статистикой по странам от Gapminder , на данных высоты мужчин/женщин и проч. Препод не только дает азы работы с данными, но и показывает, как ошибка подгона статистики может испортить все выводы.  Практики много, и материал выстроен так, чтобы воспользоваться знаниями из первого курса в том числе, а ко всему прочему автор подводит к тому, что грамотная статистика может изменить мир к лучшему. Мне очень понравилось, хотя такого рода работой я никогда не занималась.
 
Туда же как бонус хорошо идет вот этот мини-проект с DataCamp, где нужно проанализировать, каким языком люди пользуются на соревнованиях Kaggle. Там ничего сложного нет, но данные реальные и требуют небольшой корректировки.
 
 
Мне хотелось побольше дичи  – сграбить что-нибудь и проанализировать,  поэтому я переключилась на эту тему. И Wrangling – про то, как очищать сырые данные, как анализировать тексты, как “снимать” таблицы и инфу с сайтов и так далее. На сладкое там разбирается статья дата аналитика про анализ твитов Трампа со словарем эмоций  – как пример, который можно выполнить.  Очистка данных – это геморный и не то, чтобы очень захватывающий процесс, но проблема не в этом – я вполне азартно сграбила рецепты с сайта, разобравшись со скриптом, а возможности преобразования датасетов в R поражают воображение.  Но в этом курсе нет интеграции с DataCamp, а значит практика вырождается в ответы на тесты и самостоятельное повторение скриптов-примеров.  Это и близко не так захватывающе, но в целом курс ок.
 
На середине  Data Science: Probability  я завязла, потому что теорию вероятностей в том объеме, который нужен, я уже знаю, а задания про вынимание шаров вызывают у меня зевоту  Я плохо реагирую на материал, оторванный от реальности, т.е. на задачи с абстрактными примерами. Дайте мне реальный датасет – и я впереди всей планеты, а вот чем более абстрактная задача (выньте шары в игре в лото), тем быстрее падает мой интерес. Так что я переключилась на курсы DataCamp, чтобы расширить владение R – и потом вернуться на регрессию.
 
 
Мини-курс на несколько часов про корреляцию/регрессию и про оценочные характеристики модели – расчет RMSE и так далее. Помимо базы автор рассказывал про ряд ошибок, которые можно допустить, слепо полагаясь на модель. В разделе про корреляцию чувак показал квартет Энскомба , и это было полезно, но в целом курс – суховатый ликбез на тему линейной регрессии.
 
 
А вот это было смачно. Женщина-аналитик из автомобильной индустрии рассказывала, как анализировать результаты опросов потребителей – и на их базе выстраивать предсказания, будет ли продаваться тачка с теми или иными фичами. Здесь скомбинированы 1) упрощенная, но реальная задача, 2) особенности построения иерархических моделей 3) приведение данных к нужным для построения регрессии с множеством входных данных 4) специфика применения моделирования в маркетинге. И все это в маленьком курсе на несколько часов.
 
 
Я руководитель в IT, мне интересно ML, так что я решила посмотреть, на что способны наши ребята в плане онлайн-обучения. Ну и название-то какое. =) В результате курс как-то пролился мимо меня. Авторы решили работать евангелистами применения машинного обучения, но тут трудно соблюсти баланс между интересами руководителя и особенностями ML. Мне была интересна исключительно специфика управления ML-проектами, отличия от обычных проектов, но главное –  конкретные кейсы внедрения, какие-то крутые примеры, ведь у учителей полно такого опыта в отличие от меня.  Но оказалось, что когда ты поднимаешься на уровень управления,  специфики ML остается не так много, а примеры больше касались NLP и чат-ботов. Мне материала оказалось мало, хотя свои моменты в курсе были.
 
Основная его проблема: постоянная сдвижка в ошибки проектного менеджмента в целом. В качестве “практического задания” помимо тестов нужно было заполнить паспорт планируемого или воображаемого проекта. Оставлять комментарии в паспортах вымышленных проектов других людей? I’m too old for this shit. Много советов касалось опять же базы управления проектами, а думаю, все участники в этом должны быть подкованы заранее.  Поэтому семинары, где разбирались конкретные кейсы ML,  и сжатые советы по планированию и поиску персонала мне понравились, а все остальное на троечку.
 
 
У linkedIn есть своя обучающая платформа lynda.com или https://www.linkedin.com/learning/ .  Она хороша, если вы хотите быстро закрыть какой-то профессиональный пробел. Я, например, большую часть времени работала в крупных компаниях (“кровавый enterprise”), которые практикуют waterfall,  – т.е. это большие проекты с крупными заказчиками и заранее определенным процессом и мучительно закрепленным на этапе ТО скоупом продукта.  Когда я ушла, закончив очередной проект, мне захотелось чего-то повеселее, я ходила в конторы поменьше – и хотела разобраться, что такое Scrum, на пальцах, чтобы не облажаться.  Для этой цели мини-курс + Agile manifesto подходят идеально.
 
 
Курс по тому, как использовать утилиты из Kali Linux, даже если ты тупой, как пробка.  У меня давно лежал дистрибут Кали, был отпуск, и я решила вспомнить времена любви к журналу “Хакер”. Курс оказался настолько для новичков, что взломать wi-fi с помощью пары прог под руководством этого препода сможет даже ребенок.  То есть это основы-основы – чувак, похожий на меланхоличного студентика, объясняет, как запустить и настроить определенные утилиты, чтобы добиться определенного эффекта, и почти полностью убирает комментарий по существу происходящих процессов. Linux command line обязательна, конечно, но в остальном пререквизиты курса минимальны.
 
Я ожидала чего-то более заковыристого и развесистого, поэтому ощущала сильный дефицит инфы, но взломать перебором кода роутер соседа или практиковать дидос wi-fi-точки с помощью USB-карты – это приятные технарские эмоции.  Серьезным спецом вы после такого курса не станете точно, но он показывает ряд основных возможных направлений сетевых атак. С другой стороны, если вы не хотите сложностей, но ощущаете тягу приобщиться к миру сетевой безопасности и ощутить хакерскую романтику в минимальном комплекте, то Udemy – ваш вариант. Таких курсов на Udemy просто море. Не знаю, на основании каких критериев можно отличить один от другого без теста, но я уверена, что можно найти “своего” лектора.
 
Оставила на середине, т.к. это было just for lulz, но скоро вернусь и доделаю, потому что я хотела узнать, что интересного он расскажет про DOS-attacks.
 
 
Я обожаю Kadenza за концепт их курсов – они рассказывают, как людям творческих профессий совместить творчество и современные технологии, творчество и бизнес, т.е. это курсы про искусство и то, как искусство интегрировать в жизнь. Но у Каденцы есть большой минус – большая часть курсов платная, причем плата не формальная, а часто весьма приличная.  Курсы ведут преподаватели художественных колледжей из Америки и других стран, и это обсусловило ценник.  Хотя я не художник, меня интеграция художников, музыкантов, писателей в бизнес сильно интересует, поэтому я решила пройти бесплатный мини-курс по финансовому планированию, чтобы оценить полет мысли.
 
И этот курс, конечно, вызывает широкую улыбку, потому что в первой секции учит творческих людей ставить SMART-цели и строить портфолио-карьеру, а потом учит работать с Excel. Серьезно. Учит делать простую табличку с расчетом доходов-расходов, базовым бюджетом, и это дико смешно. Но одновременно для творческих людей очень полезно. Я сама посмеялась над бесхитростностью преподавателя, уговаривающего не бояться таблиц,  но потом решила сделать расчет и посмотреть, сколько мне приносит творчество и сколько я на него затрачиваю. Выводы оказались бесценны. Одно дело – воспринимать Excel как инструмент на работе, а другое – попробовать применить финансовое планирование к собственной жизни, свободной, хаотичной и веселой.
 
Для писателей больше всего полезной окажется идея про портфель карьер. Все, что вы делаете, условно можно разделить на работу, которая приносит основной массив денег, творчество и прослойку – работу, за которую платят, и которая опосредованно развивает навыки, полезные для творчества.  Для писателя, например, творчество – это книги, а прослойка – это журналистика, ведение курсов по литературе, редактура и проч.  Основная цель многих творческих личностей – зарабатывать только творчеством, но это получается далеко не у всех, даже очень талантливых людей. Хорошо, если большую часть денег приносит творчество + прослойка, частично прокачивающая полезные для творчества навыки. Но у разных людей этот “портфель” сбалансирован по-разному. Кто-то зарабатывает основной работой, не связанной с творчеством, + редкими доходами с творчества, т.е. обходится без прослойки, кто-то балансирует доходы “прослойки” и творчества, иногда подрабатывая на нерелевантных работах и т.д.  Важно критически осмотреть свой пул доходов и посмотреть, нельзя ли его “переформулировать”.
 
Если взять простое выражение “вы преуспеваете в том, чем больше всего занимаетесь“, то стоит посмотреть на свое распределение времени и решить, не стоит ли внести какие-то изменения в план развития и выбор работы.  Очень полезная часть, а вот облегченный курс по Excel – это на любителя, и все же рекомендую особенным снежинкам его пройти.  Я после курса добавила в свою жизнь “прослойку” в виде журнализма разного сорта – и получила дополнительный доход в ~10-20 к в месяц.  Немного по сравнению с зарплатой, но приятно.
 

Leave a Reply