Давно не писала про онлайн-курсы, а ведь в этом году я снова поучилась немного.
С крупными системами онлайн-обучения вроде Coursera успели произойти большие изменения. Полученные на них знания избавились от статуса маргинального “обучения в интернете”, IT-мир так и вообще привык к тому, что человек учится сам удаленно. А значит порталы стали более формальными и за курсы стало необходимо платить гораздо чаще, чем прежде. Также везде появились “специализации”, т.е. линейки курсов, необходимые, чтобы человек мог считаться специалистом в какой-то области. Порталам удобно навязывать специализации, т.к. за них больше платят, поэтому навигация на Coursera стала неудобной, и я перешла на другие платформы, где постепенно появляется та же проблема. При этом я охотно плачу за курс, если цена небольшая и курс меня штырит, у меня верифицированный статус. Но сейчас я больше всего люблю Edx за интерфейс и немного Udemy за их полную безбашенность. Там никогда не знаешь, на что наткнешься.
Вот краткий обзор курсов, жирным выделила очень удачные.
Data Science на языке R от HarvardX на Edx – это линейка из семи курсов, из которых я прошла пока 3.5. Все они были информативными, но мне больше нравятся те, где есть интеграция с практической платформой DataCamp. Вот она меня покорила по полной схеме, потому что выполнять там задания очень удобно + там целая сеть своих курсов и свое комьюнити дата саентистов всех мастей.
Нормальный курс для тех, кто хочет начать программировать на R. Я до того, как его взять, баловалась со swirl, где R сам учит тебя работать с R, поэтому большая часть концепций была мне известна. Когда я работала с SAP HANA, там был встроенный R движок для визуализации, но я им пренебрегала, потому что R мало кто знал, и работала с HANA SQL + у меня в целом бэкграунд больше смещен на базы данных/управление, поэтому особенности интерпретации работы с данными в R меня искренне восхитили. Мне хотелось закрыть этот пробел – и курс как раз для этого.
Курс состоит из лекций и целой орды практических задачек на Datacamp, так что это хороший старт.
Курс полностью посвящен работе с ggplot2, самым распространенным инструментом для построения графиков и нахождения закономерностей в данных с помощью визуализации в R. Практика тут тоже на DataCamp – и это прямо очень удачно и доходчиво сделано. Много интересных заданий на датасетах со статистикой по странам от Gapminder , на данных высоты мужчин/женщин и проч. Препод не только дает азы работы с данными, но и показывает, как ошибка подгона статистики может испортить все выводы. Практики много, и материал выстроен так, чтобы воспользоваться знаниями из первого курса в том числе, а ко всему прочему автор подводит к тому, что грамотная статистика может изменить мир к лучшему. Мне очень понравилось, хотя такого рода работой я никогда не занималась.
Туда же как бонус хорошо идет вот этот мини-проект с DataCamp, где нужно проанализировать, каким языком люди пользуются на соревнованиях Kaggle. Там ничего сложного нет, но данные реальные и требуют небольшой корректировки.
Мне хотелось побольше дичи – сграбить что-нибудь и проанализировать, поэтому я переключилась на эту тему. И Wrangling – про то, как очищать сырые данные, как анализировать тексты, как “снимать” таблицы и инфу с сайтов и так далее. На сладкое там разбирается статья дата аналитика про анализ твитов Трампа со словарем эмоций – как пример, который можно выполнить. Очистка данных – это геморный и не то, чтобы очень захватывающий процесс, но проблема не в этом – я вполне азартно сграбила рецепты с сайта, разобравшись со скриптом, а возможности преобразования датасетов в R поражают воображение. Но в этом курсе нет интеграции с DataCamp, а значит практика вырождается в ответы на тесты и самостоятельное повторение скриптов-примеров. Это и близко не так захватывающе, но в целом курс ок.
На середине Data Science: Probability я завязла, потому что теорию вероятностей в том объеме, который нужен, я уже знаю, а задания про вынимание шаров вызывают у меня зевоту Я плохо реагирую на материал, оторванный от реальности, т.е. на задачи с абстрактными примерами. Дайте мне реальный датасет – и я впереди всей планеты, а вот чем более абстрактная задача (выньте шары в игре в лото), тем быстрее падает мой интерес. Так что я переключилась на курсы DataCamp, чтобы расширить владение R – и потом вернуться на регрессию.
Мини-курс на несколько часов про корреляцию/регрессию и про оценочные характеристики модели – расчет RMSE и так далее. Помимо базы автор рассказывал про ряд ошибок, которые можно допустить, слепо полагаясь на модель. В разделе про корреляцию чувак показал квартет Энскомба , и это было полезно, но в целом курс – суховатый ликбез на тему линейной регрессии.
А вот это было смачно. Женщина-аналитик из автомобильной индустрии рассказывала, как анализировать результаты опросов потребителей – и на их базе выстраивать предсказания, будет ли продаваться тачка с теми или иными фичами. Здесь скомбинированы 1) упрощенная, но реальная задача, 2) особенности построения иерархических моделей 3) приведение данных к нужным для построения регрессии с множеством входных данных 4) специфика применения моделирования в маркетинге. И все это в маленьком курсе на несколько часов.
Я руководитель в IT, мне интересно ML, так что я решила посмотреть, на что способны наши ребята в плане онлайн-обучения. Ну и название-то какое. =) В результате курс как-то пролился мимо меня. Авторы решили работать евангелистами применения машинного обучения, но тут трудно соблюсти баланс между интересами руководителя и особенностями ML. Мне была интересна исключительно специфика управления ML-проектами, отличия от обычных проектов, но главное – конкретные кейсы внедрения, какие-то крутые примеры, ведь у учителей полно такого опыта в отличие от меня. Но оказалось, что когда ты поднимаешься на уровень управления, специфики ML остается не так много, а примеры больше касались NLP и чат-ботов. Мне материала оказалось мало, хотя свои моменты в курсе были.
Основная его проблема: постоянная сдвижка в ошибки проектного менеджмента в целом. В качестве “практического задания” помимо тестов нужно было заполнить паспорт планируемого или воображаемого проекта. Оставлять комментарии в паспортах вымышленных проектов других людей? I’m too old for this shit. Много советов касалось опять же базы управления проектами, а думаю, все участники в этом должны быть подкованы заранее. Поэтому семинары, где разбирались конкретные кейсы ML, и сжатые советы по планированию и поиску персонала мне понравились, а все остальное на троечку.
Scrum: the Basics
У linkedIn есть своя обучающая платформа lynda.com или https://www.linkedin.com/learning/ . Она хороша, если вы хотите быстро закрыть какой-то профессиональный пробел. Я, например, большую часть времени работала в крупных компаниях (“кровавый enterprise”), которые практикуют waterfall, – т.е. это большие проекты с крупными заказчиками и заранее определенным процессом и мучительно закрепленным на этапе ТО скоупом продукта. Когда я ушла, закончив очередной проект, мне захотелось чего-то повеселее, я ходила в конторы поменьше – и хотела разобраться, что такое Scrum, на пальцах, чтобы не облажаться. Для этой цели мини-курс + Agile manifesto подходят идеально.
Курс по тому, как использовать утилиты из Kali Linux, даже если ты тупой, как пробка. У меня давно лежал дистрибут Кали, был отпуск, и я решила вспомнить времена любви к журналу “Хакер”. Курс оказался настолько для новичков, что взломать wi-fi с помощью пары прог под руководством этого препода сможет даже ребенок. То есть это основы-основы – чувак, похожий на меланхоличного студентика, объясняет, как запустить и настроить определенные утилиты, чтобы добиться определенного эффекта, и почти полностью убирает комментарий по существу происходящих процессов. Linux command line обязательна, конечно, но в остальном пререквизиты курса минимальны.
Я ожидала чего-то более заковыристого и развесистого, поэтому ощущала сильный дефицит инфы, но взломать перебором кода роутер соседа или практиковать дидос wi-fi-точки с помощью USB-карты – это приятные технарские эмоции. Серьезным спецом вы после такого курса не станете точно, но он показывает ряд основных возможных направлений сетевых атак. С другой стороны, если вы не хотите сложностей, но ощущаете тягу приобщиться к миру сетевой безопасности и ощутить хакерскую романтику в минимальном комплекте, то Udemy – ваш вариант. Таких курсов на Udemy просто море. Не знаю, на основании каких критериев можно отличить один от другого без теста, но я уверена, что можно найти “своего” лектора.
Оставила на середине, т.к. это было just for lulz, но скоро вернусь и доделаю, потому что я хотела узнать, что интересного он расскажет про DOS-attacks.
Я обожаю Kadenza за концепт их курсов – они рассказывают, как людям творческих профессий совместить творчество и современные технологии, творчество и бизнес, т.е. это курсы про искусство и то, как искусство интегрировать в жизнь. Но у Каденцы есть большой минус – большая часть курсов платная, причем плата не формальная, а часто весьма приличная. Курсы ведут преподаватели художественных колледжей из Америки и других стран, и это обсусловило ценник. Хотя я не художник, меня интеграция художников, музыкантов, писателей в бизнес сильно интересует, поэтому я решила пройти бесплатный мини-курс по финансовому планированию, чтобы оценить полет мысли.
И этот курс, конечно, вызывает широкую улыбку, потому что в первой секции учит творческих людей ставить SMART-цели и строить портфолио-карьеру, а потом учит работать с Excel. Серьезно. Учит делать простую табличку с расчетом доходов-расходов, базовым бюджетом, и это дико смешно. Но одновременно для творческих людей очень полезно. Я сама посмеялась над бесхитростностью преподавателя, уговаривающего не бояться таблиц, но потом решила сделать расчет и посмотреть, сколько мне приносит творчество и сколько я на него затрачиваю. Выводы оказались бесценны. Одно дело – воспринимать Excel как инструмент на работе, а другое – попробовать применить финансовое планирование к собственной жизни, свободной, хаотичной и веселой.
Для писателей больше всего полезной окажется идея про портфель карьер. Все, что вы делаете, условно можно разделить на работу, которая приносит основной массив денег, творчество и прослойку – работу, за которую платят, и которая опосредованно развивает навыки, полезные для творчества. Для писателя, например, творчество – это книги, а прослойка – это журналистика, ведение курсов по литературе, редактура и проч. Основная цель многих творческих личностей – зарабатывать только творчеством, но это получается далеко не у всех, даже очень талантливых людей. Хорошо, если большую часть денег приносит творчество + прослойка, частично прокачивающая полезные для творчества навыки. Но у разных людей этот “портфель” сбалансирован по-разному. Кто-то зарабатывает основной работой, не связанной с творчеством, + редкими доходами с творчества, т.е. обходится без прослойки, кто-то балансирует доходы “прослойки” и творчества, иногда подрабатывая на нерелевантных работах и т.д. Важно критически осмотреть свой пул доходов и посмотреть, нельзя ли его “переформулировать”.
Если взять простое выражение “вы преуспеваете в том, чем больше всего занимаетесь“, то стоит посмотреть на свое распределение времени и решить, не стоит ли внести какие-то изменения в план развития и выбор работы. Очень полезная часть, а вот облегченный курс по Excel – это на любителя, и все же рекомендую особенным снежинкам его пройти. Я после курса добавила в свою жизнь “прослойку” в виде журнализма разного сорта – и получила дополнительный доход в ~10-20 к в месяц. Немного по сравнению с зарплатой, но приятно.