четверг, 14 января 2016 г.

Machine Learning Courses

Технологии machine learning сейчас достаточно активно применяются для разработки алгоритмических стратегий, поэтому владение этой проблематикой я думаю будет достаточно полезным для серьезных quant трейдеров. Тут конечно есть много вопросов/нюансов связанных с оверфиттингом и т.д., но об этом надо писать отдельно.
Опять же "сырьевой" цикл похоже завершен и в ближайшие 5-7 лет вряд ли мы увидим высокие цены на нефть, металлы. Соответственно эта ситуация ничего хорошего нашей стране не сулит, а при сохранении цен на нефть на уровне 30-40 $/bbl в течении пары лет и вовсе грозит стране катастрофой. Соответственно, для молодежи с хорошими математическими способностями, чтобы остаться относительно независимыми в нашей стране долбанутых мудаков и побеждающего мракобесия, и иметь возможность устроиться работать не за фантики, получение специальности в области data science это очень даже неплохой вариант,
тем более что как пишут ожидается большой дефицит таких специалистов в ближайшем будущем.






































Теперь собственно перейдем непосредственно к теме поста.
Пару дней назад стартовал онлайн курс Стэнфорда по machine learning, основанный на материалах отличной книжки. Для выполнения заданий используется язык R. Уровень знания математики требуемый для изучения материала достаточно умеренный (базовые курсы линейной алгебры и теории вероятности и математической статистики на уровне технического вуза) в отличие от более продвинутой книжки тех же авторов.




















Саму книжку можно бесплатно скачать на странице авторов.
Видео предыдущих курсов можно посмотреть здесь или здесь.

Если говорить о других онлайн курсах по теме, то надо также отметить еще один стэнфордский курс на Coursera.
В этом курсе используется совсем простая математика, так что доступно практически всем (хотя нельзя сказать, что задания прям совсем простые). Здесь также удобно, что нет жестких дедлайнов и учиться можно в комфортном для себя темпе. Плохо только, что задания надо делать в Matlab & Octave, Python & R они не принимают.
Предыдущие версии материалов курса доступны здесь.
Более продвинутые лекции того же автора по теме можно
найти здесь и здесь.

Также в конце января на Coursera стартует курс по машинному обучению от Яндекса.
Я так понимаю, что это будет насколько упрощенная версия их курса, который они читают в своей школе анализа данных.
https://yandexdataschool.ru/edu-process/courses/machine-learning
Для выполнения практических заданий нужно будет использовать Python.
Я сам этот курс не смотрел, но думаю должно быть интересно.

Еще можно упомянуть про курс от университета Джона Хопкинса на курсере,
но там стандартная по отзывам для всей специализации  проблема, что объясняют мало и плохо, а задания дают достаточно непростые.

Через какое то время постараюсь написать, какие еще книжки по теме можно почитать.











4 комментария:

  1. Книжка An Introduction to Statistical Learning скоро будет в переводе.

    ОтветитьУдалить
    Ответы
    1. Тут главное, чтобы перевод был хороший,
      а то у нас в последние годы зачастую
      ужас полный выходит.
      Ну а вообще тем кто серьезно собирается заниматься этой темой английский конечно нужно неплохо знать,
      потому что основные материалы все равно на нем.

      Удалить
    2. Полагаю, что Мастицкий Сергей, не испортит ее.
      А по поводу англоязычных книг, да, это конечно,
      так как на русском почти и нет ничего увлекательного.

      Удалить
    3. Это хорошо когда за перевод берется спец в предметной области, поскольку как правило основные косяки в переводе не от незнания языка, а из-за непонимания предмета.

      Удалить