- Главные фичи от Kaggle
- Что представляет собой домашняя страница соревнований
- В чем польза Kaggle
- Что нужно сделать, чтобы быть готовым к обучению на Kaggle
- Заключение
Kaggle – это уникальная платформа на которой проходят конкурсы и одновременно социальная сеть, где общаются юные и уже опытные программисты. Основана она компанией Google в 2017 году.
Здесь программисты показывают свой талант, формируют рейтинг. Лучших вычисляют крупные компании по информационным технологиям и приглашают на работу с ИИ, нейросетями. На конкурсах здесь зарабатывают до 100 тысяч долларов за решение головоломки с кодом.
Внимание! Мнения о преимуществах и недостатках Kaggle разошлись в разных направлениях. Например, многие опытные программисты говорят, что новичок ничему толком не обучится, участвуя в конкурсах на платформе. Потому что уже подготовленные коды не сравнятся с тем, что приходится проходить Дата Сайентисту на работе, в офисе или хотя бы в университете при изучении.
Главные фичи от Kaggle
Популярной фичей на платформе является система рейтинга. Ее формируют и улучшают в четырех категориях взаимодействия с платформой:
- Соревнования дают возможность новичкам по одиночке или в команде решать задачи, представленные создателями уникальной площадки. Задачи даются самые разные. Например, предсказать количество выживших на Титанике или более сложные оценить эффективность игроков защиты в NFL Big Data Bowl.
- Поделиться программным кодом с другими. Каждый, кто создал что-нибудь свое может рассказать и показать соратникам через систему Kaggle Notebooks. KN – это облачная вычислительная среда.
- Набор данных. Каждый, кто зарегистрирован на площадке может помогать другим выкладывая новые данные и рассказывая о них.
- Форум. На форумах можно общаться, делиться мнениями, лайкать посты других участников.
Успех в одной из категорий не зависит от успеха в других. У пользователя, зашедшего на страницу и зарегистрировавшегося в Kaggle, путь продвижения начинается со звания новичка. Всего уровней достижений пять:
- Чтобы получить стаж новичка, нужно лишь зарегистрироваться.
- Получает стаж участника тот сайентист, который заполнил свой профиль, участвовал в одном из соревнований, пишет комментарии. Дополнительно за этого участника должны проголосовать другие люди. То есть он должен получить хотя бы один голос.
- Эксперта получает тот, кто заработал хотя бы одну бронзовую медаль, участвовал во многих категориях взаимодействия с платформой и имеет золотую, серебряную медали.
- Чтобы получить звание мастера, необходимо доказать свое превосходство в одном или нескольких видах взаимодействия с площадкой. Участник должен заработать золотые и серебряные медали. Тот, кто подтвердит звание мастера сможет участвовать в эксклюзивных соревнованиях, которые закрыты для других участников, стоящих ниже по рейтингу.
- Грандмастером становится тот, кто получает только золотые медали и выигрывает почти все соревнования.
Что же собой представляют соревнования в Kaggle – этим вопросом задаются многие новички, вступившие на площадку.
Что представляет собой домашняя страница соревнований
Страница соревнований состоит из следующих вкладок:
- Overview. Здесь располагаются метрики, оценки, призы.
- Data. В этой вкладке находится информация, которая необходима пользователю для участия в конкурсе. Сюда он подгружает все данные с программными кодами и другие, важные для соревнований.
- Kernels. Здесь располагаются работы, уже созданные участником во время проведения прошлого конкурса. В этой вкладке можно тщательно изучить все скрипты, скопировать их в облачную вычислительную систему и запустить на следующем конкурсе.
- Discussion. В этой вкладке располагаются обсуждения тем по конкурсу от других участников. Можно поучаствовать в форуме, чтобы получить много новой информации или спросить о том, что интересует пользователя.
- Leaderboard показывает, кто сейчас находится на вершине и какое место занимает интересующий участник.
- Rules. В этой вкладке пользователь найдет правила, которые необходимо прочитать перед началом конкурса. Это может показаться нудным, но правила должны все знать, чтобы не вылететь из соревнования.
- Team дает право управлять своей командой или получать задания от капитана, если участвующий не является им.
- My Submissions. В этой вкладке можно посмотреть прошлые материалы и выбрать один из вариантов, чтобы запустить его на конкурс.
Теперь, когда начинающий специалист по Data Science знает все о вкладках соревнований, можно поговорить о том, что все-таки дает ему платформа и чем она будет полезна.
В чем польза Kaggle
Опытные программисты считают соревнования отличным инструментом для обучения. А меньшая часть из них подтверждает, что, пользуясь Kaggle, можно изучить науку Data Science. Однако понимание всех процессов в Дата Сайнс посредством этой уникальной платформы возможно только в том случае, если у участника есть огромный потенциал аналитического склада ума и большое желание учиться.
Kaggle помогает прокачать настойчивость и умение работать в команде, исследуя алгоритмы, фреймворки и библиотеки. Так как все задания на площадке упакованы и очищены от лишнего мусора, у участника есть возможность полностью сосредоточиться на поиске лучшего решения и изучении алгоритмов.
Решать задачи по Data Science – это эффективный способ изучить данную науку. Поэтому участнику не нужно оглядываться на ушедшие кому-то другому деньги за выигрыш в конкурсе. Прокачивая свои скиллы в решении задач, в будущем он продвинется дальше, сможет дорасти до Senior’а программиста и получать тысячи долларов за проект.
Просмотр интервью и комментариев уже имеющих опыт участников поможет научиться мыслить, как настоящие Дата-сайентисты. Как начинающему программисту начать обучение?
Что нужно сделать, чтобы быть готовым к обучению на Kaggle
Прежде чем начать учиться необходимо выбрать для себя язык программирования. В Data Science обычно используется два вида языка:
- Python;
- R.
Если нет опыта в программировании вообще, то лучше начать с Питона. Это универсальный язык, который легко изучать.
После изучения языка необходимо обучиться разведывательному или исследовательскому анализу данных. Нужно уметь загружать и визуализировать информацию. В этом помогут инструменты, которые находятся в библиотеках Питон: Pandas, Seaborn.
Сдать экзамен, чтобы лучше понять, насколько участник уяснил основы науки, поможет обучение первой модели на несложном датасете. В качестве модели можно взять Random Forest в библиотеке Scikit-learn.
После того, как участник пройдет все вышеописанные этапы, можно будет поучаствовать в соревнованиях. Для начинающего рекомендуется категория Getting Started. Там он укрепит свои знания и не запутается в сложных алгоритмах.
Заключение
Теперь, когда будущий участник знает, что такое Kaggle и что нужно, чтобы продвигаться в рейтинге на платформе, можно попробовать зарегистрироваться в Kaggle и сделать свои первые шаги. Если же у новичка совсем нет опыта и навыков программирования, то набрать его и узнать, что такое Data Science, как работают нейросети, помогут курсы от DevEducation.