Monitoring Engeneer

  • Полная занятость

Описание компании

Welltory — приложение №1 в России про здоровье. Более 3,5 млн юзеров, 50 тысяч пятизвездочных оценок, core audience — США. Мы помогаем людям улучшить свое здоровье, повысить продуктивность и эффективность занятий спортом с помощью анализа данных. Интересный продукт, о котором приятно рассказать на встрече друзьям или на конференции. Можно каждый день читать отзывы и чувствовать, как растет ваша карма.

Описание вакансии

Требования

  • Сейчас мониторингом продукта занимается команда DevOps. Работа по отслеживанию и предотвращению ошибок частично автоматизирована и описана инструкциями. Тебе предстоит забрать часть задач на себя и помочь выстроить процесс работы.
  • Нашим продуктом пользуются по всему миру больше 3,5 млн пользователей, нагрузка на систему происходит круглосуточно. Оповещения о сбоях или ошибках могут приходить в ночное время. Поэтому нам важно чтобы твой часовой пояс совпадал с временем на Дальнем Востоке (Владивосток, Хабаровск), Западе (Калининград) или Сибири (Томск, Новосибирск, Иркутск) или тебе должно быть комфортно работать в ночное время суток по московскому времени.
  • Тебе предстоит отслеживать алерты об ошибках в Prometheus, ELK, Grafana, Alertmanager. Круто, если у тебя уже есть опыт работы с этими системами.
  • Тебе знаком инструмент PagerDuty и Incident Management в целом.
  • Ты не представляешь как можно работать без качественных инструкций и любишь их писать. Спойлер — мы тоже :)
  • Работать будет еще интересней, если у тебя уже есть опыт работы системным администратором или специалистом технической поддержки. При этом мы готовы взять человека с минимальным опытом и интересом к теме мониторинга, у нас есть все ресурсы, чтобы учить и развивать тебя.
  • Мы ценим аккуратность и педантичность к представлению результатов. Здорово, если ты разделяешь наш подход.

Задачи

  • У тебя будет возможность обеспечить высокий uptime системы, реагируя на алерты согласно инструкциям. В том числе сможешь самостоятельно описывать инструкции, по которым потом будет работать вся команда.
  • Ты сможешь предлагать любые улучшения мониторинга для системы, приложений, кода и помогать внедрять их.
  • Вместе с командой тебе предстоит разработать систему алертов и реакции на них, чтобы ты, DevOps или разработчики могли реагировать самостоятельно.
  • Будешь много общаться с Customer Support командой (поддержка пользователей), чтобы построить понятный, воспроизводимый процесс реакции и решения инцидентов.
  • Самостоятельно и с помощью DevOps-команды настраивать сбор метрик с инфраструктурного ПО, а также приложений. (Prometheus, Alertmanager, etc).

By clicking the link above or any third-party link within this posting, you are leaving this site and going to a third-party website where the third-party website's terms and privacy policy apply