Компания «СИАМ» объявила о запуске хакатона Siam ML Hack, который посвящён применению машинного обучения в нефтегазовой отрасли. Мероприятие пройдет с 28 февраля по 19 марта и станет площадкой для разработчиков, аналитиков и специалистов по машинному обучению, желающих предложить инновационные решения для реальных задач отрасли.
Задачи хакатона относятся к среднему уровню сложности, поэтому специалисты разной степени подготовки могут попробовать свои силы при выполнении заданий. Кроме того, начальник отдела автоматизации компании «СИАМ» Исупов Сергей Вадимович поделился нюансами предстоящего события.
На фото: Исупов Сергей Вадимович, начальник отдела автоматизации компании «СИАМ»
– Компания «СИАМ» работает в нефтесервисе с 1990 года. Как за это время изменились подходы к анализу данных, и какие технологии сейчас наиболее востребованы?
За прошедшие десятилетия методы сбора и анализа данных в нефтесервисе претерпели колоссальные изменения. Если до 1990-х годов на месторождениях использовались в основном механические приборы, которые писали показания на бумагу (по принципу, схожему с кардиограммами в больницах), то анализ таких данных приходилось проводить вручную — с помощью линейки, циркуля и других «античных» инструментов. Эти бумажные ленты складывали, обрабатывали и лишь затем делали выводы.
С развитием цифровых технологий появилась возможность сохранять данные в электронном виде, загружать их в базы и автоматизировать часть расчетов. Собственно, с этого этапа начала свою деятельность и наша компания: мы начали разрабатывать приборы, заменяющие устаревшие механические устройства, и предлагать первые программные инструменты для аналитики.
Позднее, по мере роста вычислительных мощностей и увеличения объёмов доступных данных, стали набирать популярность сложные численные методы анализа. Сегодня мы внедряем инструменты на базе искусственного интеллекта, которые фактически развивают идеи прежних аналитических и численных подходов, но работают автономнее и позволяют обрабатывать большие потоки информации без постоянного ручного контроля со стороны инженеров.
– Как машинное обучение применяется в гидродинамических исследованиях? С какими типами данных вы работаете?
Мы используем разные архитектуры нейронных сетей: полносвязные (Fully Connected), сверточные (Convolutional) и рекуррентные (Recurrent). Каждая из них решает свои «атомарные» задачи, а затем все вместе объединяются в комплексные системы для выполнения более сложных интеллектуальных инженерных задач. Основные типы данных, с которыми мы работаем:
• Временные ряды: непрерывные измерения параметров со скважин.
• Графические данные: изображения графиков, которые могут содержать визуальные паттерны.
• Табличная априорная информация: справочные сведения, различные параметры объектов и т.д.
В последнее время мы активно изучаем большие языковые модели (LLM) и разрабатываем на их основе специализированных агентов, которые помогают автоматизировать рутинные задачи в аналитике и обработке данных.
– Как вы видите развитие машинного обучения в нефтесервисе? Какие задачи в будущем можно будет автоматизировать?
Тренды примерно те же, что и в других отраслях: любая рутинная и не слишком «высокоинтеллектуальная» работа постепенно будет автоматизирована при помощи ИИ. Прежде всего, это сбор, классификация, предобработка данных, а также простейшие интерпретации.
Мы видим, что большие языковые модели (LLM) и интеллектуальные агенты могут найти применение не только в аналитике, но и, например, в диспетчеризации и логистике. При идеальном сценарии люди продолжат решать стратегические и тяжелые научные (rocket science) задачи, а повседневный «оператив» возьмёт на себя искусственный интеллект. Разумеется, путь к этому довольно долгий и трудоёмкий, но те, кто первыми добьются результата, получат значительное конкурентное преимущество.
– Как выстраиваются отношения между IT-отделами и другими сотрудниками компании?
У нас налажена дружеская и при этом продуктивная атмосфера. Формальные процессы, такие как сбор требований и фиксация задач, идут через стандартные инструменты — баг-трекеры, таск-трекеры и т.д. Однако мы не ограничиваемся строгими регламентами: если появляется срочная проблема или новое интересное решение, сотрудники могут напрямую взаимодействовать с разработчиками или инженерами.
Часто возникают ситуации, когда кто-то из пользователей просит «быстро поправить» функционал, либо наоборот разработчик просит «протестировать» новую фичу на реальных данных. Иногда такие «пробы пера» вырастают в полноценный продукт. Мы стараемся сохранять баланс между формальной структурой и живым творческим процессом.
– Будут ли финальные решения хакатона использоваться в работе компании? Возможно ли дальнейшее сотрудничество с участниками?
Если хакатон принесёт результат, который превосходит наши внутренние наработки, мы немедленно возьмём его в работу. Сейчас мы находимся в фазе активной разработки и можем достаточно быстро интегрировать новое решение в наши продукты, разумеется, после необходимой обкатки и тестирования.
Что касается сотрудничества, то это одна из главных причин, по которым мы решили провести хакатон. Нам нужны специалисты, и если мы увидим сильные команды или отдельных участников, мы будем рады предложить им сотрудничество или даже постоянное место в компании.
– Есть ли перспективы для участников в компании? Например, на hh.ru нет вакансий для разработчиков. Планирует ли «СИАМ» привлекать IT-специалистов?
Мы не особо полагаемся на hh.ru, поскольку наш опыт показывает, что найти профильных и мотивированных сотрудников там бывает непросто. Поэтому сейчас пробуем альтернативные способы привлечения специалистов — хакатон является одним из них. Нам действительно нужны IT-кадры, и мы всегда открыты для предложений от потенциально подходящих кандидатов.
– Какие навыки нужны IT-специалистам, чтобы работать в нефтесервисной отрасли? Что важно помимо машинного обучения?
Мы ищем инженеров, которые умеют эффективно решать задачи и создавать работоспособные продукты. Формальные «прокачанные» знания — это хорошо, но нам куда важнее практический склад ума и способность доводить проект до результата.
Мы не гонимся за «рок-звёздами» или специалистами, которые жаждут осваивать все новые технологии ради самих технологий. Для нас приоритет — надёжность, инженерное мышление и желание разбираться в специфике нефтесервиса.
Если мы видим, что человек «горит» задачей, умеет держаться и показывать реальные результаты, — это наш потенциальный сотрудник.
– Возможна ли удаленная работа для IT-специалистов в вашей компании?
Да, мы давно перешли к распределённой модели: сотрудники отдела разработки сейчас находятся минимум в четырёх разных городах. Удалённая форма работы показала себя эффективной, поэтому мы спокойно относимся к географической разбросанности команды.
– Какие реальные бизнес-задачи стоят за треками хакатона? Можно ли сказать, что они приближены к кейсам, с которыми сталкиваются специалисты «СИАМ»?
Задачи хакатона — это не отвлечённые упражнения, а самые настоящие бизнес-кейсы, с которыми наши инженеры сталкиваются в повседневной работе. К примеру, трек по определению бинарных признаков помогает дополнить сложные алгоритмы интерпретации и улучшить точность итоговых моделей.
Другая задача — определение областей полезных данных в непрерывном потоке замеров со скважин. Важно автоматически понимать, какие временные интервалы или сегменты заслуживают дальнейшего анализа, а какие можно отсеять как нерелевантные. Если упростить: первая задача помогает интерпретировать данные, вторая — решает вопрос, какие данные вообще нужно интерпретировать.
– Почему были выбраны именно эти треки? Они рассчитаны на инновации, новые решения или привлечение новых сотрудников в компанию?
У нас две цели, связанные с этими задачами:
Улучшение или поиск альтернативных решений:
• Одна из задач у нас уже решена, но мы хотим посмотреть, нет ли более оптимального или «свежего» подхода. Всегда полезно увидеть, как другие специалисты, незашоренные контекстом, подходят к задаче.
• Вторая задача пока не имела готовой реализации внутри компании, поэтому мы надеемся получить либо прототип, либо полноценное решение.
Расширение команды:
• Хакатон — это отличная возможность найти людей, которым интересен наш профиль. У нас очень много идей и проектов, и нам постоянно нужны новые разработчики.
– На какой уровень рассчитаны задачи хакатона? Кто является целевой аудиторией мероприятия?
По своей природе это скорее задачи среднего уровня, возможно дажеё ближе к начальному. Ключевые операции — это классификация, регрессия и базовая работа с данными. Однако их актуальность и ценность от этого не становятся меньше: именно такие «типовые» задачи составляют значительную часть реальной практики машинного обучения в нефтесервисе.
На фото: программный комплекс Siam Well Test
– Что привело к решению провести хакатон? Это ведь первое подобное мероприятие для компании.
Да, это действительно наш первый опыт в проведении подобных мероприятий. Идея пришла после того, как мы начали активно набирать молодёжь, у которой был опыт участия в хакатонах. Они рассказали, насколько это эффективный формат для поиска инноваций, прокачки компетенций и нетворкинга. Мы видим для себя несколько целей:
1. Повышение узнаваемости компании в информационном пространстве.
2. Получение реальных решений для реальных кейсов.
3. Привлечение новых сотрудников — у нас много планов и проектов, и мы хотим найти людей, готовых ими заниматься.
– Расскажите о наиболее успешных проектах, которые были реализованы совместно с IT-специалистами в компании «СИАМ». Какие результаты они принесли и как повлияли на развитие компании?
SiamWellTest
Это наш основной продукт для интерпретации гидродинамических и газодинамических исследований. Фактически он замещает собой импортные аналоги и закрывает большинство потребностей в данной области. Мы успешно продвигаем этот продукт на российском рынке (хотя это весьма узкая ниша), и мы активно развиваем его в направлении автоматизации анализа с помощью моделей ИИ.
SiamEngy
Мобильное приложение, ориентированное на более широкую аудиторию — от начинающих нефтяников и студентов до практикующих инженеров. Оно предоставляет справочные данные и функционал, упрощающий повседневную работу. На сегодняшний день им пользуются порядка 15 тысяч человек (на обеих платформах – Andoid, iOS). Для своей ниши это очень хороший показатель, а само приложение распространяется бесплатно. Мы не нашли на рынке аналогов, сопоставимых с ним по качеству и содержанию.
SiamDataSpectrum
Новый программный комплекс для системного хранения больших массивов данных, поступающих с датчиков. В нефтесервисе такие данные представляют собой непрерывные высокодискретные потоки. Это могут быть терабайты информации в месяц, которые нужно не только хранить, но и уметь быстро индексировать и сегментировать, получать доступ к нужным интервалам «по щелчку». Сейчас продукт находится в стадии бета-тестирования внутри компании, и мы готовим его к выводу на рынок.
Регистрация на хакатон открыта до 27 февраля на сайте: https://codenrock.com/contests/siam-ml-hack/
Митап хакатона Siam ML Hack успешно состоялся 21 февраля в 19:00 по московскому времени. Во время трансляции организаторы подробно рассказали о задачах хакатона и ключевых организационных моментах. Если вы пропустили мероприятие, рекомендуем ознакомиться с записью!
Сам хакатон Siam ML Hack пройдёт с 28 февраля по 19 марта. Победители получат ценные призы от партнёров и возможность сотрудничества с одной из ведущих компаний нефтесервисной отрасли.
Если у вас есть любой вопрос, связанный с «Компанией СИАМ»,
просто оставьте свою электронную почту, и мы с вами свяжемся