Создание команды по разметке данных и машинному обучению

- Задача
- Решение
- Результат
- Бизнес-эффект
- Соавторы
- Презентация проекта
- Примеры реализации
- Другие работы автора
Задача
Задача, которую мы решаем в целом - создание гибкой аутсорс-команды для внедрения нейросетей в бизнесс-процессы.
Пример задачи от заказчика:
Организовать процесс разметки данных и обучения нейросети для автоматизации подсчета пассажиропотоков в общественном транспорте различных города. Проконтролировать корректность выполняемой ими задачи и внедрить решение в инфраструктуру заказчика.
Команда состоит из Разметчиков и Программистов.
Разметка* - процесс выделения различных объектов (на снимках), сущностей (в текстах или аудиозаписях), необходимый для корректного и быстрого машинного обучения. Машинное обучение это то, что сегодня называют "Искусственным интелектом". К этому разделу компьютерных наук относится обучение нейросетей и определенные методы математической статистики.
Основу команды составляют фриланс исполнители по разметке и разработке.
Решение
Такие задачи требуют быстрого подбора большого количества исполнителей, их обучение и контроль качества работы. Крупным компаниям сложно и дорого этим заниматься, ввиду того, что зачастую это не их профиль работы, а подзадача в крупном проекте. Всю работу по набору людей, обучению, контролю качества, увольнению мы берем на себя.
Процесс работы про проекту:
1. Оценка объема работы и утверждение сроков. Подсчет необходимого количества исполнителей.
2. Набор людей на разметку. В данном проекте - 40 человек. Набираем людей из нашей базы и при необходимости добираем новых.
3. Источники новых исполнителей - это в первую очередь фриланс сайты, сообщества мам в декрете и центры занятости инвалидов (сотрудничаем с ЦЗИ г. Москвы и г. Муром). Основной поток исполнителей из регионов.
После набора проводим обучение разметке задачи, которое занимает 1-7 дней, затем начинаем работу.
4. Подключение разработчиков. Под конкретную задачу мы подбираем специалистов из нашей базы, ставим им техническое задание и контролируем/консультируем в ходе работы.
Тот факт, что и разметка и обучение нейросетей находится в одних руках позволяет быстро корректировать ТЗ для разметки (нашей области встречается очень часто) и исключает конфликт между этими командами.
5. Параллельное выполнение задачи разметки и разработки. Корректировка ТЗ в случае необходимости.
6. Передача готового решения заказчику, утверждение, внедрение в его инфраструктуру.
Как работа выглядит для наших разметчиков:
1. Все обучение и сама работа - дистанционные
2. Возможность работать людям с ограничениями и родителям в декрете
3. Для работы необходим только компьютер (95% устройств по характеристикам нам подходят) и выход в интернет
4. Возможность работать откуда угодно
5. Абсолютно свободный график - мы только устанавливаем минимальный рекоммендуемый объем в неделю и периодически проводим онлайн собрания
6. Основной пласт задач не требует высокой квалификации
7. Наиболее успешных разметчиков мы переводим на более сложные задачи или в руководителей разметчиков
Результат
Результат работы нашего проекта в целом:
1. База обученных и мотивированных разметчиков, более 60 человек (в ходе отборов через наш прошло более 300 человек)
2. Возможность людям из регионов/инвалидам/родителям в декрете получать достойную оплату
3. База лояльных разработчиков
4. Реализованные проекты по экологическим тематикам, государственным заказам, небольшим стартапам и крупным компаниям
Результат работы по конкретной задаче:
1. Набрана команда разметки и разработки под задачу заказчика
2. Люди обучены и по необходимости мы быстро подключаем их к новой задаче или доработке текущей (создание подобного решения подсчета пассажиров для другого транспорта/города требует доработки, т.е. повторной итерации всех процессов)
3. Создана база данных размеченных снимков и обученные нейросети
4. Решение целиком передано заказчику и совместно с ним внедрено в систему общественного транспорта города, что позволяет в автоматическом режиме отслеживать количество пассажиров, собирать статистику и корректировать пути и нагрузку общественного транспорта города
P.S. в снимках приведены примеры других работ, выполненных нашими исполнителями: задача автоматического определения 65 классов мусора, задача определения маркеров и мячей для приложения Футбольного тренера.
Бизнес-эффект
Создана команда, готовая быстро подключаться к последующим проектам заказчика. Осуществленна возможность сбора полной аналитики по пассажиропотокам города, что необходимо для оптимизации транспортных маршрутов.