Двое молодых iOS-разработчиков — Александр Карцев и Алексей Коротков — придумали приложение, которое позволяет тренировать нейронные сети без кода. При помощи такого продукта можно создать подобие WannaNails от WANNABY (пускай и не совсем совершенное) за считаные часы. 42.TUT.BY поговорил с ребятами, как к ним пришла эта идея и почему они работают не в офисе, а в читальном зале Национальной библиотеки.
Как обучить модель распознавать ногти по примеру WANNABY
О MakeML нам рассказал бизнесмен, CEO FriendlyData Михаил Румянцев: «Например, в Минске есть очень интересная компания MakeML, которая помогает тренировать модели для машинного обучения. Эти модели в дальнейшем можно использовать для построения различных приложений, используя компьютерное зрение. Приведу простой пример: используя это приложение, вы сможете построить продукт уровня MSQRD за считаные часы».
Хотя MSQRD ребята пока не пытались повторить, но на их сайте есть инструкция, как обучить модель распознавать ногти по примеру Wanna Nails. Выходит, конечно, не так красиво, как у WANNABY, но стоит помнить, что это «черновик», сделанный за несколько часов при помощи всего 50 фотографий.
MakeML — не первый проект парней. До того Алексей Коротков , CEO проекта, участвовал в создании соцсети HERO, где можно было поддержать проект не только лайком, но и пожертвованием в криптовалюте. К сожалению, идея не взлетела.
— Такое случается, — говорит он. — После HERO еще было приложение для проектирования товаров в дополненной реальности — ARCraft.me: мы хотели продавать кастомный мерч с предпросмотром в AR. Тоже не пошло, но из каждого проекта мы вынесли много полезного. Например, поняли, что нужно полностью доверять своему кофаундеру и всегда стоит быть готовым к тому, что что-то пойдет не по плану.
— А еще всегда нужно быть на позитиве, независимо от того, что происходит, — добавляет CTO MakeML Александр Карцев . — Постоянно есть какие-то вопросы, ты чего-то ждешь, волнуешься, стрессуешь. Но верить, что у тебя все в итоге получится, мне кажется, невероятно важно.
Идея MakeML родилась из достаточно нестандартного проекта. «Знакомому знакомого» Алексея пришла идея, что было бы «невероятно хайпово» сделать приложение, которое станет блюрить определенные части тела.
— Не то чтобы я был в восторге от этой идеи, но мне понравилась возможность потренироваться: постоянно слышишь, что «AI делает то» и «AI делает это», — говорит Алексей. — Плюс была возможность проконсультироваться с людьми, которые занимались AR, например с Юрием Писарчиком (Юрий работал над Fabby от AIMATTER. — Прим. TUT.BY) — он сейчас наш adviser. Но даже несмотря на помощь Юрия, у меня ушло более двух недель фуллтайма вместе с выходными.
После того как я отмучился и сделал продукт, мы поговорили с Сашей, что есть такая штука, ее очень сложно и муторно сделать, но, кажется, ее можно упаковать во что-то более удобное и быстрое.
Алексей и Александр знакомы давно: они вместе учились сначала в родной школе в Жлобине, затем в Лицее БГУ и на ФПМИ БГУ; вдвоем создавали iOS-приложения и участвовали как в HERO, так и ARCraft. Так что и новый проект они решили запустить совместно.
Старт был положен в январе 2019 года. Позже к их небольшой команде присоединилась дизайнер Ольга Бессонова. Сейчас они работают в довольно необычном месте — в читальном зале Национальной библиотеки.
— Дома много что отвлекает, а в библиотеке рабочая атмосфера, — поясняет Алексей. — К тому же здесь нет арендной платы (смеется ). Когда-то все сбрасывались на строительство «националки», так почему бы не воспользоваться чудесами социального государства.
К тому же в библиотеке есть бесплатный Wi-FI, два кафе, где по телевизору крутят музыкальные клипы и мультики, и даже комнаты для совещаний. Разве что на этажах повыше плохо ловит связь — порой ребятам приходится звонить из машины.
«MakeML для computer vision — это как Tilda для создания сайтов»
Если кратко, то MakeML призван уменьшить расход времени и средств для обычных разработчиков. При помощи этого приложения можно тренировать нейронную сеть без кода и интегрировать ML-модель со своим приложением.
— В стартапах перед запуском всегда нужно смотреть, есть ли потенциальный рынок для твоего продукта, — поясняет Алексей. — Мы изучили статистику по рынку deep learning, в котором как раз и задействован Data Science — это самое близкое к тому, чем мы занимаемся. Так, ресурс indeed.com опубликовал отчет, что в 2019-м спрос на data science за год вырос на 30%, но при этом количество приложений выросло только на 15%. Получается, gap за год — 450 тысяч человек. При этом marketwatch.com полагает, что рынок deep learning вырастет с 3 миллиардов до 18, то есть в 6 раз.
Мы хотим позволить обычным разработчикам быстро и просто тренировать нейросети — это достаточно долгое и муторное дело, но теперь обычный разработчик iOS может сделать то же самое за несколько часов.
— MakeML для computer vision — это как Wix.com или Tilda для создания сайтов: что-то такое, что ты можешь быстро понять по интерфейсу, без специальных знаний, — говорит Александр.
В качестве примера парни приводят стартап, который позволяет посмотреть, сколько касаний мяча было сделано за определенное время. За 15 минут они сделали 180 фотографий мяча, и еще час заняла тренировка модели.
Как происходит процесс? Допустим, пользователю нужно научить нейросеть определять лица на фото. Он создает новый проект, загружает снимок и выделяет область лица, чтобы нейросети было с чем сравнивать свои результаты. Далее следует нажать «Запуск тренировки» и оставить компьютер на несколько часов — тренировка идет в облаке.
Процесс тренировки отображается на графике loss-функции: чем он ниже, тем лучше, значит, нейросеть делает все меньше ошибок в определении объекта. Как сказала дизайнер проекта Ольга, программа очень проста и поэтому доступна каждому. Даже человек без специального образования легко может отправить проект на тренировку.
— Время тренировки зависит от количества картинок, шагов, а еще очереди на сервере: возможно, там сейчас кто-то другой тренирует свою сеть. Но в целом это занимает несколько часов, — поясняет Александр
У стартапа сейчас примерно 50 активных платных пользователей из Австралии, США, Канады, Индии, Китая, Южной Кореи, Германии, Швейцарии, Италии, Франции. В программе можно сделать три бесплатных экспорта дата-сета (грубо говоря, это картинки с размеченными объектами). Но бесплатно натренировать модель не получится: это стоит около 28 долларов в месяц.
«Если человек пользуется „сырым“ продуктом и готов за это платить деньги, значит, это то, чем стоит заниматься»
— То, что наш продукт экономит время, это 100%, — продолжает Алексей. — Он также помогает простому разработчику проверить свою гипотезу быстро и без особых усилий, не нанимая Data Scientist’ов (людей, тренирующих нейронные сети. — Прим. TUT.BY). Например, один из наших клиентов живет в Канаде и ведет картографический сервис. Там важно обновлять скоростные лимиты, поэтому их человек ездил по дорогам и вручную делал пометки о знаках. И вот этому парню пришла в голову идея: а что если сделать «нейронку», которая будет определять знак и автоматически все апдейтить? Но для этого компания должна нанять Data Scientist’а. А в нашем приложении можно сделать это быстро, посмотреть, нужно ли что-то улучшать, «докручивать», и если нужно, тогда только задуматься над наймом специалиста.
На вопрос об обратной связи с пользователями Алексей признается, что пока было много отзывов вроде «продукт сыроват».
— Но надо понимать, что если ты работаешь в стартапе и выпускаешь продукт, за который тебе не стыдно, то, значит, ты выпустил его слишком поздно. Почему? Потому что если человек пользуется «сырым» продуктом и готов за это платить деньги, значит, это то, чем стоит заниматься. Ну и вопрос с оптимизацией — не самый сложный. Гораздо сложнее понять, что нужно людям, и как раз-таки в этом помогает именно «сырой» продукт. Но за последние три недели мы собрали фидбэк от пользователей за полгода и «закрыли технический долг» по основным вещам.
Создатели стартапа утверждают, что сейчас они не видят подходящих продуктов по тренировке нейросетей для обычных разработчиков. Тот же Amazon SageMaker ориентирован на крупный бизнес и довольно сложен в использовании. А в CreateML от Apple нет разметки, то есть нужно загружать уже размеченные фото, к тому же на время тренировки приходится оставлять девайс включенным.
— Из решений, которые бы отмечали до конца и с минимальными затратами, мы нашли только Lobe AI. Но их уже купила Microsoft, и продукт сейчас недоступен, — подытоживает Алексей.
— Какие у вас планы на ближайшее время, может, хотите масштабироваться?
— Об этом пока рано говорить, — отвечает Алексей. — Хотя у нас есть платящие клиенты и клиенты, которые покупают годовую подписку, мы все еще в поисках — как сделать так, чтобы человек хорошо понимал, что он может сделать с помощью нашего приложения, что он получит в результате, и чтобы этот результат его устраивал. Нужно точно понять, что цепляет пользователей в продукте, чтобы они были довольны и советовали наш продукт своим друзьям.
Но в будущем можно сделать и web-версию приложения, и приложения для Windows и Ubuntu, добавить большее количество видов нейронных сетей для тренировки и добавить большее количество платформ, на которых эти нейронные сети можно запустить.