Как создавали первую кыргызоязычную умную колонку AkylAI – интервью с разработчиками
Технологический прогресс продолжает удивлять новыми достижениями. Невероятные инновации не обошли стороной и Кыргызстан. В стране разработали первую умную колонку на кыргызском языке – AkylAI. Этот уникальный гаджет создан для того, чтобы упростить нашу повседневную жизнь, предлагая удобный и доступный способ управления и получения информации на нашем родном языке.
О том, как создавался кыргызоязычный искусственный интеллект, как сложен был этот путь и какие у AkylAI планы на будущее, в эксклюзивном интервью для Economist.kg рассказали представители The Cramer Project Тимур Туратали и Нурсултан Бакашов.
Не так давно вы презентовали умную колонку AkylAI. Расскажите, как это было
– В августе прошлого года мы выпустили первую бета-версию чат-бота AkylAI. Изначально у нас не было идеи создавать колонку, но так сложились обстоятельства. Мы хотели завершить этот проект, ведь на рынке уже было много голосовых колонок, таких как Алиса, Alexa и Apple Home. Однако ни одна из них пока не поддерживает кыргызский язык. Поэтому мы решили попробовать сделать колонку на кыргызском языке, что оказалось весьма интересной задачей.
У нас был потенциал, чтобы реализовать эту идею, и с января мы начали разработку. Нам нужно было создать полноценный продукт, чтобы можно было его протестировать и пощупать. К апрелю мы уже проделали значительную часть работы.
Многие удивляются, как нам удалось создать с нуля колонку за пять месяцев. Это стало возможным благодаря нашей команде, которая работала очень интенсивно. Первый этап заключался в дизайне колонки, который разработал Олег Ермаков, известный как Steel Drake. Олег занимался проектированием компонентов и модулей. Второй этап – заказ компонентов из Китая. После заказа нужно было всех их собрать воедино и сделать так, чтобы все работало. Тут нам нам помог Егор Гарающенко. Параллельно Денис Павлов с Амантуром Аматовым создавали голос.
Как проходил процесс записи голоса?
– Перед нами стояла важная задача создать для колонки голос, так как у нас его не было. Нам пришлось записывать с актрисой кыргызскую речь на протяжении примерно 25 часов. После этого колонка заговорила по-кыргызски. У нас была готовая модель, которую нужно было адаптировать, и на это потребовалось около пяти месяцев.
Мы реализовали идею голосовой активации и распознавания кыргызского языка. Для активации колонки используется слово AkylAI. Когда вы произносите AkylAI, колонка начинает записывать ваш вопрос. После паузы она понимает, что запись завершена, и отправляет данные на сервер. Сервер обрабатывает информацию и возвращает ответ в формате аудиофайла, который колонка воспроизводит.
Конечно, были трудности. Кыргызский язык имеет свои особенности, и нам пришлось разрабатывать много вещей с нуля. Например, голос мы записывали и обрабатывали самостоятельно, а также адаптировали активацию под кыргызский язык. Мы создавали интонацию и произношение с нуля, что было непростой задачей, но мы справились.
Когда вы презентовали свою колонку, большим удивлением для всех стало именно то, что AkylAI говорила без акцента
– Верно, так и должно было быть. Девушка-актриса, которая записывала речь, говорила на четком кыргызском языке. Поэтому акцента и не было. В обратную сторону это тоже работает. Если AkylAI попросить заговорить на русском, то, вероятно, у нее будет кыргызский акцент.
При этом хотим отметить, что в нашем языке есть разные диалекты: к примеру, южный и северный значительно друг от друга отличаются. Однако, по нашим тестам, AkylAI отлично понимает кыргызскую речь с разными диалектами. Даже когда русскоязычный человек говорит с ней на кыргызском с заметным акцентом, она все равно способна воспринять речь и обработать ее. Для нее это не проблема.
Однако, как все же быть с диалектами? У нас бывает, что одно и то же слово звучит по-разному в разных частях страны
– Это уже вопрос обучения модели. Если мы добавим слова из различных диалектов в обучающие данные, система будет их понимать и отвечать правильно.
На данный момент, конечно, различных вариантов диалектов в системе не много, потому что мы использовали данные из интернета, а таких материалов там мало. Но мы планируем предлагать людям колонку, проводить тесты непосредственно с пользователями, задавать вопросы и постепенно добавлять актуальные данные. Это ведь искусственный интеллект, он всегда обучается новому.
Вы сказали, что будете предлагать колонку людям. То есть продавать аудитории или передавать на тестирование?
– Пока в рамках тестирования, разумеется. Но в ближайшем будущем мы, конечно, рассматриваем вариант, в котором мы запустим предзаказы на покупку AkylAI. Если будет много предзаказов, то начнем массовое производство.
А сколько она будет стоить?
– К сожалению, на данный момент мы не можем назвать точную цену, так как процесс производства зависит от множества факторов. Как правило, чем больше объем производства, тем дешевле себестоимость. Поэтому сейчас нам очень сложно озвучить какую-то конкретную цену.
Говоря о производстве, расскажите о процессе создания колонки
– Первый прототип колонки, который мы как раз презентовали ранее, мы собрали прямо здесь, в Бишкеке. Необходимые запчасти, такие как чипы и модули, заказывали из Китая, а сама сборка происходила в КР. Егор из нашей команды собственноручно все это паял, монтировал и собирал.
Где будет производиться сборка, когда встанет вопрос массового производства? Вы ведь не сможете этим заниматься вручную
– Все верно, для массового производства нам понадобится завод. Наша первая задача была создать прототип. Для последующих моделей мы просто возьмем этот прототип, поедем на завод и скажем: «Вот такую колонку нам нужно собрать».
У нас в Кыргызстане таких заводов пока нет. Поэтому производство планируется в Китае. Все крупные компании собирают свои устройства в КНР – это обычная практика.
Какие у вас планы на будущее? Вы планируете сосредоточиться только на рынке Кыргызстана?
– На данный момент мы планируем выход на рынок Кыргызстана. У нас есть амбиции выйти и на международные рынки, но это в будущем. Работа с кыргызским языком оказалась самой сложной задачей. Все остальные языки, такие как английский, русский, японский, уже имеют множество готовых решений, и внедрить их в нашу колонку не будет проблемой.
Но при этом мы понимаем, что Кыргызстан – не такой уж большой рынок, поэтому нам нужно выходить на другие рынки, с нашими отечественными разработками открывать двери в огромный мир. Сейчас мы хотим выйти на американский рынок.
На данный момент мы проходим онлайн-акселерацию и планируем к концу июля поехать в США с колонкой, которая говорит на английском языке, чтобы ее продемонстрировать. Для американского рынка мы планируем создать колонку-ассистента по ментальному здоровью. Пользователь сможет, например, поговорить с колонкой, получить советы по снижению стресса, записать свои мысли и получить рекомендации.
Все продукты, которые вы создаете, наверняка, требуют для своей жизнедеятельности большой поддержки
– Если говорить о выходе на другие рынки, то, честно говоря, многое зависит от наличия инвестиций. На данный момент у нас недостаточно средств для самостоятельного производства. Если мы получим инвестиции, то процесс значительно ускорится. Производство – это дорогостоящий процесс, требующий аренды завода или другой производственной базы.
Мы начали создавать AkylAI на голом энтузиазме. Проект возник из желания поддержать наш язык и помочь ему войти в сферу искусственного интеллекта. Мы делаем это, потому что нам это нравится, и мы верим, что это важно для нашего языка и государства. И, честно говоря, лишь благодаря помощи и поддержке мы смогли продвинуться так далеко вперед.
Наша основная команда состоит из десяти человек, и у нас было много партнеров с начала проекта, включая университеты и различные компании, предоставляющие данные. Теми, кто с самого начала поддерживал нас и верил в проект, стала команда Парка высоких технологий (ПВТ). Они предоставляли ресурсы, оказывали консультационную и техническую помощь. Мы также получили поддержку от американских менторов, которые консультировали нас через Zoom и Google Meets.
Расскажите, в каких сферах будут полезны ваши разработки?
– На самом деле, применение искусственному интеллекту можно найти в самых различных сферах. Во-первых, в Центрах обслуживания населения (ЦОН). Она поможет автоматизировать процессы, облегчить работу сотрудников и улучшить качество обслуживания граждан за счет быстрого и точного предоставления информации.
Во-вторых, в секторе создания чат-ботов. Наша технология позволит развивать многоязычные чат-боты, которые будут эффективно взаимодействовать с пользователями на кыргызском языке, решая различные задачи – от простых консультаций до выполнения сложных запросов.
В-третьих, в образовании. Умная колонка станет отличным помощником в учебном процессе. Она сможет поддерживать студентов и школьников, отвечать на их вопросы, помогать с выполнением домашних заданий и предоставлять дополнительные образовательные материалы на родном языке.
Таким образом, наши разработки открывают широкие перспективы для улучшения качества жизни и повышения эффективности различных процессов на кыргызском языке. Мы верим, что наши разработки будут полезны и востребованы.
С какими трудностями на своем пути вы сталкивались?
– На самом деле, трудностей было много. Например, выбрать дизайн оказалось очень сложной задачей. Затем возникли проблемы с доставкой материалов. Мы долго ждали поставки, а санкции усложнили ситуацию. Некоторые компоненты, такие как модули и чипы, находились в Израиле, и пришлось искать альтернативы в Китае.
Еще одной сложностью стала запись голоса. Когда записываешь голос, нет гарантии, что он будет работать корректно. Это исследовательский процесс, который требует много времени и усилий. Кроме того, возникали проблемы с интернетом и серверами. Весь проект оказался чередой препятствий, которые нам приходилось преодолевать. Никто до нас не делал подобного, и таких компаний в мире мало. Мы создавали колонку и разрабатывали технологии на нескольких языках, что добавляло сложности.
В проекте было много тонкостей и деталей, требующих нестандартных решений. Каждое решение приходилось придумывать с нуля, так как у кыргызского языка не другого аналога, подобного AkylAI. Кроме технических трудностей были и проблемы с людьми. Многие не верили в нас и думали, что мы занимаемся чем-то бесполезным. Однако мы продолжали двигаться вперед, несмотря на все сомнения. Теперь мы, можно сказать, протаптываем дорожку для других подобных проектов в Кыргызстане, так как мы доказали, что это возможно.
Заключительное слово
– В заключение мы хотели бы подчеркнуть: как классно, что в Кыргызстане появляются новые стартапы. Мы замечаем, что в последнее время у многих активное движение, множество новых инициатив и идей. Это вдохновляет. Некоторые люди усердно работают, путешествуют, обмениваются опытом, чтобы сделать наши продукты еще лучше и занять свое место на глобальной арене. Это действительно потрясающе, что мы можем выходить за пределы нашей страны.
Хотелось бы видеть больше стартапов, больше людей, вовлеченных в инновации, создающих уникальные продукты и привносящих свежие идеи. Я уверен, что наша нация способна конкурировать с мировыми лидерами. Идеи здесь, в Кыргызстане, так же ценны и перспективны, как и в Силиконовой долине или любом другом технологическом центре мира.
Мы готовы поддерживать развитие стартапов, инициатив и инноваций в нашей стране. Давайте вместе создадим будущее, где кыргызстанские стартапы будут успешно выходить на международный рынок и вдохновлять других своими достижениями. Пусть наши усилия помогут достичь новых высот и привлечь внимание мировой общественности к нашему потенциалу и талантам.