История AkylAI - как создавали первый кыргызоязычный искусственный интеллект
Искусственный интеллект играет важнейшую роль в технологическом прогрессе и экономическом развитии во всем современном мире. И чтобы наша страна не оставалась позади, команда проекта The Cramer Project создала кыргызоязычный искусственный интеллект AkylAI.
О том, как продвигается работа, каким тернистым получается этот путь и как AkylAI необходима поддержка, рассказал в интервью для Economist.kg основатель сообщества искусственного интеллекта Кыргызстана Тимур Туратали.
Расскажите немного о вашей деятельности
– Наше сообщество продвигается с 2019 года. В рамках своей деятельности мы стараемся активно развивать и продвигать искусственный интеллект в Кыргызстане. Наша цель – сделать так, чтобы граждане понимали, что в мире существует такое направление и что это уже не какое-то далекое будущее, а вполне реальные сейчас возможности, которые можно и нужно использовать.
В рамках сообщества мы выделили отдельное направление, которое будет заниматься обучением и созданием проектов открытого программного обеспечения (open source). Так, был создан The Cramer Project, который как раз занимается разработкой кыргызоязычного искусственного интеллекта AkylAI.
Что вас сподвигло на создание AkylAI?
– Мы заметили, что одной из самых больших и серьезных проблем в нашей стране является отсутствие технологий для работы с кыргызским языком. Это нас сильно обеспокоило, ведь мир уже настолько далеко ушел вперед, активно пользуется самыми разными видами искусственного интеллекта. А для кыргызоязычного населения нет даже самых базовых инструментов.
Мы решили исправить ситуацию. Так, на свет родилась идея о создании AkylAI. Конечным итогом данного проекта будет чат-бот на кыргызском языке, за основу работы которого взят искусственный интеллект. По сути, это будет кыргызоязычный ChatGPT.
При этом, под данным проектом есть еще очень много других задач. То есть, для создания одной AkylAI нам необходимо решить еще много других вопросов: создание мелких инструментов, обработка языка и так далее. Такие гиганты, как ChatGPT, Alexa, Siri и прочие создавались не за раз, в их распоряжении было множество предыдущих исследований и различных инструментов, облегчающих жизнь, – конечный продукт собирался по кирпичикам.
В нашем же случае все далеко не так радужно. У нас не то, чтобы кирпичиков, у нас даже фундамента для создания кыргызоязычного искусственного интеллекта нет. Поэтому работы у нас в несколько раз больше.
Расскажите о команде, которая трудится над данной инициативой?
– Основная наша команда состоит примерно из пятнадцати человек. Это очень хорошие специалисты из разных стран. Некоторые из них – кыргызстанцы, работающие за рубежом. Другие и вовсе даже не связаны с Центральной Азией. Но все эти люди выразили желание помочь нам с нашим проектом. Помимо этого, у нас также есть около 200 волонтеров, которые помогают нам собирать данные и прочее.
Практически каждый работает на голом энтузиазме. У всех нас уже есть какое-то дело, которым мы зарабатываем себе на жизнь. Но мы все равно стараемся выделять время вне основной работы, чтобы заняться нашим проектом.
Помимо этого, мы также сотрудничаем с кафедрой лингвистики университета "Манас", кафедрой компьютерной лингвистики КГТУ. Нам также помогают Парк высоких технологий и языковая комиссия при администрации президента.
Когда AkylAI будет полноценно запущена?
– В конце августа текущего года мы запустили бета-версию нашего чат-бота. Мы сделали это в первую очередь для того, чтобы протестировать нашу разработку, как она выполняет свои функции. А также собрать данные и понять, какие чаще всего идут запросы от пользователей, какие у нас есть недочеты и как нам их исправить.
Мы уже в процессе работы над полноценной версией AkylAI. Разумеется, работа активно кипит и поэтому заявлять предварительно о каких-то более точных сроках пока рано, но мы стараемся ориентироваться примерно на весну 2024 года. Надеемся, что к тому времени у нас уже будет готовый хороший продукт.
Пока мы сосредоточены на текстовой составляющей нашего искусственного интеллекта. Для нас сейчас задача номер один – сделать его хорошо. А уже после мы будем накладывать сверху голос и разрабатывать не только чат-бот, но и создавать кыргызоязычного голосового ассистента, как "Алиса" в "Яндексе".
Будет ли платформа работать бесплатно или же вы запустите монетизацию?
– Мы еще думаем над этим вопросом. В целом, ту базовую версию, которую мы сейчас разрабатываем, мы сделаем бесплатной на основе опенсорса. То есть, мы откроем код разработки, расскажем, как мы его обучали. Чтобы другие люди могли тоже внести свой вклад и, может быть, улучшили наш искусственный интеллект.
То есть, говоря простым языком, обычные люди могут бесплатно и открыто пользоваться нашей разработкой. Если же кто-то захочет кастомизировать AkylAI под бизнес, условно говоря запустить в банках или колл-центрах, тогда это уже будет платная функция.
При этом, инфраструктура, на которой держится AkylAI, очень дорогостоящая. Это ведь проект, который держится на голом энтузиазме и мы тратим свои деньги, чтобы поддерживать его. Мы арендуем сервера, и в конечном итоге получилось так, что в день мы тратим на это примерно по $200.
После того, как мы запустили бета-версию, нагрузка очень выросла. А мы не могли уже тратить на это такие огромные деньги из своего кармана. Поэтому нам пришлось ввести счетчик бесплатных запросов в день. То есть, пользователь может зайти и задавать AkylAI вопросы, но бесплатно он может их задать ограниченное количество раз в день. После уже придется платить или ждать следующего дня.
С какими трудностями вам приходится сталкиваться?
– Искусственный интеллект сегодня – это прерогатива очень богатых компаний, потому что поддерживать его обходится в очень круглые суммы. Необходимо много денег, чтобы позволить себе исследования и инфраструктуру для ИИ. К примеру, нужно иметь множество супер-компьютеров, мощность которых позволит этим заниматься.
У нас нет проблем в части исследований. У нашей команды достаточно знаний и человеческих ресурсов. Мы горим этой идеей и готовы вкладываться в нее. Однако у нас не хватает мощностей для того, чтобы работать еще эффективнее.
Разумеется, мы были бы очень рады, если бы нам оказали поддержку в материальном плане. К примеру, если бы государство оценило нашу работу и то, что мы делаем ради страны, и выделило хоть какую-то часть средств для развития искусственного интеллекта. Просто потому что с этой помощью мы смогли бы двигаться намного быстрее.
Вторая трудность, с которой нам пришлось столкнуться, – это отсутствие данных на кыргызском языке. Нам приходится тратить огромное количество энергии, чтобы откопать их. А иногда, даже если получается что-то найти, нам очень тяжело получить их в свое распоряжение из-за вопросов с авторским правом и прочего. Это очень замедляет и затрудняет работу, поэтому было бы хорошо, если бы правительство также помогло нам ускорить процесс получения данных.
Почему искусственный интеллект – это важно для Кыргызстана?
– Направлений, где можно использовать ИИ в Кыргызстане, очень много. К примеру, технологии значительно помогли бы в вопросах образования. У нас очень сильная нехватка учителей, особенно в регионах, а также имеются проблемы с программами обучения детей. Когда мы запустим AkylAI, мы в первую очередь хотим помочь школьникам и студентам получать с помощью нее знания.
В целом, применение ИИ просто безгранично. В мире полно кейсов, доказывающих, что применение технологий может оптимизировать и облегчить процессы во многих сферах. Кыргызстану нельзя оставаться позади всего мира, нам нужно тоже использовать современные возможности и двигаться вперед. Один из самых известных исследователей Эндрю Ын говорил:
"Искусственный интеллект будет везде, как и электричество. Также, как электричество когда-то в корне повлияло на развитие человечества, так же ИИ будет менять нашу жизнь сейчас и в будущем".