ИИ с украинским ДНК. Зачем Украина создает свою языковую модель и когда она заработает
Украина планирует войти в тройку мировых лидеров по развитию и внедрению искусственного интеллекта. Необходимая для этого инфраструктура создается уже сегодня.Об этом в интервью РБК-Украина рассказал руководитель направления ИИ Министерства цифровой трансформации Украины Даниил Цьвок.
Амбициозная цель: Украина стремится войти в топ-3 стран мира по развитию ИИ уже до 2030 года.
АІ-суверенитет: украинские специалисты создают собственную "фабрику ИИ" и национальную языковую модель.
Украинский контекст: собственная АІ-инфраструктура позволит защитить данные и оперировать правдивой информацией.
Доступность: сначала украинская LLM станет основой для государственных чат-ботов и AI-ассистентов, но позже модель будет open-source (доступной для всех).
Как Украина строит АІ-инфраструктуру
Эксперт поделился, что сейчас есть важная "миссия" -"войти в тройку стран мира по развитию и внедрению ИИ до 2030 года".
"Сейчас мы переходим от цифрового к агентивному государству, где AI-ассистенты проактивно удовлетворяют потребности граждан и государства", - добавил Цьвок.
В то же время он напомнил, что "настоящий прогресс невозможен без АІ-суверенитета".
Именно для этого, по словам специалиста, Украина строит собственную инфраструктуру:
AI Factory (так называемую фабрику искусственного интеллекта, первую в стране государственную инфраструктуру для АІ-решений);
национальную LLM (большую языковую модель).
"Это гарантирует безопасность данных и развитие Украины как технологического лидера", - подчеркнул Цьвок.
Что такое большая языковая модель или LLM
"Что такое украинская большая языковая модель? Мы не создаем новый ChatGPT или Gemini, или любой другой продукт", - рассказал представитель Минцифры.
Он объяснил, что "в пределах каждого такого продукта есть ядро, мозговой центр".
"Это ядро - большая языковая модель. Это - большая нейронная сеть, которая обучена на больших объемах информации", - поделился Цьвок.
Зачем Украине собственная языковая модель
"Зачем Украине национальная большая языковая модель - LLM? В общем - иностранные модели не имеют глубокого понимания украинского контекста", - сообщил руководитель направления ИИ Минцифры.
Он объяснил, что именно поэтому специалисты хотят "создать модель, которая будет проукраинской: понимать украинский язык, культуру, историю, терминологию, национальные особенности".
"По сути, это закладка кирпичика нашего ДНК в сферу искусственного интеллекта. Сейчас Минцифра это делает в партнерстве с компанией Kyivstar", - поделился Цьвок.
Вторая причина, по его словам, заключается в том, что сейчас люди живут "в условиях информационной войны".
"Особенно важно, чтобы модели давали ответы на политические и исторические темы без предубеждений относительно Украины", - подчеркнул эксперт.
Так, условно говоря, "не должно возникать сомнения насчет Крыма или насчет причин, которые спровоцировали войну на Востоке Украины". Или "что такое, например, так называемые ЛНР или ДНР".
"Нужно понимать, что наш враг также ведет свою работу. У него свои подходы, как отравлять имеющиеся на рынке большие языковые модели. Поэтому нам нужно иметь прежде всего первоисточник правды", - рассказал Цьвок.
Наконец третья причина - "украинская LLM будет в 2,5-3 раза дешевле иностранных аналогов".
"Имея собственную инфраструктуру и собственную национальную большую языковую модель, которая работает на государственной инфраструктуре, мы полностью обеспечиваем AI-суверенитет. Это гарантирует, что данные никоим образом не выходят за пределы страны", - подчеркнул чиновник.
Следовательно, по сути, AI-суверенитет - способность страны самостоятельно разрабатывать, запускать и контролировать системы искусственного интеллекта (без критической зависимости от иностранных компаний, облаков или моделей).
Когда может появиться первая версия украинского LLM
Цьвок рассказал, что сейчас украинская языковая модель "как раз находится в активной фазе создания".
"Есть технологическая часть, которую взяла на себя компания партнер Kyivstar. Они отвечают за процесс разработки и тренировки большой языковой модели. Мы, как государство, отвечаем за сбор и агрегацию данных, на которых будут проводить дообучение модели", - поделился эксперт.
Он отметил, что сейчас идет важнейший этап - сбор данных.
"К этому процессу привлечены государственные институты, университеты, научные учреждения, бизнес, медиа и т.п. Усилия сосредоточены на системе тестирования (так называемые бенчмарки). Они измеряют, насколько хорошо модель знает украинскую историю, язык и придерживается ли она этических норм и права собственности", - объяснил специалист.
Кроме того, было разработано:
критические компоненты архитектуры (например "токенайзер"), без которых невозможно построить большую языковую модель;
пайплайн - последовательность определенных шагов на уровне компьютерной инженерии (обучение шаг за шагом на этих больших данных).
"Украинская LLM будет основой для государственных чат-ботов и AI-ассистентов. Сначала мы интегрируем модель в "Дія.АІ", а затем в АІ-тьютор в "Мрії", - поделился планами на будущее Цьвок.
После тестирования, по его словам, "модель станет open-source - доступна для всех".
Это позволит бизнесу, ученым и общественным организациям создавать собственные продукты.
"Планируем так, чтобы с первой версией модели мы вышли на конец весны 2026 года", - подытожил руководитель направления ИИ Министерства цифровой трансформации.
Источник: rbc.ua
Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо зайти на сайт под своим именем.


