На международната конференция ACL 2025 изследователите на Sberban представиха иновативен подход за създаване на руски езикови модели. Статията „Семейство Gigachat: Ефективно моделиране на руския език, използвайки архитектурата на експертите“, описва технология, която ускорява работата на изкуствения интелект (AI) наполовина в сравнение със съществуващите аналози.
Ключовата характеристика на развитието е използването на архитектура „експерти смес“ (MOE). Тази система работи на принципа на екип от специалисти, където за всяка задача се активират само необходимите модули. Този подход не само увеличава скоростта на обработка на данни, но също така намалява разходите за изчислителни ресурси.
От особено значение е създаването на специален токенизатор, оптимизиран за руския език. Този инструмент ви позволява да контролирате по -точно темите на отговорите на AI, предвид езиковите и културните характеристики.
По -младата версия на модела вече е достъпна за безплатна употреба. Според техническия директор на Gigachat Fedor Minkin, технологията отваря нови възможности за бизнес – от автоматизиране на поддръжката на клиенти до генерирането на съдържание. Разработчиците също предоставиха достъп до кода и скалите на моделите, които ще ускорят изследванията в областта на изкуствения интелект.