Нейросеть заговорила на татарском, башкирском и еще 30 языках России и СНГ

сегодня, 16:47

ИИ-помощник научился понимать и создавать тексты на национальных языках, которые ранее были мало представлены в цифровой среде. В обучении модели участвовали носители языка, ученые и фонды.

Разработчики генеративной нейросети "ГигаЧат" объявили о значительном расширении языковой поддержки. Теперь ИИ-помощник способен работать более чем с 30 языками народов России и стран СНГ, включая татарский, башкирский, чувашский, удмуртский, якутский, бурятский, осетинский, чеченский и карачаево-балкарский. С учетом других международных языков общее число доступных для общения языков превысило 40.

Для качественной работы на каждом из национальных языков потребовалась точечная доработка модели с привлечением широкого круга экспертов. Партнерами по сбору и верификации обучающих данных выступили ФГБУ "Дом народов России", интернет-энциклопедия "Рувики", региональные академии наук, университеты и некоммерческие фонды. Носители языка лично участвовали в разметке текстов и оценке корректности ответов, проверяя грамматику и стилистику живой речи.

Разработчики отмечают, что такая функция особенно важна для старшего поколения, получающего доступ к цифровым госуслугам и информации на родном языке, а также для молодежи, осваивающей цифровую среду – передает ИА "Новости Волгограда".

Фото: freepik.com