Google стал на шаг ближе к созданию 1000-язычной модели искусственного интеллекта
Пока Microsoft и Google спорят о том, чей чатбот с искусственным интеллектом лучше, это не единственное применение машинного обучения и языковых моделей. Наряду со слухами о планах продемонстрировать более 20 продуктов на базе искусственного интеллекта во время ежегодного мероприятия I/O в этом году, Google продвигается к своей цели – созданию языковой модели ИИ, поддерживающей 1 000 различных языков. В обновлении, опубликованном в понедельник, Google поделилась дополнительной информацией об универсальной речевой модели (USM) – системе, которую Google называет “важнейшим первым шагом” в достижении своих целей.
В ноябре прошлого года компания объявила о своих планах по созданию языковой модели, поддерживающей 1 000 наиболее распространенных языков мира, и одновременно представила модель USM. Google описывает USM как “семейство самых современных речевых моделей” с 2 миллиардами параметров, обученных на 12 миллионах часов речи и 28 миллиардах предложений на более чем 300 языках.
USM, который YouTube уже использует для создания закрытых титров, также поддерживает автоматическое распознавание речи (ASR). Оно автоматически определяет и переводит языки, включая английский, мандаринский, амхарский, себуано, ассамский и другие.
На данный момент, по словам Google, USM поддерживает более 100 языков и послужит “фундаментом” для создания еще более обширной системы. Meta работает над аналогичным инструментом перевода с искусственным интеллектом, который пока находится на ранней стадии. Подробнее о USM и о том, как она работает, можно прочитать в исследовательском документе, который Google разместил здесь.
Одним из мест применения этой технологии могут стать очки дополненной реальности, подобные тем, которые Google продемонстрировал в прошлом году на мероприятии I/O. Они смогут распознавать и предоставлять переводы в режиме реального времени, появляющиеся прямо перед глазами. Однако эта технология все еще кажется немного отдаленной, а искажение арабского языка, допущенное Google во время I/O, доказывает, как легко можно ошибиться.
Комментарии ()