Яндекс выложил в открытый доступ крупнейшую в мире GPT-подобную нейросеть

23 июня 2022 16:57

Вчера Meta* выложили свою модель на 66 млрд. параметров, и объявила её крупнейшей, но меньше чем за сутки этот рекорд был побит Яндексом. Речь о языковой модели YaLM 100B на 100 млрд параметров. Модели YaLM применяются, например, в Алисе.

YaLM 100B обученна на почти 2 ТБ русских и английских текстов. Причём не только на Википедии/новостных статьях/книгах, но и на коде и научных статьях.

Теперь исходный код доступен на Github, а на Хабре можно почитать об истории создания и обучения. Спойлер: без суперкомпьютеров не обошлось.

*запрещённая в РФ организация

#Заметки

Join the conversation.

Яндекс выложил в открытый доступ крупнейшую в мире GPT-подобную нейросеть

Перевод принят, возврат отклонён

Теперь старость нам не страшна

Мы теперь ещё ближе к бессмертию