«Яндекс.Браузер» начал переводить видео с китайского языка
Для обучения нейросети браузера разработчики с помощью особого алгоритма обработали 1,5 млн видео. Из них выбрали 100 тыс. с качественными субтитрами на севернокитайском языке.
- Чтобы обучить нейросеть иероглифам, нейросеть научилась их понимать, разработчики закодировали необходимый словарь в виде 10 тыс. токенов.
- Ранее для пяти европейских языков понадобилось 5 тыс. токенов. Один токен соответствует одному слогу или сочетанию двух слогов.
- За месяц «Браузер» также обучили четырем тонам китайского языка.
- Когда пользователь откроет видео на китайском на YouTube, браузер предложит его перевести: достаточно нажать на кнопку «Перевести видео».