Понимание естественного языка, которое всегда было довольно сложным для поисковых систем, сейчас выходит на совершенно новый уровень. На конференции Google I/O 2021 глава поискового бизнеса Google Прабхакар Рагхаван (Prabhakar Raghavan) представил новую технологию многозадачной унифицированной модели - MUM (Multitask Unified Model), которая поможет Google отвечать на сложные поисковые запросы.
MUM — это инструмент на базе искусственного интеллекта, предназначенный для упрощения поиска в Интернете. Эта система предназначена для того, чтобы понять неявные сравнения в поисковом запросе и дать наиболее подходящий ответ.
Например, обработать такой запрос:
«Я поднялся на гору Адамс и теперь хочу подняться на гору Фудзи следующей осенью, что мне сделать по-другому, чтобы подготовиться?».
MUM могла бы понять, что пользователь сравнивает две горы, поэтому информация о высоте и тропе может быть актуальной. Модель также могла бы понять, что в контексте пеших прогулок «подготовка» может включать в себя такие вещи, как фитнес-тренировки, а также поиск подходящего снаряжения.
Ответ на вопрос о походе не обязательно будет представлен в виде списка ссылок на веб-сайты, которые могут быть полезны. Но это будет ответ, основанный на различных фрагментах информации, собранной из Интернета. В будущем Google хочет сократить количество поисковых запросов, которые кто-то должен выполнять, и вместо этого использовать возможности MUM, чтобы обеспечить более последовательный и упрощенный ответ.
По данным Google, новая языковая модель в 1000 раз мощнее, чем BERT, выпущенная в 2019 году.
В чем особенность системы MUM и как она работает
Многозадачность — главная особенность MUM. Модель обучается на 75 языках и одновременно выполняет множество различных задач, что позволяет развивать более полное понимание информации и знаний о мире, чем предыдущие модели.
MUM является мультимодальной технологией, поэтому она понимает информацию через текст и изображения и в будущем может расширяться до большего количества модальностей, таких как видео и аудио.
Второй гипотетический сценарий, приведенный на конференции, описывает ситуацию, в которой пользователь фотографирует свои походные ботинки и спрашивает: «Могу ли я использовать их для подъема на гору Фудзи?». MUM сможет понять содержание изображения и цель запроса, а также сообщит пользователю, подходит ли его снаряжение, и укажет ему на список рекомендованного снаряжения для подъема на Фудзи.
Как подготовиться к новому алгоритму
Появление MUM в Google уже сейчас называют «новой вехой в понимании информации». Алгоритмы Google всё больше приближаются к тому, чтобы читать и понимать текст подобно человеку. Как же подготовиться к новой модели понимания текста?
Чтобы сделать контент наиболее понятным для поисковых систем, нужно как минимум начать с внедрения микроразметки на страницы сайта. Это поможет поисковику понять контент страницы и даст возможность оказаться сайту в расширенных результатах поисковой выдачи.
Какие сервисы помогут внедрить структурированные данные в контент корректно:
- Schema.org — словарь семантической разметки данных,
- Валидатор микроразметки от Яндекса
- Валидатор микроразметки данных от Google
- Мастер разметки структурированных данных от Google
Ну и конечно же, важно писать качественные тексты, которые легко читаются и оптимизированы естественным образом. Не стоит злоупотреблять ключевыми фразами, чтобы ранжироваться выше — думайте о пользователе и пишите только то, о чем он хотел бы прочесть на сайте. Текст должен быть уникальным, грамотным, полезным и хорошо структурированным.
Технология MUM пока находится на стадии эксперимента. Прямо сейчас Google проводит внутреннее тестирование, чтобы лучше понять типы запросов, которые могут быть решены.