Что такое ключевые слова LSI и почему они важны для SEO
«Являются ли ключевые слова LSI одним из факторов ранжирования Google?»
В этой статье мы попытаемся ответить на этот вопрос и даже больше.
Вот что вы узнаете:
Что такое ключевые слова LSI?
Ключевые слова LSI — это слова или фразы, которые семантически связаны с основным ключевым словом, чтобы дополнить его дополнительным контекстом.
Скрытое семантическое индексирование (LSI), также известное как латентный семантический анализ, было разработано в 1980-х годах и представляет собой метод обработки естественного языка (NLP), целью которого является лучшее понимание намерений поискового пользователя при вводе запроса в поисковую систему.
Например, если ваше основное ключевое слово «торт», некоторые ключевые слова LSI будут «тесто», «мука», «масло», «печь» и «выпечка». Эти слова помогают создать контекст вокруг слова «торт» и показать, что оно означает десерт, который вы едите на днях рождения или свадьбах.
Итак, какова важность LSI и ключевых слов LSI ?
По данным Google , он проиндексировал сотни миллиардов веб-страниц. Из этих миллиардов возможных страниц, как, по-вашему, Google решает, какие именно показывать вам, когда вы что-то вводите в свою поисковую систему?
Первое, что, вероятно, придет на ум, это то, что после получения вашего запроса поисковые системы ищут страницы, которые содержат термины, совпадающие с теми, которые вы использовали, и выбирают эти конкретные страницы.
Например, если вы введете слово «вафли», вы думаете, что поисковые системы вернут страницы, содержащие точное слово, которое вы ввели («вафли»), верно?
Хотя это звучит как самый очевидный метод, он может быть очень неточным. Многие слова имеют разные значения (полисемия), поэтому сопоставление буквальных терминов может привести к тому, что пользователю, выполняющему поиск, будут возвращены совершенно нерелевантные страницы.
Кроме того, разные слова могут означать одно и то же (синонимия), поэтому только совпадение точных терминов серьезно ограничивает результаты поисковой системы для ее пользователей.
Таким образом, сопоставление буквальных терминов с поисковым запросом пользователя оказывается недостаточным и неточным.
Лучшим и более интуитивным способом было бы получение информации на основе концептуальной релевантности темы, чего и пытается достичь LSI. Для этого он ищет базовые («Скрытые») отношения между словами («Семантические») для улучшения поиска информации («Индексирование»).
Какую проблему решают ключевые слова LSI?
В конечном счете, миссия Google всегда была одной и той же: сопоставить лучшую страницу с поисковым запросом пользователя . Для этого Google необходимо понимать, что именно имеет в виду пользователь поиска, когда ищет слово в поисковой системе. Однако сложность языковой конструкции создает для Google много проблем для достижения этой цели.
Одна из таких проблем возникает, когда пользователи поиска используют многозначные слова и синонимы в своих запросах.
Например, если я наберу слово «свидание» в Google, как он узнает, ищу ли я сегодняшнее свидание, романтическую встречу с кем-то ?
Это то, что мы называем многозначными словами : слова, которые имеют разные значения.
С другой стороны, синонимы — это разные слова, обозначающие одно и то же.
Некоторые примеры синонимов: легкий и простой, большой и огромный, тест и экзамен и т. д.
Пользователь может выполнить поиск «компьютер», используя термины «ПК», «рабочий стол» или даже «ноутбук». Поисковая система, которая не понимает синонимы, будет рассматривать эти условия поиска независимо друг от друга и не будет возвращать все релевантные результаты, которые хочет пользователь.
То же самое относится и к региональным вариациям слов, используемых для описания одного и того же предмета. Пользователь из России, который ищет картофель фри, будет запрашивать «картофель фри рядом с моим местоположением», а пользователь из Белоруссии будет искать «чипсы рядом с моим местоположением».
Компетентная поисковая система должна понимать, что оба пользователя, вероятно, ищут одну и ту же еду.
Как ключевые слова LSI различают многозначные слова и синонимы?
Латентное семантическое индексирование (или латентный семантический анализ) решает вопрос различения многозначных слов и синонимов с помощью статистических методов.
Латентный семантический анализ анализирует статистические совпадения слов, которые появляются рядом друг с другом в наборе документов, чтобы сделать вывод, связаны ли они контекстуально или семантически друг с другом. Это то, что специалисты по данным называют встраиванием слов в науке о данных и обработке естественного языка.
В этом смысле ключевые слова LSI — это ключевые слова, которые семантически или контекстуально связаны с ключевым словом, на которое вы ориентируетесь. Например, если исходным ключевым словом является «автомобиль», соответствующими ключевыми словами LSI будут «автомобиль», «транспортное средство» или даже «автомобили».
Некоторые утверждают, что LSI не подходит для поисковых систем, потому что она была разработана для небольших корпусов документов в доинтернетную эпоху и непрактична для применения к такому огромному объему данных, как всемирная паутина.
Хотя это верно с точки зрения поисковой системы, вот почему это не имеет значения: при SEO-оптимизации мы просто ищем конкретное ключевое слово, по которому не так много данных для анализа.
Когда мы имеем дело с конкретными ключевыми словами, мы имеем дело только с первыми 10-20 результатами поиска, поэтому эти очень маленькие наборы данных делают LSI прекрасным методом для извлечения связанных ключевых слов.
Являются ли ключевые слова LSI одним из факторов ранжирования Google?
У Google более 200 факторов ранжирования — половина из них подтверждена, а другая половина… нет. Одним из тех подтвержденных факторов, проверенных самим Google, являются не что иное, как обратные ссылки — это привело SEO-специалистов и владельцев веб-сайтов в безумие в поисках лучшего средства проверки обратных ссылок, которое они могут получить.
Но правда в том, что многие факторы ранжирования являются предположениями SEO-сообщества, основанными на успешных экспериментах и достоверных слухах.
Несколько лет назад велись дискуссии о том, что Google использует скрытое семантическое индексирование в своем алгоритме поиска, и использование ключевых слов LSI в вашем контенте может улучшить рейтинг вашего контента в результатах поиска.
Имеет смысл предположить, что Google использует LSI в своем алгоритме поиска, потому что им необходимо уметь различать многозначные слова и синонимы, чтобы точно расшифровать намерения искателя.
Однако в 2019 году советник Google по поиску Джон Мюллер осудил эту идею, подтвердив, что Google не использует ключевые слова LSI в своей поисковой системе.
Кроме того, в документах Google по их алгоритму поиска не упоминается латентное семантическое индексирование или латентный семантический анализ, как в официальных документах других поисковых систем.
Итак, снова возникает вопрос: «Являются ли ключевые слова LSI одним из факторов ранжирования Google?»
Настоящий ответ? Никто из нас не узнает (знает только Google).
Вероятный ответ? Нет… но и как-то да.
Чтобы действительно ответить на этот вопрос, нам нужно обратиться к истории развития обработки естественного языка, НЛП .
Проще говоря, НЛП — это процесс обучения компьютеров понимать человеческий язык.
Одним из самых первых методов НЛП является встраивание слов , форма представления слов, которая позволяет группировать слова с похожими значениями «ближе». А ЛСИ? Это один из пионеров техники встраивания слов в те дни.
Затем, в 2013 году, когда исследователи пытаются прорваться через Word Embedding, родился Word Vector (Word2Vec) . Опираясь на концепцию встраивания слов, исследователь Томас Миколов разработал Word Vector, чтобы помочь компьютеру быстрее понимать языки.
И, наконец, в 2018 году Word Vector превратился в BERT (представления двунаправленного кодировщика от трансформеров) . В отличие от однонаправленного характера Word Vector, BERT использует двунаправленный подход к NLP, что позволяет Google лучше понимать поисковые запросы так, как это делает человек.
BERT принимает во внимание другие слова в искомом предложении и относительное расположение слова в предложении, чтобы сделать вывод о контексте, в котором используются слова, чтобы он более точно отражал намерение искателя.
Модель также классифицирует условия поиска по тематическим объектам, а не сортирует каждое слово по отдельности. Например, запрос «Бонд» и «Джеймс Бонд» — это два разных ключевых слова, но они будут относиться к одному и тому же объекту.
К концу 2020 года Google начал использовать BERT практически в каждом запросе .
Учитывая это развитие NLP от Word Embedding до Word Vector и, наконец, до BERT, мы можем сказать, что нет, Google, вероятно, сегодня не использует LSI как таковую в своем алгоритме.
Но BERT, который сегодня очень популярен среди SEO-специалистов? Его история и корни восходят к базовому, то есть к встраиванию слов, используемому LSI.
Хорошая аналогия, которую я хотел бы привести, — автомобильный двигатель. Перемотайте 30 лет назад, и все автомобильные двигатели существуют в виде бензинового двигателя; тогда как сегодня они превратились в усовершенствованные формы двигателей, такие как Plug-in Hybrid, Hydrogen Engine и Pure EV.
Все эти новые двигатели определенно лучше, но старый добрый бензиновый двигатель, несмотря на то, что он устарел, по-прежнему доставит вас из пункта А в пункт Б.
А ЛСИ? LSI точно такой же, как бензиновый двигатель; конечно, он уже не самый модный, но он по-прежнему помогает создавать контекст для вашего контента и продвигаться вверх в рейтинге SERP.
Новые расширенные ключевые слова LSI
Тот факт, что Google не использует ключевые слова LSI, не означает, что ключевые слова LSI не имеют отношения к SEO.
Напротив, теперь, когда Google может понимать условия поиска так, как это делают люди, использование LSI и семантических ключевых слов никогда не было более актуальным. Наличие контекстуально и семантически связанных терминов с вашим целевым ключевым словом говорит Google, что ваш контент очень релевантен.
Это также делает ваш контент более привлекательным для читателей и, соответственно, для алгоритма Google BERT. Хорошо написанный контент не повторяет одно и то же ключевое слово снова и снова, а наполняет статью контекстными и связанными терминами, чтобы сделать ее более приятной для чтения.
Google даже подтверждает это :
Другими словами, ваша запись в блоге о собаках будет иметь более высокий рейтинг в результатах поиска, если она содержит связанные ключевые слова, такие как породы собак и периферийные устройства, связанные с собаками, такие как поводки или ошейники.
Основная идея остается прежней: повысить релевантность контента, чтобы он соответствовал поисковому намерению пользователя и, следовательно, повышал его рейтинг в Google.
Помня о том, что LSI по-прежнему является строительным блоком сегодняшнего BERT, LSIGraph дополнительно улучшил наш алгоритм, включив в него интегрированную в BERT модель машинного обучения, чтобы возвращать нашим пользователям контекстные и семантические ключевые слова, которые повысят релевантность их контента для алгоритмов ранжирования Google.
Это преобразует ключевое слово LSI в его более сложную форму «Контекстные условия» .
Заключение
Легкий и простой ответ на вопрос «Являются ли ключевые слова LSI одним из факторов ранжирования Google?» было бы нет, это не так.
Однако это не означает, что она совершенно незначительна.
Поскольку LSI является частью того, что в конечном итоге превратилось в BERT, который сегодня повсеместно используется Google, он по-прежнему имеет значение в том, что помогает ранжировать контент.
Подобно тому, как метод встраивания слов развился до сегодняшнего BERT, LSIGraph также эволюционировал от использования ключевых слов LSI к чему-то еще лучше: контекстным терминам.
Не отказываясь полностью от идеи ключевых слов LSI, но вместо этого опираясь на нее, контекстные термины помогают создать контекстуальную релевантность вашего контента, чтобы, когда боты Google сканировали его, они понимали, о чем ваш контент, и, следовательно, ранжировали его для нужной аудитории.
Если статья «Что такое ключевые слова LSI и почему они важны для SEO» вам понравилась и была полезной, то стоит поделиться с друзьями? Возможно , их заинтересует данная информация .