Поисковые алгоритмы google

Поисковые алгоритмы Google

Недавно я решил разобраться в такой, казалось на первый взгляд, простой теме. Но когда я заметил, что с разных компьютеров некоторые новые страницы сайта то появляются, то пропадают — мне захотелось, почитать детальную справку и разобрать тему до мелочей. А по какому алгоритму работает поисковик Google? Как страницы попадают в индекс?

Индексация в Google

  • При очередном сканировании наряду со списком веб-адресов, полученных во время предыдущего сканирования, используются файлы Sitemap, которые предоставляются владельцами сайтов.
  • По мере посещения сайтов робот переходит по указанным на них ссылкам на другие страницы.
  • Особое внимание он уделяет новым и измененным сайтам, а также неработающим ссылкам.
  • Он самостоятельно определяет, какие сайты сканировать, как часто это нужно делать и какое количество страниц следует выбрать на каждом из них.
  • Владельцы сайтов могут при помощи инструментов для веб-мастеров указывать, как именно следует сканировать их ресурс, в частности, предоставлять подробные инструкции по обработке страниц, запрашивать их повторное сканирование, а также запрещать сканирование, используя файл robots.txt.

Какой вывод можем сделать? Это официальное заявление. Итак, очень важно настроить Sitemap, robots.txt, страницу 404, удалить все дубли и битые ссылки, чтобы робот даром не переходил по ним и не тратил так-называемый «краулинговый бюджет». Прописать канонические страницы, редиректы — см. выше. Сайт обязательно должен быть добавлен в Панель Вебмастера — Google Search Console, чтобы можно было мониторить индексирование и запускать в переобход те страницы, которые не были проиндексированы (возможно, как раз из-за не продуманного юзабилити и вложенности страниц, а также битых ссылок, не частого обновления). Перечитайте это заявление пару раз и вы поймете без всяких гайдов, как нужно оптимизировать сайт под индекс Гугла. Идем дальше:

  • Во время сканирования наши системы обрабатывают материалы страниц так же, как это делают браузеры, и регистрируют данные по ключевым словам и новизне контента, а затем создают на их основе поисковый индекс.
  • Чтобы подобрать страницы, содержащие релевантные сведения, прежде всего необходимо проанализировать значение слов в запросе. Мы разрабатываем языковые модели, позволяющие определять, какие сочетания слов следует искать в индексе.Для этого выполняется ряд действий – от интерпретации орфографических ошибок до определения типа введенного запроса на основе результатов последних исследований в области понимания естественного языка. Например, даже если у введенного вами слова несколько значений, Google Поиск определит верное.
Читайте также:  Важность Title и H1: основы оптимизации

Как видим, тут работают очень уникальные и сложные семантические алгоритмы, алгоритмы распознавания текста, возможно искусственный интеллект. И я думаю в будущем они очень сильно пойдут вперед, вплоть до каких-то нейронных связей — когда человек подумал, и поисковик тут же прочитал это и выдал нужный результат в SERP’е.

Можно сделать один явный вывод — поисковик научился понимать связи между словами, он знает что такое синонимы и распознает опечатки. Что это значит? А это значит, если ваш сайт вышел в ТОП по одному самому частотному запросу, например «купить автомобиль Acura MDX 2008», то вы будете также показываться и для всех синонимов, и других словоформ этого слова.

Продолжаем читать:

  • Затем мы подбираем страницы, содержащие информацию, которая соответствует запросу. Обычно, когда пользователь вводит запрос, наши алгоритмы ищут в индексе подходящие страницы, а также определяют, как часто ключевые слова встречаются на странице и в каких ее разделах (например, в заголовке или основном тексте).
  • Наши алгоритмы не только сопоставляют ключевые слова, но и определяют, насколько полная информация содержится в предполагаемых результатах поиска. Например, пользователя, указавшего запрос «собаки», вряд ли интересует страница, в которой сотни раз повторяется это слово. Мы стараемся убедиться в том, что та или иная страница содержит сведения по запросу, а не просто дублирует его. Так, алгоритмы Поиска определят, представлен ли на страницах нужный контент, например изображения собак, видео с их участием или список пород. Наконец, пользователю в первую очередь будут показаны страницы на том же языке, на котором введен запрос.
  • Мы разрабатываем алгоритмы, позволяющие оценивать релевантность страниц, чтобы наиболее подходящие из них показывались первыми.Чтобы предоставлять наиболее актуальную информацию, эти алгоритмы оценивают сотни самых разных факторов – от новизны контента и количества повторов запроса до удобства просмотра страницы.
  • Для выявления источников достоверных и актуальных сведений по той или иной теме мы отслеживаем наиболее популярные ресурсы среди пользователей, указывающих похожие запросы. Если на страницу ссылаются авторитетные в своей области сайты, это означает, что на ней вероятно представлен качественный контент.
  • В Интернете существует множество сайтов, содержащих спам. Их владельцы стараются обеспечить для них высокие позиции в результатах поиска, используя различные способы, такие как повтор ключевых слов и покупка ссылок, которые учитываются системой PageRank. Поскольку большинство подобных мошеннических или опасных сайтов не приносят посетителям никакой пользы, мы разрабатываем алгоритмы, позволяющие выявлять спам и исключать из результатов поиска сайты, нарушающие рекомендации для веб-мастеров.
  • Чтобы предоставлять пользователям наиболее подходящую и актуальную информацию, мы учитываем сведения об их местоположении, предыдущих запросах, настройках Google Поиска и т. д. Мы показываем результаты поиска, исходя из сведений о стране и местоположении пользователей.
Читайте также:  Михаил Шакин - SEO Винчестер (2014)

Оценка:
( Пока оценок нет )
Виталий Крашенинин / автор статьи
Основатель блога, публицист, IT-специалист
Понравилась статья? Поделиться с друзьями:
Opt In Image
Хочешь первым получать свежую информацию от меня?
Тогда подписывайся ↓
Krasheninin IT Блог - все о веб-технологиях, и не только
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

19 − семь =

>