Що таке пошукові системи?

Основним двигуном, який приверне нових відвідувачів на ваш сайт, є пошукові системи. Лише дізнавшись детально про їхню роботу, ви зрозумієте основний механізм пошуку і видачі результатів по потрібних ключових словах, що дасть у свою чергу можливість оптимізувати веб сайти для додавання їх в базу даних, і зрозуміти, що в цілому являє собою процес оптимізації.

Існують п'ять основних компонентів пошукових систем. Перший компонент, з яким стикається кожен користувач глобальної мережі, називається Search engine results engine і являє собою програму видачі результатів пошуку. Наступний компонент це система зчитування та додавання в базу інформації, яка здійснюється павуком - Spider. Далі в справу вступає Crawler (Краулер) - програма, яка шукає нові посилання на сайті для передачі їх павуку. Компонент Indexer (Індексатор) аналізує вміст сторінки (заголовки та інші елементи). Ну і останній компонент, який відповідає за зберігання всієї проіндексованої інформації є Database (База даних).

Індексація інформації здійснюється приблизно як в бібліотечних каталогах. Пошук потрібної інформації відбувається тільки у власній, постійно оновлюваній базі даних, тому вона вимагає дуже великих ресурсів.

В цілому, глобальна мережа не структурована і об'єднує величезну кількість різних за інформацією сайтів, що унеможливлює застосовувати стандартні методи управління базою даних в звичайному інформаційному пошуку.

Існують унікальні пошукові алгоритми, які сортують результати видачі і являють собою математичні методи програмування. У різних пошукових системах практично завжди буде різна інформація, що створює до них індивідуальний підхід.

На сьогоднішній день пошукова система Google є найбільшою в світі. Але навіть їй не в силу щодня оновлювати дані всіх сайтів в мережі, тому процес індексації сайту може займати досить багато часу. Щодня пошукові машини додають в базу сотні терабайт інформації.

Найважливішим завданням пошукових систем є виявлення та індексація релевантних сторінок. Тому дуже важливо своєчасно оновлювати інформацію в базах даних, як нову, так і вже існуючу, щоб вона відповідала поточним запитам.

Пошукові системи заносять в базу для індексації мільйони сторінок в день. І тут відразу виникає проблема їх частоти оновлення. Адже час, коли спайдер знову прочитає вже існуючу в базі сторінку, може бути досить великим, а інформація може кілька разів на сторінці змінитися (ціна, номенклатура, продукція і т.д.). Пошукові системи не можуть постійно стежити за оновленнями інформації веб-сторінки, ось саме цей фактор є основною проблемою релевантності.

Якщо зовні всі пошукові системи здаються схожими, то завжди у них будуть відрізняться результати видачі пошукових запитів, що залежать від індексації, частоти оновлення баз даних і алгоритмів вибірки.
Залишати коментар дозволено лише зареєстрованим користувачам. Процедура займе зовсім небагато часу, і ви зможете швидко добавити відгук.

Авторизуватися

Вперше на KovelPost? Приєднуйтесь

Статистика: