→ Пошук по сайту       Увійти / Зареєструватися
Партнери проекту:
Лучшее массажное кресло для айтишника.
Знання Сервiси Internet Пошук інформації в Internet

Види пошукових систем

Цiлеспрямований пошук у величезнiй кiлькостi текстових документiв неможливий без спецiалiзованих пошукових систем, що можна роздiлити на двi групи: категоричнi та iндексацiйнi.

Основу категоричних пошукових систем складають вiртуальнi бiблiотеки, тобто Web-сторiнки, присвяченi якiйсь тематицi, iз стислим описом джерел iнформацiї, то гiперпосилань на них. Iз зростанням кiлькостi посилань на однiй сторiнцi з'являється необхiднiсть її подiлу або, iнакше кажучи, введення нових пiдтем або категорiй. У результатi розвитку такої системи з'являється деревоподiбна структура каталогiв, пiдкаталогiв i т.д. Iнодi всерединi каталогу за певними критерiями вiдбираються кращi посилання за темою.

У будь-якому випадку такими пошуковими системами найкраще користуватися при початковому, "широкому" ознайомленнi з необхiдною тематикою. YAHOO - http://www.yahoo.com дотепер неперевершена категорична пошукова система, тому що час iснування подiбної структури - головний критерiй її популярностi, у тому числi й за охопленням джерел. Крiм того, за джерело вiртуальних бiблiотек можна порекомендувати сервер World Wide Web Consortium - http://www.w3.org
У Росiї аналоги YAHOO - це АУ - http://www.ay.ru, це сервер Росiйських Web-Серверiв - http://www.weblist.ru - проте вони перебувають у початковiй стадiї розвитку.

Iнший тип пошукової системи - iндексацiйнa. Перший дiйсно ефективний iз подiбних комплексiв AltaVista - http://www.altavista.com, створений компанiєю DEC, допускає аналiз усiх текстових документiв iз WWW i news group, а також можливiсть пошуку в них за ключовими словами, тобто за будь-якими словами i виразами, що зустрiчаються. Незабаром пiсля появи AltaVista її аналоги, у тому числi й неангломовнi, стали виникати дуже швидко. Зараз у Європi вiкрито дзеркало AltaVista з iнтерфейсами всiма європейськими мовами.

Хоча в основi подiбних комплексiв лежить унiкальне програмне забезпечення, iснує ряд ознак, що їх об'єднує. Це насамперед система пошуку, заснована на алгебрi логiки, i стандартнi функцiї пiдтримки "i", "або", "нi", а також пошук заданого виразу. Часто цi функцiї спецiально не видiляються, а позначаються словами, як у HOTBOT - http://www.hotbot.com:

all the words

усе слово

any of the worlds

будь-яке iз слiв

the exact phrase

точну фразу

the person

людини

links to this URL

гiперпосилання на дане джерело

the Boolean expression

формулювати запит у булєвих виразах


На жаль, AltaVista, надаючи бiльш широке коло можливостей, не має зручного користувального iнтерфейсу i пропонує користувачу малозрозумiлi вирази мовою алгебри.
Локальна пошукова машина каталогу допускає пошук за ключовими словами, що входять у назви роздiлiв, вузлiв, i iншими нечисленними даними, що вводяться при реєстрацiї. У той час, як в автоматичному iндексi iнформацiя про окремий вузол набагато ширша, в iдеалi аж до одиничного слова кожного документа, причому з облiком спецiальних полiв Wеb-сторiнки i режиму вiдновлення даних.

У дiйсностi ефективною пошукову систему може зробити тiльки Ваш власний запит. Правило полягає в тому, щоб вибрати декiлька слiв або готовi фрази, якi зустрiчаються обов'язково в потрiбному Вам текстi, i задати ключовi слова пошуковiй системi для одночасного пошуку, тобто зв'язати їх фукцiєю "i".

Пiсля одержання списку посилань треба провести їх найпростiший аналiз перед тим, як робити подальшi кроки. Якщо на екранi наводиться початковий текст документа, то аналiзу необхiдно пiддати URL гiперпосилання. Основнi правила:

  • адреси WWW з розширенням com належать комерцiйним органiзацiям, i можливiсть вiльного надання ресурсiв, крiм цiн на продукцiю i мiнiмальне ознайомлення, дуже невелика;
  • довгi посилання найчастiше говорять про недовговiчнiсть ресурсу й непростий доступ до нього.

Основнi критерiї ефективностi пошукової системи це:

  • повнота вiдображення її бази в iнформацiйному полi, що змiнюється дуже швидко;
  • перiодичнiсть вiдновлення документiв i можливiсть самостiйного виявлення нових серверiв;
  • багатомовнiсть пошукових систем iз урахуванням лiнгвiстичних особливостей.

З цих причин iдеальним повинне бути сполучення категоричних та iндексацiйних систем. Для нас це, наприклад, такi системи як:

Яndex - www.yandex.ru
Rambler -www.rambler.ru
Апорт - www.aport.ru
Openweb -www.openweb.ru

Сторінки, близькі за змістом