В Интернет, на различни сайтове, на потребителя се предлага голямо количество различна информация. Създадени са търсачки за получаване на необходимата информация, търсене на отговори на въпроси. Чувайки тази фраза, много хора мислят за Google, Yandex. Въпреки това, има много повече търсачки в Интернет.
Какво е търсачка
Търсачката се счита за софтуер, който се състои от база данни с документи. Потребителите разполагат със специален интерфейс, който им позволява да въвеждат необходимите заявки и да получават връзки със съответната информация. Документите, които най-много съответстват на това, което търси определен човек, винаги са в горната част на резултатите от търсенето.
Резултатите от търсене, които се генерират в съответствие с въведената заявка, обикновено съдържат различни типове резултати. Може да съдържа уеб страници, видео и аудио файлове, снимки, pdf файлове, специфични продукти (ако търсенето се извършва в онлайн магазин).
Класификация на търсачките
Съществуващите търсачки са класифицирани в няколко типа. На първо място си струва да споменем традиционните търсачки. За такива търсачки принципите на работа са фокусирани върху намирането на информация в огромен брой съществуващи сайтове. Търсачките все още са достъпни в отделни интернет ресурси:
- в онлайн магазини (за търсене на правилните продукти);
- във форуми и блогове (за търсене на публикации);
- в информационни сайтове (за търсене на статии по желаната тема или новини) и др.
Търсачките също са подразделени въз основа на географски характеристики. В тази класификация има 3 групи търсачки:
- Глобално. Търсенето се извършва по целия свят. Лидерът в тази група е търсачката Google. Преди това имаше търсачки като Inktomi, AltaVista и др.
- Регионален. Търсенето се извършва по държава или група държави, които са обединени от един език. Регионалните търсачки са широко разпространени. Техният пример в Русия е Yandex, Rambler.
- Местно. Търсенето се извършва в конкретен град. Пример за такава търсачка е Tomsk.ru.
Компоненти на търсачките
Във всяка търсачка има 3 съставни елемента, които определят принципите на търсачката:
- робот (индексатор, паяк, обхождащ);
- база данни;
- обработчик на заявка.
Robot е специална програма, чиято цел е да формира база данни. Базата данни съхранява и сортирацялата събрана информация. Манипулаторът на заявки, наричан още клиент, работи с потребителски заявки. Има достъп до базата данни. Клиентът не винаги се намира на един и същ компютър. Манипулаторът на заявки може да бъде разпределен върху няколко физически несвързани електронни компютъра.
Принципи на търсачките
Всички съществуващи системи работят на същия принцип. Помислете например за функционирането на традиционните търсачки, предназначени за Интернет. Функционирането на робота е подобно на действията на обикновен потребител. Тази програма периодично заобикаля всички сайтове, добавя нови страници и интернет ресурси към базата данни. Този процес се нарича индексиране.
Когато потребител в Интернет въведе определена заявка в полето за търсене, клиентът започва да работи. Програмата осъществява достъп до съществуващата база данни и генерира резултати въз основа на ключови думи. Търсачката предоставя връзки към потребителя в определена последователност. Те се сортират, както съответстват на заявката, т.е. уместността се взема предвид.
Всяка търсачка има свой собствен начин за определяне на уместността. Ако потребителят изпрати конкретна заявка към различни системи, тогава той ще получи не съвсем същите резултати. Алгоритъмът за определяне на уместността се пази в тайна.
Подробности за уместността
С прости думи, уместността е съответствието на думата или комбинацията от думи, въведени в търсенетоспецифични връзки в SERP. Няколко нюанса влияят върху позицията на документите в списъка:
- Наличие на думи за търсене в документи. Този нюанс е очевиден. Ако документът съдържа думи от въведената от потребителя заявка, това означава, че този документ отговаря на условията за търсене.
- Честота на поява на думите. Колкото по-често се използват ключови думи в даден документ, толкова по-високо ще бъде той в списъка на SERP. Не всичко обаче е толкова просто. Прекаленото използване на думи може да е знак за нискокачествено съдържание за търсачката.
Алгоритъмът за определяне на уместността е доста сложен. Преди няколко години линкове, съдържащи необходимите ключови думи, но несъответстващи по съдържание, можеха да попаднат в резултатите от търсенето. В момента принципите на работа на търсачките са сложни. Сега роботите могат да анализират целия текст. Търсачките отчитат огромен брой различни фактори. Благодарение на това изданието се формира от най-висококачествени, подходящи връзки.
Как да формулирам правилно заявките
Дори в училище бяхме научени да задаваме въпроси правилно. Зависи какви отговори ще получим. Това правило обаче не е необходимо да се спазва при използване на търсачки. За съвременните търсачки няма значение в какъв номер или случай човек пише своята заявка. Така или иначе изходът ще включва същите резултати.
Търсачките не се нуждаят от ясна формулировка на въпроса. Потребителят трябва само да избере правилните ключови думи. Помислете за пример. Трябва да намеримтекста на песента "Ден без теб", която се изпълнява от известната женска поп група "Виа-Гра". Когато се свързвате с търсачката, не е необходимо да наименувате групата, посочете, че това е песен. Достатъчно е да напишете "един ден без текст." Запазете регистъра, пунктуацията не се изисква. Тези нюанси не се вземат предвид от търсачките.
Класиране на търсачките в света
Водещата търсачка в света е Google. Основана е през 1998 г. Системата е много популярна, което се потвърждава от аналитична информация. Около 70% от заявките, идващи в Интернет, се обработват от Google. Базата данни на търсачката е огромна. Индексирани са над 60 трилиона различни документи. Google привлича потребители с опростен интерфейс. Главната страница има лого и лента за търсене. Тази функция ни позволява да наречем Google една от най-минималистичните търсачки.
Bing е втората най-популярна търсачка. Появи се в същата година като Google. Създател на тази търсачка е известната международна корпорация Microsoft. По-ниски позиции в класацията са заети от Baidu, Yahoo!, AOL, Excite, Ask.
Какво е популярно в Русия
Yandex е най-популярната търсачка в Русия. Тази услуга се появи през 1997 г. Първоначално руската компания CompTek International се занимаваше с това. Малко по-късно се появи компанията Yandex, която продължи да се занимава с търсачка. Търсачката загодини на съществуване придоби огромна популярност. Може да се търси на няколко езика - руски, беларуски, украински, татарски, казахски, английски, немски, френски, турски.
От статистически данни е известно, че "Яндекс" представлява интерес за повече от 50% от потребителите на Рунет. Над 40% от хората предпочитат Google. Приблизително 3% от потребителите са избрали Mail.ru, рускоезичен интернет портал.
Защитени търсачки
Обикновените търсачки, които са ни познати, не са точно подходящи за деца. Младите интернет потребители могат случайно да намерят някои материали за възрастни, информация, която може да навреди на психиката. Поради тази причина са създадени специални защитени търсачки. Техните бази данни съдържат само безопасно съдържание за деца.
Пример за една такава търсачка е Sputnik. Children. Тази услуга е доста млада. Създаден е от Ростелеком през 2014 г. Основната страница на търсачката е ярка и интересно проектирана. Представя широка гама от местни и чуждестранни анимационни филми за деца от различни възрасти. Освен това на главната страница има информативни връзки, свързани с няколко заглавия – „Спорт“, „Искам да знам всичко“, „Направи си сам“, „Игри“, „Технологии“, „Училище“, „Природа“.
Друг пример за сигурна детска търсачка е Agakids.ru. Това е абсолютно безопасен ресурс. Как работи търсачката? Роботът е конфигуриран по такъв начин, че да заобикаля само онези сайтове, които са свързани с детски теми илиса полезни за родителите. Базата данни на търсачката включва ресурси с анимационни филми, книги, образователна литература, игри, книжки за оцветяване. Родителите, използвайки Agakids.ru, могат да намерят за себе си сайтове за възпитанието и здравето на децата.
В заключение, заслужава да се отбележи, че търсачките са сложни системи. Те се сблъскват с много проблеми - проблемите със спама, определянето на уместността на документите, скриването на нискокачествено съдържание, анализирането на документи, които не съдържат текстова информация. Поради тази причина разработчиците въвеждат нови подходи и алгоритми, които са търговска тайна в работата на интернет търсачките.