Motoarele de căutare îşi “antrenează” boţii căutători de noi pagini de internet pentru a-şi eficientiza rezultatele oferite în urma căutărilor online ale utilizatorilor.
Tehnologie - Indexarea paginilor web, mai eficientă
Motoarele de căutare îşi “antrenează” boţii căutători de noi
pagini de internet pentru a-şi eficientiza rezultatele oferite în urma căutărilor
online ale utilizatorilor.
În momentul în care cineva caută o anumită informaţie pe un motor de căutare, rezultatele întoarse provin ca urmare a inspectării unor baze de date pe care respectivul motor de căutare a reuşit să şi le construiască. Boţii sînt instrumentele principale care permit realizarea acestor baze de date şi sînt, în practică, programe care caută în permanenţă pe web noi site-uri pe care să le indexeze. Paginile web pot stopa accesul boţilor la informaţiile referitoare la conţinutul lor, prin intermediul unui fişier, robot.txt.
Metode. Google are googlebots, iar Yahoo îl are pe Slurp. Recent, boţii Google au devenit mai activi, primind o nouă “sarcină”. Pe site-urile care conţin rubrici de tipul formularelor electronice, aşa-numitele HTML forms, adică locuri în care utilizatorii pot introduce diverse informaţii sau pot face selecţii dintre mai multe opţiuni, boţii Google au început să introducă ei înşişi informaţii, ca un utilizator virtual. Este analizată apoi pagina web rezultată în urma alegerilor făcute de bot, a informaţiilor submise. Dacă este interesantă, ea este indexată şi introdusă în baza de date. Boţii nu completează însă rubrici care corespund unor informaţii personale, de tipul parolelor, pentru a evita probleme legate încălcarea intimităţii. În ultimele săptămîni, Yahoo şi-a pregătit ultima generaţie de boţi cu o serie de update-uri în infrastructură, fiind în prezent operativ Yahoo! Slurp 3.0. O promisiune de schimbare este Twiceler, botul companiei înfiinţate de doi foşti specialişti ai Google, dar nu a fost anunţată o dată la care noul serviciu va fi disponibil.