Sumarul brevetului Google

Sumarul brevetului Google

Pentru cei care nu au timp indeajuns sa citeasca noile reglementari emis pe 31 Martie privind ceea ce se numeste “Google Patent”, iata un rezumat cu cele mai importante specificatii .

Data de emitere al unui document

Motoarele de cautare vor “invata” data de emitere/creare a unui document prin “crawling” (analiza facuta de roboti specifici) , inscrierea documentului pe un motor de cautare sau director ori prin accesul direct al robotilor.
Motorul de cautare va evalua data unui document, in functie de momentul in care a fost inscris sau cand a fost descoperit link-ul catre el. Alte tehnici de a determina cat de vechi este documentul sunt amprenta datei de pe server sau data cand domeniul apare inregistrat la crearea documentului. Se va inregistra documentul in functie de aceasta data de inscriere. Documentele mai vechi ar trebui sa aiba mai multe date spre deosebire de cele noi care au un “trecut” mai slab. Daca un document nou are prea multe link-uri e posibil ca acestea sa fie SPAM pentru motorul de cautare si rangul/importanta documentului scade. In plus, motorul de cautare poate determina vechimea fiecarui document intr-un set de rezultate, poate determina o medie de varsta si poate modifica rangul documentului in functie de aceste date.

Continut/Update/Modificari

Un document modificat/actualizat frecvent va fi notat diferit fata de un document in care nu apar modificari pentru o perioada mai mare de timp. Cu cat continutul e la zi, cu atat se va modifica si notarea.
Motorul de cautare tine cont si de numarul de pagini unice si noi asociate documentului intr-o perioada de timp in comparatie cu numarul total de pagini ale documentului. In unele cazuri, semnatura documentului este pastrata pentru a evidentia schimbarile survenite in timp. In alte cazuri, documentele vor fi pastrate integral. Motorul de cautare poate determina data cand continutul uneia sau a mai multor pagini s-au modificat si in functie de acestea modifica si scorul documentului, dupa diferenta intre datele de schimbare si media lor.

Analiza

Motorul de cautare noteaza documentele diferit si dupa criteriul de selectie, de cate ori a iesit un document in cautari. Daca un document e selectat de mai multe ori decat altul atunci va fi notat ca atare. Un alt criteriu este representat de subiectele fierbinti sau noutati. Site-urile referitoare la acestea vor fi notate mai sus. Un alt factor este reprezentat de vechimea documentului (determinata in functie de aparitia lui, trafic, numarul de link-uri etc.). Motorul de cautare se va uita dupa cat de des un document vechi este preferat unuia nou, si isi va modifica notarea in concordanta cu aceasta. Documentele pot fi si monitorizate si folosite ca baza pentru notare. De exemplu daca un anumit document apare in serii discordante de cautari, ar putea fi considerat ca un semnal de spam, si va fi notat ca atare de motorul de cautare.

Criteriul bazat pe Link

Motorul de cautare va monitoriza comportamentul link-urilor in diferite perioade de timp, cand apar ele, cand dispar si frecventa la care sunt schimbate. O modificare slaba in decursul timpului scade notarea spre deosebire de modificarile concrete care sunt considerate relevante. Link-urile pot fi cantarite si in functie de increderea care poate fi acordata(de exemplu site-urile guvernamentale sau educationale) si noutatea paginilor (cu alte cuvinte de cand e prezent link-ul acolo). Daca un document e considerat vechi linkurile continute in el vor fi ignorate la notarea lui.

Textul Ancora

Modificarile in timp ale textului ancora pot indica faptul ca s-a produs o updatare sau un nou subiect in document. Aceasta se poate intampla cand un domeniu este cumparat si textul ancora nu corespunde cu tema siteului. Motorul de cautare va incerca sa combata aceasta problema prin estimarea datei cand s-a facut modificarea. Toate textele ancora precedente acestei date vor fi considerate invechite. Data cand se face modificarea la zi este de un real ajutor pt pagina voastra. Cand documentele de legatura isi schimba datele, inseamna ca textul ancora este relevant si la subiect.

Motorul de cautare foloseste traficul drept criteriu de notare al unui document. O scadere a traficului indica invechirea unui document. Motorul de cautare se va lua dupa schimbarile de trafic dintr-o perioada oarecare de timp (vara, weekends, sau alte perioade) pentru a marca documentul.
Traficul determinat de reclame este de asemenea luat in considerare pt a vedea rata de update si calitatea lor (spre exemplu amazon.com sunt mai de incredere si mai bine notate decat siteurile cu reclame porn).

Comportamentul utilizatorului

Motorul de cautare va monitoriza de cate ori un document a fost ales intr-o cautare si-l va marca in functie de asta. Daca documentul este vizitat des intr-o perioada de timp, creste valoarea lui, altfel scade.

Informatii referitoare la domeniu

Informatiile referitoare la cand si unde are hostul un domeniu sunt folosite pt marcarea documentului. Domeniile doorway(folosite pt spam la motoarele de cautare) sunt adesea inregistrate cu un an in avans in timp ce domeniile legitime sunt inregistrate pe o perioada mai indelungata. Datele sunt stocate in asociatie cu datele de contact ale domeniului, serverele, adresele de IP, etc.
Acestea sunt folosite pt a verifica legitimitatea unui domeniu si implicit a documentului de acolo.
Serverele recunoscute au de obicei mai multe domenii cu diferite inregistrari si o istorie buna.
Domeniile proaste sunt de obicei cele pornografice sau doorway, domenii comerciale sau bulk de la un singur utilizator.

Istoria claselor.

Documentele vor fi monitorizate si in functie de valoarea lor in timp. Un document care scade si creste in cautari poate fi considerat SPAM. Cautari care cresc intr-un timp scurt, indica subiecte fierbinti si documentele de legatura, vor fi notate mai bine. Clasamentul in timp, sau diferentele de clasament vor fi de asemenea analizate. Documentele autoriale , de exemplu cele de pe siteuri guvernamentale scapa de penalitati daca un numar mare de linkuri indicatoare apar deodata. Pe de alta parte, daca un document scade in clasament in timp, motorul de cautare il va marca drept iesit din uz.

Mentinerea/Data generata

Motorul de cautare va monitoriza datele ca favorite, bookmark sau alte tipuri care indica favorizarea unui document. Vor fi de asemenea analizate cresterile si descresterile de tendinte a datelor, anume de cate ori oamenii scot bookmark-ul. Alte date, cum sunt cele “cache”vor fi analizate din acelasi punct de vedere al tendintelor.

Cuvinte unice, biograme, fraze in textul ancora

Motorul de cautare va monitoriza link-urile, grafica si comportamentul acestora pt a preveni SPAM-ul. Un numar mare de text ancora de acelasi fel sau total diferite deliberat vor fi considerate SPAM.

Link-urile independente

O crestere rapida a numarului de link-uri independente afiliate poate indica SPAM. Daca se intampla cu textul ancora care de obicei este coerent sau discordant, motorul de cautare il va considera SPAM.

Subiectele documentului.

Motoarele de cautare analizeaza bucati de informatie pt a determina subiectul documentului.
Informatii de genul: categorisire, analiza URL, analiza de continut, grupare, rezumare si un set de termeni cu frecventa scazute sunt folositi pt a gasi subiectul. Un document cu lacune de subiect pot fi considerate spam. O alta indicatie poate contine disparitia subiectelor originale ale documentului.

Procesare exemplara.

Motorul de cautare poate marca documentele bazandu-se pe relevanta cautarilor. Aceasta este determinata in parte de istoria datelor documentului. Aceasta istorie este la randul ei determinata de subiectele expuse mai sus.

There are no comments yet...

Leave a comment

Your email address will not be published. Required fields are marked *

© 2010 - 2015 4SEO. All rights reserved.