kun nykyään puhutaan niin paljon merkityksellisyydestä, ajattelin esitellä teille hakukoneen taustalla olevaa teknologiaa ja mitä mahdollisia eroja niiden välillä voisi olla. On olemassa joitakin mielenkiintoisia otteita hakuteknologian Pre-ranking tulokset lennossa neuroverkkojen yhteisöllinen haku.
vertaamalla ”suurta nelikkoa”
näissä artikkeleissa keskityn ” suureen nelikkoon. Näiden moottoreiden katsotaan omistavan etsintäalueen. Ne ovat Google, Yahoo!, MSN, ja Ask Jeeves. Ensimmäisenä tulevat Google ja Yahoo!
Google-Google lienee tunnetuin hakukone. Laukaisun yhteydessä niitä pidettiin olennaisimpina.
Miten Google toimii
he määrittivät merkityksellisyyden ensisijaisesti PageRank-algoritmillaan. PageRank pohjimmiltaan sanoo, että sivusto, joka on enemmän ulkomailta linkkejä kuin niiden kilpailijat on todennäköisesti parempi sivusto, siksi pitäisi sijoitus korkeampi. Webmasters pian tajusi tämän, ja myös tajusi, että heidän tarvitsi vain rakentaa enemmän linkkejä – tarpeeksi linkkejä päihittää kilpailijansa – jotta sijoitus korkealle. Google tietenkin reagoi muuttamalla ranking-algoritmia jonkin verran. Nyt on olemassa auktoriteetin ja asiaankuuluvuuden elementtejä, joita sovelletaan PageRankin algoritmiin.
Miten Google toimii, kun sivut on ryömitty ja indeksoitu Googlebotilla (katso edellinen artikkelini hakukonehämähäkeistä) ne palautetaan Googlelle rankingia varten.

Google käyttää tuhansia palvelimia näiden rankingien laskemiseen. He katsovat satoja tekijöitä-sekä sivulla ja pois sivulta (kuten ulkomailta linkkejä). He käyttävät satoja algoritmeja näiden laskelmien tekemiseen. Periaatteessa pitäisi olla yksi algoritmi per tekijä. Algoritmit painavat sivuja ja antavat niiden arvot. Nämä arvot tallennetaan myöhempää käyttöä varten.
kun käyttäjä suorittaa kyselyn, vielä yksi joukko algoritmeja punnitsee aiemmin lasketut arvot toisiinsa yleisen merkityksellisyyden määrittämiseksi. Tulokset lähetetään käyttäjien selaimeen.
kuten voidaan kuvitella, tämäntyyppisen jalostustehon tarpeen täytyy olla valtava. Lisäksi sen perusteella, kuinka nopeasti Google palauttaa tuloksia, yksittäisten palvelimien kiintolevyille ei voi kirjoittaa paljoakaan dataa. Siksi on oletettava, että suurin osa Googlen indeksistä sijaitsee käytännössä muistissa. Tai ainakin käyttäjille tarjottavat osat.
kun seuraavan kerran teet haun, katso, kuinka nopeasti Google palauttaa tulokset. Etsin ”serach engine” (olen tarkoituksellisesti väärin kirjoitettu se) ja se palasi 68,900 tuloksia. Lisäksi Moottori palautti sponsoroituja tuloksia sivun toiselle puolelle sekä oikeinkirjoitusehdotuksen. Kaikki 0,36 sekunnissa.
ja suosituissa kyselyissä moottori on vielä nopeampi. Esimerkiksi Hurricane Kathrinan tai MTV Awardsin hakuihin (molemmat viimeaikaiset tapahtumat) meni vähemmän kuin .2 sekuntia kullekin.
ja Google on kuuluisa hajauttamisesta ja irtisanomisesta. Jokaista välimuistissa olevaa sivua kohti on todennäköisesti tallennettu 2-3 kappaletta, ehkä jopa enemmän. Google jakaa indeksin hyvin pieniin osiin-niin pieniin kuin 2 megatavun kappaleisiin, ja kuten aiemmin mainitsin, nämä 2 megatavun osiot tallennetaan kaikkialle Googlen infrastruktuuriin. Kukin 2 megatavun osio voidaan tallentaa toisiinsa liittymättömän osan viereen. Esimerkiksi lemmikkisivuston sivuja voi olla blogin sivujen vieressä, verkkokauppasivuston sivujen vieressä.
vaikka kukin tietokeskus toimii toisistaan riippumatta, tehtävät ovat todennäköisesti osittain päällekkäisiä.
Kuvittele huone, jossa tuhannet tietokoneet pyörivät yksiäänisesti keskenään. Kuvitelkaa, että sama huone kopioitiin yhä uudelleen kaikkiin muihin datakeskuksiin ympäri Pohjois-Amerikkaa.
juuri näiden eri datakeskusten ansiosta, jotka toimivat kukin erikseen, mutta samalla päämäärällä, koimme ”Google Dancen” kuukausittain. Google Dance oli se ajanjakso, jolloin Google päivitti hakutuloksiaan eri datakeskuksissa. Lisäksi jokainen datakeskus päivittyisi itse, joten sivut, jotka ovat saattaneet olla sijalla #1 yhdessä datakeskuksessa, eivät ehkä ole ilmestyneet 30 parhaan joukkoon muissa datakeskuksissa.
tietenkin tekijät, joita Google on käyttänyt sivujen sijoittamiseen, ovat muuttuneet ajan myötä. He painottavat PageRankia vähemmän, mutta se on silti tärkeä. On tärkeää huomata, että liikkuvat eri tekijät noin sisällä laskelma voi suuresti vaikuttaa sivuston rankingissa. Esimerkiksi, jos sivustolla on korkea PageRank, mutta alhainen avainsanan tiheys, se voi olla sijalla #1, Jos PageRank vaikuttaa laskemiseen myöhemmin, mutta sivusto voi kadota tuloksista, jos PageRank katsotaan aikaisemmin.
ja näin todennäköisesti tapahtuu nytkin – Google on käytännössä siirtänyt PageRank-kertoimen jonnekin muualle lopullisessa laskelmassa. Muista, että rankingiin vaikuttaa todennäköisesti satoja tekijöitä. Järjestämällä uudelleen, missä järjestyksessä niitä sovelletaan lopulliseen rankingissa voi olla dramaattinen vaikutus kokonaissijoitukseen hakutulossivulla.
Google näyttää myös siirtyneen kerran kuukaudessa päivitettävästä indeksistä pysyvämpään indeksiin. Huomaamme muutokset vain harvoin, mutta ne tapahtuvat yhä suuremmalla tasolla, ja suurempia päivityksiä tapahtuu harvemmin.
Kai Googlea voisi tarkastella sarjana kerroksia – jokainen kerros rakentuu kerroksen aiemmin tekemälle työlle. Ylimmäinen kerros on ainoa, jolle altistumme selaimen kautta, mutta kyseinen sivu, jonka näet, ei olisi olemassa ilman alempien kerrosten tekemää työtä.
nyt katsotaan Yahoota
Yahoo! – Vaikka kukaan muu kuin Yahoo!s insinöörit tietävät varmasti, voimme spekuloida, että Yahoo! hakutekniikka toimii hyvin samalla tavalla kuin Googlen
the reason Yahoo! on niin vaikea mitata on, koska he eivät ole todella rakennettu hakukoneen maasta ylöspäin kuten Google tai MSN. Tietenkin Yahoo! haku näet on ainutlaatuinen itselleen, kuitenkin Yahoo! on rakentanut hakunsa muiden aiempina vuosina ostamiensa teknologioiden varaan.
oli juuri joulun tienoilla 2002, kun Yahoo! ostettu hakupalvelu Inktomi. Siihen asti Yahoo! olivat saaneet hakutuloksensa joko Inktomi tai viime aikoina Google. Itse asiassa, asti kun he ostivat Inktomi oli spekulointia, että Yahoo! ostaisi Googlen.
vain muutama kuukausi tämän jälkeen Overture (pay-per-click – mainosyritys) osti Altavista-yhden ensimmäisistä ja vahvimmista hakukoneista. Sitten, vain muutama viikko sen jälkeen alkusoitto ostettu Alltheweb.com fastilta.
oli selvää, että alkusoitto siirtyisi algoritmiseen hakuavaruuteen.
mutta pian tämän jälkeen alkoi jyrinä, että Yahoo! voi olla kiinnostunut ostamaan joitakin tai kaikki Overture n teknologiaa. Ja heinäkuussa 2003 Yahoo! ostin alkusoittoa.
Yahoo! haku helmikuuhun 2004 asti-silloin yhtiö lanseerasi oman versionsa algoritmisesta hausta. Eikä se ollut sitä, mitä moni odotti. Jotkut ajattelivat, että he yksinkertaisesti rebrand Inktomi, kun taas toiset ajattelivat he rebrand yksi alkusoitto ostot ja kääntää joko Altavista tai Alltheweb haku Yahoo! etsiä.
mutta niin ei käynyt. Jihuu! rakensivat oman hakunsa ja kokosivat ominaisuuksia omistamastaan teknologiasta.
heillä oli supernopeat Inktomi-ja Altavista-ryömijät sekä yllättävän hyvät Alltheweb-ja Altavista-ranking-algoritmit. Joten he muussasivat kaiken yhdessä saadakseen Yahoo! Etsiä.
Yahoo! Haku ei ole paljon erilainen kuin Google. Heidän oma sivusto kertoo, että he analysoivat sivuja käyttäen monia tekijöitä määrittääkseen hakukyselyn relevanssin, ja tämän analyysin tulokset ovat mitä käyttäjä näkee suorittaessaan kyselyn.
tietenkin Yahoo! kuten kaikki muut moottorit, on viettänyt viime vuoden tai enemmän työtä parantaa sijoitusta algoritmeja. Kun he ensimmäisen kerran tuli ulos, näytti siltä, että he asettavat paljon painoa kotisivun tietyn sivuston, vähemmän painoa saapuvia linkkejä,tai jopa muiden sivujen.
viime kuukausien aikana olemme kuitenkin huomanneet hienoisen siirtymisen pelkän kotisivun rankingista useiden sivujen rankingiin, jossa Kotisivu kerran sijoittui.
lisäksi niillä on tapana sijoittaa saapuvia linkkejä eri tavalla kuin Googlella. Kun teet linkin tarkistaa Google ja sama tarkistaa Yahoo! Googlen tulokset ovat lähes aina heikompia. Googlen mukaan tämä johtuu siitä, että ne näyttävät vain tilannekuvan ”asiaankuuluvista” linkeistä, kun taas Yahoo! näyttää ne kaikki oleellisuudesta riippumatta.
ja muitakin eroja on, mutta tässä artikkelissa on liikaa läpikäytäväksi.
riittää sanoa, että Google ja Yahoo! käytä suurin piirtein samaa teknologiaa palauttaaksesi samanlaisia tuloksia. Myönnettäköön näet eroja rankingissa, mutta tämä johtuu monista asioista. Esimerkiksi Yahoo! näyttää päivittävän harvemmin kuin Google. Olen työskennellyt sivustoja, jotka ovat uusia sivuja indeksoitu ja ranking Google muutamassa päivässä luomisen ja joskus se voi kestää kuukausia Yahoo! tehdä samoin.
pohjimmiltaan mitä sanon on tämä: jos kaikki olet huolissaan on sijoitus – sitten optimoimalla Google saat kunnon rankingissa Yahoo! mutta se voi vain kestää kauemmin voit näy Yahoo! hakutulos. Tämä johtuu siitä, lopulta, teknologia takana sekä Yahoo! ja Google on hyvin samanlainen.
huomenna esittelen kuitenkin kaksi ainutlaatuista moottoria. Joka väittää käyttävänsä Neuroverkkoteknologiaa ja joka käyttää yhteisöllisyyttä rankinginsa pohjana.