A Google másodpercenként több mint 60 ezer kérést szolgál ki, akár emberi hang alapján, gépi tanulással javítva az eredményeket.
Az út 1990-ben kezdődött, akkor jelent meg az interneten az első kereső, az Archie Query Form. A világháló történetét bemutató sorozatunkban megemlékeztünk már a két távoli számítógép közötti első összeköttetésről, az első emailről, vírusról, spamről és domainről. Ezúttal a keresők történetét vesszük górcső alá, ugyanis jó néhány versenyző próbálkozott ezen a pályán a Google előtt.
A színes, böngészhető, kereszthivatkozásokkal ellátott weboldalak megjelenése előtt még más típusú tartalmak, szolgáltatások uralták az internetet. Ilyen volt például a fájlmegosztás őse, az FTP archívumok világa. Az Archie név éppen az „archive” kifejezés lerövidítésével jött létre.
Archie, a prototípus
A kereső ötlete akkor született meg, amikor 1987-ben a McGill University School of Computer Science számítógépes hálózata rácsatlakozott az internetre. Ekkor készítette el Alan Emtage, az egyetem egyik diákja az Archie első változatát, ami havonta felvette a kapcsolatot a publikus FTP archívumokkal, majd lekérte és eltárolta az elérhető fájlok listáját. A listában az egyetemi rendszeren belül egy parancs kiadásával lehetett keresni. A cél az volt, hogy az egyetemi kutatók könnyebben megtalálják és elérjék az interneten halmozódó tudást, a munkájukhoz szükséges tartalmakat.
Ezután Peter Deutsch, az egyetem rendszergazdája, és Bill Heelan a Concordia University hallgatója is beszállt a fejlesztésbe. Következő lépésben a programozók lehetővé tették, hogy érdeklődők Telnet protokoll segítségével bejelentkezhessenek az archie.mcgill.ca címen elérhető gépre, és keressenek az egyre terebélyesedő adatbázisukban. Később a rendszer hatékonyabb backendet és frontendet kapott, majd helyi eszközből hálózati szolgáltatássá vált, és a kereséseket már több, különböző helyeken működő szerver szolgálta ki. Végül pedig Archie a World Wide Weben is elérhető lett. Aranykorában Montreal internetes forgalmának felét ez a szolgáltatás generálta. A keresőt egyfajta mementóként ma is fenntartja egy lengyel egyetem.
Archie internetes debütálásakor 1990-et írtunk. Vagyis az első kereső abban az évben született, amikor:
|
Az ezt követő években gombamódra szaporodtak a keresőszolgáltatások, amelyek eltérő megoldásokat használtak: például a webszervereket listázták, fájlneveket és weboldalak fejlécéből nyerhető információt tároltak. A legtöbb esetben a címszöveg betű szerinti ismerete nélkül lehetetlen volt bármit is megtalálni. 1993-ban már az URL-ek tárolása is megjelent, de a megtalálás sorrendjében, mindenféle rangsor nélkül.
Az 1994-ben debütált Infoseek volt az első szolgáltatás, amelynek adatbázisába maguk a rendszergazdák vihették fel a weboldaluk adatait. Ugyanebben az évben indult útjára a Yahoo! Search, amely kézzel épített linkgyűjteményként indult, majd kereshető adatbázissá nőtte ki magát.
A WebCrawler volt az első kereső, ami teljes weboldalakat indexelt, és annyira népszerű lett, hogy napközben szinte lehetetlen volt használni.
A mai keresőmotorok szoftveres robotjai módszeresen böngészik a webet, és a megtalált oldalakat címek, fejlécek, tartalom és más specifikus elemek alapját indexelik, és ezeket az információkat saját adatbázisukban tárolják. Amikor egy felhasználó keresőszavakat küld ebbe az adatbázisba, akkor a rendszer válaszként egy rangsorolt találati listát küld vissza, amelynél a sorrendet számos tényező határozza meg – például megbízhatóság, relevancia vagy éppen az adott oldal technikai megfelelősége. |
A szintén 1994-ben bevezetett Lycos 54 ezer dokumentumot katalogizált, ami még az indulás évében 394 ezerre, 1995-re 1,5 millióra, 1996-ra pedig 60 millióra nőtt. Ráadásul a keresett kifejezéseket előtaggal kiegészítve, illetve szóhasonlóság alapján is megtalálta, és az eredményeket relevancia alapján rangsorolva tudta kiadni. Az 1995-ben elérhetővé vált LookSmartnál azt is meg lehetett adni, hogy mely kifejezések ne forduljanak elő a találatok között.
Az 1995-ös év nagy nevei közé tartott még az Excite és az AltaVista. Ez utóbbi számos forradalmi újítást vezetett be, például korlátlan sávszélességgel fogadta a keresőket, és természetes szövegeket, vagyis akár kerek mondatokat is lehetett keresőszövegként használni. Eközben a WebCrawlert felvásárolta az AOL, a Netscape webböngészőben pedig az Infoseek lett az alapértelmezett kereső.
1998-ben debütált a neten a Google és az MSN Search – ez utóbbit 2009-ben nevezték át Bingre.
Ma már a keresések több mint 90%-át a Google bonyolítja le. A SearchEngineLand adatai szerint egy átlagember napi 3-4 keresést indít a keresőóriásnál, ami 3,8 millió keresés percenként, 228 millió óránként, 5,47 milliárd naponta és közel 2 trillió keresés évente. A Google mintegy 200 szempontot vesz figyelembe, mielőtt egy adott keresésre kiadja a legjobbnak ítélt találati listát.
Kapcsolódó
A világ legmenőbb szerverparkjai
Miközben teljesen természetesnek vesszük, hogy az adatainkat és a legkülönfélébb szolgáltatásokat bármikor és bárhonnan elérhetjük a felhő segítségével, nem feltétlenül gondolunk bele, milyen grandiózus technikai megoldásokra van szükség a háttérben ahhoz, hogy mindez zökkenőmentesen működjön 4 milliárd internetfelhasználó számára.