Celkom zaujímavá situácia nastala na poli internetových vyhľadávačov. Analýza Google ukázala, že Bing má podozrivo podobné výsledky.
Reklama tvorí pre Google asi najväčší zdroj príjmov. Túto reklamu nám užívateľom podsúva nevtieravým a inteligentným spôsobom, pri vyhľadávaní cez hlavnú stránku google.com. Úspech teda priamo závisí od toho, ako veľa budú ľudia službu používať. Dvaja zakladatelia Larry Page a Sergey Brin vytvorili pokrokový algoritmus Page Rank, ktorý robí výsledky skutočne relevantné, pričom sa stále vylepšuje a dopĺňa o nové aspekty. Existuje však aj konkurencia, ktorá môže z tohto reklamného koláča ukrajovať. Kým však konkurencia zaostáva v tom hlavnom – relevantnosti výsledkov, nie je to pre Google až taká hrozba. Čo ak však začnú byť výsledky vyhľadávania iného nástroja podozrivo podobné?
Niečo takéto si v Google začali všímať začiatkom minulého roka na vyhľadávači Bing, ktorý má na starosti Microsoft. Nezvyčajne podobné výsledky v najvyšších miestach (prvých pár najviac relevantných, ktoré sa zobrazia na vrchu stránky) naznačovali, že niečo sa deje na pozadí. Samozrejme, je tu možnosť že algoritmy Microsoftu vyhodnotili relevantnosť podobne ako tie od Google. Je tu ale niekoľko ALE, ktoré prinútili Google na hlbšiu analýzu problému.
Google má, ako už všetci poznáme, schopnosť opraviť, resp. navrhnúť opravu slova, v ktorom sme spravili preklep. V akcii to vyzerá asi takto:
Prvé podozrenia sa objavili vtedy, keď Bing správne našiel požadované výsledky pre zle zadané slovo aj bez toho, aby sa použila nejaká funkcia korekcie. Kým Google preklep užívateľa opravil a vyhľadal podľa správneho slova, Bing vykazoval dobré výsledky hneď, bez toho aby slovo potreboval opraviť.
Uveďme si príklad z článku na serveri SearchEngineLand:
Slovo torsaraphy opravené na tarsorrhaphy v Google, prvá stránka odkaz na Wikipediu
Slovo torsaraphy bez akejkoľvek opravy, ale so správnym hľadaním a rovnakým výsledkom ako má Googlena prvom mieste.
Ako vedel Bing, že sa hľadá iné ako zadané slovo, bez korekcie preklepov? Keď sa začali objavovať rovnaké výsledky hľadania na zle zadané slová, prinútilo to inžinierov v Google sledovať situáciu pozornejšie.
Neskôr, asi od októbra 2010, sa začali výsledky z oboch vyhľadávačov na najvyšších miestach oveľa viac prekrývať ako v minulých mesiacoch. Stáva sa, že Bing má takmer totožné prvé stránky hľadaní, ako Google. Vtedy sa už tušilo, že Microsoft musí nejakým spôsobom „kopírovať“ postupy Google.
Otázka znela, ako by to bolo možné robiť? Microsoft musel sledovať, ako ľudia vyhľadávajú cez Google a tieto informácie potom využívať pre vylepšenie svojho vlastného nástroja Bing. Túto teóriu bolo treba overiť.
Tu Google pristúpil k niečomu, o čom hovorí že nikdy predtým nerobil, a ani v budúcnosti robiť nebude – vedome a schválne upravil hodnotenie stránky tak, aby sa pri hľadaní určitého slova ostala na prvé miesto. Obišiel sa tak celý algoritmus Page Rank. Vytvorilo sa asi 100 „syntetických“ hľadaní, ktoré by v normálnom stave nevyprodukovali žiadne, alebo len minimálne výsledky. Išlo o dlhé zhluky písmen, niečo, čo by bežný užívateľ zadával len málo pravdepodobne. Ku týmto slovám sa potom priradili stránky, ktoré sa dostali na prvé miesto. Išlo o akési „návnady“, žiaden algoritmus nemal dôvod vyhodnotiť ich ako relevantné vzhľadom k vyhľadávaným slovám.
Ak by sa teraz začali objavovať rovnaké výsledky hľadania na Bing, znamenalo by to že ten k tomuto dospel kopírovaním výsledkov Google.
Keďže prvotné podozrenie padlo na to, že Microsoft „špehuje“ užívateľov cez prehliadač Internet Explorer, jeho funkcie a prídavný Bing Toolbar, nakázal asi dvadsiatke svojich vývojárov spraviť testy. Z domácich počítačov v priebehu niekoľkých dní pravidelne hľadali určené slová cez Google, pričom používali Internet Explorer so zapnutou funkciou „Navrhované lokality“ a Bing Toolbar-om. V prípade „špehovania“ cez tieto nástroje by sa mali umelo vytvorené výsledky hľadania neskôr objaviť na prvých miestach aj na vyhľadávači Bing. Pritom neexistovalo žiadne logické spojenie medzi hľadaným slovom a nájdenou stránkou.
Čo sa predpokladalo, to sa aj potvrdilo. Experiment začal 17. Decembra, na konci mesiaca sa už niektoré výsledky začali objavovať aj na Bing-u.
Niekoľko príkladov takýchto zhôd:
Slovo hiybbprqag cez Google
Rovnaký výsledok cez Bing
Slovo mbzrxpgjys cez Google
Rovnaký výsledok cez Bing
Pred začatím testu by oba vyhľadávače nenašli na tieto slová takmer nič. Potom Google manuálne priradil bez akejkoľvek súvislosti vlastné stránky a o pár dní začal rovnaké výsledky generovať aj Bing. Je zjavné, že sa celkom dobre „priúčal“.
Následné rozhorčenie Google je zrejmé – niekto sa na jeho výsledkoch a algoritmoch iba „zvezie“ a vylepšuje si tým svoj vlastný produkt. Otázka znie – je to nelegálne? Nemá byť prečo. Google o nič neprichádza ani mu nebola spravená žiadna škoda (priama). A čo s tým, že Microsoft sleduje správanie svojich užívateľov na webe? Taktiež to nie je problém, Internet Explorer, funkcia Navrhované lokality aj Bing Toolbar dávajú užívateľovi vedieť, že sa budú odosielať nejaké tie anonymné údaje Microsoftu o tom, ako surfuje. Samozrejme všetko sa dá vypnúť, ale v základnom stave je toto zapnuté.
Jediné čo ostáva je fakt, že takéto funkcie boli nefér a v podstate podvádzaním. Bing zjavne využíva informácie o výsledkoch hľadania z Google ako jednu z mnoho metrík na vytvorenie relevantných výsledkov. V podstate teda ako keby využíval cudzie algoritmy.
Celá kauza je však viac-menej jednoducho vysvetliteľná. Z reakcie Microsoftu sa dá vyčítať takýto odkaz - pre hodnotenie stránok používame mnoho zdrojov a signálov, príznakov. Jedným z nich je aj to, že sa učíme od našich užívateľov.
V tomto učení od užívateľov sú potom samozrejme z časti zahrnuté aj hľadania cez Google. Prístup sledovania činnosti reálnych ľudí je samozrejme celkom účinnou metódou ako vylepšovať schopnosti vyhľadávania. To že sa pri tom použijú aj tie informácie, ktoré si užívateľ nájde cez iný prehliadač, je logickým dôsledkom. Následne sa situácia dá interpretovať aj ako „kopírovanie“, ak chcete.
Čo to však znamená pre nás užívateľov? Nie veľa. A ako tak pozerám štatistiky čitateľov PC.sk, takmer nič – Internet Explorer nepoužíva ani nie jedno percento z vás. A tí, čo tak robia, majú stále možnosť vypnúť funkcie, ktoré by odosielali informácie o vašom surfovaní či hľadaní cez Google Microsoftu. V konečnom dôsledku z tohto len získame. Vyhľadávače, nech už sa vylepšujú akokoľvek, budú vlastne produkovať čím ďalej, tým lepšie výsledky. A to je to, čo požadujeme. Marketingové vojny na pozadí sú však zaujímavou témou na sledovanie.
omega8
passco
landrower
faugusztin
passco
passco
Nameless
Ondro1
rado3105
AmOK