Maandag 24/01/2022

Waar de wereld naar op zoek is

Elke dag krijgen de drie grote zoekmachines op het internet zo'n 350 miljoen vragen binnen. Over de vraag wat er met die elektronische archieven kan gebeuren, maken steeds meer mensen zich zorgen.

Jennifer 8. Lee

In de lobby van het Californische hoofdkwartier van Google kijken de bezoekers als gehypnotiseerd naar de woorden die op de wand achter het bureau van de receptioniste voorbijglijden: "Animación japonese Harry Potter pensées et poèmes associação brasileira de normas técnicas." De projectie heet 'Live Query' en toont de trefwoorden die mensen overal ter wereld in de zoekmachine van Google intikken. De termen dansen over de muur in het Engels, Chinees, Spaans, Zweeds, Japans, Koreaans, Nederlands, Italiaans, alle 86 talen die Google gebruikt. Als je lang genoeg naar Live Query staart, voelt het alsof je het collectieve bewustzijn van de wereld aan het werk ziet. Elk trefwoord vertegenwoordigt een gedachte van iemand, ergens aan het andere einde van een internetverbinding. Google verzamelt alle opzoekingen - 150 miljoen per dag, uit meer dan 100 landen - in zijn databank.

En wat houdt de wereld bezig? Seks, natuurlijk. "Als je in de logs kijkt, leer je 'seks' in alle talen van de wereld zeggen", vertelt Craig Silverstein, directeur technologie van Google - om Live Query netjes te houden filtert Google alle opzoekingen in verband met seks weg, wat in de buitenlandse talen niet altijd lukt.

Ondanks haar geografische en etnische diversiteit denkt de wereld vaak aan dezelfde dingen. Van land tot land, van streek tot streek, van dag tot dag en zelfs van minuut tot minuut komen dezelfde thema's naar boven: beroemdheden, nieuws, producten en downloads. "Als je naar het zoekgedrag kijkt, is het verbazend hoe sterk mensen in de hele wereld op elkaar lijken", zegt Greg Rae, een van de drie leden van het logteam dat verantwoordelijk is voor de databank.

Weinigen staan erbij stil, maar alle zoekopdrachten worden ook opgeslagen. En ze vertellen het een en ander over degene die een search heeft gedaan. In veel gevallen bieden de gegevens waarover de drie zoekmachines beschikken een interessant beeld van de culturele veranderingen in de wereld. Dat bij Yahoo vorige week vooral werd gesurfd naar sites over rappers Eminem en Nelly Tupac is gewoon aardig om te weten, en wie zo'n muzikaal icoon heeft opgevraagd, zal daar geen problemen mee krijgen. Dat volgens de gegevens waarover Lycos beschikt Las Vegas de stad is waar het meest naar gezocht wordt, kan ook geen kwaad. Problematischer is dat de operatoren van die zoekmachines zich bewust zijn van de gigantische commerciële mogelijkheden die ze in hun archieven hebben. Zoals blijkt uit de slogan waarmee Yahoo reclame maakt voor zijn database Buzz Index: 'Dit kan het geduchtste wapen worden in uw marketingarsenaal, aangezien wij een uniek beeld kunnen geven van de trends en interesses van miljoenen mensen.' Een beeld dat geld waard is voor heel wat bedrijven.

De aanhangers van Google, de meest gebruikte zoekmachine, geven Greg Rae een beeld van de wereld op zijn scherm. Sinds oktober 2001 kent hij een massa vertalingen van miltvuur: Milzbrand (Duits), carbonchio (Italiaans), antrax (Spaans). Hij vertelt dat hij aan de frequentie van de opzoekingen kan zien welke landen hun recente verkiezingen ernstig hebben genomen (Brazilië en Duitsland).

Dankzij de mondialisering van de consumptiecultuur komen de populaire merken uit alle windstreken: Nokia, Sony, BMW, Ferrari, Ikea en Microsoft. Volgens de databank van Google slaan sommige sportevenementen zowat overal ter wereld aan: de Tour de France, Wimbledon, de Melbourne Cup (een paardenrace) en het WK voetbal zaten in de toptien van de sportopzoekingen van vorig jaar. Amerikaanse films, bands en sterren doen het ook overal goed.

Twee jaar geleden merkte een technicus van Google, Lucas Pereira, dat de opzoekingen naar Britney Spears afnamen, wat hij interpreteerde als een daling van haar populariteit. Uit die vaststelling ontstond 'Google Zeitgeist', een lijst van de trefwoorden die in een bepaalde week of maand het sterkst in opkomst of in verval zijn. Britney Spears is al zo lang een hit op het Internet, dat het logteam haar naam min of meer als maatstaf gebruikt. Van Britney hebben ze geleerd hoe een nieuwtje de opzoekingen kan doen pieken, zoals toen ze het uitmaakte met Justin Timberlake. De schokgolven van dergelijke incidentjes, maar ook van ernstige gebeurtenissen, zijn ogenblikkelijk op Google voelbaar.

De gevoelige culturele seismograaf van Google kan echter ook de triviaalste gebeurtenissen detecteren. Zo ontdekte het logteam op een ochtend dat "Carol Brady maiden name" (meisjesnaam Carol Brady) op de hitlijst was verschenen. Dat maakte hen nieuwsgierig. Ze analyseerden de opzoekingen volgens het tijdstip van de dag en vonden vijf duidelijke pieken: een hele grote, een kleine, nog een kleine, weer een grote en ten slotte, na een lange pauze, een hele kleine. Elke piek begon 48 minuten na het uur. De mensen van Google snapten er niets van. Carol Brady was de naam van een personage uit een Amerikaanse televisiereeks uit de jaren zeventig, The Brady Bunch. Waarom die belangstelling? De gegevens kunnen alleen patronen aanwijzen, zonder ze te verklaren. Dat is een paradox van het Google-log: het registreert niet de fenomenen zelf, maar alleen de schaduw die zij op het internet verspreiden.

"De interessantste vraag is het waarom", zegt Amit Patel, een gewezen lid van het logteam. "Je kunt pas interpreteren als je weet wat er allemaal in de wereld gaande is." Wat was er gaande op 22 april 2001? Die avond was de laatste vraag in de Amerikaanse versie van de quiz Wie wordt multimiljonair: "Wat was de meisjesnaam van Carol Brady?" Enkele seconden nadat presentator Regis Philbin de vraag had gesteld, haastten duizenden mensen zich naar Google om het antwoord (Tyler) op te zoeken. Telkens als het programma in een van de vier tijdzones van de Verenigde Staten werd uitgezonden, ontstond er een piek. En de vijfde en laatste? "Hawaï", zegt Patel.

Uit bezorgdheid over de privacy geeft Google buitenstaanders geen toegang tot de onbewerkte gegevens. De opzoekingen worden geregistreerd volgens tijd en datum, het ip-adres van de gebruiker (informatie die een opzoeking kan koppelen aan een specifieke computer) en de sites waarop wordt geklikt. Mensen vertellen zoekmachines dingen waarover ze in het openbaar nooit zouden spreken. Trefwoorden als Viagra, zwangerschapstest, fraude of facelift zeggen genoeg. Statistisch is dat onschuldige informatie, maar wanneer ze wordt teruggekoppeld naar een individu kan ze zijn privacy schenden.

Sinds kort is daar nog een ander privacyprobleem bijgekomen. De regering-Bush heeft, in de nasleep van 11 september, besloten een gigantische database samen te stellen waarmee terroristen gedentificeerd moeten worden. Dat 'Total Information and Awareness Programme' zal ook gaan graven in internetbestanden, kredietkaarten en medische dossiers. Hou daar dus rekening mee wanneer u, uit gewone wetenschappelijke nieuwsgierigheid natuurlijk, een woord als antrax opgeeft aan uw zoekmachine.

Operatoren zijn zich bewust van de gigantische commerciële macht die zij in hun archieven opslaan

Meer over

Nu belangrijker dan ooit: steun kwaliteitsjournalistiek.

Neem een abonnement op De Morgen


Op alle artikelen, foto's en video's op demorgen.be rust auteursrecht. Deeplinken kan, maar dan zonder dat onze content in een nieuw frame op uw website verschijnt. Graag enkel de titel van onze website en de titel van het artikel vermelden in de link. Indien u teksten, foto's of video's op een andere manier wenst over te nemen, mail dan naar info@demorgen.be.
DPG Media nv – Mediaplein 1, 2018 Antwerpen – RPR Antwerpen nr. 0432.306.234