Zondag 29/11/2020

Facebook vervangtenquêtes en peilingen

Waarom zou je als socioloog of psycholoog nog op een klassieke manier aan kwantitatief onderzoek doen? De hele wereld zet zijn zielenroerselen immers zonder aarzelen op het internet.

Het blijft een beeld dat de sociale psychologie tot in lengte der dagen zal blijven achtervolgen: Diederik Stapel, een sjoemelende Nederlandse hoogleraar, die in zijn auto zakjes met M&M's leeg eet die hij had gekocht voor proefpersonen aan een experiment dat hij niet zou uitvoeren. Stapel beschrijft het tafereel in zijn pas verschenen boek.

Altijd onderweg - dat is het lot van de menswetenschapper. Hij moet de paden op, de lanen in, om zijn onderzoeksobjecten het hemd van het lijf te vragen. Of het nu gaat om het welzijn van het individu of het humeur van een heel land, met interviews en enquêtes moeten de psycholoog en de socioloog de waarheid boven water krijgen.

Maar het kan ook anders.

Cameron Marlow, socioloog in Californië, hoeft de deur niet uit en laat zelfs de telefoon op de haak. Toch kan hij beschikken over een panel van maar liefst een miljard proefpersonen. Die verblijven binnen en buiten de Verenigde Staten, en wat helemaal geweldig is: in veel gevallen hebben ze hun hele hebben en houden al voor Marlow geopenbaard. Zonder dat de onderzoeker ze daarom hoeft te vragen.

Marlow staat aan het hoofd van het Data Science Team van Facebook, het grootste sociale netwerk op internet. Technology Review, het huisorgaan van het Massachusetts Institute of Technology (MIT), omschreef de twaalfkoppige onderzoeksgroep afgelopen zomer als "een soort van Bell Labs in het tijdperk van de sociale netwerken". De Bell-laboratoria van het telefoonbedrijf AT&T vormden decennialang een van de belangrijkste broedkamers voor nieuwe technologie.

Marlow en zijn mannen vinden geen laserlicht uit of een nieuwe transistor. Ze passen wiskunde, programmeerkennis en sociale wetenschap toe om nieuwe inzichten te verkrijgen uit de zee van gegevens die op Facebook staat opgeslagen.

Al twee jaar geleden, toen het Data Science Team net was gevormd, zetten de onderzoekers de 'Index van algemeen nationaal geluk' online. Het is een barometer waarop het welbevinden van een land is af te lezen. De index wordt voortdurend berekend op basis van de verhouding tussen positieve en negatieve woorden die bezoekers gebruiken.

Facebook blijkt niet de enige onlinebron voor wetenschappelijk speurwerk. In 2010 werden niet één maar twee nieuwe instrumenten geïntroduceerd om de verspreiding van griep in kaart te brengen. Zoekmachine Google had ontdekt dat bepaalde zoektermen een goede indicatie zijn voor hoe snel een influenzavirus om zich heen grijpt. Het internetbedrijf bracht 'Grieptrends' uit, een pagina waarop de griepactiviteit op elk moment kan worden bekeken.

Grieptweets

Een tweede bruikbare griepmeter bleek verborgen in Twitter. Onderzoekers van de Southeastern Louisiana University analyseerden een half miljard tweets en konden zo de verspreiding van het griepvirus achterhalen en zelfs voorspellen. "Deze benadering is goedkoper en sneller dan duizenden ziekenhuizen en medische centra elke week formulieren te laten invullen", zegt computerwetenschapper Aron Culotta. De bevindingen van zijn onderzoeksgroep kwamen voor 95 procent overeen met de landelijke statistieken van het Center for Disease Control (CDC).

Onderzoekers van Johns Hopkins Hospital noemden begin dit jaar in een studie de griepbarometer van Google "een krachtig, vroegtijdig alarmsysteem" voor ziekenhuizen. Die conclusie trokken de wetenschappers nadat zij 21 maanden lang de grieptrends van de zoekmachine naast de statistieken van hun ziekenhuis in Baltimore hadden gelegd.

Twitterberichten blijken ook een goede graadmeter voor het voorspellen van de effectenhandel. Onderzoekers van de Indiana University joegen 9,8 miljoen berichten van 2,7 miljoen microbloggers door de computer om te zien of er een verband was tussen de stemming van het publiek en de slotwaarden van de Dow Jones Index.

Zie daar: over een periode van tien maanden bleek de software het beurssentiment in 87,6 procent van de gevallen juist te beoordelen, drie tot vier dagen voor de 'Dow' daalde of steeg. "Dat was verrassend, omdat we dachten dat de stemming de index zou volgen - namelijk dat als de Dow stijgt mensen blij zijn, en als de index daalt, de mensen droef", zegt Johan Bollen, universitair hoofddocent.

Niet elke poging tot datamining, het doorploegen van bergen aan gegevens op zoek naar patronen, leidt tot klinkende resultaten. In 2010 dachten Sitaram Asur en Bernardo Huberman van HP Labs in Palo Alto dat ze aan de hand van tweets konden voorspellen of een film in de bioscoop zou aanslaan of floppen.

Hun studie werd eerder dit jaar gekielhaald door twee onderzoekers van Princeton University. Zij toonden aan dat filmbazen zich maar niet moesten blindstaren op de jubel of de toorn van de twitterati. Zo blijken de microbloggers een film vaker gunstig dan ongunstig te beoordelen. Een lawine aan loftuitingen blijkt lang niet steevast tot uiting te komen in meer verkochte kaartjes aan de bioscoopkassa.

Stok in een mierennest

Niettemin zien wetenschappers wel brood in dit nieuwe onderzoeksinstrument. "Het heeft op papier veel potentie in zich om sociale bewegingen te kunnen volgen", zegt Vincent Buskens, hoogleraar theoretische sociologie aan de Universiteit Utrecht. Er komt volgens hem wel veel kijken bij het ontrafelen van gegevens uit sociale netwerken. "Je krijgt het niet zomaar op je bord. Je moet bedrijven zo ver krijgen dat ze de gegevens afstaan. Het gaat om grote hoeveelheden data, die een speciale software en hardware vereisen om te ontsluiten. Die is kostbaar."

Een ander probleem is de vraag of je met Facebook of Twitter een goede dwarsdoorsnede hebt van een land, een bevolking of zelfs maar een beperkt deel daarvan. "Bij Facebook kun je je nog het best richten op een specifieke groep mensen", vindt Buskens. "Bij Twitter weet je nog slechter wie er achter al die berichten zit."

Het Data Science Team van Cameron Marlow in Californië probeert er tot nu toe vooral achter te komen hoe relaties binnen Facebook werken. Zoals een bioloog een stok steekt in een mierennest om te zien hoe de beestjes reageren, zo experimenteren de wetenschappers met de reacties van een miljard gebruikers. Marlow en twee externe geleerden besloten bijvoorbeeld vorig jaar na te gaan wat er klopt van de gangbare sociologische theorie dat aanstekelijke nieuwe ideeën zich verspreiden als een besmettelijke ziekte: hoe meer mensen om ons heen er aan doen, des te groter de kans dat we zelf ook aanhaken.

Belangrijke zwakke banden

De onderzoekers onthielden een kwart miljard gebruikers de verwijzingen die vrienden op hun profielpagina deelden - 219 miljoen aanbevelingen gingen zo de mist in. Zo konden ze nagaan hoe vaak mensen dezelfde informatie aanprijzen omdat ze dezelfde interesses en informatie hebben. Uit de studie bleek dat gebruikers de aanbevelingen van vrienden en bekenden in hoge mate waarderen, maar dat hun invloed veel kleiner is dan de collectieve inbreng van contacten die veel verder van hen afstaan - wat sociologen de 'zwakke banden' noemen. Dat totaal aan zwakke banden bepaalt veel sterker welke informatie we tot ons nemen.

Het is niet zo gek dat een amper acht jaar oud bedrijf een groep academici loslaat op zijn kroonjuwelen, zegt Marlow in Technology Review. "Facebook staat voor dezelfde grote uitdagingen als de sociale wetenschap." Met één verschil: Facebook, met een omzet van 2,84 miljard euro, kan zich heel wat M&M's veroorloven.

VERTRAGING? TWITTEREN GRAAG

Bedrijven die nieuwsgierig zijn naar wat consumenten bezighoudt, kunnen bij IBM een sentimentmeter huren. Onderzoekers ontwikkelden software die op elk moment de actuele berichten van sociale media als Twitter en Facebook ontleedt om de stemming in kaart te brengen. Een studie van tweets leerde IBM dat elke seconde tien berichten de koffieketen Starbucks vermelden. IBM kan met Twitter vertragingen op vliegvelden voorspellen. De software pikt de tweets eruit waarin gebruikers een luchthaven vermelden en vraagt hen de wachttijden terug te twitteren.

Meer over

Nu belangrijker dan ooit: steun kwaliteitsjournalistiek.

Neem een abonnement op De Morgen


Op alle artikelen, foto's en video's op demorgen.be rust auteursrecht. Deeplinken kan, maar dan zonder dat onze content in een nieuw frame op uw website verschijnt. Graag enkel de titel van onze website en de titel van het artikel vermelden in de link. Indien u teksten, foto's of video's op een andere manier wenst over te nemen, mail dan naar info@demorgen.be.
DPG Media nv – Mediaplein 1, 2018 Antwerpen – RPR Antwerpen nr. 0432.306.234