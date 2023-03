De Vlaamse televisiezenders maken meer videocontent dan ooit. In alle mogelijke formaten. Al die video’s van ondertitels voorzien is onbegonnen werk voor de ondertitelaars van dienst. Een grootschalig proefproject rond artificiële intelligentie en automatische ondertiteling moet hen voor een burn-out behoeden.

GoPlay, VTM GO, VRT MAX. Elke zendergroep die zichzelf au sérieux neemt heeft tegenwoordig zijn eigen online platform. En daarop wordt volop geëxperimenteerd. Korte video’s die vooral jongere kijkers moeten aanspreken, livestreams voor de nieuwsjunkies onder ons, of behind-the-scenesvideo’s gelinkt aan populaire lineaire titels. Het zorgt voor een gigantische toename van de hoeveelheid videomateriaal. Materiaal waarmee je als zender een zo breed mogelijk publiek wil bereiken. En dan is ondertiteling een handig hulpmiddel om ook doven en oudere – soms slechthorende – kijkers aan te spreken.

Bovendien wil mediaminister Benjamin Dalle (cd&v) dat meer programma’s toegankelijk worden voor mensen met een handicap. Zo moet elke zender met een marktaandeel van meer dan 2 procent voortaan 40 procent van de programma’s die uitgezonden worden tussen 13 en 24 uur van ondertitels voorzien, ook wanneer die programma’s online worden aangeboden.

Die combinatie zorgt voor ongeziene werkdruk bij ondertitelaars en financiële zorgen bij de zenders. Al dat videomateriaal manueel laten ondertitelen kost die laatste immers handenvol geld. Daarom sloegen de drie grote zendergroepen – VRT, DPG Media en Play Media – de handen ineen. Zij zetten, met de steun van de Vlaamse regering die daar 500.000 euro voor uittrekt, een proefproject op poten dat tegen eind 2024 een automatisch ondertitelingssysteem moet opleveren.

Dat door AI gestuurde systeem moet in eerste instantie vooral livestreams en korte online video’s van ondertitels voorzien. Daarna kan het ook uitgerold worden naar de lineaire programmatie.

Niet accuraat

Niet dat ze daarmee het warm water weer uitvinden, geeft VRT-projectmanager Karim Dahdah toe. “Die systemen bestaan al. Je kunt Zoom-calls laten ondertitelen en ook op YouTube heb je een knop die ondertitels toevoegt aan de video’s die je bekijkt. Maar wie die bewuste knop tijdens het bekijken van een Nederlandstalige video al eens heeft aangeklikt weet meteen waar het schoentje knelt. Echt accuraat kun je de ondertitels die dan in beeld verschijnen niet noemen.”

Een taalprobleem zo blijkt. Bedrijven zoals Alphabet, eigenaar van YouTube, en Microsoft die in dat soort systemen investeren leggen zich daarbij in eerste instantie toe op de grote wereldtalen. Kwestie van hun producten zo breed mogelijk aan de man te kunnen brengen. Logisch dus dat Nederlands, dat amper in een handvol landen gesproken wordt, helemaal onderaan de prioriteitenlijst bengelt. Met een hele reeks foute ondertitels tot gevolg.

Om dat te verhelpen werken Dahdah en zijn team sinds begin dit jaar aan een Vlaams taalmodel. Wat er concreet op neerkomt dat ze een massa correct ondertitelde oude programma’s aan het AI-systeem voeden om het zo te leren om bepaalde klanken correct aan bepaalde woorden te linken. Al klinkt dat net iets simpeler dan het in de praktijk blijkt te zijn.

Denk bijvoorbeeld maar aan de verschillende accenten. Wanneer een Limburger het woord ‘goud’ in de mond neemt zal dat behoorlijk anders klinken dan wanneer een West-Vlaming dat doet. En toch is het de bedoeling dat in beide gevallen ‘goud’ in de ondertiteling verschijnt.

“Het is ook voor ons nog koffiedik kijken of we het systeem zover zullen krijgen”, geeft Dahdah toe. “Het helpt dat er al soortgelijke systemen zijn in andere talen. Ook bij France Télévisions bijvoorbeeld of de Stichting Nederlandse Publieke Omroep wordt met automatische ondertiteling geëxperimenteerd. De taalbasis die zij gebruiken is uiteraard anders, maar we kunnen wel leren van de software die er achter hun systemen zit.”

Tegenstrijdig genoeg is ook de kwaliteit van het werk van de ondertitelaars een probleem. “Professionele ondertiteling bestaat uit grammaticaal correcte volzinnen”, legt Dahdah uit. “Wat betekent dat de tekst die je ziet verschijnen niet automatisch honderd procent gelijkloopt met wat je hoort. Dat maakt het voor ons systeem moeilijk om audio en tekst met elkaar te linken.”

Korter op de bal

Wanneer het systeem eind 2024 op punt staat zullen we als kijker niet alleen bij meer programma’s de ondertiteling kunnen aanzetten. Het is ook de bedoeling om bij live-uitzendingen korter op de bal te spelen dan dat nu het geval is. “Al stoot zelfs AI wat dat betreft op zijn grenzen”, waarschuwt Dahdah. “Spreektaal verschilt nu eenmaal van schrijftaal. Je kunt niet zomaar alles wat iemand zegt meteen in de ondertitels zetten, het vraagt een beetje tijd om dat in een correcte zin te gieten.”

De vertraging die dat oplevert is momenteel onderwerp van onderzoek. Via gesprekken met kijkers, die voorbeelden te zien en te horen krijgen, wordt gepolst hoe groot die vertraging maximaal mag zijn voor mensen afhaken. Daar wordt het systeem dan op afgesteld.

En de manuele ondertitelaars? Worden zij een van de eerste beroepscategorieën die hun job aan AI zullen verliezen? Zo’n vaart zal het volgens Dahdah niet lopen. “De automatische ondertiteling zal vooral online en voor kortere of livevideo’s gebruikt worden. Wanneer ze zich daar niet meer mee bezig hoeven te houden blijft er voor de menselijke ondertitelaars meer tijd over om zich te focussen op de grotere projecten van de zender. Zodat die van nog betere ondertitels worden voorzien.”