Themadag Big Data: de moeizame dans tussen rechter en machine

Kunnen computers rechters vervangen? Of alleen ondersteunen? Over dit soort fundamentele en vragen ging de SSR-themadag Big(ger) Data – Minder(e) rechter?’ op 22 februari in Amsterdam. Met als resultaat een prikkelende confrontatie tussen rechter en computer, mens en machine. “De wereld is aan het veranderen. Kunt u dat tegenhouden?”

Big data

Heiligschennis

Hij werd nog net niet gelyncht, Jaap van den Herik, toen hij in zijn oratie als hoogleraar Informatica en Recht in Leiden beweerde dat rechters vervangen konden worden door computers. Tenminste, in bepaalde deelgebieden van het recht, zoals bijstandszaken. Het was 1991 en Internet stond nog in zijn kinderschoenen. “Het was een soort heiligschennis”, blikt Van den Herik met een glimlach terug. “Rechtspreken is zo’n complexe menselijke activiteit, daar kon een machine toch niet in de buurt komen?” 28 jaar later lopen er zorgrobots rond en maken advocatenkantoren op grote schaal gebruik van krachtige en verfijnde software om de procesgang te voorspellen. Toch is het idee dat computers een grote rol kunnen spelen bij het rechtspreken nog steeds niet geaccepteerd door veel professionals in de rechtspraak. Van den Herik beseft dat en zal vandaag voortdurend de olifant in de kamer benoemen: “Ik weet dat u uw twijfels heb, en ik zal u vandaag waarschijnlijk niet helemaal kunnen overtuigen. Het is ons doel dat u er meer open over gaat denken.”

Vernieuwers

Van den Herik is vandaag niet alleen op missie. Zijn medestrijder is Jan Scholtes – hoogleraar Text Mining aan de Universiteit van Maastricht en directeur van het softwarebedrijf Zylab. Dat bedrijf levert software aan onder meer het (voormalige) Joegoslavië-tribunaal. Scholtes neemt meer het ‘hands on’-deel van de training voor zijn rekening. Allebei zijn het vernieuwers, die ver voor de troepen vooruit lopen. Die veel van hun voorspellingen uit hebben zien komen. Gaan ze dit kritische publiek overtuigen?

Razend tempo

Eerst maar eens wat basics uitleggen. Niet iedere magistraat is immers even goed thuis in Artificial Intelligence (AI), de verzameling technieken waar het om draait bij Big Data in de praktijk van de rechtspraak. Zoals bijvoorbeeld machine learning, een zeer krachtig principe waarin programma’s zichzelf in razend tempo van alles kunnen leren. “Al dit soort technieken hebben een aantal grote voordelen vergeleken met de mens”, benadrukt Scholte herhaaldelijk. “Ze zijn veel vollediger, accurater, sneller en goedkoper. En werken 24-7 door.” Hij koppelt alledaagse voorbeelden aan mogelijke toepassingen in de rechtspraak: “Het mechanisme van aanbevelingen voor aanverwante films en muziek die je bij Netflix en Spotify gedaan worden, kun je ook gebruiken in de sfeer van jurisprudentie. Welke uitspraken passen bij de zaak waar het om gaat?”

Menselijke blik

Van den Herik legt zijn toeschouwers twee scenario’s voor: een gematigd en een revolutionair. In het gematigde scenario helpt technologie rechters om zaken op de traditionele manier te beoordelen. In het revolutionaire scenario gaat de techniek het werk van de rechters geheel autonoom overnemen. “De vraag is niet alleen of het kan, maar ook of de maatschappij het wil”, stelt hij. “Wat wilt u?”, vraagt hij de aanwezigen licht provocerend. “Ik kan me moeilijk voorstellen dat een machine alle rechtszaken kan dekken zonder dat daar een menselijke blik overheen gaat”, reageert iemand. “Ook ik zie scenario twee niet helemaal gebeuren”, vult een ander aan. “Wij werken in veel zaken met open normen, hoe gaat een computer daar mee om? En bovendien: “Een computer reproduceert alleen wat een mens erin stopt: wie doet dat dan, dat is niet inzichtelijk.” Van den Herik grijnst licht triomfantelijk. “’Uit niets kan niets ontstaan’, is een bekende spreuk. ‘Vrij vertaald: ‘Alleen wat wij erin stoppen, kan een computer leren’. Maar dat is nou net niet waar. Computers kunnen heel goed zelf dingen leren. En zijn dan zelfs het knapste jongetje van de klas.”

Vriend of vijand

Is de machine de vriend van de mens, van de rechter? Of de vijand? Moeten we hem wantrouwen of verwelkomen? Dat lijken hele scherpe tegenstellingen, maar het debat in de Rechtspraak wordt soms wel langs deze zwart-wit lijnen gevoerd. De recente tegenvallers in digitaliseringsproject KEI helpt daarin niet, beseffen Van den Herik en Scholtes. “Wij zullen deze risico’s niet wegpoetsen”, zegt Scholtes, “Maar we willen jullie vooral de mogelijkheden die er zijn laten zien.” Bijvoorbeeld met een filmpje van digitalisering in de rechtspraak avant la lettre: het digitale dossier dat werd gebruikt in het proces rond de Enschedese vuurwerkramp. Alleen het proces-verbaal in die zaak telde al 50 tot 60 ordners, in totaal waren er talloze dossierdozen. Nu stond alles op 1 dvd, inclusief filmpjes en geluidopnames. ‘Je kunt op deze wijze snel overzicht in het dossier oproepen”, vertelt advocaat Plasman in het filmpje. “Je kon zo’n dossier plots veel sneller doorzoeken op bepaalde trefwoorden”, voegt Scholte daar aan toe. “Dat was vroeger heel vernieuwend, maar tegenwoordig gaat dat natuurlijk veel geavanceerder.”

Cased based reasoning

Een van deze strategieën is de ‘case based reasoning. ’Van den Herik illustreert die aan de hand van de ‘Tegelcase’. Een oude vrouw struikelt over een opstaande tegel. Wie is aansprakelijk voor de zorgkosten: de vrouw of de gemeente? Een relatief eenvoudige case, met nauwelijks ethisch-morele dilemma’s. Ideaal dus om de zegeningen van de state-of-the-art zoektechnologie mee te demonstreren. “Zo kun je met die methode heel goed de relevante jurisprudentie bij deze zaak zoeken. Met behulp van specifieke trefwoorden als ‘holle ondergrond’ en ‘3 cm’ vindt de computer meer verwante casussen dan de mens”. Een filmpje laat zien hoe via Legal Intelligence stap voor stap de digitale fuik zich sluit rond de juiste jurisprudentie. “Maar nog niet alle jurisprudentie is digitaal opgeslagen”, werpt een rechter uit de zaal tegen. “Die observatie omarm ik”, reageert Van den Herik. “Zo ontstaat er steeds een nieuw probleem dat we moeten oplossen. Dat geldt ook als de Hoge Raad in een bepaalde juridische kwestie ‘om’ is. Een computer kan die nieuwe lijn niet foutloos in alle oude casussen verwerken. Er blijven nog mensen van vlees en bloed nodig.”

Kan een computer ooit redelijk of billijk zijn? Of is die vaardigheid voorbehouden aan menselijke rechters? Van de Herik heeft het zich vaak afgevraagd. “Ik sta wel degelijk aan uw kant”, grapt hij. “Wanneer beledig je de koning? Dat heeft te maken met sociale interpretaties die sterk gewijzigd zijn in de loop van de tijd. Er zijn zoveel tegenwerpingen te maken. Maar er zijn ook zoveel evidente voordelen. Uiteindelijk is het enige argument dat van de empirische evidentie. En ik denk dat ik over 50 jaar gelijk ga krijgen. De wereld is aan het veranderen. Kunt u dat tegenhouden?”

Denksporter moeten buigen

In dit verband is het nuttig te kijken naar een ander speelveld: niet dat van de rechter tegen de machine, maar de strijd tussen de computer en de denksporter. Een epische strijd, die is uitgevochten in zwaarbeladen wedstrijden, gevolgd door alle internationale media. Zoals de legende over de confrontatie tussen de Russische wereldkampioen schaak Gary Kasparov en schaakcomputer Deep Blue in 1998. En vorig jaar tussen Ke Jie, de Chinese wereldkampioen Go en de door Google perfect opgetuigde Angstgegner: de Go-computer AlphaGo. In beide gevallen moest de geniale mens buigen voor de geniale machine. Het belangrijkste verschil tussen Deep Blue en AlphaGo: de laatste kon zijn Go-skills perfectioneren door steeds miljoenen potjes tegen zichzelf te spelen. Deep Blue was afhankelijk van miljoenen menselijke schaakpartijen voor zijn leerproces. “Dit verschil is cruciaal Een zelflerende computer kan vele malen krachtiger selecteren, combineren en leren. Als je deze machine learning op de rechtspraak toepast, zijn de mogelijkheden enorm.”

Intelligente technieken

Scholtes en Van den Herik presenteren in hoog tempo een rijk arsenaal aan cases waaruit deze ‘brute rekenkracht’ blijkt. Met regelmatig duizelingwekkende cijfers. Zoals de 1,2 miljoen dossierpagina’s in het Joegoslavië-tribunaal die systematisch gescreend werden door de software van zijn bedrijf. Of de gemiddelde onderzoeksfase bij de Nederlandse Zorgautoriteit, die met behulp van Big Data Analysis werd ingekort van 2 maanden naar 3 dagen. Ook de grote advocatenkatoren maken al jaren gebruik van machine learning en andere AI-technieken. Het Openbaar Ministerie doet eveneens zijn voordeel bij de opsporing: “Vroeger ging het over een tap zetten bij verdachten”, weet Scholtes, “Nu zijn er veel meer soorten kanalen en codewoorden. Daar heb je intelligentere technieken voor nodig. U moet als rechter kunnen beoordelen of het OM die technieken goed toepast. Is de relatie tussen verdachte Jopie en verdachte Pietje wel terecht gelegd?”

‘Spelen met vuur’

Opnieuw speelt Van den Herik zelf voor de advocaat van de duivel. “Ik breng hier wel het evangelie van de machine learning, maar er liggen wel drie grote nadelen op de loer.” Ten eerste het principe van automatische adaptatie. Dit is een zelflerend algoritme dat zelfstandig toegevoegde informatie verwerkt en daarop voortbouwt. “”Dat is heel kansrijk maar je moet er ook verschrikkelijk mee uit kijken.” Zo is er het bekende voorbeeld dat zo’n algoritme op basis van op Twitter verschenen teksten binnen enkele dagen kwam tot een abjecte uitspraak als: ‘Hitler was right. I hate the Jews’.  De tweede booby trap van machine learning is de agressieve strategie die de computer bij het oplossen van vraagstukken kan kiezen. Een voorbeeld vormt de opgave om na te gaan wat de slimste strategie is voor twee concurrerende teams om appels te rapen. Die opgave eindigde met de door de computer gekozen variant waarin de tegenpartij volledig wordt uitgeschakeld. Computers hebben tenslotte ook de neiging vaak seksistische en racistische elementen in ons denken en woordgebruik over te nemen en dat via algoritmes te versterken. Nogal wat risico’s, erkennen beide hoogleraren. “ Spelen wij met vuur?”

Is het menselijk alternatief dan zo veel foutlozer? Uit onderzoek blijkt dat niet. Donkere verdachten krijgen in de VS veel vaker een gevangenisstraf zo is bekend. Ook in onze strafpraktijk zien we dergelijke effecten, denk aan het verschijnsel van etnisch profileren. “Rechters zijn biased. Ook als het gaat om de positie van de vrouw. Ik zeg in alle subtiliteit: rechters zijn seksistisch.”, aldus van den Herik. Het blijkt echter ook mogelijk een vruchtbaar pact te sluiten tussen mens en machine, rechter en computer. In de Verenigde Staten bevelen is rechters de partijen machine learning heel krachtig aan rondom het filteren van informatie en het aandragen van bewijs. Er is ook een club actief van rechters, high tech-bedrijven en andere partijen die samen onderzoek doen naar wat in de rechtspraak de best verdedigbare technologie is.

Verrassend compleet

De dag eindigt met een hele praktische ontmoeting tussen rechter en computer; alle deelnemers kruipen zelf achter de pc om het machinaal zoeken en selecteren in de praktijk te brengen. In koppels van twee gaan ze in de database met uitspraken op Rechtspraak.nl op zoek naar de meest relevante jurisprudentie bij een bepaald thema of casus. Met behulp van aan elkaar verwante trefwoorden zoals ‘cybercrime’, ‘sexting’ en ‘computervredebreuk’ scoren de koppels verschillende aantallen hits. De finesses van de zoektechnieken zijn soms te hoog gegrepen voor de gamma-juristen in de zaal. “Nu ben ik je kwijt”, klinkt het met enige regelmaat vanuit de zaal. wanneer de opgaven te snel elkaar opvolgen. Toch zien veel deelnemers uiteindelijk hoe effectief de nieuwste AI-technieken kunnen zijn. Met de machine learningmethode lukt het om te komen tot een verrassend complete lijst met jurisprudentie. “Die volledigheid halen wij met onze houtje-touwtje aanpak natuurlijk nooit”, beaamt een rechter. Van den Herik en Scholtes zijn tevreden.

De themadag wordt in totaal zes maal uitgevoerd bij gerechten die zich bereid hebben verklaard aan dit experimentele programma deel te nemen. Inmiddels is dat gebeurd in Den Haag, Amsterdam en Leeuwarden. In het verschiet liggen: Oost-Brabant, Limburg en Midden Nederland. Bent u geïnteresseerd in een dergelijk experiment op uw gerecht, neem dan contact op met Conny Hendriksen (SSR marketing- en communicatie). Voor alle duidelijkheid: De themadag is een verkenning op het gebied van Big Data en kunstmatige intelligentie en niet bedoeld als een instrument dat meteen toepasbaar is in het dagelijkse werk.

Nieuwsoverzicht