Eind 2020 verklaarden enkele Belgische strafrechters in een reportage op de televisie dat bepaalde – naar eigen zeggen uit de hand gelopen – strafdossiers bestaan uit 40.000 pagina's, waarbij ze verondersteld worden die allemaal te hebben gelezen. Conform de geplogenheden van de Belgische justitie worden alle pagina's afgedrukt en op papier ter beschikking gesteld van rechters, advocaten, beklaagden en burgerlijke partijen. Al die documenten netjes opgestapeld tot één meter hoog vormen dan een rij van wel 20 meter lang.
De hierboven beschreven zeer arbeidsintensieve (en foutgevoelige) werkwijze van onze rechters staat in schril contrast met de technieken die dokters en onderzoekers gebruiken om in bijvoorbeeld medische documenten zeer snel relevante informatie op te zoeken. Dankzij moderne technieken kan je tegenwoordig in een grote berg (digitale) documenten zeer vlot zoeken naar woorden die voorkomen in elkaars nabijheid (bijvoorbeeld niet meer dan tien woorden van elkaar verwijderd), naar woorden die in dezelfde zin voorkomen of zoeken naar gelijkaardige woorden als misdaad en misdadiger. Je kunt ook zoeken naar foto's van een bepaalde persoon of zelfs de teneur van een opgenomen gesprek inschatten.
Het echte potentieel van teksten komt pas tot zijn recht als nog meer geavanceerde ("big data") technieken worden toegepast om bijvoorbeeld op zoek te gaan naar groepen van gelijkaardige documenten, wat dan bijvoorbeeld nuttig kan zijn bij het opsporen van verschillende versies van eenzelfde document. Dankzij deze techniek kan ook worden gezocht naar documenten die allen eenzelfde standpunt verkondigen, naar gelijkaardige zaken die zich in het verleden hebben voorgedaan en of de uitspraak gunstig was voor een bepaalde partij. Advocaten zouden deze techniek dan bijvoorbeeld kunnen gebruiken om de kansen van hun cliënt in te schatten. Of misschien kan die cliënt dat wel zelf doen vóór hij beslist om een peperdure advocaat in te huren.
Daderprofilering of het opsporen van witwasoperaties in notariële akten zijn andere toepassingsvoorbeelden van deze technieken op grote hoeveelheden gegevens.
Justitie staat ook voor grote uitdagingen om Artificiële Intelligentie ten volle te kunnen uitrollen, denk daarbij aan data bias, explainable AI (waarom wordt een bepaalde beslissing genomen), de huidige digitale achterstand bij justitie, privacy en ethiek.
Nexus organiseert een studieavond rond datamining, die u kunt volgen vanaf 26 oktober 2021. Alle informatie vindt u hier.
Johan Decorte, docent-onderzoeker HOGENT, IT-consultant en medewerker aan deskundigenonderzoeken.
0 reacties