De Guardian had pas twee vacatures voor tagging-redacteuren. Zelfs bij een krant die tientallen mensen rond heeft lopen op de online afdeling lijkt dat wat vreemd. Maar iedereen die weet van de ontwikkeling van Web 3.0, of het semantische web, door sommigen gezien als heilige graal van het internet, weet dat de stap van de Engelsen juist heel slim is.
De huidige zoekmachines op het web doen niet veel meer dan zoeken naar sleutelwoorden. Ook Google, al zijn hun logaritmes inmiddels uiteraard wel dermate fijnmazig afgesteld dat ze behoorlijk bruikbare resultaten bieden. Maar die logaritmes hebben geen idee wat de informatie die ze ophoesten nou precies betekent. En het is altijd on-demand: als je als gebruiker niets vraagt, gebeurt er niets.
Daar komt het semantische web om de hoek kijken. Veel databanken en andere bestanden kunnen namelijk niet met elkaar praten. Ze begrijpen elkaar niet. Tagging is de eerste stap naar dat begrip. Die sleutelwoorden kun je handmatig of semi-handmatig invoeren, zoals wellicht bij The Guardian gebeurt, of automatisch middels een programma. Tags worden meestal in XML-formaat opgeslagen.
Tim Berners-Lee, oprichter van het world wide web, heeft met een aantal partners nog meer standaarden dan alleen XML ontwikkeld voor het semantische web. RDF (Resource Documentation Framework) geeft betekenis aan tags. OWL (Web Ontology Language) voorkomt spraakverwarring voor wie verschillende woorden gebruikt voor hetzelfde begrip. Simpel uitgelegd, uiteraard.
Het moet ervoor zorgen dat veel meer informatie op het web ontsloten wordt. Voorbeeldje: bibliotheken zijn bezig middels het semantische web hun collecties compleet te ontsluiten, inclusief bijvoorbeeld allerlei foto’s. In de medische wereld wordt zoveel onderzoek gedaan dat mensen geen idee hebben dat elders op deze aardbol anderen met hetzelfde bezig zijn. Met web 3.0, in feiten een forse verbetering onder de motorkap, moet dat veranderen.
Voor journalisten kan het de mogelijkheid bieden om veel meer informatie naar boven te halen. Maar vooral veel preciezere resultaten, omdat bijvoorbeeld zoekmachines slimmer worden en tenminste een klein beetje begrijpen van de informatie die ze ophoesten. Wie zoekt op ‘dokter’ en ‘Amsterdam’ wil een lijst van dokters in Amsterdam, en niet een arts die Van Amsterdam heet. Bijvoorbeeld.
Maar het mooiste is dat webservices straks ook zelf met suggesties kunnen komen. Een lezer leest bijvoorbeeld op de site van de Volkskrant elke dag berichten over de gestegen olieprijzen. Zou het dan niet mooi zijn als het web uit zichzelf komt met een lijst van goedkope pompstations in de buurt? De mogelijkheden, daarover moeten de slimmeriken nog dromen. Maar spannend is het wel, en nog nuttig ook deze keer.