De huidige populaire zoekmachines op internet doen goed werk voor het zoeken en vinden van populaire informatie. We maken er met zijn honderden miljoenen dagelijks gebruik om “feitjes” en oplossingen te vinden. We weten echter ook dat deze zoekmachines drijven op advertenties én dat de ranking van resultaten na het zoeken sterk worden beïnvloed door het leveren van zoveel mogelijk “clicks”.

Het objectieve algoritme van een zoekmachine zou gebaseerd moeten zijn op de principes van “precision”/”precisie” en “recall”/”vangst” om objectief betrouwbaar te zijn:

  • Precision
    Precisie is de verhouding tussen het aantal relevante resultaten (documenten, treffers), en het totaal aantal resultaten dat door het systeem is teruggeven.

  • Recall
    Vangst is de verhouding tussen het aantal relevante gevonden documenten, en het totaal aantal relevante documenten dat er mogelijk zijn. Dit laatste is een van tevoren opgesteld ‘wensenlijstje’, vaak ‘ground truth’ of ‘gouden standaard’ genoemd.

Ter zijde:
Op het internet gelden commerciële drivers, maar er kan ook gebruik worden gemaakt van “polulariteitsindicatoren” en “linkdichtheid” om de meeste relevante antwoorden te bepalen.
Binnen de bedrijfsmuren zijn deze drivers en indicatoren veel minder of zelfs niet aanwezig.
Een “enterprise search” oplossing moet derhalve veel sterker leunen op de informatie-statistische algoritmes die ten grondslag liggen aan de information retrieval principes van precision and recall.

Maar wat nu als je op zoek bent naar inzichten in relaties of achtergrondinformatie die een Google, Bing of Yahoo niet kan leveren?

In dit artikel wil ik jullie wijzen op het bestaan van Cluuz.com. Zoek eens op Google en daarna op Cluuz.com naar Edward Snowden. Hoewel Google goede resultaten boekt met zijn “knowledge graph” levert Cluuz een “relation ship” diagram. Daarnaast identificeert Cluuz entiteiten die een relatie hebben met Snowden. 

Daarnaast is Cluuz een “meta-zoekmachine” die meerdere openbare zoekmachines raadpleegt voor relevante resultaten. Dit levert een meer objectief beeld op.

Als we kijken naar de “Top linked entities” dan zien we namen die binnen het zoekresultaat van Google totaal niet voorkomen, zoals “Glenn Greenwald”. Een persoon die ook gerelateerd is aan het openbaar maken van geclassificeerde informatie. Cluuz.com is één van de uitdagers van de populaire zoekmachines zoals Google.

De strekking van dit artikel?
Verlaat je niet alleen op “one size fitss all” zoekmachines op internet als je op zoek bent naar achtergrondinformatie. Blijf speuren naar nieuwe en uitdagende oplossingen zoals Cluuz.com.

This entry was written by Edwin Stauthamer , posted on zondag november 03 2013at 05:11 pm , filed under Technologie, Toepassingen . Bookmark the permalink . Post a comment below or leave a trackback: Trackback URL.

Geef een reactie

XHTML: You can use these tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>