Query suggest / autocomplete in de Google Search Appliance

Vandaag heb ik een hele dag met een klant waar wij een Proof of Concept met de Google Search Appliance doen, gesproken over de mogelijkheden van de GSA, de techniek erachter etc. Ze waren zeer enthousiast, zeker over de relevantie die van meet af aan goed was. Er was één functionaliteit die tot veel discussie leidde: de Autocomplete.

Wat mij opvalt is dat steeds meer klanten een “Query autocomplete” functie willen. De reden daarvoor verschilt bij iedere klant, maar uit de theorie kunnen we halen dat query autocompletion

  1. voorkomt dat een gebruiker verkeerde woorden intikt
  2. de gebruiker tipt op een zinvolle zoekopdracht
  3. de gebruiker zicht krijgt op de content
  4. verleidt tot het gebruiken van meer zoekwoorden.

De Google Search Appliance heeft ook een Autocomplete functie. Deze functie haalt de veelgebruikte zoekopdrachten uit de query logs. De beperking daarvan is meestal snel duidelijk:

  • Waar men vaak op zoekt hoeft niet te zijn waar men ook goede resultaten op vindt
  • Er kunnen zoeksuggesties worden gegeven waar helemaal geen resultaat voor is
  • De zoeksuggesties kunnen spelfouten of andere ongewenste woorden bevatten

De lijst lijst met historische zoekvragen is verder ook niet te beheren.

Een goede query suggest / autocomplete functie bepaalt zijn woorden op basis van de volgende zaken:

  • Corpus
    De woorden moeten worden ontleend aan de geindexeerde content. Na het intikken van de eerste letters moeten termen worden teruggegeven die volgens een (wildcard) patroon scoren. Tevens moeten combinaties van woorden worden teruggegeven in de volgorde waarin ze in documenten voorkomen. Dit kan zowel links als rechts ge-wildcard worden. Denk hierbij ook aan het gebruik van trigrammen.
  • Keymatches
    De suggestfunctie zou ook een beroep moeten doen op de keymatches. Deze worden dan getoond als query suggestion, waarbij een klik op het voorgestelde woord direct naar een webpagina leidt.
  • Producten / diensten
    De derde mogelijke inhoud voor een autocomplete / suggestie is een handmatig beheerde lijst van producten of diensten waarbij zoekwoorden kunnen worden aangegeven.
    Apple had dit vroeger in zijn zoekfunctie.

Al deze zaken moeten uiteraard wel goed in de user interface worden verwerkt. Het moet voor een gebruiker immers duidelijk zijn of een suggestie / autocomplete een zoekopdracht is of een directie link naar een webpagina.

Het is dus wachten op een betere implementatie van de autocomplete functie in de Google Search Appliance.

Install base Google Search Appliance groter van die van Autonomy IDOL?

In een bericht van Beyond Search over een seminar dat Search Technologies in New York gaat houden, worden enkele interessante getallen genoemd.

Install base

Volgens informatie beschikbaar bij Beyond Search, zijn er wereldwijd meer dan 35.000 Google Search Appliances in gebruik. Ter vergelijking wordt ook het aantal wereldwijde licenties voor Autonomy IDOL genoemd: 30.000,00.

De Google Search Appliance is pas sinds 2002 op de markt en Autonomy IDOL al jaren langer. De vraag is wat dit zegt.

De GSA is voor midden tot kleine organisatie beter te betalen. De oplossing wordt soms zelfs aangeschaft in het kader van “laten we het maar proberen”. Dat er meer GSA’s zijn verkocht zegt dus niet zoveel. De oplossing van Autonomy is niet helemaal te vergelijken met de Google Search Appliance. In basis voorzien ze in de mogelijkheid om informatie uit verschillende bronnen doorzoekbaar te maken, maar Autonomy heeft hiervoor veel meer mogelijkheden en analyse functies dan de GSA.

Licentiemodel

Een ander interessant gegeven is dat de Google Search Appliance een licentiemodel van 2 of 3 jaar kent. Na die termijn moeten weer nieuwe licenties worden aangeschaft voor het volledige bedrag én krijg je een nieuwe Search Appliance. Het is pas sinds kort dat de Search Appliance ook daadwerkelijk stopt met serveren als de licentie is verlopen. De oudere modellen blijven gewoon doorwerken.

Zijn die 35.000 Google Search Appliances allemaal voorzien van een actuele licentie? Niemand zal heet weten omdat die gegevens niet bekend zijn.

Het feit is dat Google het model van éénmalige inkomsten heeft gekozen, daar waar Autonomy een éénmalig een licentie op software verkoopt en daar dan ook nog 20% “maintenance” per jaar  voor krijgt.

Hoe kom je aan een goed ontwerp van je zoekapplicatie?

Het klinkt zo simpel. Maak een programma van eisen of functioneel ontwerp van je gewenste zoekapplicatie, geef dit ontwerp aan een leverancier en laat de applicatie ontwikkelen.

Je hebt vervolgens een specificatie op papier die niet echt geschikt is om een zoekapplicatie mee te ontwerpen. Uiteraard bevat het ontwerp alle gewenste functies, maar hoe moet je deze in één of meerdere zoek- en resultaatschermen verwerken?

Zoals bekend is er niet ”één zoekoplossing voor iedereen” als het gaat om enterprise search oplossingen.

Lynda Moulton heeft een simpele maar doeltreffende manier om dit vraagstuk inhoud te geven:

http://java.dzone.com/news/where-and-how-can-you-look

Frequently, enterprise stakeholders will reference a commercial web site they like or even search tools within social sites. These are a great starting point for a designer to explore. It makes a lot of sense to visit scores of sites that are publicly accessible or sites where you have an account and navigate around to see how they handle various design elements.

Oftewel: Kruip in de huid van de ontwerpers om te zien wat zij bedoelen of prikkel hen met voorbeelden om de (platte) eisen en wensen te laten leven!

 

 

Q-Sensei krijgt veel aandacht

Q-Sensei heeft zijn product slechts enkele dagen geleden gelanceerd en krijgt gelijk veel aandacht van de online pers.

Alhoewel veel functies zich niet onderscheiden van de andere “main stream” leveranciers van zoekoplossingen is er toch een één functie die er bovenuit steekt:

Additionally Q-Sensei has a useful modular approach and the ability to provide automated classification, a feature often provided by third-party products for more established search engines

Bron: http://www.fiercecontentmanagement.com/story/q-sensei-aims-provide-complete-view-enterprise-data/2011-04-06

 

Lijst met Search Vendors toegevoegd

WatchingSearch heeft een pagina toegevoegd met een overzicht van Search Vendors (leveranciers van enterprise search oplossingen) die wij de afgelopen jaren zijn tegengekomen bij organisaties en bedrijven in Nederland.

Wij verwachten dat de lijst de aankomende tijd zal groeien wanneer we meer en meer organisaties zullen benaderen om onderdeel uit te maken van het Watching Search onderzoek.

Watching Search is online!

In April 2011 is het Watching Search initiatief van Emid Consult live gegaan.

Watching Search heeft de volgende doelen:

  • In kaart brengen van het gebruik van zoekoplossingen bij Nederlandse bedrijven
  • Informeren over de ontwikkelingen op het gebied van Enterprise search en zoektechnologie in het algemeen

In kaart brengen van het gebruik van zoekoplossingen bij Nederlandse bedrijven

Gedurende het jaar gaan wij via telefonische enquêtes en bedrijfsbezoeken op zoek naar de implementaties van zoekoplossingen en het gebruik van search engines bij Nederlandse bedrijven.

Aan het einde van het jaar (medio november) brengen wij een rapport uit met het resultaat van deze onderzoeken. Om het voor bedrijven en organisaties leuker én uitdagender te maken om aan de onderzoeken mee te werken loven wij prijzen uit. Deze prijzen zijn verdeeld over de verschillende categoriën:

  • Meest innovatieve toepassingen
  • Meest creatieve oplossingen
  • Beste gebruik van een specieke search engine

De winnaars in alle categorieën worden beloond met een geldprijs. De hoogte daarvan wordt nog bekend gemaakt.

De prijzen worden uitgereikt tijdens het “Watching Search Event”. De datum en locatie van dit event worden later gepubliceerd.

Het “Watching Search Event” is een jaarlijks terugkerende evenement waarbij alle prijswinnaars hun oplossing kunnen presenten en waarbij ook de leading search engine providers aanwezig zijn.

Informeren over de ontwikkelingen op het gebied van Enterprise search en zoektechnologie in het algemeen

Watching Search houdt u ook op hoogte van nieuws en ontwikkelingen op het gebied van Enterprise Search.

Dit doen wij via deze site én via de verschillende sociale media zoals Twitter (http://twitter.com/#!/watchingsearch) en Delicious (http://www.delicious.com/watchingsearch).