IBM neemt Vivisimo over

http://techcrunch.com/2012/04/25/ibm-acquires-enterprise-search-software-company-vivisimo-to-boost-big-data-analytics/

IBM is de volgende in de rij van Enterprise IT solution  / infrastructure aanbieders die er voor kiest om een grote speler op de markt van enterprise search in te lijven.
IBM is al langer bezig met search engines (OmniFind eerst in combinatie met Yahoo!), maar heeft echter nog niet de juiste oplossing kunnen vinden.
Met de acquisitie van Vivisimo wil IBM het “Big-data” probleem aanpakken, wat ze eerder nog is gelukt. Omnifind is nooit echt aangeslagen.

Trend?
Bijna alle grote software / enterprise infrastructure vendors hebben nu enterprise search offering (in volgorde van overname):
Het overnemen en integreren van technologie van andere gespecialiseerde ondernemingen is een praktijk die allang gaande is. Zo is onder meer Microsoft groot geworden.
Het overnemen van bedrijven die in Enterprise Search zijn gespecialiseerd is echter nog niet zo lang gaande. De eerste grote overname vond plaats door Microsoft in 2008.
De Enterprise Search wereld werd drie jaar daarvoor opgeschud door de overname van Verity door Autonomy. Verity kan worden beschouwd als de grondlegger van de Enterprise Search technology, getuige het feit dat zeer veel oud-medewerkers van Verity nu nog steeds werkzaam zijn binnen andere search bedrijven (Google, Zylab), hun eigen search bedrijven hebben opgericht (Applied relevance Inc., New Idea Engineering, Knowlegde Plaza, InfoKnowledge) of uiteraard nog steeds werkzaam zijn in het search vak.
In het rijtje van grote spelers mis ik nog SAP. SAP heeft al jaren hun TREX oplossing voor enterprise search behoeften. De oplossing heeft echter nooit veel voet aan te grond gekregen.
Is SAP het volgende bedrijf dat een pure search vendor over gaat nemen>
En Google enterprise search?
Wat wordt de reactie van Google Enterprise Search hierop?
(Enterprise) Search is een onderdeel van een totale (informatie- / procesbeheer) oplossing die alle grote spelers nu kunnen leveren.
Google Enterprise Search staat op zichzelf en moet tegen de geïntegreerde oplossingen opboxen.
Is dit juist de kracht, of wordt het een zwakte? Wij zullen hier de aankomende tijd onze tanden op stukbijten en u op de hoogte houden van onze weerspiegelingen.
Pure Search vendors
Uiteraard staat de propositie van Google niet alleen. Er zijn op dit moment nog enkele andere zeer krachtige “pure (enterprise) search” vendors:
Wij laten u vertwijfeld achter…

Google houdt grote schoonmaak. Wat is de impact op de Enterprise oplossingen?

Sinds Larry Page het bewind van Eric Schmidt heeft overgenomen waait er een nieuwe wind door Google. Larry Page is duidelijk bezig om het bedrijf meer focus te geven en dit gaat gepaard met het beëindigen van diverse projecten en producten. De laatste berichtgeving hierover (Google gaat door met grote schoonmaak) is slechts een continuering van eerder genomen besluiten.

In dit artikel ga ik in op de “Enterprise” oplossingen van Google en meer specifiek op de Google Search Appliance (GSA).

Het lijkt erop dat Google de “bijproducten” wil afstoten. Als we kijken naar de Google Search Appliance, of meer algemeen de Enterprise Search activiteiten van Google, dan zouden we de volgende vragen kunnen stellen:

  • Hoe past de Google Enterprise Search oplossing in de strategie van het bedrijf?

en daarmee samenhangend:

  • Hoeveel omzet haalt Google wereldwijd uit de verkoop van GSA’s?
  • Hoeveel ontwikkelaars zijn bij de GSA ontwikkeling betrokken?

Hierbij moet ik gelijk één ding duidelijk maken: Er is niet veel bekend over de specifieke omzet die Google op dit moment haalt uit de Enterprise producten en zoals gezegd, meer specifiek uit de Google Search Appliance.

Wat ik wel weet is dat de “enterprise” sectie van Google een zéér klein deel van de omzet vertegenwoordigd (95% van de miljardenomzet is advertising en alle daaraan gelieerde activiteiten, zo ook Google.com, Google+ en Android). Alle activiteiten zijn gericht op het verkrijgen van persoonlijke data en profilering om meer gerichte en dus effectieve advertenties te kunnen verkopen.
De meeste andere activiteiten zijn ontstaan vanuit het overschot aan kapitaal en dus de mogelijkheid om geld en tijd te investeren in R&D en de ontwikkeling van nieuwe oplossingen (“iedere medewerker van Google mag een bepaald percentage (20%?) van zijn tijd spenderen aan R&D”), zoals de Google Search Appliance (“we kunnen zoeken op internet, waarom kunnen we dit niet ook binnen bedrijven?”).
De basisfunctionaliteit van GSA is gericht op het via webcrawling indexeren van intranetten, vergelijkbaar met wat Google.com doet op internet. Dat doet ie dan ook goed. Het ontbreken van metadata is op internet niet belangrijk. Daar gaat het om de populariteit van sites en pagina’s (hoe vaak wordt er gelinkt naar pagina’s) en daarmee de authoritativiteit van bepaalde sites (een site waar waar naar wordt verwezen is per definitie een authoriteit). Die algoritmes gaan binnen een organisatie echter niet op (slechte link-kwaliteit, heterogene bronnen). Sterker nog… content die wordt gepushed via connectoren hebben per definitie een lage relevantie door het onbreken van aanknopingspunten voor het “page-rank” algoritme).
Die innovaties en R&D producten zijn de afgelopen jaren gelanceerd op Google Labs. Dat is nou juist wat Page aan het verminderen is.
Een teken aan de wand is het zomaar laten vallen van de integratie met Google Apps op de Search Appliance. Bedrijven konden eerst met de GSA gelijktijdig door hun interne informatie én de data die is opgeslagen in “the cloud” doorzoeken. Nu niet meer.
Naar mijn mening past de GSA niet binnen de lange termijn visie van Google. Ze willen zoveel mogelijk alle data in de cloud krijgen, ook bedrijfsdata. Dat is ook schaalbaar, gezien hun datacenters en gedistribueerde data-opslagsystemen.
Voor wat betreft de functionaliteit lopen ze met hun enterprise search oplossing sterk achter bij de “pure enterprise search infrastructure vendors” zoals Autonomy, Attivio, Endeca, Microsoft FAST, Exalead en de meer gespecialiseerde vendors zoals Zylab, MindBreeze, Polyspot etc. (denk aan de opmerking die ik eerder maakte over het ontbreken van “page-rank data” om de relevantie op te baseren). De GSA kan verder (nog) niet voorzien in “compliance” regels zoals het leveren van exacte aantallen gevonden documenten of het zoeken op delen van strings (zoeken met een * om de in het nederlands zo veel voorkomenden samentrekkingen aan te kunnen (compound words)). Google werkt hier op dit moment overigens wel hard aan.
Gezien de status van hun connector framework (afhankelijk van third parties, zeer gefragmenteerd en vaak onduidelijk wat kan en wat niet kan) en de architectuur van de GSA (alles op de box) vraag ik me af hoeveel ze willen investeren in de ontwikkeling van deze oplossing. Vergelijk dat met de andere oplossingen die een “plugable pipeline” (Autonomy, FAST) hebben om allerlei bewerkingen op de content te doen voordat de informatie aan de indexen wordt toegevoegd. Dat kan met de GSA oplossing niet, omdat de “document filters” (de techniek die binaire documenten zoals Word, PDF etc. omzetten naar plain tekst) op de GSA zelf zijn geimplementeerd. Als je dit met de GSA wilt doen, dan moet je dus zelf een pipeline opzetten die gebruik maakt van (vaak betaalde) externe document filters waardoor je extra (dubbele) investeringen moet doen.
Kijk ook naar de SharePoint Search oplossing. Microsoft investeert in het positioneren van SharePoint Search (powered by FAST) als “enterprise Search” oplossing. Daarbij worden de mogelijkheden van SharePoint iedere keer beter en volwassener. Google probeert bij te blijven met de ontwikkelingen van SharePoint, maar dat wordt steeds moeilijker.

De zoekmogelijkheden van SharePoint 2010 zijn al een stuk beter dan de zoekmogelijkheden in SharePoint 2007 (laat staan 2003) en Google haalt nog steeds aan dat zij een betere zoekervaring kan bieden voor SharePoint 2003 en 2007.
Ze lopen daarom achter en gebruiken argumenten die met de introductie van SharePoint 2010 voor een groot deel niet meer op gaan (zeker in combinatie met FAST Search 4 SharePoint (FS4SP).
Uiteraard heb ik het hier over de inzet van FAST Search 4 SharePoint als een Enterprise Search oplossing die verder gaat dan de informatie die in SharePoint wordt beheerd. SharePoint is slechts één van de informatiesystemen die binnen organisaties wordt gebruikt.
Als laatste het licentiemodel van de GSA. Het feit dat je als organisatie iedere 2 of 3 jaar (Google wil van de 2 jaar optie af) weer een investeringsbeslissing moet nemen (denk aan grote implementaties waarmee tonnen of zelf miljoenen aan licentiegelden zijn gemoeid) is een risico. Mijn ervaring met Autonomy is dat als een organisatie kiest voor Autonomy, zij dit voor meer dan 6 jaar ongemerkt doen. Bij de andere vendors koop je een “perpetual” licentie en betaalt van dat bedrag 20% per jaar.
Afhankelijk van hoe een organisatie dit financieel in de boeken zet, kan dit nogal wat betekenen.
Bij een commerciële organisatie zou je de kosten voor de GSA oplossing niet in één keer kunnen nemen, maar afschrijven over 3 jaar. Daarna kan je door de reservering die daarbij ontstaat, na 3 jaar weer een nieuwe investering kunnen doen. De kosten blijven dan gelijk over de jaren. Voor een overheidsinstelling gaat dit niet op door de toepassing van het “budget stelsel”. Dit is gebaseerd op kasuitgaven en worden (kunnen) niet worden afgeschreven.
Het model van de GSA kan ook niet anders omdat het om hard- én software gaat. Software schrijf je niet af. Je neemt de kosten van 20% gewoon per jaar en de vervanging van de hardware zit in het IT-budget. Hardware moet echter vervangen worden. Google had ook kunnen zeggen “Je krijgt een perpetual licentie én we geven iedere 3 jaar nieuwe hardware”. In plaats daarvan hebben ze gezegd “Je krijgt een licentie van 3 jaar en daarna moet je een nieuwe licentie én hardware aanschaffen”.
Google brengt dit dus als “heel transparant”, maar werpt daarmee wel veel vragen op in vergelijking met andere enterprise oplossingen waarbij je gewoon jaarlijks of per gebruiker een bepaald bedrag betaald.
In TCO berekingen komt de Google Search Appliance overigens wel beter uit de vergelijking. Wanneer je de kosten bekijkt over een periode van 6 of meer jaar, dan valt de 3-jaarlijkse investering beter uit dan de jaarlijkse 20% maintenance fee die software leveranciers rekenen. Dit gaat echter ook weer deels op, omdat de kosten voor een zeer grote Google implementatie (5 miljoen en hoger) meestal hoger zijn dan de kosten voor een oplossing van bijvoorbeeld Autonomy, FAST of Attivio.
Ik ben benieuwd naar de meningen van bedrijven of andere search consultants ten aanzien van dit onderwerp:
Is de Google Enterprise Search oplossing een blijver binnen de plannen van Google of niet?