SEO en Findability

Het is voor websites van essentieel belang om op de grote internet zoekmachines zoals Google.com, gevonden te worden. All jaren is het onderwerp SEO (Search Engine Optimalisation) een "hot topic". SEO richt zich op het samenstellen van de content én de structuur van websites met als doel een hogere "ranking" te verkrijgen binnen zoekmachines op internet (internet seearch).
De principes die gelden voor het kunnen vinden van relevante informatie op internet (al dan niet met een commercieel doel) gaan echter ook op voor het vindbaar maken (increased findability) van informatie binnen organisaties (enterprise search).

SEO –> websites op Internet

SEO is "booming business". Vele kleine en grote bedrijven hebben zich op deze markt gestort. Het is immers voor iedere website-eigenaar van belang om zijn website als hoogste resultaat op Google.com te krijgen. Dat garandeert veel bezoeken en – als het een beetje meezit – het kopen van producten of het afnemen van diensten.

De "kunst" van het verkrijgen van een hoge ranking op Google.com is het achterhalen van de algoritmes die de zoekmachine toepast om te bepalen welke pagina’s het meest relevant zijn voor de woorden die de gebruiker als zoekopdracht gebruikt.

Google gebruikt hiervoor – onder meer – het "PageRank" algoritme. Simpel gezegd komt dit algoritme neer op het principe "Hoe vaker een pagina wordt gelinked vanaf sites, hoe hoger de populariteit van die pagina". Uiteraard is dit niet de enige indicatie of een pagina relevant is voor een bepaalde query. In totaal gebruikt Google enkele honderden indicatoren in hun relevantie algoritme. Onderzoekers van SEO gebruiken de volgende uitgangspunten bij het verkrijgen van een hoge ranking in de zoekresultaten. De meeste van deze maatregelen moeten worden gezien als "best practices" bij het schrijven van content voor het web en het structureren van websites en pagina’s. Zie hiervoor ook de site "http://www.webrichtlijnen.nl/". Deze richtlijnen bevatten ook veel technische aanwijzingen. We zullen ons hier echter beperken tot de meer inhoudsgerichte aspecten:

  • Publiceer relevante content
    Dit een beetje een “no-brainer”, maar waarom zouden mensen jouw site bezoeken als je niets waardevols te melden hebt? Bezoekers moeten iets kunnen “halen”. Dit punt is uiteraard belangrijk voor de PageRank. Site met relevante content worden vaker gelinked.
  • Gebruik goede titels en datums
    Titels van pagina’s is het eerste wat de gebruiker in een zoekresultaat ziet. Op basis van de titel van een pagina bepaald de zoeker in hoge mate of het resultaat is wat de gebruiker zoekt.
    Goede datums bij artikelen dragen tevens bij aan het bepalen van de relevantie omdat dit een beeld van de actualiteit geeft.
  • Zorg voor regelmatige updates en nieuwe content
    De internet search engines indexeren sites met regelmatige updates vaker. Als je niets verandert aan de content van je site, zal de Googlebot je minder vaak bezoeken met consequenties voor je ranking. Denk echter ook aan updates van de content via RSS-feeds.
  • Gebruik een logische sitestructuur
    Door de indeling van een site in een logische structuur zullen de internet search engines resultaten op onderwerp kunnen tonen en naast de hoofdurl tevens vergelijkbare onderdelen van de site tonen.
  • Gebruik "friendly URL’s"
    “leesbare” urls (//titel-van-artikel.html">http://<sitenaam>/<sectie>/titel-van-artikel.html in plaats van /?pageid=9">http://<sitenaam>/?pageid=9). De leesbare urls zijn sterke aanwijzingen en deze bevatten ook inhoudelijk goede metadata voor een pagina.

Belangrijke opmerking hierbij is dat het voorzien van webpagina’s van metadata zoals omschrijvingen, keywords en categorieën niet werkt op het internet. Deze informatie is zeer gevoelig voor "spam" door het opnemen van extra keywords en termen om zo te proberen de pagina hoger in de zoekresultaten te krijgen. Google slaat deze metadata derhalve over en betrekt deze niet in het bepalen van de relevantie van een webpagina.

Findability of "vindbaarheid" –> Bedrijfsinformatie

Het onderwerp Findability is een onderwerp dat met name binnen organisaties wordt gehanteerd. Dit onderwerp lijkt echter zeer sterk op de SEO principes die op internet gelden.

Het gaat er – net zoals op internet – om dat medewerkers in staat worden gesteld om de meest relevante informatie te kunnen vinden die zij nodig hebben voor het uitoefenen van hun functie.

De overeenkomsten zijn duidelijk: het is goed om informatie en documenten op een centrale plaats neer te zetten en ervoor te zorgen dat deze duidelijk is geschreven én is voorzien van duidelijke titels en structuren.
Via intranetten, DMSsen, CMSsen wordt dit ook geprobeerd.

Waarom is de informatie binnen onze bedrijfsmuren dan toch zo slecht te vinden? Hier komen we op het onderwerp “findability” of “vindbaarheid.

  • Schrijven om gevonden te kunnen worden
    Anders dan op het internet wordt informatie binnen een organisatie vaak niet opgeslagen om gevonden te kunnen worden door een grote groep van collega’s. Documenten worden geproduceerd, opgeslagen voor eigen gebruik en via de e-mail verspreidt naar de doelgroep.
    Dit is een groot verschil met het publieke domein waar informatie juist wordt gepubliceerd om gevonden te kunnen worden. Wat heeft het voor zin om informatie op internet te zetten als niemand het kan vinden?
  • Opslagstructuren
    Het internet is met zijn websites feitelijk een zeer groot centraal CMS. Het formaat van de informatie is zeer homogeen (hoofdzakelijk HTML en PDF).
    Alhoewel er verschillende locaties zijn voor specifieke content zoals filmpjes en afbeeldingen, kunnen we toch stellen dat er enkele zeer grote opslagplekken zijn zoals Youtube en Flickr.
    Zelfs het social networking platform is redelijk centraal te noemen door de hegemonie van FaceBook.
    Binnen organisaties is het alles behalve homogeen. Er is een intranet (vaak meer dan één) , een DMS (vaak meer dan één), een CRM, databases voor bedrijfsdata, filesystemen, e-mail etc.
  • Metadata
    Tevens anders dan op het internet doet metadata binnen organisatie er wél toe. Enterprise search oplossingen drijven op metadata om structuur aan te kunnen brengen, relaties tussen informatie te signaleren en filters in de zoekresultaten aan te kunnen bieden.
    Daar waar er op het internet gebruik kan worden gemaakt van PageRank algoritmen en het gigantische aanbod aan indicatoren rondom het bezoek van websites, gebruikte zoekwoorden etc. van miljoenen gebruikers, ontbreken deze indicatoren binnen de bedrijfsmuren.
    Zonder metadata is de bedrijfsinformatie zeer slecht vindbaar.

Introduceer het begrip SEO dus ook bínnen uw organisatie en maak de vertaling van zoeken naar vinden. Om informatie en documenten beter vindbaar te maken moet aandacht uitgaan naar zowel het beheer als de ontsluiting van informatie.
Als uw interne zoekmachine niet goed functioneert is de kans groot dat het te maken heeft met de kwaliteit van de content.

Attivio haalt 34 miljoen op

bron: http://www.boston.com/business/technology/innoeco/2012/10/attivio_collects_34_million_in.html

Attivio timmert zeer goed aan de weg (ze hebben afgelopen week 34 miljoen aan nieuwe investeringen ontvangen).
Ze hebben een specieke “Analytics” en “BI” insteek, maar dan gebaseerd op zoektechnologie.
Zij zijn naar mijn weten de engine die “joins” (combineren van relationele data) kunnen doen tijdens het uitvoeren van een query. Wat in ieder geval uniek is, is dat de querytaal zowel “free text” kan zijn als “SQL”.
Dat geeft ze de mogelijkheid om direct aan te sluiten op bestaande BI tools omdat dit meestal SQL “praten”. Die tools zijn immers bedoeld om tegen databases aan te praten.
Attivio is er daarmee in geslaagd om “the best of both worlds” te combineren:
  • zeer snelle performance voor het uitvoeren van full-text zoekvragen op ongestructureerde data (zoals we gewend zijn van search engines)
  • gebruik maken van SQL en andere mogelijkheden om  gestructureerde data en ongestructureerde data te verbinden.

Meer over de insteek van Attivio’s “Active Intelligence Engine” op http://www.itbriefcase.net/the-power-of-unifying-unstructured-and-structured-data-for-business-intelligence

Google kondigt de Google Search Appliance versie 7.0 aan

Vandaag heeft Google de nieuwe versie van de Google Search Appliance software aangekondig: versie 7.0

Belangrijkste verbeteringen:

  • Entity recognition (Entiteit herkenning)
    Dit mag de grootste functionele update van de GSA sinds tijden genoemd worden.
    Tot nu toe gold het principe “garbage in – garbage out”, oftewel als de te indexeren content slechte of geen metadata heeft, dan zullen de zoekresultaten ook van gemiddelde kwaliteit zijn en filters (zoals de krachtige  facetten (zie http://en.wikipedia.org/wiki/Faceted_search)) zijn niet mogelijk.
    Met entity recognition wordt het mogelijk om gestructureerde metadata aan ongestructureerde content toe te voegen. Zie http://en.wikipedia.org/wiki/Named-entity_recognition voor de meer theoretische achtergrond van dit principe.
    Praktische voorbeelden zijn het herkennen van productnamen, plaatsnamen, persoonsnamen etc.
  • Moderne standaard search result page
    Sinds 2005 was de standaard met de GSA meegeleverde zoek- en resultaatpagina niet meer ge-updated. Google.com heeft sindsdien echter vele verbeteringen doorgevoerd.
    De GSA bevat nu een sterk gemoderniseerde standaard SERP.
  • Beter relevantie berekening
    In versie 6.14 werd nog uitsluitend gebruik gemaakt van het “page rank” algoritme dat Google.com zo groot heeft gemaakt.
    De heterogene bronnen met zo weinig onderling gelinkte pagina’s binnen organisaties, waren hier echter niet mee geholpen.
    Het gevolg was een relatief lage ranking van documenten die via “feed”-mechanismes werden geindexeerd.
  • Betere schaalbaarheid
    Eén enkele GSA kan nu meer dan 10 mln documenten bevatten. Dit zal de architectuur voor grote omgevingen versimpelen omdat er minder “gestapeld” hoeft te worden.

Het hele artikel is hieronder opgenomen.

Introducing the Google Search Appliance, version 7.0

TUESDAY, OCTOBER 9, 2012

Posted by Matthew Eichner, General Manager, Enterprise Search 

Every day, Google helps people find the information they need, when they need it. When you need to know which spices make for a great butternut squash soup, typing just a few words into Google yields the answer in a fraction of a second.

In the workplace, people’s needs and expectations for search are similar. You might be searching for last quarter’s sales goals, product launch materials or your colleague’s telephone number – but there isn’t one simple search box to help you find all the information you need. When 60 percent of corporate workers say that it’s hard to find information within their organization1, something needs to change.

Ten years ago, Google introduced a bright yellow “Google in a box” for enterprises, giving them one simple way to search all content within their organization. Today we are adding new capabilities for Google Search Appliance customers. GSA 7.0 delivers a universal, powerfully relevant, yet simple and familiar search experience to your users.

Universal search
The GSA 7.0 helps you find information stored anywhere in your organization, whether you’re using a desktop, smartphone or tablet. Administrators can easily add content sources from secure storage, cloud services or the public web and social networking sites. GSA 7.0 also provides Google-quality search for SharePoint 2010, making for a more simple and intuitive, all-in-one search experience.

Powerful simplicity
Users are happy when they get relevant results returned quickly. At Google, speed and relevance are the core components of a great search experience. With GSA 7.0, we’ve refined our relevance signals so that the most useful information for each particular user is always easy to find. Assisted navigation makes it easy to refine search results, and requires no manual configuration from administrators. Entity Recognition automatically identifies and suggests content you might be looking for, and GSA 7.0 also harnesses the “wisdom of crowds,” allowing employees to add their own search results.

More search magic for business
GSA 7.0 also adds a new set of powerful search features, such as:

  • Document preview – view thumbnails and flip through full-screen document previews right alongside search results.
  • Google Translate – secure and automatic translations display in search results, in more than 60 languages.
  • Updated language capabilities – including parsing the complex morphology of Arabic, Chinese, Japanese and Korean to improve results. Expert search – tap into your organization’s knowledge graph, and instantly collaborate with colleagues who have answers.
  • New interface – a more beautiful search experience rolling out with the GSA 7 series.
  • Improved scale – a single rack of GSAs could now fit the equivalent of the entire Google.com index in 2000 – 1 billion pages.

Search should help your users, not become a source of frustration – especially as the volume of corporate content grows. GSA 7.0 provides a tool that will meet your users’ expectations for relevant and universal search, no matter where they are.
For more information about the Google Search Appliance and to contact our sales team, visitour website.

 

Bron: http://googleenterprise.blogspot.co.uk/2012/10/introducing-google-search-appliance.html