Una mappa per meglio Orientarsi

Chi si occupa di siti web si è certamente trovato alle prese con dei file particolari chiamati “Sitemap.xml”, che assieme al “Robot.txt” servono (teoricamente) per dare delle indicazioni agli spider che contenuto andare a leggere del nostro sito e dove si trova.
Tuttavia, credo che molto spesso questi due indicatori di direzione all’interno della root principale dei nostri siti web non siano compilati nella maniera più adeguata.
Capita infatti che molti siti ne siano privi o pur avendoli siano compilati nella loro forma più semplice.
Vorrei soffermarmi in particolare sulle Sitemap, poichè il file Robot.txt è praticamente presente in quasi tutte le root dei siti web della rete.

Le Sitemap che siamo abituati a vedere hanno la seguente forma:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset>
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>

Questa scrittura è sicuramente corretta per indicare al crawler del motore di ricerca le informazioni basilari,quanti e quali sono gli url presenti nel nostro sito, la loro ultima modifica, generalmente ogni quanto vengono aggiotnati e la rilevanza che noi diamo a quel particolare url e quindi a quella pagina.

uttavia Google nelle sue pagine di approfondimento sottolinea che le sitemap possono comunicare molte più informazioni e che queste sono una buona pratica  per far si che i crawler indaghino meglio il nostro sito.

Ad esempio Google porta il seguente esempio:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″
xmlns:image=”http://www.sitemaps.org/schemas/sitemap-image/1.1″
xmlns:video=”http://www.sitemaps.org/schemas/sitemap-video/1.1″
xmlns:mobile=”http://www.google.com/schemas/sitemap-mobile/1.0″
xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9>
<url>

<loc>http://www.example.com/foo.html</loc>
<image:image>
<image:loc>http://example.com/image.jpg</image:loc>
</image:image>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
<image:image>
<image:loc>http://example.com/photo.jpg</image:loc>
</image:image>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.9</priority>
<video:video>
<video:content_loc>http://www.example.com/video123.flv</video:content_loc>
<video:player_loc allow_embed=”yes” autoplay=”ap=1″>http://www.example.com/videoplayer.swf?video=123</video:player_loc>
<video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc>
<video:title>Bistecche alla griglia per l’estate</video:title>
<video:description>Come ottenere bistecche sempre perfette</video:description>

</video:video>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://mobile.example.com/articolo100.html</loc>
<mobile:mobile/>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.7</priority>
</url>
<url>
<loc>http://www.example.com/business/article55.html</loc>
<news:news>
<news:publication>
<news:name>The Example Times</news:name>
<news:language>en</news:language>
</news:publication>
<news:access>Subscription</news:access>
<news:genres>PressRelease, Blog</news:genres>
<news:publication_date>2008-12-23</news:publication_date>
<news:title>Companies A, B in Merger Talks</news:title>
<news:keywords>business, merger, acquisition, A, B</news:keywords>
<news:stock_tickers>NASDAQ:A, NASDAQ:B</news:stock_tickers>

</news:news>
<lastmod>2005-01-01</lastmod>
<changefreq>daily</changefreq>
<priority>0.3</priority>
</url>
</urlset>
Come possiamo vedere la differenza tra la prima sitemap e la seconda è eveidente, sia per complessità, sia per completezza di informazioni.

Le considerazioni che scaturiscono possono essere molteplici, io vorrei soffermarmi solo su alcune:

1) Nella seconda sitemap possiamo notare che non sono solo indicati gli url base, ma addirittura il supporto a cui fanno riferimento
2) la presenza costante degli indicatori di modifica e di proprietà dell’url
3) La presenza di <title> e <description> per meglio identificare la tipologia del video, che il crawler “non vede”
4) la possibilità di far leggere al crawler contenuti per Mobile
5) L’importanza che viene data alla parte legata alle news, con la possibilità non solo di inserire delle keywords che le identifichino, ma addirittura delle keywords di macrocategoria per meglio collocarle all’internio della ricerca (NASDAQ:A, NASDAQ:B).

In ultima analisi non saprei dire se costruire una sitemap così complessa, ma così completa possa servire a meglio posizionare i nostri siti sulla Serp di Google, certo è che se non portasse a nessun vantaggio, non sarebbe stata così sviluppata, anche se sicuramente non potrà essere l’unico mezzo per scalare le migliori posizioni del motore di ricerca.

LinkedInDeliciousEmailFacebookCondividi