2   3   4   5   6   7   8   9 

Pliki robots.txt i sitemap.xml. Kontrola zachowania robotów internetowych

8. Lista map

Mapa witryny może być zapisana w jednym pliku lub może być podzielona na wiele plików. W przypadku podzielenia mapy witryny na wiele plików należy także przygotować indeks map witryny. Indeks map jest plikiem XML, w którym występują elementy: sitemapindex, sitemap, loc oraz lastmod.

Pojedynczy plik z indeksem może zawierać informacje o 1000 map.

Zatem wielkość mapy podzielonej na wiele plików jest ograniczona do:

1 000 * 50 000 = 50 000 000

adresów URL.

8.1 Element sitemapindex

Element sitemapindex jest wymagany. Zawiera on adresy map witryny. Atrybut xmlns ustala wersję protokołu sitemap:

<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>...</sitemap>
  <sitemap>...</sitemap>
  ...  
</sitemapindex>

8.2 Element sitemap

Element sitemap jest wymagany. Występuje wyłącznie wewnątrz sitemapindex. Opisuje on pojedynczy plik z mapą witryny. Zawiera elementy: loc oraz lastmod.

Element loc jest wymagany. Występuje wyłącznie wewnątrz sitemap i ustala adres URL pojedynczego pliku z mapą witryny.

Element lastmod jest opcjonalny. Ustala on datę ostatniej modyfikacji podanego pliku z mapą witryny:

<sitemap>
  <loc>http://www.example.pl/artykuly.xml</loc>
  <lastmod>2007-10-20</lastmod>
</sitemap>  
lp. Element Może wystąpić w Może zawierać Wymagany/Opcjonalny Znaczenie
1. sitemapindex - sitemap wymagany Zawiera listę adresów URL.
2. sitemap sitemapindex loc, lastmod wymagany Opisuje pojedynczą stronę WWW.
3. loc sitemap - wymagany Adres dokumentu.
4. lastmod sitemap - opcjonalny Data ostatniej modyfikacji.

Tabela 3. Elementy XML występujące w indeksie map

8.3 Przykład mapy z indeksem

Mapa stosująca indeks składa się z wielu plików XML. W przykładzie plikami tymi są: sitemapindex.xml, artykuly.xml oraz przyklady.xml. W pliku sitemapindex.xml wymieniamy wszystkie mapy, zaś w plikach artykuly.xml oraz przyklady.xml wymieniamy poszczególne podstrony. Przykładowa mapa witryny podzielona na dwa pliki jest przedstawiona na listingu 2.

sitemapindex.xml
----------------
<?xml version="1.0" encoding="utf-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>http://www.example.com/artykuly.xml</loc>
    <lastmod>2007-10-20</lastmod>
  </sitemap>
  <sitemap>
    <loc>http://www.example.com/przyklady.xml</loc>
    <lastmod>2007-11-01</lastmod>
  </sitemap>
</sitemapindex>


artykuly.xml
------------
<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.gajdaw.pl/art1.html</loc>
    <lastmod>2007-11-02</lastmod>    
    <changefreq>daily</changefreq>
    <priority>0.7</priority>
  </url>
  ...
</urlset>


przyklady.xml
------------
<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.gajdaw.pl/p1.html</loc>
    <lastmod>2007-10-25</lastmod>    
    <changefreq>daily</changefreq>
    <priority>0.7</priority>
  </url>
  ...
</urlset>

Listing 2. Przykładowa mapa witryny podzielona na dwa pliki

...  2   3   4   5   6   7   8   9