Scansione Indicizzazione e Ranking

L’indicizzazione spesso viene confusa con il posizionamento. Si sente spesso dire frasi di questo tipo: “Il tuo sito è indicizzato,?”, “Mi fai un preventivo per l’indicizzazione?”. L’indicizzazione è gratuita, non si paga, Google la fa in automatico sul tuo sito.

Quello che si paga è il posizionamento perché è quest’ultimo che risulta difficile da realizzare e se non viene fatto con una certa metodologia il rischio è quello di non indicizzare correttamente il sito e di conseguenza non comparire mai tra i primi posti di Google.

Vediamo di fare chiarezza su questi 3 punti fondamentali per comprendere il funzionamento di Google, così da poter creare una solida base di partenza per una strategia SEO.

[info_box title=”Indice dell’articolo” image=”” animate=””]

  1. Scansione della pagina
  2. Come fa Google a trovare e scansionare le pagine di un sito?
  3. Come fa Google a capire quali pagine scansionare e quali no?
  4. Come migliorare la scansione
  5. Indicizzazione
  6. Come Indicizzazione un sito web
  7. Bloccare la scansione con il tag noidex e il robots.txt
  8. Perché impostare il tag NOINDEX
  9. Come migliorare l’indicizzazione si un sito web
  10. Posizionamento o Ranking
  11. Come migliorare il posizionamento

[/info_box]

indicizzazione google
Come Google Scansiona, indicizza e posiziona le pagine

Scansione delle pagina

La scansione è la fase in cui Googlebot rileva nuove pagine nel web. Per scovare nuovi siti internet Google utilizza dei programmi che vengono chiamati con diversi nomi che sono i seguenti: robot, bot o spider.

Questi programmi utilizzano degli algoritmi per capire quante volte scansionare un sito e quante volte visitarlo, assegnando così un Budget in termini di tempo da dedicare al tuo sito. Più il sito è autorevole, segue le linea guida, pubblica contenuti di valore etc., più il Budget che gli è stato assegnato è alto.

Più il Budget è alto, più Google valuta autorevole il tuo sito. Questa fase prende il nome di Crawl Budget.

 

Come fa Google a trovare e scansionare le pagine di un sito?

La scansione di un sito inizia dal momento in cui Google viene a conoscenza dell’esistenza di un sito internet,; per far conoscere un sito a Google è necessario inviare una sitemap che altro non è che una pagina in formato XML con il percorso sotto forma di URL di tutte le pagine.

indicizzazione
Esempio di come inviare la sitemap

 

Così facendo il motore di ricerca viene a conoscenza del sito internet e di tutte le pagine che lo compongono.

Un altro modo in cui Google può venire a conoscenza di un sito internet è tramite i link di collegamento che provengono da altre pagine: in questo caso parliamo di Link Building esterna nel caso in cui questi link arrivino da siti esterni e Link building Interna nel caso in cui provengano da altre pagine del sito.

 

Come fa Google a capire quali pagine scansionare e quali no?

  • Google non scansiona le pagine bloccate dal robots.txt, ma potrebbe essere comunque in grado di indicizzarle se queste pagine sono raggiungibili tramite dei link interni. Ad esempio se abbiamo la Pagina A bloccata con il robots.txt e la pagina B non bloccata con il robots.txt che contiene però un link che punta verso la pagina A, Googlebot sarà in grado di raggiungere la pagina A e indicizzarla anche se risulta bloccata.
  • Se Google trova delle pagine duplicate allora visiterà con meno frequenza queste pagine.

 

Come migliorare la scansione

Ci sono molti modi per migliorare la scansione delle pagine di un sito web, vediamone alcuni:

  • Inviare una sitemap
  • Inviare richieste di scansione di singole pagine tramite l’apposito strumento di Google Search Console
  • Utilizzare percorsi di URL semplici che contengono la parola chiave del topic principale.
  • Indicare la pagina canonica e le pagine alternative
  • Utilizzare hreflag per i siti multilingue.

indicizzazione google

Indicizzazione

Per comprendere cosa è l’indicizzazione dobbiamo pensare a Google come il capo di una enorme libreria, nella quale ogni libro rappresenta un sito e ogni pagina di un sito rappresenta una pagina del libro.

Immaginate ora che il capo della libreria abbia letto ogni libro e memorizzato ogni singola pagina.

Quando arriva una richiesta al librario, egli è in grado di fornire il miglior libro a quell’utente, indicandogli anche la pagina precisa in cui trovare le informazione che sta cercando.

Ecco, questa è l’indicizzazione che è la fase in cui Google è venuto a conoscenza di un sito internet e aggiunge le informazioni in esso contento all’interno del suo indice.

 

Come Indicizzazione un sito web

Indicizzare un sito web è un’operazione fondamentale se vogliamo che il nostro sito web sia posizionato nelle [tooltip hint=”Search Engine Result Page, pagina dei risultati”]SERP[/tooltip] di Google.

Per comprendere i contenuti di una pagina, gli spider sondano la pagina alla ricerca dei tag ritenuti più importanti. Inserire quindi il <title> o i vari attributi ALT delle immagini è essenziale per far comprendere il contenuto della pagina al motore di ricerca.

 

Google, pur essendo molto intelligente, non è in grado di capire alcuni tipi di contenuti, come quelli multimediali, perciò i vari tag ALT devono essere presenti e devono essere impostati correttamente, descrivendo il contento dell’immagine, aiutando così il motore di ricerca nella comprensione del documento.

Se tra la fase di scansione e indicizzazione lo spider trova due o più contenuti uguali li segnala come duplicati e di conseguenza li visiterà con minore frequenza, mentre se trova dei contenuti simili assegnerà loro il tag canonical che serve per rappresentare quale tra le pagine deve essere presa in considerazione ai fini del posizionamento.

 

Bloccare la scansione con il tag noidex e il robots.txt

Per impedire l’indicizzazione di una pagina o per rimuoverla dall’indice di Google possiamo ricorrere al tag NOINDEX che deve essere messo nell’ header della pagina in modo tale che appena lo spider arriva analizzerà sì la pagina, ma non ne inserirà il contenuto nell’indice.

E’ importante però che la pagina sia raggiungibile dallo spider perché se il nostro scopo è togliere dall’indice una determinata pagina questa deve essere raggiungibile. Se abbiamo impostato in precedenza il robots.txt con il comando Disallow: /nomepagina Googlebot non sarà in grado di raggiungere la pagina e di vedere se è impostato il tag NOINDEX o no.

 

Perché impostare il tag NOINDEX

Ci sono molti motivi per cui non si voglia indicizzare una pagina di un sito web, ad esempio la pagina potrebbe contenere dei file importanti che non vogliamo siano resi facilmente reperibile su Google ( ma comunque rimangono raggiungibili per chiunque fosse in possesso della URL).
Oppure si può impostare il tag NOINDEX quando vogliamo togliere dall’indice di Google la nostra pagina, magari vecchia che non genera traffico andando così ad ottimizzare il Crawl Budget.

indicizzazione
Copertura delle pagine indicizzate su Google

Come migliorare l’indicizzazione si un sito web

Esistono numerose tecniche per migliorare l’indicizzazione di un sito:

  • utilizzare dati strutturati in formato J-SON come sonsigliato da Google;
  • seguire le istruzioni per i webmaster di Google;
  • inviare la sitemap a Google.

 

Posizionamento o Ranking

 

L’obiettivo di Google, oltre a quello di guadagnare soldi, è quello di fornire la miglior risposta a una determinata domanda. Svolgendo questo lavoro in maniera eccezionale, cosa che effettivamente fa, Google garantisce ai publisher (cioè a tutte quelle persone che utilizzano Google Ads per fare delle campagne pubblicitarie) che i loro annunci saranno visti dalle persone giuste.

Fatta questa piccola premessa ecco come funziona Google.

Quando un utente inserisce una query nella barra di ricerca, i computer di Google (parliamo di computer veramente enormi che si trovano dentro a degli hangar giganteschi) vanno ad analizzare i loro enormi indici e restituiscono i risultati ritenuti più pertinenti.

Se ciò non dovesse accadere, Google si troverebbe di fronte a un enorme problema: infatti gli utenti riterrebbero il motore di ricerca poco affidabile, smettendo di utilizzarlo e i publisher non avrebbero più utenti a cui far vedere i loro annunci.

Google, per decidere quali siano i contenuti più pertinenti oltre ai computer descritti poco fa, utilizza circa 200 algoritmi e la maggior parte di essi sono segreti. Secondo i vari guru della SEO sono circa 50 quelli che conosciamo.

Gli unici dati certi che ci sono ce li fornisce Google stesso nelle linee guida nelle quali dice di tenere in considerazione fattori come la User Experience. Assicurati quindi che il tuo sito si carichi velocemente e che abbia una versione mobile ottimizzata.

Come migliorare il posizionamento

  • Seguire le istruzioni per i webmaster di Google;
  • Prendere in considerazione l’implementazione dei dati strutturati;
  • Implementare una versione AMP per velocizzare notevolmente il caricamento delle pagina da smartphone;
  • Concentrarsi sulla qualità dei contenuti.

 

Hai problemi di indicizzazione?

Non aspettare oltre scrivimi per iniziare ad indicizzare il tuo sito e iniziare a guadagnare

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *