Come indicizzare un sito web? Introduzione a Google Search Console

Un avvocato che si dedica ad un blog fa' un investimento, perlomeno in termini di tempo. Tipicamente, il ritorno che ci si aspetta è una maggiore visibilità e la possibilità di trovare nuovi clienti su internet.

Tuttavia, alcuni aspetti tecnici, ove trascurati, possono frustrare tale aspirazione. In questo articolo ne consideriamo uno tra i principali: come indicizzare un sito web o blog con Google.



Introduzione

Gran parte del traffico internet passa per i motori di ricerca, Google in primis. L'utente digita qualcosa, effettua una query, il motore di ricerca restituisce una lista di risultati, pagine web, in un certo ordine.

L'ordine, e il tanto agognato posizionamento in pagina 1, è stabilito da una serie di fattori, non tutti noti: di questo abbiamo parlato nel nostro articolo: Seo per avvocati.

Tuttavia, affinché si possa anche solo aspirare ad un buon posizionamento, è necessario che Google si accorga dell'esistenza del nostro sito internet o articolo appena pubblicato sul blog.

Il primo step consiste nell'accertarsi che il nostro sito sia stato correttamente indicizzato da parte dei motori di ricerca, che il procedimento sia almeno iniziato, che proceda e che non vi siano errori che potrebbero ostacolare l'indicizzazione e penalizzare il posizionamento.

Tutto ciò vale per qualsiasi motore di ricerca; tuttavia, di qui in avanti vedremo come indicizzare un sito su Google e illustreremo uno strumento dedicato: Google Search Console.

L'argomento è molto ampio: qui tratteremo gli aspetti più accessibili ad un utente senza particolari competenze tecniche in materia.

Cosa si intende per indicizzazione

Come abbiamo accennato, per indicizzazione si intende il processo attraverso cui Google:

  • trova un sito internet
  • ne scansiona le pagine
  • si "fa' un'idea su di cosa trattano
  • le "memorizza" e le salva in un proprio indice, rendendole disponibili per le future ricerche degli utenti.

Per far questo, Google si serve di software noti come spider o web crawler che scansionano senza sosta il web.

Gli spider

Il nome è piuttosto efficace nel dare un'idea di cosa fanno gli spider: si muovono sul web (rete), passando da un sito all'altro, seguendo i link che li uniscono, scoprendo nuove pagine web appena pubblicate o scansionando periodicamente quelle già note.

Ecco un punto molto importante: Google trova e indicizza le pagine web seguendo i link che le collegano; questo comporta che la velocità con cui una pagina web viene trovata ed indicizzata dipende dalla presenza o meno di link che portano a quella pagina.

I link possono essere di 2 tipi:

1 - Interni: internal linking

Collegano tra loro le pagine web dello stesso sito.

Un fattore che influenza positivamente tanto l'indicizzazione quanto il posizionamento assegnato è la logica osservata nello strutturare il sito internet e i suoi contenuti: questa deve portare ad avere un collegamento coerente tra le pagine, cosa che favorisce il propagarsi degli spider dall'una all'altra e "aiuta" Google ad indicizzarle correttamente.

I link interni possono avere origine:

Nel menu di navigazione

Senza dilungarci troppo, possiamo dire che i contenuti di un sito vanno organizzati secondo una gerarchia di categorie e sottocategorie: queste si rifletteranno nel menu di navigazione, che conterrà i link alle categorie, mentre da queste partiranno link verso eventuali sottocategorie e infine le singole pagine.

Si parla infatti di alberatura, al cui apice abbiamo la home page e a seguire, come detto, categorie e sottocategorie.

schema di alberatura di un sito internet
schema di alberatura di un sito internet
Nelle singole pagine

Abbiamo un articolo sul nostro blog in cui parliamo di un certo argomento: sarà utile inserire un link ad un altro articolo che abbiamo pubblicato in precedenza su un argomento attinente che il lettore potrà trovare interessante.

In definitiva, è questo che conta: organizzare in contenuti in maniera che questi possano essere fruiti in maniera pratica ed efficace dall'utente: Google se ne accorgerà e premierà.

2 - Esterni: backlink

Provengono da altri siti internet. Questi non solo rendono nota a Google l'esistenza di una pagina: se questa riceve un numero elevato di backlink, Google ne desume una certa autorevolezza per la pagina in questione e finirà per assegnarle un buon posizionamento.

Il ragionamento è: se tanti rimandano a questa pagina, vuole dire che questa ha qualcosa di interessante e vale la pena proporla bene in vista agli utenti che effettuano una ricerca.

Ti starai chiedendo:

Se i backlink sono così utili, come faccio ad averli?

Difatti, tutti li cercano e sono molto ambiti; la risposta è però semplice:

Bisogna produrre contenuti che risultino utili ed interessanti per gli altri utenti di internet: questi saranno portati ad indicarli come proprie fonti nei testi che pubblicheranno a loro volta e a farvi riferimento attraverso un link.

Ricapitolando

Da quanto abbiamo detto, possiamo trarre due conclusioni:

  • in assenza di link verso una pagina Google potrebbe non trovare mai e dunque non indicizzare affatto un sito internet;
  • l'indicizzazione richiede un tempo variabile.

Fatta questa introduzione, possiamo chiederci: abbiamo appena pubblicato il nostro nuovo sito o un articolo sul nostro blog: cosa possiamo fare per agevolarne l'indicizzazione?

Come controllare se il mio sito è stato già indicizzato?

Possiamo effettuare una ricerca e digitare: site:iltuosito.com: verranno elencate le pagine già indicizzate.

screenshot di Google

Se invece gli spider non ci hanno ancora fatto visita:

screenshot di Google

Google Search Console

I motori di ricerca forniscono uno strumento che consente di chiedere l'indicizzazione di un sito o pagina web e di ricevere una serie di informazioni su:

  • lo stato del processo di indicizzazione;
  • eventuali errori;
  • come gli utenti trovano le pagine (già indicizzate): per quali ricerche queste vengono mostrate all'utente e in che posizione.

Ciascun motore di ricerca ha una propria soluzione: ci sono anche Bing Webmaster Tools e Yandex.Webmaster.
In questo articolo parliamo di come indicizzare un sito con Google Search Console.

Come attivare Google Search Console?

Basta un account Google, ma occorre poi:

  • aggiungere il nostro sito;
  • autenticarsi: l'accesso viene concesso solo al proprietario del sito internet.
Aggiungere il tuo sito

Secondo la terminologia usata da da Google, bisogna aggiungere una proprietà.

Puoi scegliere tra due metodi:

screenshot da Google Search Console
Aggiungi proprietà
Autenticazione

Vi sono 5 modalità di attivazione; se però scegli la proprietà "Dominio" ti sarà possibile autenticarti solo attraverso DNS.
Con "Prefisso Url" invece, sono praticabili in alternativa tutti i 5 metodi di autenticazione.

Qui esponiamo quello meno ostico per un utente alle prime armi; sono necessari due passaggi:

  1. scaricare un file html da Google
  2. caricare il file sul server.
screenshot di Google Search Console verifica proprietà
Verifica proprietà
Upload del file html

È necessaria una breve introduzione.

Il tuo sito non è altro che un insieme di file e cartelle salvate sul server del tuo host.

Il tuo host ti consente di collegarti alla cartella del server dove hai installato il tuo sito: lì potrai modificare, scaricare, cancellare i file, come fai abitualmente con il tuo computer. Per poterti collegare ti vengono fornite delle credenziali: più precisamente, un account FTP.

Se non hai queste credenziali, dovrai chiederle al tuo host, o comunque dovrà averle chi ha realizzato il tuo sito: con tutta probabilità sarà la stessa persona che lo ha pubblicato, caricandolo sull'host.

Con le credenziali FTP potrai connetterti al server dove è installato il tuo sito attraverso un client FTP: si tratta di un software che ti consente di collegarti all'host e avere accesso ai file che vi sono salvati.

Un client FTP molto diffuso è Filezilla.

Ecco come si presenta una volta avviato:

screenshot di client FTP Filezilla
Filezilla

In alto trovi i campi per inserire le coordinate del tuo account FTP: host - username - password.

Una volta connesso al server, sulla sinistra vedrai i file e le cartelle che sono sul tuo computer; sulla destra quelle che sono sul server dove è pubblicato il tuo sito. Per la precisione, dovrai trovare l'esatta cartella dove risiede il tuo sito internet: spesso si tratta di /public_html; all'occorrenza, chiedi al tuo host.

Per autenticarti come proprietario del sito che vuoi monitorare tramite Google Search Console devi dunque caricare il file html.

Dovrai cercare il file che hai scaricato tra le cartelle del tuo computer visualizzate a sinistra, selezionarlo con il tasto destro e poi upload. Effettuato l'upload, vedrai il file nell'elenco di destra: sul server.

Una volta caricato il file, dovrai ultimare la procedura con due ultimi passaggi:

  1. digitare nel tuo browser, nella barra degli indirizzi, il percorso al file che hai appena caricato: iltuosito.com/nome-del-file.html
  2. cliccare su Verifica secondo le istruzioni che troverai nel tuo account di Google Search Console.

Fai attenzione: le performance del sito che hai aggiunto verranno registrate se manterrai il file html sul tuo server. Non rimuoverlo.

Ora: hai aggiunto una proprietà e completato l'autenticazione. è completa. Hai accesso a tutte le funzionalità di Google Search Console; per descriverle tutte non basterebbe un articolo. Qui ci limitiamo a quelle che ti consentono di chiedere l'indicizzazione e, come prima cosa, aggiungere un sitemap.

Sitemap

Il sitemap è un file xml che fornisce a Google una mappa di un sito internet: vi sono elencate tutte le url delle pagine da indicizzare.

Grazie ad un file sitemap l'indicizzazione sarà più veloce perché non dovrai aspettare che siano gli spider a trovare il tuo sito: con il sitemap gli fornisci una mappa e comunichi la tua intenzione di procedere.

Online vi sono tanti strumenti che consentono di generare un file sitemap: dovrai inserire l'indirizzo del tuo sito, questo verrà scansionato e alla fine potrai scaricare il file.

Dovrai poi:

  • caricare il file sitemap.xml sul server con Filezilla, come visto poco fa';
  • avvertire Google che hai caricato il file sitemap.

Vediamo come.

Aggiungi sitemap

Su Google Search Console, a sinistra trovi: Sitemap:

screenshot da Google Search Console
Sitemap

Dovrai inserire il percorso al file sitemap: se lo hai caricato nella cartella principale del tuo server, che come visto può essere /publc_html, il percorso da inserire (come vedi nello screenshot precedente) sarà https://iltuosito.com/sitemap.xml.

Clicca INVIA e...Google saprà cosa fare.

Inserimento manuale delle url

Quanto abbiamo visto finora è necessario quando hai appena pubblicato un sito nuovo, magari con tante pagine da indicizzare.

L'esigenza di indicizzazione è però la stessa se hai appena pubblicato un articolo sul tuo blog e vuoi che questo venga trovato il prima possibile.

In tal caso, hai dunque una sola url da sottoporre a Google: puoi servirti del Controllo URL

screenshot da Google Search Console
Controlla url

In tal modo, potrai verificare se la pagina è stata già indicizzata e, in ogni caso, chiederne l'indicizzazione.

Questa pagina è stata già indicizzata...

screenshot da Google Search Console
Pagina indicizzata

e questa ancora no.

screenshot da Google Search Console
Pagina da indicizzare

Robots.txt

Qui entriamo un po' sul tecnico e non ci dilungheremo; ci limitiamo a segnalare l'esistenza di un file, detto robots.txt, salvato sul server, che da' istruzioni ai motori di ricerca su cosa indicizzare, e cosa no.

Per adesso possiamo dire che un file robots.txt è un file di testo, salvato nella cartella principale del tuo server, che specifica se tutti o alcuni spider possono o non possono accedere a determinate parti del sito internet, ponendo delle regole.

Ad esempio:

Con la regola che segue consenti a qualsiasi web crawler di indicizzare ogni cosa del tuo sito.

User-agent: *
Allow: /


Con questa invece neghi a qualsiasi spider l'accesso e dunque l'indicizzazione a qualsiasi contenuto del tuo sito che si trovi nella cartella /esempio.

User-agent: *
Disallow: /esempio


IN BREVE: le regole possono essere solo Allow oppure Disallow, a seconda che si voglia concedere o meno l'accesso agli spider indicati come user-agent a determinate cartelle del sito.

Fai attenzione dunque: un file robots.txt configurato male può impedire a Google di indicizzare il tuo sito internet, del tutto o in parte.

Magari torneremo su questo ed altri aspetti tecnici, finora solo accennati, in un prossimo articolo.

C'è dell'altro che posso fare?

Abbiamo fin qui illustrato come agevolare l'indicizzazione da parte di Google del nostro sito internet o blog.
I tempi rimangono comunque lunghi e non troppo comprimibili.

C'è però altro che puoi fare: promuovi il tuo sito, blog o articolo.

Pensaci: hai investito tempo e soldi per avere finalmente qualcosa pubblicato online che possa parlare di te e delle tue competenze: promuovilo attivamente.

Come?

Comincia con il condividere il tuo ultimo articolo sui social network e fallo con convinzione: se posti solo il link, senza un testo di presentazione che introduca il contenuto ad un lettore che potrebbe essere interessato, chi ci cliccherà mai sopra?

Al contrario, tramite una tua attività di promozione e supporto sui social, più persone arriveranno sul tuo blog dai social e questo può attirare l'attenzione di Google, favorendo una più veloce indicizzazione.



Vincenzo Lalli

Vincenzo Lalli

Di formazione legale, appassionato da sempre di tecnologia ed informatica; esperienza professionale acquisita a cavallo tra i due mondi, finora piuttosto lontani tra loro. Mi dedico ad esplorare le crescenti interazioni tra il Diritto e la tecnologia, e a dare il mio contributo alla causa dell'innovazione nel settore legale; a tal fine, ho dato vita ad Avvocloud.net.

Contatti


Creative Commons License

Leggi anche

Tecnologia

Come indicizzare un sito web? Introduzione a Google Search Console
Mag 24, 2022
Un avvocato che si dedica ad un blog fa' un investimento, perlomeno in termini di tempo. ...
Che cos'è un token?
Mag 27, 2021
Una delle attualmente più discusse applicazioni della blockchain attiene agli NFT, acronimo di non ...
Come funziona Bitcoin?
Apr 30, 2021
Tutti ormai ne hanno sentito parlare, ma come funziona Bitcoin?Per cominciare, possiamo dire che ...