Buongiorno, da qualche giorno giungono segnalazioni che molti siti istituzionali realizzati secondo le linee di design non risultano più presenti nelle indicizzazioni di google. Chi mi può aiutare con qualche info in più?
Buongiorno Andrea
riscontriamo anche noi lo stesso problema.
Molti siti comunali sono spariti dall’indice, ma non tutti e non capiamo la ratio.
Il problema che rileviamo in search console usando lo strumento di Controllo url è:
“La pagina non è indicizzata: Pagina scansionata, ma attualmente non indicizzata”
Nella documentazione ufficiale di Google search dicono solo
La pagina è stata sottoposta a scansione da Google, ma non indicizzata. In futuro la pagina potrebbe essere indicizzata o meno, ma non è necessario inviare di nuovo l’URL per la scansione.
In rete abbiamo trovato un po’ di articoli (ad esempio questo oppure questo) dove fondamentalmente si parla di migliorare la qualità di contenuti.
Ma è davvero strano che da un giorno all’altro siano sparite centinaia di pagine…
Mi unisco perciò alla tua richiesta di aiuto
No, we didn’t find any suspicious activity in the contents of the sites.
Confermo quanto segnalato, anche il nostro sito è scomparso dai risultati di ricerca. Si trovano le singole pagine se si cerca un elemento specifico in esse contenuto.
Quello che appare strano è che anche siti di comuni con qualità alta e punteggi core web vitals alti e comuni che non sono ancora passati a Design Italia risulterebbero coinvolti in questo problema.
Al momento, anche se molto strano, sembrerebbero coinvolti tutti o comunque molti siti di comuni italiani, a prescindere da tecnologia, qualità, layout, …
Ma allora cosa significa è scomparso dai risultati di ricerca? Quale ricerca?
Sarebbe interessante, per capire, vedere un esempio di sito che non compare per quale ricerca. È lo stesso con altri motori di ricerca?
No dai nostri controlli su Bing non ci sono stati cambiamenti radicali, quindi io penso che si tratti dell’algoritmo di ranking di google.
Nel caso del mio comune, e di altri comuni della mia zona, è scomparso dai primi risultati, cercando ad esempio “comune XXX”, mentre se si va a fare la ricerca per sito (quindi con site:comune.xxxx.xx.it) le pagine compaiano, quindi sembra che siano indicizzate, ma con un ranking molto basso.
Ad esempio, ho fatto la prova con il mio comune e con quest’altri della mia zona; cercando semplicemente “comune XXX”, su Bing compaiono come primo risultato, e fino a poco fa ere così anche su Google, o comunque tra i primi.
Adesso invece non si trovano in tutta la prima pagina di risultati, e neanche scorrendo nelle pagine immediatamente successive.
Ad esempio:
- Paladina
- Almè
- Valbrembo
- Almenno San Salvatore
- Alzano Lombardo
- San Pellegrino Terme
A me viene tutta la mezza pagina di destra, dove Website rimanda a https://www.comune.paladina.bg.it/
Quello okay, ma è la sezione relativa all’attività (onestamente nemmeno ci avevo fatto caso, perché non guardo mai quella sezione a destra).
Nei risultati di ricerca a sinistra non compare più, mentre c’è sempre stato, e l’utente si aspetta di trovarlo li.
Ad esempio per il comune di Almè, quella sezione neanche compare, e quindi il sito da Google non è accessibile.
Buongiorno,
confermo quanto detto sopra, digitando “comune di xxx” in Google fino a poco tempo fa il primo risultato era sempre il sito del comune (il dominio ufficiale comune.[nome].[pr].it), ora non è più così.
Propendo anche io per un cambio nell’algoritmo di indicizzazione di Google (ad Agosto è stato fatto un cambio sostanzioso), ho provato a segnalare la cosa tramite il bottone “feedback” presente in Google ma non ho ricevuto risposte al momento.
Il problema sembra trasversale, a prescindere se il sito del comune adotta il layout PNRR o meno.
Per alcuni comuni sto provando a registrarmi nella Google Search Console per verificare le pagine indicizzate ma al momento non ho ottenuto risultati accettabili.
Sospetto necessità di questo rel="canonical"
citato in
per evitare che eventuali nuove versioni del sito vengano scambiate per “doppioni”
Nei siti istituzionali con problemi di indicizzazione vi risulta definito?
Ho dato una occhiata alla situazione insieme alla mia consulente SEO di fiducia, e
-
cercando ad esempio il comune di Paladina, il primo (o massimo secondo, dopo Wikipedia) risultato è quello della sezione “Amministrazione Trasparente”. Hostata presso un dominio terzo, il quale ad oggi ha un robots.txt che inibisce tutte le indicizzazioni. Se ne desume che fino a poco tempo fa questo sito fosse indicizzabile, motivo per cui adesso appare su Google
-
il medesimo dominio terzo compare tra i primi risultati Google per un po’ tutti i comuni citati in questo thread
-
altri comuni che hanno un diverso fornitore di servizi web sono correttamente indicizzati (cfr. Avigliana, in provincia di Torino)
La mia umile conclusione è che in Halley hanno combinato qualche casino nel configurare le proprie piattaforme, togliendo la regola di Disallow da una parte e aggiungendola dall’altra. Nel frattempo Google ha indicizzato, loro se ne sono accorti, e hanno rimesso a posto.
Se è così, passerà qualche settimana prima che i siti ufficiali tornino nei risultati di ricerca, e qualche mese prima che tutte le pagine siano nuovamente indicizzate e ricercabili.
Ciao Francesco,
La cosa strana è che settando l’url canonico (con o senza www), la search console segnala che “Google ha scelto una pagina canonica diversa da quella specificata dall’utente”. Quindi sembra un po’ un controsenso: chiede di precisarne uno ma poi dice che tanto lo sceglie lui.
@madbob
Temo che la situazione sia più complicata di così.
I siti che hanno subito il crollo di ranking stanno su piattaforme di hosting diverse , diversi provider, diversi template di sito, diverso tutto.
In mezzo, ci sono eccezioni - ma può darsi che anche per chi sembra finora immune il riaggiustamento del ranking possa arrivare in futuro.
Soprattutto, motori di ricerca diversi da Google non paiono influenzati, cosa che escluderebbe dalle cause le regole robots, che bene o male vengono seguite da tutti.
Se devo scommettere, non penserei a un qualche incidente occorso a un provider, piuttosto a qualcosa “alla radice”, legato strettamente a Google. Chiamiamolo un ricalibramento del loro algoritmo di ranking, che ha avuto effetti collaterali inaspettati.
Quindi se è così anche sulla eventuale normalizzazione della situazione non possiamo dire molto. Tempi e modi, dipendono da Google.
Confermo anche io, su diversi siti comunali creati col vecchio template di agid.
Stesso identico problema generico ma sempre e solo su motore di ricerca di google, se si usa bing i risultati sono invariati.
Avevo ipotizzato anche io potesse essere coinvolta in qualche modo Halley, visto che è l’elemento che potrebbe accomunare tutti i siti coinvolti, ma non vedo come il loro robots.txt possa causare problemi ad un sito su un altro dominio.
Nel caso del comune di Paladina, Halley viene usato solo per la parte di amministrazione trasparente, ma il sito web comune.paladina.bg.it è su un altro server, ed è un sito Wordpress.
A creare pasticci potrebbe essere il fatto che nelle pagine di Halley il pulsante “Homepage” riporta a “comune.paladina.bg.it”, quindi Google potrebbe aver indicizzato il “sottosito” su Halley some se fosse un duplicato del sito, e per qualche motivo da maggior priorità a quello piuttosto che al sito principale.
Il punto era: adesso il robots.txt blocca tutte le indicizzazioni, eppure quei contenuti sono oggi reperibili su Google.
La conclusione empirica: fino a poco tempo fa il robots.txt di Halley non bloccava niente, dunque è stato modificato qualcosa.
L’assunzione: se è stato modificato quello, magari è stato modificato qualcos altro in modo uguale e contrario (il robots.txt dell’hosting che governa i siti leciti).
Ad ogni modo: se il sito del comune di Paladina sta su uno spazio web erogato da un altro fornitore che non ha rapporti con Halley, e nessun sistema di Halley ha accesso ad esso in nessuna maniera (e.g. plugin Wordpress che fanno cose, o routine locali di aggiornamento, o cose del genere), evidentemente anche questa mia teoria non ha fondamento.
Posto che si tratti di un cambiamento intenzionale da parte di Google (e non un qualche tipo di inciampo tecnico temporaneo che si spera rientrerà da solo), mi chiedo quale sia lo scopo.
Intanto, è strano che un supposto cambiamento nei criteri di indicizzazione, così radicale e in un settore così specifico, non sia stato preannunciato, per dare modo a tutti di adattarsi per tempo.
Comunque, come ipotesi di lavoro, diamo per buono che sia stato fatto apposta, e cerchiamo di intuire se dietro c’è un’intenzione.
Se è tutto un complotto mirato a far migliorare la qualità delle homepage, che cosa si potrebbe fare?
Le prime mosse base SEO forse aiutano. Ad es., una sitemap xml? E, come si diceva sopra, controllare i canonical (ma credo che il canonical abbia rilevanza solo quando ci sono alternative o redirect).
C’è qualcuno che pur avendo queste cose tutte in ordine ha avuto siti penalizzati lo stesso?
La prima cosa che mi era venuta in mente, per la HP in particolare, è provare ad aggiungere metadati, che sappiamo che Google senz’altro apprezza.
Lo facciamo già per i servizi, perché non mettere un JSON-LD anche in home.
Il type adatto di schema.org potrebbe essere questo: GovernmentOrganization.
Aiuterebbe a distinguere il sito “ufficiale” da altre menzioni del Comune in giro per la rete (Wikipedia, ecc.), a cui adesso sembra venire dato più credito.
Altre idee?