Il web è innanzitutto uno spazio di informazione, cioè un luogo virtuale nel quale troviamo documenti digitali interconnessi o, come più comunemente diciamo, “linkati” tra di loro. Questo spazio è diventato sempre più grande e, con l’arrivo dei blog e poi dei social, ha iniziato a crescere in maniera esponenziale, tanto da lasciare attonita anche la nostra più fervida immaginazione. Basti dire che in rete troviamo oggi oltre due miliardi di siti web (e Amazon o Wikipedia sono un solo sito web con migliaia di pagine!) e che ogni minuto gli utenti caricano su YouTube circa cinquecento ore di video.
Già all’inizio degli anni ’90 è stato chiaro che, per potersi raccapezzare in questo immenso, mutevole e a tratti informe mondo digitale, serviva una guida. In questo articolo esploriamo tre tipologie di strumenti che offrono una guida nel web.
Virgilio e la selva oscura
C’è stato un momento in cui i pionieri del web, impegnati a scoprire e dare forma a un nuovo mondo digitale, erano avidi di metafore: il cyberspazio era una prateria, una biblioteca digitale, una piazza del villaggio globale e i motori di ricerca erano, appunto, guide. Così in Italia nacque Virgilio, un motore di ricerca in lingua italiana chiamato con il nome del sommo poeta latino che, nella Divina Commedia, conduce Dante attraverso la selva oscura, l’Inferno e il Purgatorio. Virgilio utilizzava la classificazione umana: c’erano persone che, come bibliotecari del web, recensivano e catalogavano i siti. Questo approccio, utilizzato anche dal piu famoso Yahoo!, è stato superato dagli eventi: oggi le informazioni sul web sono semplicemente troppe perché degli esseri umani possano classificarla, e cambiano troppo in fretta perché tali classificazioni risultino davvero utilizzabili.
Nessuno però ha mai messo in discussione l’idea che il web, senza una porta d’accesso più o meno intelligente e usabile, sia una giungla impenetrabile: può contenere tesori inestimabili, ma nessuna persona ragionevole perderebbe il suo tempo a cercarli senza una guida o senza almeno una mappa. Tant’è vero che la maggior parte delle sessioni di navigazione oggi inizia con una ricerca. L’evoluzione del web e delle nostre pratiche di condivisione delle informazioni ha portato a una costante evoluzione dei sistemi di ricerca e oggi possiamo scegliere tra diversi tipi di guida o di porta sul mondo digitale: ad esempio, possiamo setacciare, conversare o riassumere.
Setacciare
I motori di ricerca sono da oltre due decenni la principale porta d’accesso al web. Abbandonata la classificazione umana di Virgilio e Yahoo!, lavorano oggi con algoritmi sempre più sofisticati, come quelli di Google. Un motore di ricerca offre una selezione di pagine web rilevanti, e la parola chiave qui è “rilevanti”, che significa più o meno “utili per l’utente in quel momento” (ne abbiamo parlato qui). Nei suoi data center, Google possiede una copia aggiornata e quasi completa del web e utilizza oltre duecento criteri per selezionare e ordinare i risultati che propone ad ogni nostra richiesta. Tra questi rientra chiaramente la presenza o meno delle parole chiave (nel testo, nel titolo, una o più volte, ecc.), ma anche la conformazione del documento (quantità di testo, presenza di immagini, data di aggiornamento, ecc.), la relazione tra l’utente e il documento (la lingua, la regione geografica di provenienza, se il documento è già stato visto o meno, ecc.) e, infine, la popolarità dei documenti (quanti collegamenti puntano verso il documento e quante persone lo hanno visitato).
I motori di ricerca sono sostanzialmente dei filtri: impostati determinati criteri, sono in grado di setacciare il web ed estrarre documenti che potrebbero fare al caso nostro. Saremo noi a scegliere come usare questo setaccio e quanti e quali documenti consultare – anche se poi, nella pratica, oltre il 90% di noi clicca su uno dei primi tre risultati.
Conversare
L’arrivo di ChatGPT ha rotto le uova nel paniere di Google, incontrastato monopolista dei motori di ricerca. Non perché ChatGPT o gli altri chatbot setaccino meglio il web che l’algoritmo di Google, quanto piuttosto perché offrono una modalità diversa di trovare informazioni, e cioè la conversazione. Nell’interazione con un chatbot semplicemente parlariamo o scriviamo e otteniamo risposte, esattamente come avviene con un’altra persona. In realtà ci accorgiamo presto che mancano ironia, complicità, ed empatia; ma se l’altra persona non fosse un amico ma si trovasse al di là di un banco informazioni, l’interazione sarebbe probabilmente molto simile.
Un chatbot però non è fatto per selezionare informazioni ma, appunto, per sostenere una conversazione (dal verbo inglese to chat, chiacchierare). A differenza di un motore di ricerca, non è dunque equipaggiato per distingere buone e cattive informazioni: le sue risposte si basano sui testi che ha assimilato e “digerito” durante il suo allenamento, che sono stati presumibilmente selezionati dagli sviluppatori. Nel caso in cui i dati di allenamento vengano presi da internet, tuttavia, sarà difficile evitare che contengano anche informazioni false o incomplete, benché presentate in testi sintatticamente e formalmente corretti. L’algoritmo di un chatbot sostanzialmente mette in fila parole per generare le risposte più probabili (ne abbiamo parlato qui), senza adottare criteri di veridicità o qualità.
Le variazioni e i possibili accorgimenti sono infiniti: i chatbot sono spesso in grado di imparare dai propri utenti e alcune aziende, come OpenAI, hanno assoldato centinaia di persone e chiesto loro di valutare le risposte fornite da ChatGPT, in modo da ottenere un feedback per migliorare il chatbot. In ogni caso, in sostanza abbiamo a che fare con un’interfaccia che genera testi ben fatti ma senza capirne i contenuti. Se Google non è un oracolo, ChatGPT non è un saggio, ma un utile generatore di testi (se lo usiamo per ciò che sa fare e cioè, appunto, generare testi!).
Riassumere
Di recente assistiamo alla comparsa di strumenti ibridi, nei quali un’interfaccia chatbot interagisce con gli algoritmi di un motore di ricerca. È il caso di Perplexity (ma anche di Bard o Bing Chat): se chiediamo qualcosa a questa app, lei interrogherà Google (o Bing), estrarrà alcuni documenti rilevanti, e poi fornirà un riassunto in linguaggio naturale come potrebbe fare ChatGPT. La combinazione è vincente, perché in questo modo Perplexity è in grado di setacciare come un motore di ricerca e di conversare come un chatbot, e combina queste due abilità nel riassumere le informazioni. Il riassunto, inoltre, integra i riferimenti alle fonti, in modo che sia poi facile risalire al documento che riporta una determinata informazione, consentendo una verifica
A scuola abbiamo imparato che scrivere un riassunto implica l’identificazione dei punti-chiave di un testo e la loro riorganizzazione, magari scegliendo accuratamente le parole. Se il tema è semplice, riassumere è un’azione poco problematica; quando invece il tema è sfaccettato e complesso, la questione si complica. Se ad esempio sto lavorando a un tema controverso come l’immigrazione, quali argomenti pro o contro una determinata scelta saranno inseriti nel racconto? Quali dati saranno presi in considerazione e quali saranno omessi? E nel caso in cui due fonti siano in disaccordo, questo verrà segnalato? Anche le parole contano, e può succedere che testi diversi usino parole diverse per parlare del medesimo fenomeno, portando però significati secondari diversi. Nel riassunto parleremo di migranti, immigrati, extra-comunitari, richiedenti asilo, fuggiaschi? Come nessuna mappa è uguale al territorio, così nessun riassunto restitutisce la completezza dell’originale (altrimenti non sarebbe un riassunto!).
E tu come cerchi?
Motori di ricerca che setacciano, chatbot the conversano e sistemi ibridi che riassumono: sono tre tipologie di strumenti oggi disponibili a tutti per la ricerca di informazioni in rete. Quale sia il migliore non dipende tanto dalle caratteristiche tecniche degli strumenti stessi, quanto dal nostro obiettivo, dal tema, dalle nostre competenze e dalla situazione.
Se ho poco tempo per farmi un’idea anche sommaria sulla coltivazione delle orchidee, probabilmente una rapida interazione con ChatGPT è più che sufficiente. Se voglio invece imparare a distinguere le varietà di orchidea, Perplexity potrebbe fornirmi una buona panoramica iniziale e dei link di approfondimento (ne esistono circa 20'000 varietà raggruppate in 650 generi!). Se sto invece cercando un centro di competenza di livello internazionale sulla coltivazione di questi fiori, Google sarà probabilmente lo strumento più adatto a trovarlo (ce ne è uno in India). A tutto questo si aggiunge la possibilità, sempre a disposizione, di cercare non sul web ma all’interno di cataloghi curati, come quelli delle biblioteche, o su banche dati informative affidabili come quelle delle notizie del servizio pubblico o di altri canali di cui ci fidiamo.
Come nel caso del coltellino svizzero, è confortante sapere che in tasca abbiamo strumenti diversi per ogni evenienza. Basta poi evitare, per pigrizia o ignoranza, di trovarsi a tentare di affettare il salame con le forbici.
Luca Botturi, professore in media in educazione alla SUPSI