Sentiment analysis: are bots better than humans?

sentiment

Prendiamo oggi in analisi un argomento che, all’apparenza, non ha molto a che vedere con i viaggi, ma che si dimostra in realtà assai interessante.

Come capisce un’azienda se i propri clienti sono soddisfatti dei loro acquisti? Oggi siamo abituati alle mail che ci arrivano da Amazon, Zalando, ecc. che ci chiedono di recensire i prodotti che abbiamo acquistato. Le nostre recensioni poi, sono elaborate con complessi algoritmi di “sentiment analysis”, destinati a stabilire se, complessivamente, il prodotto sia buono o negativo.

Come funzionano questi algoritmi? Per semplificare la questione, possiamo dire che analizzano le parole contenute nelle recensioni paragonandole con due “vocabolari”, uno di parole positive e uno di parole negative. Sarà positiva la recensione che contiene più parole positive che negative, e viceversa.

Arriviamo ora a capire come questo riguardi anche il mondo del turismo. La comunicazione di una destinazione turistica non avviene soltanto attraverso canali ufficiali ma sono anche i visitatori stessi che “comunicano” la destinazione usando i social media, postando foto, video, commenti…e piccoli “microblog” su Twitter, usando i ben noti #hashtag. Questa attività di microblog è ancora più intensa, come flussi, quando ci troviamo davanti ad eventi, come, ad esempio, “La mostra del cinema di Venezia”. Per questo l’evento stesso lancia un hashtag ufficiale, al fine di incoraggiare la comunicazione da parte dei visitatori e addetti e per poter analizzare meglio quali sono i sentimenti generati dalla mostra nei visitatori.

Vediamo ora un caso concreto. Come se la cava un algoritmo molto semplice di sentiment analysis nel valutare la mostra del cinema di Venezia del 2015?

Utilizziamo una “banca dati”, ovvero l’insieme dei tweets in inglese che contengono l’hashtag #Venezia72 e un programma in grado di “processare” statisticamente questa mole di dati, confrontandola con i due “vocabolari” a cui si accenna sopra: in pratica due insiemi di parole, l’uno positivo contenente vocaboli come “good”, “great”, “terrific”, e l’altro negativo, contenente parole come “bad”, “awful”, “creepy”.

La valutazione del “tono” (o, per usare un linguaggio tecnico, della polarità) del tweets verrà effettuata così: la differenza tra il numero di parole positive e il numero di parole negative restituisce la polarità.

In questo caso la polarità si distribuisce così: la maggior parte dei tweets sono di valore 0 (neutrali), seguiti, come incidenza dai tweets debolmente positivi (+1). capture

L’istogramma mostra una disposizione dei punteggi che segue circa la campana gaussiana: restituisce chiaramente una valutazione complessivamente positiva della mostra, sebbene, in senso assoluto, sia più estesa la gamma delle valutazioni negative che di quelle positive.

Valutiamo ora il funzionamento dell’algoritmo prendendo in considerazione alcuni di successo nell’analisi.

“#pure #beauty #venice #canalgrande #view #sea #sky #love #beautiful #venezia72 @ Grand Canal Of Venice”

Questo tweet è classificato come +5. E in effetti è un giudizio estremamente positivo del contesto veneziano in cui si svolge la mostra.

Altri esempi di valutazioni positive:

“We wanna thank all the audience at #Venezia72 who supported #Bangland and all people who helped us to reach such a proud result. #cinema” (+4)

“RT @JonathanRomney: Best Actor – Fabrice Luchini  for L’HERMINE. Nice video, nice scarf, nice raspy voice. He’s one of the best, isn’t it? …”(+5)

“Award Winners of #Venezia72, FROM AFAR Wins Golden Lion for Best Film http://t.co/xhBFBb8H9U http://t.co/h9cypWfna8” (+5: ma in realtà è una semplice comunicazione dal tono è molto differente)

Ma si pone subito un problema. Come valutare l’argomento del tweet stesso? Un giudizio negativo è SEMPRE scritto su una cattiva organizzazione della mostra? E uno positivo è SEMPRE scritto sul buon lavoro fatto da madrina e giuria? Non funziona proprio così….

“Those of you who nervously laughed during heartbreaking moments of emotional pain, what the hell? It’s not a fucking comedy. #Venezia72”

A questo tweet è stato associato un punteggio -5. Ma si riferisce a un atteggiamento di una parte del pubblico, un elemento che difficilmente potrebbe essere controllato dall’organizzazione. E così una serie di tweet, dai giudizi fortemente positivi o negativi, si riferiscono al valore dei film più che della kermesse in sè.

“Spotlight a solid work following fine tradition of investigative journalism oeuvre. Fine collective work. #Venezia72 #Spotlight @HeyUGuys” (+5)

“MAN DOWN: Post apocalypse becomes an allegory for post traumatic stress? Weird story and bleak visuals in Dito Montiel’s latest. #Venezia72” (-5)

“MAN DOWN (Dito Montiel): Oh dear, what a mess. Don’t even know where to start, such a strange, bizarre film. Batshit crazy finale #Venezia72” (-4)

Ma a volte l’algoritmo non si dimostra così efficace.

“sort-of liked dystopian EQUALS, but its exaggerated romantic clichés would work if Dormeus played it less safe elsewhere #Venezia72” (+4)

“#Venezia72 #LookingForGrace Thin story, witty look, gentle mood. Not enough to enchant but good to watch” (5)

Questi tweet iniziano con le migliori premesse, ma traggono conclusioni assai fredde sui film. La nostra valutazione sarebbe quella di tweets quasi neutrali, ma l’algoritmo li valuta con +4 e +5. Il lavoro si complica ancor più se aggiungiamo sfumature di sarcasmo e ironia.

“Venice follows Cannes in choosing a fair film for top prize rather then the best one #Venezia72 @CineVue”(+4)

Tweet valutato come estremamente positivo: ma in realtà è sarcasmo contro il politically correct nella scelta dei film vincenti.

Altro esempio di fallimento:

“Johnny Depp as sociopathic mobster “Whitey” Bulger was so creepy, am afraid his lizzard eyes will haunt my dreams  #BlackMass #Venezia72″ (-4)

La polarità è fortemente negativa: ma in realtà, letto tra le righe, è un giudizio su una performance particolarmente convincente dell’attore in un film dalla trama un po’ oscura (tanto che lo stesso film è anche protagonista di altri tweet classificati +4)

Sicuramente l’algoritmo può essere migliorato (e personalizzato) aggiungendo parole ai dizionari positivo o negativo, e già di per sè l’algoritmo “corregge” errori di battitura e spelling in modo da non travisare i tweet per qualche distrazione.

Tuttavia, a meno di non utilizzare algoritmi più complessi, gli errori commessi nella valutazione sono significativi e non possono essere trascurati. La valutazione e la capacità di discernere umana non possono essere sostituiti completamente da una valutazione meccanica, anche se questa ha il pregio di processare molti dati in poco tempo.

Wandering ’round Veneto

Riporto oggi una mail inviatami da Neil, un mio caro amico di Toronto che ho conosciuto qualche anno fa durante un periodo trascorso in Russia. Già quando ci siamo conosciuti avevamo discusso la sua passione per l’Italia e l’unicità di Venezia: Neil mi aveva confessato il suo desiderio di visitare la zona non solo a mo’ di “mordi e fuggi”, ma con l’intento di entrare profondamente in contatto con la natura del Veneto, regione su cui aveva letto parecchio. Dopo qualche anno, il desiderio di Neil è diventato realtà: arrivato in Italia per un tirocinio universitario da svolgere a Milano, ha ottenuto una settimana libera e ha deciso di trascorrerla a Venezia. Il momento dell’anno era tra i migliori dal punto di vista naturalistico: Maggio, mese di fioritura, di piacevole tepore, di lunghe giornate…

“Ho prenotato una stanza in un ostello vicino a Campo San Polo; la zona, come mi avevi detto, è bellissima: l’ostello è ok, e, anche se la signora non parla molto bene l’inglese, ci siamo arrangiati! Il primi due giorni ho visitato Piazza San Marco (meravigliosa come dicono), Palazzo Ducale, la galleria dell’Accademia, il ghetto ebraico, e mi sono goduto l’atmosfera della città. Ma le città, come sai, non sono proprio il mo habitat naturale; molto meglio stare immersi nella bellissima natura della prima estate veneta. Così ho iniziato a pensare a come trascorrere gli altri 4 giorni che mi restavano all’insegna di esperienze più inconsuete; è stato difficile organizzarmi, anche perchè a Venezia trovare un WiFi non è per niente facile! Ho deciso di dedicarmi subito a un’escursione in laguna.
Ecco un sito che ho consultato, ed eccone un altro ma ho trovato troppo difficile fare tutto da solo; allora ho dato un’occhiata a questo sito ma era troppo costoso il tour privato, e il tour organizzato in gruppi mi portava solo a Murano-Burano-Torcello; ho trovato anche compagnie di escursione più economiche, ma le isole proposte erano sempre quelle. Alla fine, dopo un’ora di ricerche, mi sono ricordato della mia passione per il kayak e ho trovato questo bel sito, venicekayak.it, molto pratico e ben organizzato. ho passato un’altra ora a leggere il sito e capire come raggiungere l’isola di certosa, punto di partenza delle escursioni. ho deciso di prenotare un’escursione da un giorno intero; il prezzo era alto, ma mi fornivano tutta l’attrezzatura necessaria e alcuni servizi, come la doccia. Prenotare non è stato semplice (circa mezz’ora), erano richieste molte informazioni il pagamento non ho potuto farlo online ma solo sul posto in contanti.  La guida parlava un buon inglese, e sono stato abbinato a un altro ragazzo, olandese, che aveva deciso di fare un’esperienza simile.laguna

Con il ragazzo e con la guida abbiamo potuto personalizzare il nostro tour; è stata un’esperienza emozionante e autentica, anche se un po’ scomodo dover pagare tutti i servizi come cibo e acquisto di qualche souvenir separatamente e solo in contanti, e raggiungere l’isola di Certosa autonomamente (spendendo ulteriori 15 €).

Nel frattempo avevo deciso anche di voler pescare nell’Adriatico: tu sai che papà mi porta spesso a pescare al lago e sono sempre stato curioso riguardo il pesce di acqua salata e il pesce di laguna. Così ho deciso che uno dei miei ormai 3 giorni rimasti lo avrei trascorso a bordo di una barca da pesca. Ho trovato dei bei siti che proponevano queste esperienze in Croazia, ma dopo aver speso un?ora alla ricerca di un modo per raggiungere la Croazia che fosse rapido e non mi costasse un patrimonio, sono giunto alla conclusione che questo modo non esiste e ho rinunciato alla Croazia. Ho trovato un sito che permetteva la stessa visita in Italia… ma anche qui, lontano da Venezia, e raggiungere questo “Porto Tolle” senza una macchina era veramente difficile, troppo costoso e avrebbe portato via troppo tempo alla pesca. Dal momento che avevo già pagato la stanza a Venezia per tutta la settimana e la signora non sembrava disposta a restituirmi il costo di una notte, ho deciso di cercare ancora, per non sprecare soldi.
Ho trovato qualcosa sul sito Venice.cityexperience, e sembrava bellissimo, pranzo a bordo, orari flessibili, pesca in laguna, segreti dei pescatori…ma putroppo il prezzo non era disponibile se non dopo aver prenotato! Ho comunque fatto una richiesta di prenotazione, ma non c’erano posti per i giorni che mi restavano da trascorrere a Venezia. Dopo aver passato complessivamente 3 ore al computer a tentare, mi sono arreso e ho deciso di trascorrere un giorno in più tra le calli di Venezia, rinunciando alla pesca.

Essendo rimasto a Venezia ho avuto più tempo per organizzare la mia visita alle zone del Prosecco. Ho trovato subito un bellissimo sito che proponeva un pacchetto per turisti inglesi nelle colline del Prosecco: molto interessante…ma troppi giorni! Mi sono salvato il link per la prossima volta in Italia….

Ho poi effettuato qualche ricerca e ho trovato varie opzioni possibili: per esempio questo tour assolutamente comodo e interessante (specie per il pranzo nel castello medievale!), o questa offerta molto curata ma decisamente troppo costosa. Ho letto questa interessante opinione di un blogger che aveva tratto grande soddisfazione dall’organizzarsi da s&egrave il proprio tour del Prosecco. Ho preso in considerazione l’idea di seguirne le orme (tranne per il pernottamento), ma alla fine ho optato per questa offerta dopo aver chiamato gli organizzatori ed essermi accordato per essere aggiunto a un gruppo di 5 persone in modo da raggiungere un prezzo per me abbordabile.

Ho fatto amicizia con le persone con cui ho diviso la giornata e ho complessivamente trascorso una giornata meravigliosa, mangiando l’ottimo cibo che era compreso nel prezzo e bevendo l’ottimo vino che mi è stato offerto.

colline

Rientrato a Venezia dal tour del Prosecco, ho deciso di trascorrere l’ultima notte che avrei dovuto passare a Venezia nel bellissimo paese di Auronzo di Cadore, proprio sotto le 3 cime di Lavaredo, per avere un’intera giornata  da dedicare alla passeggiata intorno a queste bellissime montagne. Ho trovato molte informazioni utili sul questo sito anche se l’inglese non era sempre buono. Ho deciso, per questa giornata, di on usufruire di tour preconfezionati ma di fare da solo. Raggiungere Auronzo con i mezzi pubblici non è stato per niente facile: treni molto vecchi, cambi frequenti, nessuni che parlava inglese…avrei dovuto fare l’ultimo pezzo di percorso in bus, ma non trovavo nessuno in grado di offrirmi informazioni perciò ho preso un taxi: nemmeno il tassista parlava inglese ma ci siamo in qualche modo capiti. Il trasporto fino ad Auronzo mi è costato 40 € e ho pagato il viaggio in treno a Venezia con la carta e il tassista in contanti. Arrivato lì, ho pagato il mio B&b di nuovo in contanti: voi italiani proprio non amate le carte di credito! Il padrone di casa, però, era gentile e m ha aiutato a capire come arrivare al Rifugio Auronzo (bus+a piedi). Dopo una buon colazione sono partito e in un paio d’ore ho raggiunto il Rifugio Auronzo. Lì ho acquistato una cartina e sono partito per un’escursione non troppo impegnativa di 3 ore.tre-cime

Tornato al rifugio ho pranzato e m sono rilassato un po’. Ho deciso poi di tornare in paese; ho fatto una doccia, ho raccolto le mie cose e con l’aiuto del padrone di casa questa volta sono riuscito a prendere il bus per raggiungere la stazione del treno più vicina (15 km circa). Ho potuto acquistare il biglietto del bus a bordo. Lì ho acquistato il biglietto per Milano con la mia carta e in sole 6 ore, con ben 4 treni differenti e 50 euro spesi, ho raggiunto Milano.

A proposito del sito che mi avevi suggerito, quello della regione Veneto, devo dire che l’ho trovato molto interessante, e l’ho usato come base informativa per scoprire il vostro bellissimo territorio.

Il mio viaggio è stato molto emozionante e avventuroso, e credo che lo ricorderò a lungo!”

Di seguito riporto una schematizzazione dell’esperienza di Neil da un punto di vista organizzativo: spero serva a riflettere sulle difficoltà che un turista in Veneto si trova ad affrontare se vuole andare oltre un’esperienza “classica”

escursione in laguna
pesca in adriatico
colline del Prosecco
3 cime di Lavaredo
TEMPO DI RICERCA
2H  3h?  2,5 H  1,5h
TEMPO DI PRENOTAZIONE
 1h  N.D.  1 H  1h
NUMERO DI PAGAMENTI
 5  N.D.  3  7
PRESENZA PACCHETTI (sì/no)
 sì  no  Si Si

DMO e travel planning

austria

Viaggiare è diventata sempre più un’azione pianificata in modo autonomo, e quando è così, il mezzo attraverso cui quasi sempre si pianifica il viaggio è internet. Ma, se abbiamo soltanto una generica destinazione o più in mente, come orientarci nella scelta? Ogni regione o nazione ha un’organizzazione che si occupa della promozione e dell’organizzazione della destinazione turistica, che ha dei canali ufficiali per promuovere l’immagine della regione all’interno o all’estero; nello specifico mi riferisco alle organizzazioni di DMO, che mettono in luce le peculiarità delle destinazioni, specie dei paesi, con un punto di vista interno ma fortemente orientato al turismo internazionale.

Se, allora, saremo indecisi su come trascorrere un paio di giorni avendo in mente qualche città europea facilmente raggiungibile con le compagnie aeree di low cost, potremmo dare un’occhiata ai siti delle relative DMO nazionali, come http://www.spain.info, o http://www.croatia.hr. Ma quanto sono “facili da usare”, intuitivi, utili questi siti? O, per esprimerci in modo più tecnico, qual è il livello di accessibilità e usabilità di questi siti?

Per spiegare questo concetto prenderò oggi in esame due siti di DMO, quello dell’Austria e quello della Polonia, sulla base di alcune regole tecniche che valutano la qualità in termini di accessibilità e usabilità dei siti internet: sto parlando delle euristiche di Nielsen e delle più intuitive regole di Krug, per valutare quanto questi siti siano alla portata di tutti e utili nell’orientare a un’effettiva visita turistica.

Innanzitutto, trattandosi di un sito rivolto ai turisti internazionali, l’attenzione va alla lingua: in entrambi i siti il linguaggio è corretto sia in italiano che in inglese, con differenti sfumature però: mentre nel sito austriaco il registro utilizzato  è colloquiale e naturale dati gli argomenti, nel sito polacco la versione in lingua italiana, per quanto impeccabile da un punto di vista grammaticale, risulta in alcuni punti un po’ troppo aulica, con perdita di freschezza. In entrambi i siti, però non vi sono particolari tecnicismi di difficile comprensione.

Esaminare le versioni in differenti lingue mi ha fatto notare anche un aspetto interessante di personalizzazione del sito: a seconda della lingua selezionata gli elementi messi in primo piano nelle pagine sono differenti, con attenzione alle differenti sensibilità nazionali e ai differenti elementi di appeal. Peraltro, passare da una lingua all’altra è molto semplice (anche qualora, per esempio, si selezioni l’ungherese al posto dell’italiano per errore), anche grazie all’ausilio delle immagini iconiche delle bandiere. Unica spiacevole eccezione, la pagina in cui si spiega il funzionamento della DMO polacca, disponibile solo in polacco e in cui manca la finestra di dialogo per il cambio lingua. A compensare questa mancanza, però, nel sito polacco, ci pensa l’interessante funzione della lettura audio del testo: molto interessante in linea di principio, se non fosse per il dettaglio della voce fredda e robotica..

In entrambi i siti, però, si fa largo uso di immagini piacevoli, di alta qualità e immediate; per la gioia di Krug, le parole sono ridotte al minimo, a meno che non si voglia deliberatamente accedere a delle parti più discorsive (come i rispettivi blog: aggiornatissimo quello della Polonia, un po’meno quello austriaco) e le alternative tra cui l’utente è chiamato a scegliere sono poche e ben distinguibili. Per aiutare l’utente, poi, non mancano mai le rappresentazioni del percorso fatto per giungere in quella sezione del sito, e anche una piacevole guida al contesto nel sito polacco, in cui sono presenti anche molte informazioni utili (meteo, tasso di cambio, necessità di visti in ingresso, ecc), ma non un aiuto nel caso di errori (es: 504, gateway timeout). Anche il sito austriaco non manca di fornire informazioni utili, nonchè di avvertire l’utente nel caso di reindirizzo a siti esterni o possibili cambiamenti di interfaccia.

trakai

Nel complesso si tratta di due siti molto piacevoli, anche se con “personalità” molto differenti (più asciutto, essenziale e innovativo in sito polacco, più ammiccante e tradizionale quello austriaco). Dopo averli conosciuti, non farete più a meno dei siti di DMO per organizzare le vostre brevi fughe in Europa!