Il Progetto

Text and Trend Analysis

lla capacità di un elaboratore di manipolare grandi quantità di documenti di testo, che rappresentano la stragrande maggioranza dei contenuti digitali su web e non, dipende dalla possibilità di crearne delle “sintesi” machine-readable.

Esistono due approcci a questo problema: il primo, proveniente dal mondo dei motori di ricerca, consiste nell’indicizzare un insieme di parole senza tentare di carpirne il significato. Il secondo, più recente, punta sulla capacità di comprendere la semantica del testo individuando in esso i termini rilevanti e le relazioni che li legano.

L’affermarsi dei Social Network e la crescente importanza che essi rivestono nell’osservazione di dinamiche sociali e di mercato, ha portato ad un aumento vertiginoso della domanda di strumenti di Social Media Analysis.

Tali strumenti sono per lo più basati su analisi del testo di tipo sintattico, che, sebbene efficaci per i motori di ricerca, non sono sufficienti a catturare la complessità necessaria in questi contesti.

Il presupposto per poter realizzare strumenti efficaci di Social Media Analysis dipende quindi dalla qualità delle sottostanti tecnologie di analisi dei testi.

Sfruttando la conoscenza pregressa delle tre PMI coinvolte e del gruppo di ricerca A3 dell’Università di Pisa, diretto dal prof. Paolo Ferragina, il progetto SenTaClAus vuole svolgere delle attività di ricerca su sistemi software per:

– l’analisi e l’estrazione di semantica da documenti di testo (Text Analysis)
– l’individuazione di tendenze, comportamenti e opinioni degli utenti a partire dall’analisi dei contenuti pubblicati sui Social Networks (Trend Analysis).

Sulla base dei risultati sperimentali saranno costruiti dei prototipi volti a testare la possibilità di erogazione di servizi in ottica Cloud Computing sotto forma di software-as-a-service che, migliorando in modo significativo lo stato dell’arte, offriranno alle PMI un importante vantaggio competitivo.