LIT 2006 - Lessico Italiano Televisivo
Il LIT 2006 è una banca dati testuale e audiovisiva sul web, che raccoglie un campione rappresentativo dell’italiano televisivo del 2006 (168 ore dalle reti RAI e Mediaset).
Le registrazioni digitali delle trasmissioni sono state fornite dalla RAI e da Mediaset secondo uno schema di prelievo giornaliero a scacchiera nella fascia di ascolto serale, in modo da ottenere un campione rappresentativo dell’italiano televisivo in cui casualmente, nella fascia di maggiore ascolto, sono cadute varie trasmissioni di 6 delle maggiori reti a diffusione nazionale.
Le registrazioni sono state trascritte e marcate in XML/TEI in modo da risultare allineate al materiale audiovisivo autentico. La marcatura prevede notazioni sui parlanti, sulle tipologie comunicative, sui generi.
Il motore di ricerca consente la ricerca di forme e gruppi di forme collegate da operatori booleani, e il filtro del corpus in base a tutti i marcatori impiegati. Una volta ricercata una forma, si ottengono tutti i risultati quantitativi di frequenza anche in relazione ai vari marcatori, le concordanze e il rimando al punto specifico della registrazione audiovisiva fruibile via web.
Piattaforma di marcatura e motore di ricerca sono stati realizzati dal MICC Media Integration and Comunication Center dell’Università della Crusca e implementati dal Centro Informatico dell’Accademia della Crusca.
Per approfondimenti: BIFFI 2010
Schema di prelievo: reti RAI - reti Mediaset
Elenco delle trasmissioni:: reti RAI - reti Mediaset
Criteri di trascrizione
Crediti
Consulta il LIT