Il bias ai tempi dei big corpora
Data di trasmissione
Durata
Lo studio della lingua si basa sempre di piu' sull'utilizzo di corpora, collezioni di testi parlati o scritti annotati con informazioni linguistiche. Come tutte le tecnologie pero', chi le costruisce ci infonde i valori che sceglie (e i bias che non decostruisce). In un'altra puntata dedicata alla scienza, oggi parliamo delle tre fasi di costruzione di un dataset linguistico e di tutte le questioni politiche associate a ogni step.
Scaletta musicale:
- Josif Tumari - Chiziq
- Sabinē - Bengali