Ascolta lo streaming di Radio Onda Rossa

Il bias ai tempi dei big corpora

Data di trasmissione
Durata

Lo studio della lingua si basa sempre di piu' sull'utilizzo di corpora, collezioni di testi parlati o scritti annotati con informazioni linguistiche. Come tutte le tecnologie pero', chi le costruisce ci infonde i valori che sceglie (e i bias che non decostruisce). In un'altra puntata dedicata alla scienza, oggi parliamo delle tre fasi di costruzione di un dataset linguistico e di tutte le questioni politiche associate a ogni step.

Scaletta musicale:

  • Josif Tumari - Chiziq
  • Sabinē - Bengali