Come sono fatti i thesauri?
Prima dell'era dei computer, i thesauri erano compilati da compilatori compulsivi di liste, come Peter Mark Roget, la cui opera monumentale è ancora lo standard per l'inglese. Con l'aiuto dei computer ci sono molti modi per semplificare il processo di raccolta di parole con significati correlati, anche se questi metodi non sempre danno risultati migliori e i thesauri prodotti possono ancora richiedere l'intervento umano per renderli convenzionalmente utili.
Un metodo è quello di creare un thesaurus distributivo, in cui un corpus viene esaminato e le parole vengono raggruppate in base alle loro affinità per lo stesso slot sintattico in migliaia di frasi. Questo spesso dà risultati simili a un corpus tradizionale, ma con alcune differenze, come la comparsa di antonimi nello stesso raggruppamento di parole (dato che gli antonimi molto spesso hanno un comportamento sintattico quasi identico).
Un thesaurus più convenzionale può essere compilato computazionalmente sondando un database di dizionario e, attraverso diverse iterazioni, raccogliendo le parole che si rimandano l'una all'altra, raccogliendo liste di sinonimi che appaiono come tali, e raccogliendo parole le cui definizioni condividono il vocabolario. Questo non produrrà un thesaurus buono come quello di Roget, ma lo farà molto più velocemente (ore piuttosto che decenni), e l'editing umano può fornire carenze e fare correzioni.
Articoli simili
- I film alla fine smetteranno di essere fatti perché i film già fatti sono troppi e sono sufficienti per tutta la vita di una persona?
- Perché i telefoni fatti in Corea come i Samsung sono più economici? Quali sono i suoi svantaggi?
- Quali sono tutti i film di Hulk in ordine, compresi gli anni in cui sono stati fatti?
- Come sono fatti i moderni cartoni animati 2D?