Quali sono 10-15 applicazioni di didascalie di immagini, Deep Learning?
Lol, perché "10-15″? Sembra una domanda da compito :P
Ad ogni modo, l'implicazione principale della didascalia delle immagini è automatizzare il lavoro di qualche persona che interpreta l'immagine (in molti campi diversi).
- Probabilmente, sarà utile nei casi/campi in cui il testo è più usato e con l'uso di questo, è possibile dedurre/generare testo dalle immagini. Come in, utilizzare le informazioni direttamente da qualsiasi immagine particolare in un formato testuale automaticamente..
- Ci sono molte applicazioni NLP in questo momento, che estraggono approfondimenti/riassunto da un dato testo di dati o un saggio ecc. Gli stessi benefici possono essere ottenuti da persone che beneficerebbero di approfondimenti automatici da immagini.
- Un caso d'uso un po' (non tanto) a lungo termine sarebbe sicuramente, spiegare cosa succede in un video, fotogramma per fotogramma.
- Sarebbe di enorme aiuto per le persone ipovedenti. Molte applicazioni possono essere sviluppate in quello spazio.
- Social Media. Piattaforme come Facebook possono dedurre direttamente dall'immagine, dove ti trovi (spiaggia, caffè ecc.), cosa indossi (colore) e soprattutto cosa stai facendo (in un certo senso). Vedi un esempio per capire meglio.
- Hackers? :P ^
- (Aggiornerò se avrò altre idee :P)
Fonte[1]
Un'immagine può valere più di mille parole, ma a volte sono le parole ad essere più utili.[2]
Footnotes
[1] Show and Tell: image captioning open sourced in TensorFlow[2] Un'immagine vale mille parole (coerenti): costruire una descrizione naturale delle immaginiArticoli simili
- Come costruire un PC per il gioco e per il deep learning
- NVIDIA RTX 2070 Super è adatta al deep learning?
- Come implementare il riconoscimento dell'attività umana nel deep learning e indicarmi eventuali dataset disponibili pubblicamente
- Il deep learning è supervisionato, non supervisionato o qualcos'altro?