Se hai scelto di non accettare i cookie di profilazione e tracciamento, puoi aderire all’abbonamento "Consentless" a un costo molto accessibile, oppure scegliere un altro abbonamento per accedere ad ANSA.it.

Ti invitiamo a leggere le Condizioni Generali di Servizio, la Cookie Policy e l'Informativa Privacy.

Puoi leggere tutti i titoli di ANSA.it
e 10 contenuti ogni 30 giorni
a €16,99/anno

  • Servizio equivalente a quello accessibile prestando il consenso ai cookie di profilazione pubblicitaria e tracciamento
  • Durata annuale (senza rinnovo automatico)
  • Un pop-up ti avvertirà che hai raggiunto i contenuti consentiti in 30 giorni (potrai continuare a vedere tutti i titoli del sito, ma per aprire altri contenuti dovrai attendere il successivo periodo di 30 giorni)
  • Pubblicità presente ma non profilata o gestibile mediante il pannello delle preferenze
  • Iscrizione alle Newsletter tematiche curate dalle redazioni ANSA.


Per accedere senza limiti a tutti i contenuti di ANSA.it

Scegli il piano di abbonamento più adatto alle tue esigenze.

In Cina modello multimodale Intelligenza Artificiale

In Cina modello multimodale Intelligenza Artificiale

I ricercatori puntano ad aumentare il pre-addestramento

11 luglio 2021, 18:24

Redazione ANSA

ANSACheck

In Cina modello multimodale Intelligenza Artificiale - RIPRODUZIONE RISERVATA

In Cina modello multimodale Intelligenza Artificiale - RIPRODUZIONE RISERVATA
In Cina modello multimodale Intelligenza Artificiale - RIPRODUZIONE RISERVATA

(ANSA-XINHUA) - PECHINO, 12 LUG - I ricercatori cinesi hanno costruito un nuovo modello di pre-addestramento dell'Intelligenza artificiale a tre modalità per realizzare la generazione reciproca tra discorso e immagine.
    Il macchinario, denominato OPT-Omni-Perception pre-Trainer, può imparare insieme il contenuto multimodale di testo, discorso, immagine e video.
    Gli attuali modelli di pre-addestramento spesso coprono le modalità di immagine, video e testo, mentre ignorano le informazioni sul parlato nell'ambiente. Al fine di superare tali limitazioni, il nuovo progetto è in grado di svolgere azioni di generazione cross-modale come la creazione di immagini dal testo, di testo dall'immagine e di immagini dal parlato.
    Stando a quanto reso noto dallo sviluppatore, l'Institute of Automation della Chinese Academy of Sciences, la costruzione del nuovo modello promuoverà lo sviluppo dell'Intelligenza artificiale (AI) e migliorerà significativamente le prestazioni dei compiti base di testo, discorso, immagine e video.
    Questo nuovo modello possiede un grande valore potenziale nel riconoscimento e nella sintesi vocale, nonché nelle applicazioni commerciali, come l'interazione uomo-computer e la guida senza pilota. (ANSA-XINHUA).
   

Riproduzione riservata © Copyright ANSA

Da non perdere

Condividi

O utilizza