Risolvere compiti matematici è una delle principali sfide dell’intelligenza artificiale. DeepMind di Google ha ora testato la sua intelligenza artificiale nelle attività delle Olimpiadi internazionali della matematica (IMO) di quest’anno. Gli espositori sono riusciti a risolvere correttamente quattro dei sei compiti, raggiungendo così il livello della medaglia d’argento, ha annunciato DeepMind in un post sul blog.
annuncio
Presso l’Organizzazione marittima internazionale Ogni anno partecipano studenti provenienti da più di 100 paesi. Hai quattro ore e mezza due volte per risolvere un totale di sei compiti difficili. I partecipanti raccolgono punti e, a seconda del loro numero di punti, possono vincere una medaglia di bronzo, argento o oro. I compiti provengono dai campi matematici dell’algebra, della combinatoria, della geometria e della teoria dei numeri. Il Congresso IMO 2024 si è tenuto a Bath, in Inghilterra, a metà luglio.
DeepMind ha testato i suoi modelli di intelligenza artificiale AlphaProof e AlphaGeometry 2 con le missioni IMO di quest’anno. I due modelli sono riusciti a risolvere correttamente quattro dei sei compiti: AlphaProof ha risolto due problemi di algebra e uno di teoria dei numeri – compreso il problema più difficile delle Olimpiadi, che è stato risolto solo da cinque partecipanti. AlphaGeometry2 Risoluzione di problemi di geometria. Tuttavia, entrambi fallirono nei compiti di fusione. I sistemi di intelligenza artificiale hanno ottenuto complessivamente 28 punti su 42. Ciò equivale a una medaglia d’argento, solo un punto davanti all’oro. Tuttavia, i modelli di intelligenza artificiale hanno superato il limite di tempo del concorso: i sistemi di intelligenza artificiale hanno impiegato tre giorni per risolvere una soluzione, ma ne hanno risolta un’altra in pochi minuti.
Le soluzioni di intelligenza artificiale sono state esaminate dai matematici Professor Sir Timothy Gowers, medaglia d’oro e Fields dell’IMO, e dal Dr. Joseph Myers, due volte medaglia d’oro dell’IMO e presidente del comitato di selezione delle questioni dell’IMO 2024, ha dichiarato: “Il fatto che il software possa creare un progetto così poco appariscente è davvero impressionante e va oltre quello che pensavo fosse lo stato della situazione”. arte.” Gowers dice sul blog DeepMind.
Modelli linguistici complessi
AlphaProof formalizza il linguaggio matematico per risolvere i problemi. Innanzitutto, i problemi matematici vengono tradotti in un linguaggio di programmazione Lean utilizzando un modello linguistico basato su Gemini. Questo è un complemento alle dimostrazioni matematiche. Quindi AlphaZero, un algoritmo che utilizza l’apprendimento per rinforzo e che in precedenza ha imparato da solo a giocare a scacchi e a Go, genera un indizio suggerito. Questo è stato finalmente verificato con Lean. Ciò ha il vantaggio che le soluzioni allucinate dall’intelligenza artificiale possono essere esaminate e ordinate.
AlphaGeometry2 è un ulteriore sviluppo dello strumento AlphaGeometry per risolvere problemi di ingegneria. Quest’ultimo ha risolto i compiti delle precedenti IMO all’inizio dell’anno. AlphaGeometry2 è un’intelligenza artificiale neuro-simbolica: combina reti neurali e intelligenza artificiale simbolica. Sebbene il modello linguistico identifichi rapidamente le potenziali soluzioni, non può giustificare le sue decisioni. Il modello linguistico utilizzato si basa su Gemini, ma riqualificato con dieci volte più dati rispetto al suo predecessore. D’altro canto, i sistemi di intelligenza artificiale simbolica si basano sulla logica formale e utilizzano regole chiare per raggiungere conclusioni. Grazie a questa combinazione, AlphaGeometry2 ha risolto l’83% dei problemi di ingegneria IMO negli ultimi 25 anni – mentre il suo predecessore ne ha risolto solo il 53%.
Leggi anche
Recentemente, i compiti IMO sono emersi come una sfida di apprendimento automatico e sono considerati una misura della capacità di un’intelligenza artificiale di risolvere compiti matematici avanzati. L’intelligenza artificiale generale (AGI) che sarà in grado di risolvere problemi matematici complessi avrà molti ambiti di applicazione nella ricerca e nello sviluppo tecnologico.
(Terme)
“Pensatore incurabile. Appassionato di cibo. Studioso di alcol sottilmente affascinante. Difensore della cultura pop.”
More Stories
Gli utenti Samsung dovrebbero aggiornarsi immediatamente: c’è il rischio di perdere il controllo dello smartphone
Nuovo gioco di carte collezionabili lanciato per Android e iOS
Sicurezza Web: utilizzo della policy di sicurezza dei contenuti contro il cross-site scripting, parte 1