banner
Casa / Notizia / L'ascesa dell'Open
Notizia

L'ascesa dell'Open

Apr 08, 2023Apr 08, 2023

Seth Grief-Albert

Seguire

Revisione della tecnologia QMIND

--

Ascoltare

Condividere

La tecnologia è un fenomeno interessante. Può esistere in una forma o nell'altra per un bel po', nascosto o inaccessibile, finché un giorno sembra emergere completamente formato e viene poi voracemente consumato dal pubblico. La nuova corsa all’oro del 21° secolo è alle porte. L’era dell’intelligenza artificiale (AI) commercializzata sta accelerando e, con essa, viene intrapresa la battaglia per il suo potenziale potere e i suoi profitti.

L'"intelligenza artificiale" che ha raggiunto una diffusione straordinaria è più appropriatamente etichettata come il suo sottoinsieme specifico, Large Language Models (LLM), ma la cultura popolare ha un modo di assegnare parole d'ordine che si attaccano all'intero campo. Molti potrebbero aver sentito parlare di "questa nuova tecnologia AI" per la prima volta dai media o da un membro della famiglia piuttosto che dal loro solito feed Twitter o blog tecnico: tale è la velocità con cui si è diffusa sul mercato. Il campo dell’intelligenza artificiale ha fatto progressi incredibili per anni, ma il punto di esplosione dei consumatori sembra essere stato all’inizio di metà dicembre 2022, quando OpenAI ha rilasciato ChatGPT al pubblico su una pagina web. Il grafico seguente parla da solo:

È chiaro che le persone hanno fame di interagire e utilizzare la tecnologia AI. Immagina di essere uno sviluppatore che vede questa immagine, o il dirigente di una gigantesca società tecnologica, o il fondatore di una startup. Prendendo in prestito dalla storia, possiamo paragonare l’attuale era dell’intelligenza artificiale al periodo medievale. I governanti detenevano potere e ricchezza e custodivano i loro castelli, mentre la gente comune ne veniva esclusa. Di tanto in tanto, i barbari erranti tentavano di usurpare i governanti. Le grandi aziende (Google, Meta, Microsoft, ecc.) occupano il posto nella sala del trono, mentre gli sviluppatori e gli accademici svolgono il ruolo di outsider. Come si svolge questa storia? Torniamo all'inizio del 2023.

ChatGPT era disponibile da più di un mese e l'hype attorno ai Large Language Models era in pieno svolgimento. Ma cos’è esattamente un LLM? Nascono come "modelli di base", ovvero algoritmi specializzati che hanno attraversato lunghi periodi di addestramento su grandi quantità di dati testuali. Il risultato di questo processo è un modello in grado di rispondere alle domande linguistiche con risposte dal suono ragionevole. Questi modelli hanno un gran numero di pesi e parametri che per i nostri scopi possono essere considerati come tutti i modelli appresi durante la formazione. Questi pesi e parametri sono malleabili e possono essere regolati con precisione. Qui, i LLM sono esposti a un compito più specifico rispetto alla ricostruzione generale del testo. L'attività ottimizzata più popolare che abbiamo visto finora è stata la conversazione naturale, ma il secondo posto è che il modello linguistico segua le istruzioni testuali.

Il modello fondamentale di ChatGPT è GPT-3, che è stato ottimizzato per interagire in modo conversazionale utilizzando l'apprendimento per rinforzo con feedback umano (RLHF), diventando GPT-3.5. In sostanza, le persone reali hanno esaminato una serie di risposte fornite dal LLM e hanno selezionato quelle che erano più simili alle conversazioni reali. Questa messa a punto dell’intervento umano ha trasformato un modello per il testo predittivo (che esisteva già da oltre un anno) nella meraviglia globale che conosciamo oggi. La messa a punto è uno strumento potente che può trasformare il caos dei dati in una parvenza di ordine.

Ma OpenAI non era l’unico giocatore in gioco. Lavorando silenziosamente, Meta stava preparando il rilascio del proprio modello di fondazione. Il 24 febbraio 2023 è stato lanciato nel mondo LLaMA (Large Language Model Meta AI). Non ci volle molto perché le cose andassero male.

Avanti veloce in meno di una settimana. Il pomeriggio del 2 marzo 2023 ha segnato un nuovo inizio per la decentralizzazione dell'IA: un file contenente i pesi di LLaMA è stato reso pubblico da un utente anonimo sul sito di social media 4chan. Ciò ha provocato un’esplosione di interesse che ha preso d’assalto il mondo dell’intelligenza artificiale. Non c'è voluto molto tempo prima che i pesi si facessero strada attraverso Internet nel territorio di GitHub e HuggingFace – essenzialmente la prima pagina di Internet rispettivamente del software e dell'intelligenza artificiale.