Sincronicità: un paradigma per la mente
Riflessioni sull'intelligenza artificiale - Oscar Bettelli
08) Reti neuronali
Un approccio diverso ma complementare è costituito dalla reti neuronali.
L'approccio ideale alla soluzione di problemi legati alla percezione è quello connessionista.
Un sistema può manifestare comportamenti intelligenti se possiede le seguenti caratteristiche:
- Elevato numero di componenti elementari
- Ogni componente è interconnesso con un elevato numero di altri componenti
- Le connessioni non sono rigide, ma plastiche, modificabili da adeguati processi di apprendimento
- Ogni componente è in grado di effettuare semplici operazioni
Una rete neurale si comporta come un sistema adattativo che apprende il valore opportuno da dare ai pesi delle connessioni per ottenere una rappresentazione non simbolica del mondo reale.
Le reti neurali rappresentano una metodologia di calcolo che tenta di replicare i processi di elaborazione utilizzati dal cervello umano.
L'idea risiede nel fatto secondo cui copiando la struttura a neuroni del cervello si possa ottenere delle funzionalità simili a quelle del cervello stesso. Il cervello, infatti, si rivela estremamente efficiente nel risolvere problemi complessi di classificazione, riconoscimento, controllo senso-motorio, e soprattutto possiede la capacità di apprendere un comportamento, sia sulla base di esempi che in funzione dei propri errori.
Il principale modello di calcolo neuronale si basa su una architettura parallela di tipo connessionistico. In particolare è possibile costruire delle memorie associative.
I singoli neurodi sono astrazioni a partire dalle conoscenze disponibili sul funzionamento dei neuroni. La principale caratteristica della rete neurale consiste nel fatto che funziona come un tutto unico; i singoli impulsi sono determinati dalle numerose connessioni tra i neurodi e non sono determinati a priori. La rete ha necessità di un periodo di addestramento durante il quale si creano delle "vie" preferenziali degli stimoli, ciò consente alla rete di imparare un determinato compito. I pesi associati ad ogni connessione mutano con l'esperienza e determinano la risposta della rete. Nonostante che il neurodo sia una copia molto rudimentale di un neurone del cervello il comportamento complessivo, determinato dall'interazione di molti neurodi, mostra significativi successi in compiti complessi come per esempio il riconoscimento di immagini.
La relazione tra stimolo e risposta viene polverizzata in tantissimi contributi associati ad ogni singolo neurodo, il risultato è una memoria dinamica che consente alla rete di "risuonare" se sollecitata da un determinato stimolo.
La distribuzione dei pesi nella rete non è prevedibile a priori, e costituisce l'essenza della conoscenza della rete.
Nelle reti neurali la conoscenza è memorizzata in una forma subsimbolica, mentre in una entità virtuale la conoscenza è memorizzata in forma simbolica.
È possibile tradurre la logica di una rete neurale in termini matematici, ovvero simbolici; infatti molte di queste reti sono simulate a calcolatore, calcolando istante per istante le funzioni caratteristiche di ogni neurodo.
Non esiste pertanto una differenza di principio tra l'utilizzo di reti neurali o l'utilizzo di entità virtuali nel risolvere il problema di fornire risposte automatiche a domande in input.
La frammentazione che riscontriamo nelle reti neuronali è riproducibile simbolicamente, pertanto le potenzialità di emulazione del cervello dovute all'elevato numero di interazioni, rimane sostanzialmente inalterato: è solo un problema di complessità.
Indubbiamente le reti neurali mostrano una notevole capacità di apprendimento e apparentemente sfuggono ad una analisi dettagliata delle singole interazioni. Per esempio se addestriamo una rete neurale a riconoscere la parola "mela" non troveremo nessuna stringa o simbolo che la rappresenta: l'informazione è distribuita su tutta la rete complessivamente. L'informazione è frammentata e solo una funzione di correlazione è in grado di ricomporla nella veste originaria. Ogni singolo neurodo contribuisce alla risposta finale. Questo tipo di memorizzazione richiama alla mente gli ologrammi, in cui l'immagine è ricostruibile solo tramite processi di interferenza.
Dal punto di vista simbolico ciò implica la costruzione di una ragnatela di relazioni che consente l'associazione di ogni singolo termine ad un numero notevole di altri termini.
Sia nelle personalità virtuali sia nelle reti neurali
non esiste alcuna "coscienza",
se cerchiamo la sede della coscienza non troviamo altro che
pure relazioni tra uno stimolo ed una risposta.
Tutto questo fa pensare che il nostro senso dell'io sia puramente illusorio e assolutamente non necessario.
Forse, invece, l'esistenza di un "io" è fondamentale nei processi cognitivi, forse solo attraverso una stratificazione aggiuntiva di elaborazione è possibile simulare il comportamento umano.
Vi sono alcuni meccanismi intellettivi che sono difficilmente emulabili dal computer: simulare alcune funzionalità è già un notevole risultato anche se non si coglie l'intima essenza del processo stesso.
Un'automobile si sposta velocemente anche senza gambe.
La realizzazione di processi automatici di pensiero ci consente di comprendere meglio la natura del pensiero umano.
La memoria di un computer è estremamente più fedele della memoria umana, le informazioni sono riportate fedelmente così come sono introdotte, nell'uomo avviene invece una elaborazione, fin dall'inizio della percezione, dell'informazione.
L'uomo mostra una notevole elasticità e capacità elaborativa ma per certi scopi è meglio la risposta fedele di un computer.
Che dire poi dell'attenzione, che governa i nostri processi percettivi.
Un uomo può prestare attenzione a questo e a quello, nulla di simile esiste per una macchina che macina i dati come un rullo compressore.
La possibilità di eseguire un processo è la chiave del funzionamento del computer, come per l'uomo del resto.
Un processo che si sviluppa nel tempo e che può elaborare delle informazioni, trasformare un input in un output, fornire una risposta ad una domanda. Ma una importante relazione tra processi paralleli è la sincronicità che consente la sincronizzazione dei processi stessi: due orologi funzionanti forniscono la stessa ora.
Il tentativo di emulare il comportamento umano porta ad una maggiore conoscenza delle caratteristiche del nostro comportamento e attraverso l'analisi dei principi che governano particolari funzionalità si perviene ad una tecnologia più avanzata al servizio dell'uomo stesso.
In particolare è possibile costruire macchine che eseguono funzioni complesse e gestiscono una mole considerevole di informazioni.
La sinergia tra le caratteristiche tecnologiche dei computer e la conoscenza dei principi base dell'elaborazione della conoscenza portano a strumenti estremamente potenti di elaborazione delle informazioni.
Esiste, forse, una incompatibilità tra l'efficienza funzionale e la malleabilità tipica dei sistemi viventi; quando si introducono dei parametri di variabilità e di incertezza in un sistema computazionale si osserva un inevitabile degrado delle prestazioni.
Le tecnologie informatiche sembrano non avere limiti di applicabilità ma solo problemi legati alla crescita esponenziale del tempo di calcolo, relativamente ad alcuni problemi combinatoriali.
La combinazione di processi e memoria sembra coprire le più svariate esigenze logiche legate alle prestazioni degli organismi viventi.
La capacità di apprendere viene emulata con la memorizzazione di informazioni, la capacità di modificarsi viene emulata con opportuni processi elettronici.
La realtà è governata da leggi che controllano gli eventi in natura.
Un organismo vivente deve riconoscere gli eventi e reagire di conseguenza: un importante fattore risiede nella coincidenza di stimoli corrispondenti ad eventi concomitanti.
Il principale paradigma di questo stato di fatto è la relazione di causa ed effetto che lega due eventi distinti.
La vicinanza o distanza (sia spaziale che temporale) di stimoli è il principale indizio di cui la percezione tiene conto per la costruzione di connessioni astratte tra eventi.
Matematicamente è possibile definire uno spazio metrico in cui gli eventi sono collocati, definendo una distanza basata sulle coincidenze presenti in insiemi astratti delle proprietà degli eventi medesimi.
In particolare risulta naturale determinare una soglia di attivazione che consente la creazione di categorie astratte: tali categorie, generate dalla percezione, consentono di classificare il mondo circostante e quindi di riconoscere eventi simili.
La struttura matematica alla base di tali astrazioni, basata sulla teoria degli insiemi, è abbastanza semplice: essa prende origine dalla definizione dei possibili input sensoriali in termini di attributi, per procedere con la costruzione di domini che consentono al processo di astrazione di definire le classi astratte.
Il cervello è la struttura più complessa che conosciamo in natura.
Affrontare la comprensione del funzionamento del sistema nervoso centrale è effettivamente un'impresa notevole.
Per isolare alcuni aspetti delle capacità cognitive dell'uomo alcuni ricercatori realizzano esperimenti su animali di laboratorio.
Altri ancora studiano il comportamento di animali unicellulari o sistemi fisiologici come il sistema immunitario.
Le fonti a cui attingere indicazioni sono innumerevoli.
Il cervello è il risultato di un processo evolutivo su una scala di tempi astronomici, e si può dire che è iniziato con la nascita dell'universo circa quindici miliardi di anni fa.
Per molti aspetti siamo figli delle stelle.
La ricerca teorica, pur prendendo spunto da osservazioni sul comportamento o sulla struttura degli esseri viventi, utilizza principalmente nozioni e modelli matematici.
Le relazioni logiche sono alla base dei primi studi di intelligenza artificiale: logica dei predicati e linguaggi logici in testa.
Quando ci si è accorti che particolari funzioni, come il controllo motorio o il riconoscimento visivo, presentano inattese difficoltà per gli algoritmi conosciuti, allora l'interesse per ciò che la selezione naturale ha realizzato nel tempo in natura è divenuto preponderante rispetto alle tecniche matematiche disponibili.
Un aspetto teorico è comunque fondamentale: la traduzione delle informazioni in una rappresentazione simbolica deve conservare la sostanza delle corrispondenze ed interrelazioni esistenti tra gli eventi originari.
Spesso utilizziamo nei nostri ragionamenti le proprietà di invarianza ed omogeneità presenti in natura, trasformiamo una connessione logica in una prossimità spaziale o temporale oppure attribuiamo ad un nome le proprietà che l'oggetto presenta.
Il ragionamento per analogia, tipico del pensiero esoterico, anche se gravido di possibili errori, fornisce ai ricercatori utilissimi spunti di indagine e fertili idee per sviluppare le ricerche.