sabato 9 gennaio 2016

Ma i numeri primi sono veramente casuali?

Prima di tutto vediamo cosa significa casualità o come dicono gli inglesi randomness.

Per randomness i matematici e fisici intendono il caos, l’imprevedibilità, l’assenza di strutture interne, l’assenza di qualsiasi particolare configurazione. Per generare un risultato randomico , normalmente si usa una moneta o un dado. Ma nel caso di una sequenza di numeri, come per esempio quella dei numeri primi , 2, 3, 5, 7, 11,13,17,19, 23…. che cosa significa randomico? Semplicemente che non è possibile trovare un algoritmo, una formula matemtica che riproduca esattamente la sequenza, cioè che non è possibile determinare il prossimo termine della sequenza a partire da quelli conosciuti.

Prima dell’avvento della meccanica quantistica c’era un comune accordo tra tutti gli scienziati che “Dio non gioca ai dadi”, cioè la casualità nel lancio di una moneta era solo dovuto al risultato della nostra ignoranza su tutte le forze coinvolte. Se avessimo conosciuto tutto con esattezza allora la casualità sarebbe scomparsa.

La meccanica quantistica, invece, ha mostrato che Dio gioca ai dadi: il comportamento della materia a livello microscopico è imprevedibile. Non c’è modo di prevedere, per esempio, quando un nucleo radioattivo decadrà.

Un team di ricercatori, nel 2003, ha fatto una scoperta proprio sulla distribuzione dei numeri primi nella sequenza dei numeri interi. Il Team costituito da tre fisici dell’Università di Boston, Pradeep Kumar, Plamen Ivanov e Eugene Stanley, ha trovato una specie di ordine nella distribuzione dei primi che mai nessuno aveva notato.

Essi hanno considerato la distanza tra due numeri primi consecutivi e poi la differenza tra queste distanze chiamandola incremento. Per i numeri primi  minori di 20 abbiamo 1, 2, 2, 4, 2, 4, 2 come distanze e 1, 0, 2, -2, 2, -2 come incrementi (vedi figura 1).

Considerando tutti i numeri primi  minori di 50.000.000 hanno trovato che la distribuzione degli incrementi non è quella di una sequenza randomica in quanto esibisce degli alti picchi in corrispondenza di determinati valori di incrementi, dei picchi medi e picchi bassi per altri valori, con una chiara oscillazione di periodo 3 (vedi figura 2). I valori positivi sono quasi sempre seguiti da valori corrispondenti negativi. La frequenza degli incrementi decresce esponenzialmente e questo andamento è evidente sia per i picchi alti che per quelli bassi, formando una forma a “doppia tenda” (vedi figura 2 (b)). Inoltre la frequenza per gli incrementi positivi e quelli negativi è quasi la stessa come si può vedere nella figura 2.

 

Figura 1 Distanze tra numeri primi consecutivi (a) e i loro incrementi (b).

 

Figura 2 Istogramma degli incrementi per il primo milione di numeri primi. La frequenza con cui compaiono gli incrementi mostra un sistema oscillante con periodo 3. Gli incrementi con valori (6k+2) e –(6k+2) per k=0,1,2,3... sono quelli più frequenti. Seguono gli incrementi con valori (6k+4) e –(6k+4) e poi ci sono quelli rari in corrispondenza degli incrementi 6k e -6k (a). Al centro viene riportata la stessa distribuzione ma in scala semilogaritmica (b). E nell’ultimo grafico (c) la stessa cosa ma prendendo il valore assoluto dei valori negativi. Si può vedere chiaramente una legge di potenza.

 

Due ricercatori cinesi hanno ottenuto dei risultati analoghi effettuando dei test di randomness (chiamati FIPS che sta per Federal Information processing Standard) sulla stessa sequenza degli incrementi usata dai tre fisici di Boston. Il test statistico è costituito da 4 differenti sotto-test che sono utilizzati per verificare se una sequenza di numeri è realmente casuale. I risultati ottenuti hanno evidenziato che dei 4 sotto-test effettuati solo due hanno superato la verifica. Questo significa che la distribuzione dei numeri primi non sembra essere una sequenza casuale in senso stretto confermando i risultati dei ricercatori di Boston.

Della serie, casuale (randomica) ma non troppo. Se anche Dio si divertisse a giocare con i dadi, per i numeri primi deve essere successo qualche cosa di strano che al momento non ci è dato sapere.

Un risultato analogo per gli incrementi è visibile anche nella sequenza delle distanze tra i numeri primi. In un mio lavoro, pubblicato sulla rivista matematica SNJ (Smarandache Notions Journal) nel 2002, è riportato l’istogramma della frequenza delle distanze diviso 2 in scala lineare e semilogaritmica (vedi figura 3) da cui si evince un andamento oscillante sovrapposto ad un comportamento esponenziale. In questo caso i picchi delle frequenze sono in corrispondenza delle distanze i cui valori sono multipli di 3.

 

Figura 3 Istogramma delle distanze in scala lineare e semilogaritmica.(Da un articolo dell’autore pubblicato sul giornale SNJ n.13 del 2002)

 

E la sorpresa non finisce qui. La distribuzione dei numeri primi, infatti, mostra un’altra caratteristica che è comune a molti sistemi naturali: il cosiddetto rumore rosa. In fisica si definisce rumore rosa o rumore 1/f, un particolare tipo di rumore in cui le componenti a bassa frequenza f hanno potenza (energia per unità di tempo) maggiore di quelle ad alta frequenza, a differenza del rumore bianco, invece, in cui la potenza è uguale per qualsiasi frequenza (vedi figura 4).

 

Figura 4 Rumore rosa (destra) e rumore bianco (sinistra). Sull’asse verticale viene riportata la potenza e su quello orizzontale la frequenza. Si vede chiaramente che il rumore rosa si concentra nella regione delle basse frequenze mentre quello bianco dappertutto.

 

Se indichiamo con S(f) lo spettro di potenza in funzione della frequenza f,  per il rumore rosa varrà una legge del tipo:    

S(f)=k/fb

dove b è un coefficiente il cui valore è compreso tra 0 e 2 e k una costante. 

Un fisico teorico dell’Università Polacca, Marek Wolf, in un suo articolo ha mostrato che il numero di primi all’interno di particolari intervalli di interi si comporta come un segnale con rumore rosa. In particolare per tutti gli interi tra 1 e N, vengono formati M intervalli di lunghezza L in modo che M=N/L. Dopo di che vengono contati quanti numeri primi ci sono in ogni intervallo formando una sequenza 

XL(t) 

con t=1 per il primo intervallo, 2 per il secondo e cosi via. Nella figura 5 viene mostrato l’andamento di questa sequenza in funzione di t. Calcolando lo spettro di potenza  di questa sequenza, interpretata come un segnale temporale, Wolf si è accorto che esso si comporta come il rumore rosa con un coefficiente pari a 1.64:

SX(f)=k/f1.64

 

Figura 5 Andamento della sequenza XL (vedi testo per la definizione) in funzione di t

 

Nella figura 6, in scala logaritmica viene riportato lo spettro S in funzione della frequenza. Si può vedere chiaramente che indipendentemente dalla lunghezza scelta per gli intervalli, c’è un andamento lineare tra le due variabili, cioè:

ln(SX(f))~b*ln(f) --> SX(f)~f-b

L’indipendenza di b da l sembra suggerire una qualche sorta di auto-similarità nella distribuzione dei primi, un fenomeno già osservato in altri contesti. Questo significa che il tutto sembra essere simile alla parte che è una caratteristica fondamentale della teoria dei frattali piu’ volte trattati in questo blog.

Molti dei sistemi naturali che mostrano un rumore rosa, sono stati spiegati ricorrendo a modelli di tipo SOC  (Self organized criticality), cioè sistemi che autonomamente si auto-organizzano  in uno stato critico come i mucchietti di sabbia, i terremoti o gli incendi delle foreste.

 

Figura 6 Spettro di frequenza della sequenza XL . È chiaro l’andamento lineare indipendente dalla lunghezza degli intervalli.

 

Si tratta di sistemi in uno stato critico. Basta una piccola variazione in ingresso per produrre grosse variazioni in uscita (come il granello di sabbia che può innescare una valanga). La stessa vita può essere interpretata come un sistema in uno stato critico. In bilico tra l’ordine e il caos, la frontiera dove il comportamento di un sistema può essere estremamente complesso. Un po’ a sinistra di questa frontiera e il sistema diventa regolare, ordinato; un po’ a destra e diventa altamente disordinato. La vita è continuamente in bilico tra ordine e disordine. Il primo a parlare di SOC fu il fisico Bak , per spiegare il comportamento dei granelli di sabbia osservato in un suo esperimento che consisteva nel far cadere un granello alla volta al di sopra di un piano. Il più delle volte al cadere di un unico granello di sabbia non succedeva praticamente nulla di significativo. Altre volte invece il granello innescava una reazione a catena nel mucchietto di sabbia, con la generazione di una valanga. Bak  modellò questo sistema con un reticolo bidimensionale e delle regole molto semplici. In modo casuale erano fatti cadere dei granelli di sabbia all’interno del reticolo. Se una cella conteneva più di 4 granelli, questi venivano ridistribuiti alle 4 celle adiacenti o perse al di fuori della frontiera del reticolo. La ridistribuzione portava a delle instabilità con la possibilità di produrre valanghe di dimensioni sempre più grandi (vedi figura 7).

 

Figura 7 Modello del mucchietto di sabbia usato da Bak. I numeri nelle griglie rappresentano il numero di granelli al tempo t. Le diverse rappresentazioni sono immagini del modello a diversi istanti di tempo (da sinistra verso destra e dall’alto verso il basso). Quando una cella raggiunge 4 c’è una ridistribuzione dei granelli nei primi vicini. In nero viene rappresentata una valanga.

 

Misurando la dimensione di tutte le valanghe prodotte, Bak  si accorse, che come per il rumore rosa, alla base del sistema c’era una legge di potenza (vedi figura 8).

Le piccole valanghe erano molto più frequenti di quelle catastrofiche cosi come succede per i terremoti ,  la dimensione degli incendi  nelle foreste, il numero di vittime di un attacco terroristico, il numero di vittime delle guerre e cosi via. Emerge sempre una legge di potenza anche se con coefficienti diversi tra loro (vedi figura 9). Tornando ai numeri primi  questo significa che anche essi possono essere consierati come un sistema in uno stato di criticità auto-organizzata? E se questo fosse vero cosa ha spinto questo insieme verso la criticita’?  Domande a cui nessuno oggi sa rispondere. 

 

Figura 8 Frequenza P(S) delle dimensioni S delle valanghe nel modello del mucchietto di sabbia di Bak. Notare la scala bi logaritmica. Si tratta di una legge di potenza, che evidenzia come ci sia un elevato numero di valanghe di piccole dimensioni e poche valanghe catastrofiche.

 

Figura 9 Legge di potenza per diversi sistemi come: terremoti (f), nomi persone (k) e popolazione citta'(l). Sull’asse verticale è riportata la probabilità che l’evento si verifichi.

http://www.wikio.it