Welcome to Analisi non standard’s documentation!

I numeri iperreali

Introduzione

Questo testo è costruito partendo dal libro di Giorgio Goldoni “I numeri Iperreali”.

Sito di riferimento:

Pagina facebook: <www.facebook.com/pages/Il-professor-Apotema/344320422244703>

I libri del prof. Apotema: <ilmiolibro.kataweb.it/community.asp?id=104013>

Licenza

Tutti i materiali da me prodotti per questo corso sono rilasciati sotto la licenza Creative Commons: CC-BY-SA.

Licenza: CC-BY-SA

Problemi introduttivi all’uso degli infinitesimi e degli infiniti

Il calcolo infinitesimale fa uso di quantità infinitamente piccole, o infinitesime, e di quantità infinitamente grandi, o infinite. Dovremo quindi ricorrere a un insieme di numeri che comprenda numeri infinitesimi e numeri infiniti: i numeri iperreali. Prima di introdurre i numeri iperreali affrontiamo in modo informale alcuni problemi in modo da entrare nello spirito del calcolo infinitesimale.

Ascissa del vertice della parabola

Cominciamo da un problema molto semplice di cui conoscete già la soluzione:

Determinare l’ascissa del vertice della parabola di equazione y = ax^2 + bx + c.

Per altre vie abbiamo imparato che l’ascissa del vertice è: - \frac{b}{2a}, ma ora vogliamo provare a ottenere lo stesso risultato usando quantità infinitesimali.

Supponiamo di poter usare quantità infinitamente piccole e di avere a disposizione un potentissimo microscopio col quale visualizzarle. Se puntiamo il nostro microscopio su un punto della parabola, ecco che il grafico risulta indistinguibile da un segmento rettilineo. Se puntiamo il microscopio in diversi punti del grafico, l’immagine al microscopio sarà quella di un segmento con una pendenza variabile.

La pendenza di un segmento nel piano cartesiano abituale è data dal rapporto fra l’incremento delle ordinate e l’incremento delle ascisse dei suoi estremi \frac{\Delta y}{\Delta x}= \frac{y_B - y_A}{x_B - x_A}, Se il segmento è orizzontale, la sua pendenza è nulla, cioè non vi è incremento di ordinate (\Delta y=0) e infatti i valori di ordinata dei due estremi sono uguali. Ma se immaginiamo di usare quantità infinitesime, e quindi vediamo il segmento orizzontale grazie al microscopio, potrebbe succedere di vedere il segmento orizzontale perché il microscopio, mentre coglie l’incremento delle ascisse non è così potente da riuscire a cogliere l’incremento delle ordinate agli estremi. In questo caso avremmo bisogno di un microscopio più potente e allora diciamo che l’incremento infinitesimo in ordinata è di ordine superiore rispetto a quello visualizzato in ascissa.

Il vertice della parabola è caratterizzato dal fatto di essere l’unico punto per il quale il microscopio ci mostra un segmento orizzontale. Usando il linguaggio precedente, questo significa che se ci spostiamo di un tratto infinitesimo dall’ascissa del vertice, allora la variazione di ordinata è un infinitesimo di ordine superiore allo spostamento infinitesimo in ascissa.

Traduciamo le considerazioni precedenti in un calcolo. Sia \delta un numero infinitesimo.

Parabola

Parabola e super microscopi.

Calcoliamo ora la variazione di ordinata sulla parabola passando da x a x + \delta. L’ordinata corrispondente a x + \delta è:

a ( x + \delta ) ^2 + b( x + \delta ) + c =

= a ( x^2 + 2 x \delta + \delta ^2 ) + b x + b \delta + c =

= a x^2 + 2 ax\delta + a \delta ^2 + b x + b \delta + c

Poiché l’ordinata corrispondente a x è a x^2 + b x +c, la variazione cercata è:

a x^2 + 2 ax\delta + a \delta ^2 + b x + b \delta + c - (a x^2 + b x +c) =

= 2 a x \delta + b \delta + a \delta^2 =

= (2ax +b)\delta + a \delta^2.

Ma \delta^2 è un infinitesimo di ordine superiore a \delta perché rapportato a \delta dà: \frac{\delta^2}{\delta}=\delta che è un infinitesimo. Dunque \delta^2 è un infinitesimo anche rispetto a \delta. L’ascissa del vertice della parabola sarà allora quel numero x per il quale la variazione di ordinata, (2ax +b)\delta + a \delta^2, conterrà soltanto il termine \delta^2. Deve essere quindi 2ax+b=0 da cui: x= - \frac{b}{2a}.

Tangente a una parabola

Parabola

La retta t è tangente in P e secante in A e B.

Passiamo ora ad un altro problema: trovare l’equazione della retta tangente alla parabola y=x^2 nel punto di ascissa x_0=3. A volte per brevità viene definita la tangente come quella retta che ha in comune con la curva un solo punto. Ma questa definizione non è soddisfacente in generale. In certi casi una retta può essere tangente ad una curva in un punto e intersecarla in altri punti. Possiamo risolvere il problema con il metodo del fascio di rette:

  1. troviamo le coordinate del punto P di tangenza: y_P = {x_p}^2 = 3^2 = 9

  2. scriviamo l’equazione del fascio di rette passanti per P: y-y_p = m (x-x_p) \Rightarrow y-9 = m(x-3) \Rightarrow y = m(x-3) + 9

  3. Calcoliamo le intersezioni tra retta e parabola: \left\{\begin{array}{l} y = x^2\\ y = m(x-3)+9 \end{array} \right.

    Sostituendo otteniamo l’equazione risolvente: x^2 - mx + 3m -9 = 0

  4. imponiamo che le intersezioni tra la generica retta del fascio e la parabola siano coincidenti cioè che l’equazione risolvente abbia le due soluzioni coincidenti cioè abbia il discriminante uguale a zero: \Delta = m^2 - 4 (3m -9) = m^2 -12m + 36 = (m - 6)^2

    e quindi \Delta = 0 quando m = 6

La retta tangente è quindi la retta del fascio che ha pendenza uguale a 6 cioè la retta di equazione: y = 6(x-3)+9 \Rightarrow y = 6x - 9

Questo metodo funziona perché la parabola ha un’equazione di secondo grado. Già per risolvere lo stesso problema con un’equazione di terzo grado, ad esempio la cubica: y = x^3, lo stesso metodo non funziona (perché?).

Definiamo come retta tangente ad un grafico di una funzione in un suo punto l’unica retta che, nel campo visivo di un microscopio che ci consente di vedere spostamenti infinitesimi, risulta indistinguibile dal grafico della funzione. In termini più precisi, si tratta dell’unica retta per la quale la differenza tra la sua ordinata e l’ordinata del grafico della funzione, calcolata per un valore di ascissa a distanza infinitesima dall’ascissa del punto di contatto, risulta essere un infinitesimo di ordine superiore all’incremento infinitesimo in ascissa.

Ma vediamo di fare il calcolo. Come già visto, una generica retta per il punto P_0 = (3, 9) ha equazione y = m(x-3) + 9. Invece del punto di ascissa 3, consideriamo il punto di ascissa 3 + \delta, dove \delta, è un numero infinitesimo.

Troviamo quanto vale l’ordinata della retta in quel punto. Sostituiamo a x il valore 3x + \delta ottenendo: y = m(3 + \delta -3) + 9 = m \delta + 9

E quanto vale l’ordinata della parabola in quel punto?: (3 + \delta)^2 = \delta^2 + 6\delta +9.

La differenza delle ordinate vale allora: \delta^2 + 6\delta +9 -m \delta - 9 = m \delta^2 +6 \delta - m \delta che possiamo scrivere: (-m + 6) \delta + \delta^2

Imponendo che si annulli la parte dello stesso ordine di \delta quindi: -m + 6 = 0 e m = 6

Il risultato è lo stesso ottenuto con l’altro metodo, ma qui non abbiamo utilizzato le equazioni di secondo grado e il discriminante. Questo metodo è più generale e si può applicare, ad esempio, anche alla ricerca di tangenti in parabole di grado superiore.

Possiamo rivedere il problema da un punto di vista leggermente diverso: possiamo cercare la pendenza di una retta che passa per un punto della parabola e per un altro punto (sempre della parabola) infinitamente vicino a questo. Oltre al punto P_0 (3, 9) consideriamo il punto P di ascissa 3 + \delta dove \delta è un infinitesimo.

L’ordinata di P è allora: (3 + \delta)^2 = 9 +6 \delta + \delta^2 e la pendenza del segmento P_0 P è:

\frac{\Delta_y}{\Delta_x} =
\frac{9 +6 \delta + \delta^2 - 9}{3 + \delta -3} =
\frac{6 \delta + \delta^2}{\delta} = 6 + \delta

Ma l’unico numero reale a cui il numero 6 + \delta è infinitamente vicino è proprio 6 e ritroviamo così lo stesso valore.

Cerchio osculatore al vertice della parabola

La tangente è la retta che meglio approssima una curva in un suo punto. Il cerchio osculatore è la circonferenza che meglio approssima una curva in un suo punto.

Problema: trovare qual è la circonferenza che meglio approssima la parabola: y = x^2 nel suo vertice.

Parabola e circonferenza

Parabola e circonferenza passante per il vertice. La circonferenza ha centro sull’asse y e sull’asse del segmento OP.

Soluzione: dato che per individuare una circonferenza abbiamo bisogno di 3 punti, dobbiamo considerare, oltre al punto dato, altri due punti infinitamente vicini a questo. Possiamo osservare che, per questioni di simmetria, il centro della circonferenza starà sull’asse di simmetria della parabola. Il centro della circonferenza sarà l’intersezione dell’asse del segmento OP con l’asse y quando il punto P si avvicina infinitamente a al punto O .

Il punto O ha coordinate (0; 0) il punto P ha ascissa \delta e ordinata \delta^2

Cerchio osculatore

Ricerca del cerchio osculatore. P(\delta;\delta^2) percorre la parabola avvicinandosi alsuo vertice. Individua così una circonferenza di raggio progressivamente minore.

Dato che i punti dell’asse del segmento sono equidistanti dagli estremi, l’equazione dell’asse sarà: x^2 + y^2 = (x+\delta)^2 + (y - \delta^2)^2 che diventa:

x^2 + y^2 = x^2 - 2 x \delta + \delta^2 + y^2 - 2 y \delta^2 + \delta^4

Spostando tutto a primo membro ed eliminando i termini opposti si ottiene:

2 x \delta - \delta^2 + 2 y \delta^2 - \delta^4 = 0

L’intersezione con l’asse y si ottiene ponendo x = 0 quindi l’equazione diventa

- \delta^2 + 2 y \delta^2 - \delta^4 = 0

da cui ricavo:

y = \frac {\delta^2 + \delta^4} {2 \delta^2} =
    \frac {1 + \delta^2} {2} =
    \frac {1} {2} + \frac {\delta^2} {2}=

Il valore esatto dell’ordinata del centro è il numero reale che è infinitamente vicino a questo “numero”. Ma l’unico numero che è infinitamente vicino a \frac{1}{2} più un infinitesimo è proprio \frac{1}{2} Il centro del cerchio osculatore è quindi il punto C = (0, \frac{1}{2}) e il suo raggio è r = \frac{1}{2} per cui l’equazione della circonferenza è:

x^2 + (y - \frac{1}{2})^2 = (\frac{1}{2})^2

x^2 + y^2  - y + \frac{1}{4} = \frac{1}{4}

x^2 + y^2  - y =0

Questo può ricordarci che una porzione limitata di uno specchio sferico si comporta come uno specchio parabolico avente il fuoco a una distanza pari alla metà del raggio.

Riassumendo

Usando quantità “infinitesime” possiamo risolvere problemi che sappiamo già risolvere con metodi algebrici. Gli “infinitesimi” forniscono uno strumento più generale che ci permette di risolvere anche problemi che con il metodo algebrico non sapremmo affrontare. Gli “infinitesimi” sarebbero comodi, peccato che non sappiamo se esistono.

Esercizi

  1. Calcola la tangente ad una parabola cubica nel punto P = (1; 1).
  2. Calcola le tangenti alle curve: y = x^1, y = x^2, y = x^3, y = x^4, y = x^5, ... nel punto: P = (1; 1) e confrontale tra di loro.

Altri problemi introduttivi

Area di un triangolo parabolico

Consideriamo la regione di piano compresa tra la parabola di equazione: y = x^2 l’asse delle ascisse e una retta parallela all’asse delle ordinate, ad es.: x = 3. Chiamiamo triangolo parabolico questa regione e ci poniamo il problema di calcolarne l’area.

Possiamo osservare che per x = 3 l’ordinata della parabola vale y = 9 quindi il triangolo parabolico è contenuto nel rettangolo di base 3 e altezza 9. Quindi possiamo effettuare una prima stima molto grossolana dell’area affermando che deve essere minore di 27.

Triangolo parabolico

Prime approssimazioni del triangolo parabolico.

Possiamo ridurre l’incertezza dividendo l’intervallo [0; 3] in due parti uguali: [0; \frac{3}{2}] e [\frac{3}{2}; 3]. Di sicuro l’area deltriangolo parabolico sarà inferiore alla somma di due rettangoli aventi base \frac{3}{2} e altezze rispettivamente \frac{9}{4} e 9. Quindi l’area cercata è minore di: \frac{3}{2} \cdot \frac{9}{4} + \frac{3}{2} \cdot 9 = \frac{27}{8} + \frac{27}{2} = 16,875

Se togliamo il secondo rettangolo e facciamo scorrere a destra il primo, possiamo vedere che è contenuto nel triangolo parabolico, quindi l’area cercata è maggiore di \frac{27}{8} = 3,375.

Si può migliorare la stima dividendo l’intervallo in 3 parti, e poi in 4 , 5 e così via. Maggiore è il numero di suddivisioni, minore sarà l’incertezza. Se riuscissimo a dividere l’intervallo in infinite parti l’errore sarebbe infinitesimo.

Triangolo parabolico con 8 suddivisioni

Una migliore approssimazione del triangolo parabolico.

Ma proviamo a ricavare una formula generale nel caso della suddivsione in n parti. In questo caso gli estremi destri di ogni suddivisione hanno ascissa \frac{3}{2} k, con k = 1 \dots n. Le altezze dei rettangoli, che sono le ordinate di k in quei punti valgono (\frac{3}{n} k)^2 e l’area del k-mo rettangolo vale: \frac{3}{n} \cdot (\frac{3}{n} k)^2 = \frac{27}{n^3} \cdot k^2 La somma di tutte queste aree sarà:

\frac{27}{n^3} \cdot 1^2 + \frac{27}{n^3} \cdot 2^2 + \frac{27}{n^3} \cdot 3^2 + \dots

E raccogliendo \frac{27}{n^3} si ottiene:

\frac{27}{n^3} \cdot (1^2 + 2^2 + 3^2 + \dots)

Da altri studi, i matematici hanno trovato che la somma dei quadrati dal numero 1 al numero n è data dalla formula:

\frac{n (n + 1) (2 n + 1)}{6}

Ad esempio per n = 5 abbiamo che 1^2 + 2^2 + 3^2 + 4^2 + 5^2 = 1 + 4 + 9 + 16 + 25 = 55 e \frac{5(5 + 1)(2 \cdot 5 +1)}{6} = \frac{5 \cdot 6 \cdot 11}{6} = 55

La somma delle aree degli n rettangoli può allora essere scritta nella forma:

\frac{27}{n^3} \cdot \frac {n ( n + 1 ) (2n + 1 ) }{6} =
\frac{9  ( n + 1 ) (2n + 1 )}{2 n^2}

Se consideriamo un numero N infinito di rettangoli possiamo osservare che N e N + 1 saranno infinitamente vicini e questo varrà anche per 2 N e 2 N + 1

Quindi la formula precedente è equivalente a:

\frac{9 N ( 2 N )}{2 N^2} = 9

possiamo concludere che la somma delle aree degli infiniti rettangoli è infinitamente vicina a 9 che è l’area del triangolo parabolico.

Dimostrazione visiva della formula per la somma dei primi n quadrati

Possiamo rappresentare i numeri con dei cubetti. In questo caso i numeri quadrati saranno rappresentati da prismi a base quadrata di altezza unitaria. La somma di quadrati può essere rappresentata da una piramide a gradoni realizzata sovrapponendo questi prismi.

"Piramide" che rappresenta la somma di quadrati

Rappresentazione della somma di quadrati.

Consideriamo 6 di queste piramidi.

Primo passo sei "piramidi"

Primo passo: 6 “piramidi”.

Ora possiamo ruotare le piramidi...

Piramidi in posizione

Secondo passo: Ruotiamo le “piramidi” per metterle in posizione.

...iniziamo a incastrare due coppie di “piramidi”...

Alcune "piramidi" vengono incatrate

Terzo passo: Incastriamo alcune “piramidi”.

...incastriamo anche la terza piramide ottenendo due parallelepipedi...

Due parallelepipedi fatti da 3 + 3 "piramidi"

Quarto passo: Incastriamo anche la terza “piramide”.

...accostiamo i due parallelepipedi in modo da ottenerne uno unico...

Due parallelepipedi fatti da 3 + 3 "piramidi"

Quinto passo: Accostiamo i parallelepipedi.

Abbiamo dimostrato così che sei “piramidi” sono equivalenti a un parallelepipedo.

6\ piramidi = parallelepipedo

Ma il volume di una piramide è dato dalla somma di enne quadrati:

piramide = 1^2 + 2^2 + 3^2 + \dots + n^2

E il volume del parallelepipedo è:

parallelepipedo = n (n + 1) (2n + 1)

Da cui si ricava:

1^2 + 2^2 + 3^2 + \dots + n^2 = \frac {n (n + 1) (2n + 1)}{6}

Riassumendo

I numeri Iperreali permettono di affrontare in modo nuovo alcuni problemi, ma finora li abbiamo usati in modo piuttosto intuitivo. Ora dobbiamo definire in modo molto preciso cosa intendiamo con “infinitesimo”, “infinito” e “numero iperreale”.

Una definizione ben fondata di questi termini ci permetterà di usarli al pari di tutti gli altri oggetti matematici.

Esercizi

  1. Calcola l’area del triangolo parabolico delimitato dalla parabola y = x^2, dall’asse delle ascisse e dalla retta x=4
  2. Calcola l’area del triangolo parabolico delimitato dalla parabola y = 2 x^2, dall’asse delle ascisse e dalla retta x=2
  3. Calcola l’area del segmento parabolico delimitato dalla parabola y = x^2, e dal segmento che congiunge il vertice con il suo punto di ascissa x=1
  4. Calcola l’area del segmento parabolico delimitato dalla parabola y = \frac{1}{2}x^2, e dal segmento che congiunge il vertice con il suo punto di ascissa x=5

Strumenti per vedere gli iperreali

Per poter operare con le grandezze infinitesime e infinite, dobbiamo riuscire a “vederle”. Per visualizzare i numeri reali usiamo la retta, sappiamo infatti che ogni numero reale è in corrispondenza biunivoca con un punto della retta reale. Ma se tutti i punti della retta sono già impegnati con i numeri reali come possiamo rappresentare queste altre grandezze?

Abbiamo bisogno di un nuovo modello di retta che contenga oltre ai punti reali anche i punti corrispondenti a queste nuove grandezze.

Una nuova retta per i nuovi numeri

Dobbiamo inventare un’altra retta che possiede altri punti oltre a quelli reali. Creiamo una retta “Iperreale” che oltre ai punti della retta reale ha anche altri punti che corrispondono agli infinitesimi e agli infiniti.

La nuova retta contiene anche i punti della retta reale e chiameremo numeri standard i numeri reali che corrispondono a quei punti e segmenti standard i segmenti di cui i numeri standard, in valore assoluto, esprimono la misura. La novità di questa retta è che su di essa si possono visualizzare i nuovi numeri, oltre ai numeri standard. Ma come facciamo a vederli, dato che tutti i punti normali della retta sono già occupati a rappresentare i numeri reali?

Abbiamo bisogno di alcuni strumenti particolari, che la nostra immaginazione ci può fornire.

Microscopi, telescopi e zoom

Poiché si tratta di collocare sulla retta iperreale numeri infinitesimi, che rappresentano “posizioni infinitamente vicine” ai numeri standard, e numeri infiniti, che corrispondono a “posizioni infinitamente lontane”, dobbiamo migliorare la nostra capacità di osservare e definire la distribuzione dei numeri sulla la retta iperreale. Per questo useremo microscopi, telescopi e zoom. Iniziamo ad usarli per visualizzare la posizione dei numeri standard.

Visualizzare numeri standard

Il microscopio punta la posizione del numero x sulla retta iperreale e ne ingrandisce i dintorni n volte. 1+\frac{1}{n} \  \ 1+\frac{2}{n} ... sono i numeri a destra di x (e analogamente a sinistra), distanti da x multipli di \frac{1}{n}. Le distanze fra i numeri vicini, ingrandite al microscopio, appaiono uguali alle distanze nelle zone non ingrandite della retta, ma in realtà sono distanze n volte minori.

Microscopio

Il microscopio standard ad n ingrandimenti (\times n).

Invece il telescopio non ingrandisce, serve ad “avvicinare” posizioni lontane sulla retta iperreale. Le distanze fra numeri vicini sono quindi le distanze consuete. Per indicare che puntiamo su x scriveremo \rightarrow {x}

Telescopio

Telescopio standard che punta ad un x positivo lontano.

Sono strumenti che si possono usare progressivamente, nel caso si voglia approssimare un numero qualsiasi. Ecco per esempio come puntare ad un numero lontano da 0 e ingrandire i suoi dintorni fino a visualizzarne i dettagli al centesimo di millesimo. Basta applicare un telescopio, puntare al numero intero con questo e poi progressivamente applicare due microscopi (x100 e x1000).

mmt

Come organizzarsi per distinguere nel campo visivo le posizioni prossime al numero 367,01000, diverse per la quinta cifra decimale.

Lo zoom (grandangolo???) è come un microscopio al contrario: le distanze che vengono visualizzate non sono fra unità ordinarie, ma fra loro multipli. Serve a guardare un punto da più lontano e lo punteremo esclusivamente sullo zero. In questo modo vengono visualizzati sia l’origine sia il punto lontano nello stesso campo visivo, ovviamente cambiando la scala di visualizzazione. Nei disegni, lo zoom sembra un microscopio con il bordo doppio.

zoom

Lo zoom: nel campo visivo si distinguono i dintorni di 0, visti da una distanza n volte maggiore.

Visualizzare i non standard

Ora che abbiamo fatto un po’ di pratica con i nuovi strumenti puntandoli sui “vecchi” numeri reali, proviamo ad usarli con i nuovi numeri.

In quale posizione della retta si situa un numero infinitesimo \epsilon > 0? Essendo così piccolo da risultare minore di qualsiasi numero standard, un infinitesimo non può che situarsi così vicino allo zero da non riuscire a distinguere i due numeri, con qualsiasi microscopio (\times n), non importa quale ingrandimento sia impostato (\forall n). Avremo allora bisogno di un microscopio non standard, capace di infiniti ingrandimenti (\times \infty)

microst_micrononst

I campi visivi di un microscopio standard e di uno non standard.

Analogamente, un numero M infinito, così grande da superare qualsiasi numero standard, si situa così lontano dall’origine che nessuno zoom standard (\times n , \ \forall n) lo può visualizzare. Potrà entrare nel campo visivo solo di uno zoom non standard (\times \infty)

microst_micrononst

Zoom standard e zoom non standard.

Riassumendo

Per far corrispondere i nuovi numeri ai punti di una retta, non basta la vecchia retta reale, abbiamo bisogno di una nuova retta, una retta Iperreale.

Per poter visualizzare i punti della retta Iperreale possiamo utilizzare tre strumenti mentali: il microscopio, il telescopio, lo zoom.

Esercizi

  1. Scrivi 4 numeri che puoi visualizzare puntando il telescopio su:

    -389 \quad 891 \quad 200439 \quad {-70954400}

  2. Quanti ingrandimenti deve avere un microscopio se vuoi visualizzare i numeri più vicini a:

    0,0001 \quad {-0,50061278} \quad 1,0009999 \quad -\frac{1}{400} \quad \frac{1}{99999}

  3. Disegna come combinare gli strumenti per visualizzare 188,0005521 \quad -5000,0002

  4. Se disponi solo di microscopi x100 e x1000, come visualizzare la settima cifra decimale di \sqrt{2} \quad, la nona cifra decimale di \pi, la quinta cifra decimale di {1 \over 4}?

Esistenza degli infinitesimi e degli infiniti

I numeri reali sono profondamente collegati alla lunghezza di segmenti. Ogni numero reale può essere visto come la lunghezza di un segmento e, quello che è più problematico per il nostro lavoro, ogni segmento ha come lunghezza un numero reale. Quindi tutti i punti della retta sono già occupati a rappresentare numeri reali. Ma allora, gli strumenti visti nel capitolo precedente visualizzano dei miraggi o mostrano degli oggetti matematici coerenti?

Il postulato di Eudosso-Archimede

Una esperienza che possiamo fare è quella di prendere un foglietto di carta e dividerlo a metà, poi prendere una di queste metà e dividerla ancora a metà e continuare così con la metà della metà della metà e poi la metà della ... Continuando così possiamo far diventare il nostro foglietto piccolo quanto vogliamo. Ovviamente con oggetti fisici abbiamo delle limitazioni, ma con segmenti possiamo pensare di continuare questa operazione fin che vogliamo.

Detto in altro modo, se abbiamo un segmento A piccolo quanto vogliamo e un segmento B grande quanto vogliamo e continuiamo a dimezzare B, prima o poi otterremo un segmento più piccolo di A.

Questa proprietà dei segmenti, che è abbastanza evidente, non si può dimostrare, ma Eudosso prima, Archimede poi e molti altri matematici hanno suggerito di prenderla per vera. È il cosiddetto postulato di Eudosso-Archimede che può essere espresso in una di questa due forme:

1. Dati due segmenti diversi, esiste sempre un multiplo del minore che supera il maggiore.

2. Dati due segmenti diversi, esiste sempre un sottomultiplo del maggiore che è più piccolo del minore.

Sono espressioni diverse dello stesso concetto: è sempre possibile misurare un segmento, cioè esprimere la lunghezza di un segmento attraverso un numero (che sarà necessariamente positivo). Questo numero è multiplo, o sottomultiplo dell’unità di misura, cioè è un numero finito, che rappresenta quante volte il segmento contiene il segmento unitario.

Questo postulato esclude la possibilità che esistano segmenti infiniti o infinitesimi. Infatti il multiplo di un segmento finito è ancora finito e quindi, se è vera la prima affermazione, posso considerare un segmento B grande quanto voglio, ma sarà sempre più piccolo di un multiplo di un segmento finito, quindi sarà più piccolo di un segmento finito perciò non può essere infinito.

Analogamente, se prendiamo per buono il postulato di Eudosso-Archimede, possiamo dimostrare che non può esistere un segmento più piccolo di un qualunque altro segmento finito.

Con questo abbiamo dimostrato che non possono esistere infiniti o infinitesimi.

...

Stando così le cose, gli strumenti del capitolo precedente sono degli imbrogli e il resto del libro è fatto da pagine bianche.

Riassumendo:

  • abbiamo dimostrato che non esistono infiniti e infinitesimi;
  • la dimostrazione è basata sul postulato di Eudosso-Archimede;

Ma i postulati sono accordi tra matematici, non sono verità rivelate, e un accordo può essere cambiato. Se ci mettiamo d’accordo che non vale il postulato di Eudosso-Archimede allora possono esistere segmenti (e quindi numeri) infinitesimi e infiniti, gli strumenti presentati nel capitolo precedente non sono imbrogli e possiamo andare avanti a studiare il resto del libro.

D’ora in poi, chiameremo numeri standard i numeri che, in valore assoluto, esprimono le misure dei segmenti abituali; chiameremo non standard i numeri che coinvolgono quantità infinitesime o infinite.

Possiamo quindi scegliere: o Eudosso-Archimede o (esclusivo) numeri non standard. Visto che infiniti e infinitesimi possono risultare comodi teniamo questi ultimi e abbandoniamo il postulato.

Riassumendo

L’esistenza di numeri infiniti e infinitesimi contraddice il postulato di Eudosso-Archimede. Se vogliamo usare i primi dobbiamo abbandonare quest’ultimo.

Esercizi

Dimostra che se vale il postulato di Eudosso-Archimede non può esistere un segmento infinitesimo.

Iperreali e 4 operazioni

Abbiamo inventato delle grandezze infinitesime e infinite, abbiamo inventato degli strumenti mentali che permettono di vederle in una nuova retta dei numeri, la retta iperreale. Ma chi ci dice che queste cose possano essere considerate dei numeri?

Per potersi fregiare del titolo di numeri devono essere in grado di sostenere le operazioni e magari anche il confronto.

Iperreali: chi sono, quanti sono e come chiamarli.

Intendiamo per segmento infinitesimo “un segmento piccolo a piacere”, cioè un segmento più piccolo di qualunque segmento di lunghezza finita che possiamo immaginare. Una tale qualità, non può avere alcun multiplo che supera qualsiasi segmento di misura finita, per quanto piccola.

Abbiamo chiamato standard i segmenti e i numeri che abbiamo sempre usato: i segmenti che hanno misura finita e i numeri finiti. I segmenti e i numeri infinitesimi o infiniti sono non standard. D’ora in poi ci riferiamo ai numeri e tralasciamo di specificare ogni volta le proposizioni analoghe relative ai segmenti. Possiamo sintetizzare alcuni fatti:

  • Un numero infinitesimo è minore, in valore assoluto, di qualsiasi numero standard positivo.
  • Un numero è finito se è minore di almeno un numero standard. Quindi tutti gli standard sono finiti. Per lo stesso motivo, anche gli infinitesimi sono finiti.
  • Un numero standard non può essere infinito. Ai numeri standard si applica il postulato di Eudosso Archimede: quindi un numero infinito non è standard e la sua esistenza nega il postulato.
  • Un numero infinito è maggiore, in valore assoluto, di qualunque numero standard.
  • Lo zero è minore di qualsiasi numero standard positivo. È quindi un numero particolare: è l’unico numero standard infinitesimo.

Dunque i numeri finiti possono essere o no infinitesimi: i numeri finiti non infinitesimi non sono nè infiniti nè infinitesimi, quindi si collocano, per il valore assoluto, fra due numeri standard positivi.

Tutti i numeri standard sono finiti e, a parte lo zero, non infinitesimi. Ma non tutti i finiti non infinitesimi sono numeri standard, pur escludendo 0.

Quanti sono i numeri non standard?

Se ammettiamo l’esistenza anche di un solo numero infinitesimo, non possiamo che ammetterla di tutti: saranno i risultati delle 4 operazioni, svolte fra infinitesimi e standard. I reciproci dei numeri infinitesimi (per es. 1 \over \epsilon) produrranno numeri infiniti. Infatti, in quanto infinitesimo, sarà: \epsilon< {1 \over n} \ , \forall n, \ con \ \epsilon>0, n>0, (n finito).

Passando ai reciproci e ricordando che la disuguaglianza vale per tutti gli n, si deduce che 1 \over \epsilon è un numero infinito. Se è vero che si possono pensare infiniti numeri infinitesimi, allora, da questi, potremo ottenere infiniti numeri infiniti, ricorrendo a disuguaglianze analoghe alla precedente.

Come indichiamo gli Iperreali?

Possiamo ricapitolare i nuovi numeri con la seguente classificazione:

albero_iperreali

L’albero degli Iperreali

Riguardo ai nomi, in questo testo utilizzeremo le seguenti convenzioni:

numero abbreviazione simboli
Infinitesimo i  
Infinitesimo non nullo inn \alpha, \ \beta, \ \gamma, \dots
Finito f  
Finito non infinitesimo fni a,\  b,\ c, \dots
Infinito I A,\ B,\  C, \dots
Numero qualunque   x,\  y,\ z, \dots

La somma

fni+inn

Sommare un fni con un inn: a + \epsilon.

La somma fra due numeri \alpha, \ \beta\ (di tipo inn) non può dare un numero finito. Si tratta infatti di due quantità infinitesime, più piccole di qualsiasi numero finito, più piccole anche della sua metà. Sicchè, sommate, non possono superare un qualsiasi valore finito. Potrebbero però sommare 0, se fossero numeri opposti. Quindi inn + inn = i.

La somma fra a e \epsilon (fni + inn ) aggiunge una quantità piccola a piacere ad un numero finito. È come se aggiungesse “poco o nulla”, quindi il risultato è fni. Il caso particolare, che a sia finito, molto piccolo e vicino a zero, si visualizza con gli opportuni ingrandimenti. Esiste sempre almeno un ingrandimento \left(\exists n \right) utile far sì che un microscopio standard visualizzi un simile fni, proprio perché è diverso da 0. Invece, trattandosi di un microscopio standard, il suo campo visivo non riesce a cogliere una quantità infinitesima. E così abbiamo per tutti i casi: inn + fni = fni.

La somma a + b fra due fni propone vari casi: se a = -b , allora a + b = 0. Se sono di segno concorde risulterà un numero s di tipo fni. Se a, oppure b, o entrambi sono fni (nel senso che almeno uno dei due risulta da fni + inn, come visto nel caso precedente) allora può risultare un inn. Riassumendo: fni + fni = f.

tab_somma

Tavola delle somme

La tabella sintetizza i possibili casi. Come esempio di un risultato inatteso, supponiamo che M provenga da una somma I + inn = I M = A + \epsilon e B sia l’opposto di A: B = -A Allora M + B = A + \epsilon + (-A) = A + \epsilon - A = \epsilon, quindi in questo caso: I + I = inn!

La differenza

Le regole della differenza sono legate a quelle della somma; basta immaginare che il sottraendo sia l’opposto di un addendo: x - y = x + z \leftrightarrow  z = - y.

Vale quindi ancora la stessa tavola di risultati vista per la somma.

Il prodotto

C’è un modo per visualizzare il prodotto fra due numeri come segmento sulla retta: bisogna ricorrere al Teorema di Talete e immaginare i due numeri e l’unità di misura rappresentati come nel disegno.

prodotto_Talete

Dal Teorema di Talete si ricava: OU : UA = OB : BC

Riferendosi alle misure (segmenti standard): ab misura BC ed è il prodotto fra le misure dei due segmenti UA e OB. La rappresentazione non cambia sulla retta iperreale, dove, in più, si visualizzano anche le quantità infinitesime.

Immaginiamo il prodotto \epsilon \cdot a, con i punti U e A talmente vicini sulla stessa retta da potersi distinguere solo con un microscopio non standard. Allora per il Teorema di Talete B risulterà così vicino a C da richiedere l’uso di un altro microscopio non standard per distinguerli, segno evidende che il prodotto è di tipo inn.

inn x fni

Il prodotto \epsilon \cdot\ a.

Anche moltiplicare un infinito per un infinitesimo non nullo richiede qualche riflessione. Per es.

M \cdot \mu = 1 \ se\  \mu={1 \over M}\newline
M \cdot m = M\newline
M \cdot M = M^2\newline
M \cdot {1 \over M^2} = {1 \over M}

Per un prodotto del tipo i \times inn, e in assenza di ulteriori informazioni, non è possibile prevedere il tipo del risultato. Questi casi, che si verificano anche nella somma, si chiamano forme indeterminate. Vale comunque: M \cdot 0 = 0

La tabella, che contiene anche casi più facili (per es. il prodotto fra due numeri fni), è la seguente.

prod_rec

Tavola dei prodotti e dei reciproci

Il quoziente

divisione

Tavola della divisione

La seconda tabella nella Figura 6.6 elenca i tipi dei numeri reciproci di numeri iperreali. È utile per applicare alla divisione le stesse regole del prodotto. Dalla tabella è escluso lo zero, dato che il reciproco di zero non è definito.

Un esempio: dato che

\ {1\over \mbox{inn}}= \mbox{I}\ allora \ {\mbox{inn} \over {\mbox{inn}}}= {\mbox{inn} \times \mbox{I}} = \mbox{?}

che è un caso indeterminato, come si è già visto nel prodotto.

Il quoziente fra un inn e un fni è intuitivamente un infinitesimo. Lo si può dimostrare, ricorrendo alla tabella dei reciproci:

\ {\mbox{inn} \over \mbox{fni}}= {\mbox{inn} \times {1 \over \mbox{fni}}}=
{\mbox{inn} \times \mbox{fni}}= \mbox{inn}

Per il quoziente fra un inn e un I:

\ {\mbox{inn} \over \mbox{I}}= {\mbox{inn} \times {1 \over \mbox{I}}}=
{\mbox{inn} \times \mbox{inn}}= \mbox{inn}

Si possono considerare i reciproci nell’uguaglianza precedente, e ricavare:

{\mbox{I} \over \mbox{inn}}= {\mbox{I} \times {1 \over \mbox{inn}}}=
{\mbox{I} \times \mbox{I}}= \mbox{I}\,

oppure, pescando direttamente dalla tabella dei reciproci:

\ {1 \over \mbox{inn}}= \mbox{I}

Aiutandosi sempre con la tabella dei reciproci, è facile trovare i tipi risultanti dai quozienti fra un tipo I con un inn oppure con un fni. Infine nello stesso modo regoleremo il rapporto fra un I e un I, che risulta indeterminato. La tabella riassume tutti questi ragionamenti intuitivi

Le dimostrazioni

Come provare in modo esatto e formale che queste regole sono coerenti con le definizioni date ai numeri iperreali? Per dimostrare i casi nelle tabelle della somma e della differenza per lo più si ricorre alla disuguaglianza triangolare |x+y| \le |x|+|y|, come viene proposto in uno degli esercizi.

Per gli altri casi, dimostriamo come esempio che il quoziente fra un fni e un inn è I, cioé è maggiore di qualsiasi standard (s). Consideriamo per semplicità solo numeri positivi. \newline {a \over \epsilon}>s\. Se a è standard è sicuramente maggiore di un altro numero standard t. Quindi \ {a \over \epsilon}>{t \over \epsilon}\. Perché quest’ultimo sia \ {t \over \epsilon}>s\ è sufficiente che \ \epsilon <{t \over s}\, cosa senz’altro vera.

Le dimostrazioni formali possono confortare, ma è indispensabile raggiungere i risultati intuitivamente, per valutare con sicurezza e in modo spedito casi più complessi di questi, che sono elementari.

L’ordinamento

Per quanto riguarda l’ordinamento possiamo osservare che:

  • i numeri negativi sono minori dei numeri positivi;
  • i numeri negativi con valore assoluto maggiore sono minori dei numeri negativi con valore assoluto minore;
  • 0 è minore di tutti i numeri positivi;
  • Gli infinitesimi sono minori di tutti i finiti non infinitesimi positivi;
  • i finiti non infinitesimi sono minori degli infiniti positivi;
  • tra i finiti non infinitesimi diremo che a > b se a - b > 0.

Riferendoci ai numeri positivi e usando le convenzioni precedenti possiamo scrivere:

0 < \alpha < a < A

Rimangono da confrontare infinitesimi con infinitesimi e infiniti con infiniti.

Sulle proprietà

Le proprietà delle 4 operazioni nell’insieme dei reali valgono anche con gli iperreali. La dimostrazione di questo si deve al matematico Abraham Robinson, che la pubblicò nel 1963.

Riassumendo

Standard, non standard, finiti, infiniti e infinitesimi sezionano l’insieme degli Iperreali in vari sottoinsiemi che è indispensabile ricordare. Usando l’intuizione, più che le dimostrazioni formali, si studiano i tipi dei possibili risultati delle 4 operazioni, quando si usano i numeri iperreali. Le operazioni hanno le stesse proprietà che hanno con i numeri reali.

Esercizi

  1. Perché frazionando un segmento finito non riesci mai a ottenere una lunghezza infinitesima?
  2. Un numero irrazionale è un numero finito? E un numero trascendente? E un numero decimale periodico? E un numero standard può essere decimale illimitato non periodico?
  3. Se l’insieme dei numeri reali è (già) denso, come è possibile inserire anche gli infiniti e gli infinitesimi? Allora sarà denso anche l’insieme degli iperreali?
  4. Una tribù primitiva conosce solo l’uso di 4 numeri: 1, 2, 3, 4. Un numero maggiore viene genericamente indicato con “molti” (5 pecore –> molte pecore, 8, 15, 30 pecore –> molte pecore). Immagina che da un gruppo di pecore ne vengano rubate alcune e indica le sottrazioni e i risultati con questo esiguo insieme di numeri. \newline 7 \ pecore\  - \ 7 \ pecore\ \rightarrow \newline
7 \ pecore\  - \ 2 \ pecore\ \rightarrow \newline 7 \ pecore\  - \ 4 \ pecore\ \rightarrow
  5. Classifica con diagrammi di Eulero-Venn l’insieme degli Iperreali, dei numeri finiti, degli infinitesimi, dei numeri standard.
  6. Completa la casistica dei risultati inattesi per la somma I + I = ?
  7. Visualizza con microsopi e telescopi la somma a + \ -\epsilon \, supponendo a molto minore di 0.
  8. Spiega con esempi la Tavola delle somme.
  9. Visualizza con microsopi e telescopi 6 esempi diversi di prodotto
  10. Spiega con esempi la Tavola dei reciproci.
  11. Dimostra che inn + inn = i , seguendo il ragionamento del testo e facendo uso della disuguaglianza triangolare.
  12. La Tavola della divisione ha un risultato in ogni casella, non come le precedenti. Perché?
  13. Abbiamo definito i numeri standard, gli infinitesimi e gli infiniti. Possiamo dire che gli ultimi due fra questi sono non standard e che gli standard sono numeri finiti?

Confronti fra iperreali

Abbiamo visto che il rapporto fra due numeri di tipo I è una forma indeterminata. Il caso elementare è infatti \ {M \over M}\ = \ \mbox{?}\ e nulla si può dire di più, mancando ulteriori informazioni. Vediamo però un caso un po’ più impegnativo.

{aM \over {a+M}}\ Ricorrendo alle tavole del prodotto e della somma si sarebbe tentati di classificare questo rapporto secondo i tipi \ {\mathbf{I} \over \mathbf{I}}\ come il precedente. Però il ragionamento intuitivo ci dice che il numero a nel denominatore influisce sul risultato molto di meno rispetto al numeratore: in aM il numero a viene moltiplicato infinite volte, mentre in a+M, a si aggiunge all’infinito e rispetto ad esso è poco rilevante. Quindi \ a+M \approx M\ e il rapporto si può approssimativamente semplificare, determinando il tipo fni. Il ragionamento “a spanne” può essere formalizzato con una tecnica che tornerà utile: mettere in evidenza il termine più rilevante. \newline {aM \over {a+M}}={aM \over {M\left({a \over M}+1\right)}}={a \over {a \over M} +1}\quad Da qui, l’analisi dei tipi: \quad {\mathbf{fni} \over {\mathbf{fni} \over \mathbf{I}}+\mathbf{fni}}={\mathbf{fni} \over {\mathbf{inn}+\mathbf{fni}}}={\mathbf{fni} \over \mathbf{fni}}=\mathbf{fni}

Confrontare due infinitesimi

Siamo abituati a confrontare le distanze stradali, l’altezza delle persone, il peso di due oggetti... L’operazione che facciamo spontaneamente è valutare la differenza fra due misure e in genere ci sembra un’informazione sufficiente. Ma esaminiamo due casi:

  • Uno studente in sei mesi cresce di 10 cm, partendo da un’altezza di 160 cm.
  • Il Ponte di Brooklin, lungo circa 1800m, si allunga di più di un metro passando dall’inverno all’estate.

È banale dire che il ponte “cresce” di più, d’altra parte è anche molto più lungo. Se si valuta l’allungamento in rapporto alla misura iniziale, si vede che lo studente in sei mesi cresce in proporzione 112 volte più del ponte. Cioé se il ponte fosse ridotto ad un modellino di 160 cm, si allungherebbe di meno di 1 mm. Il segreto per valutare correttamente sta nel termine “in proporzione”: non si confrontano due misure con il calcolo della loro differenza, ma con il loro quoziente . Anche con due numeri di tipo inn useremo lo stesso procedimento: per confrontarli valuteremo il quoziente fra gli infinitesimi.

La tavola delle divisioni ci dice che il quoziente {\epsilon \over \delta} è indeterminato, cioé ammette più risultati. Ma entriamo nei dettagli. D’ora in avanti, per semplificare, supporremo che i due infinitesimi siano quantità positive.

stesso_ordine

Gli infinitesimi sono dello stesso ordine.

Se usiamo due numeri standard, il rapporto {a\over b} esprime la misura di a secondo b, è di tipo fni , cioé è un numero che si colloca fra due numeri standard. Sappiamo già che se a, b sono molto piccoli troveremo un opportuno microscopio standard che li visualizza vicini e distinti. Ma in questo caso, trattandosi di infinitesimi, nessun microscopio standard riesce a visualizzarli distinti da zero. Cioé per tutti gli n ingrandimenti possibili (\times n \ , \forall n) i due infinitesimi e lo zero coincidono. Allora bisogna usare un microscopio non standard e puntarlo sullo zero. Avremo due casi:

  • i due infinitesimi sono entrambi visibili nel campo visivo del microscopio, regolato allo stesso (infinito) ingrandimento: sono distinti sulla retta, vicini allo zero ma separati da esso (primo caso).
  • uno dei due infinitesimi è più piccolo dell’altro, ma non infinitamente più piccolo. Quindi uno si distingue da zero, ma non l’altro. Bisogna allora usare un secondo microscopio, questa volta un microscopio standard, e puntarlo sullo zero nel campo visivo del primo microscopio. Esisterà un opportuno ingrandimento finito (\exists n, \times n) che consente di separare dallo zero anche il secondo infinitesimo (secondo caso).

Se per entrare nel mondo infinitamente piccolo dei \delta e degli \epsilon facciamo uso di un solo microscopio non standard e con questo riusciamo a distinguerli fra loro e dallo zero allora si dice che i due infinitesimi sono del primo ordine. L’ordine di un infinitesimo corrisponde al numero di microscopi non standard utilizzati in sequenza per distinguerlo dallo zero. Quindi se basta un solo microscopio non standard per visualizzarli distinti, due infinitesimi sono entrambi del primo ordine, non importa se abbiamo avuto bisogno anche di un microscopio standard.

In generale, se due infinitesimi sono dello stesso ordine, si distinguono entrambi da zero e fra loro grazie allo stesso numero di microscopi non standard.

Il rapporto {\left|\epsilon \over \delta\right|} (oppure {\left|\delta \over \epsilon\right|}) calcola quante volte il secondo infinitesimo sta nel primo. Nel campo visivo del microscopio non standard il numero di volte può essere contato, quindi il risultato è un fni. Sappiamo che un fni si colloca fra due numeri standard, quindi s<{\left|\epsilon \over \delta\right|}<t\ \rightarrow \
s|\delta|<|\epsilon|<t|\delta| . Stiamo esprimendo la misura di |\epsilon| in unità |\delta|. Insomma, seppur ridotti al mondo infinitamente microscopico, possiamo simulare le stesse operazioni di confronto imparate con i segmenti e i numeri standard.

o(delta)

Il primo infinitesimo è di ordine superiore: \epsilon=o(\delta).

Il secondo caso è quello in cui fra i due infinitesimi, il primo è “più infinitesimo” del secondo. Seguendo il metodo del caso precedente, applicare qualsiasi microscopio standard allo zero risulta inutile. Applichiamo dunque un microscopio non standard e regoliamo l’ingrandimento fino al valore infinito che ci consente di visualizzare l’infinitesimo maggiore (diciamo \delta), che è il numero iperreale meno piccolo. \delta appare per primo nel campo visivo mentre \epsilon è troppo infinitamente vicino allo zero, troppo piccolo per poter essere visualizzato con quell’ingrandimento. Non lo potremo visualizzare nemmeno aiutandoci con un altro microscopio che sia standard: questa volta anche il secondo microscopio deve essere non standard. Quando nel campo visivo \epsilon comincia a distinguersi dallo zero (siamo a infiniti di infiniti ingrandimenti), \delta non si vede più. Per poter vedere \epsilon abbiamo raggiunto un ingrandimento così infinitamente forte che \delta è uscito dal campo visivo. Il segmento di misura \delta si è infinitamente allungato: grazie al secondo ingrandimento, \delta da infinitesimo è diventato un infinito. Se lo volessimo rivedere dovremmo cercare di attenuare l’ingrandimento e applicare un telescopio (oppure uno zoom) non standard. In una situazione così, si dice che \epsilon è infinitesimo di ordine superiore rispetto a \delta (cioé è infinitamente più piccolo) e si scrive \epsilon=o(\delta). Il rapporto fra i due risulta quindi un numero infinitesimo non nullo.

Il secondo infinitesimo è di ordine superiore

Il terzo caso è quello in cui fra i due infinitesimi, il primo è “meno infinitesimo” del secondo. In pratica nella scala in cui si visualizza il denominatore, il numeratore si trova a distanza infinita. Quindi \epsilon è infinitesimo di ordine inferiore (\delta è infinitesimo di ordine superiore), quindi stavolta \delta=o(\epsilon). Il rapporto fra i due risulta quindi un numero infinito.

Confrontare due infiniti

Il tipo \frac{\mbox{I}}{\mbox{I}} è indefinito: può dare origine a un fni, a un I oppure a un inn. Trattandosi di infiniti e non di infinitesimi, useremo gli zoom invece dei microscopi e seguiremo un percorso simile. Anche qui immaginiamo per semplicità che M e N siano infiniti positivi.

I due infiniti sono dello stesso ordine

I due infiniti non sono “a tiro” per uno zoom standard. Occorre usare uno zoom non standard perché si trovano all’infinito. Regolando l’ingrandimento di uno zoom non standard, se M > N il numero M sarà il primo a comparire nel campo visivo, distinto da zero. Di nuovo si avranno due casi: che anche il punto N risulti separato dall’origine, oppure che occorra usare un microscopio standard per separarlo. In ogni caso il rapporto fra i due infiniti è calcolabile nel campo visivo dello zoom, eventualmente tenendo conto degli ingrandimenti del microscopio. Poiché usiamo un solo zoom non standard, diciamo che entrambi i numeri sono infiniti di ordine 1. Il rapporto fra i due segmenti infiniti \frac{OM}{ON} (e anche il suo reciproco) risulterà un numero di tipo fni. Il numero di zoom non standard necessari a visualizzare un iperreale infinito dipende dal suo ordine di infinito. Se M e N sono infiniti dello stesso ordine, il numero di zoom non standard che usiamo per visualizzarli è lo stesso. Infatti possiamo averli nello stesso campo visivo.

Il primo infinito è di ordine superiore
M_O(N)

M è di ordine superiore

Se M > N, questa volta N è il primo numero a comparire separato da zero nel campo visivo di uno zoom non standard. Ma M in questa situazione si trova all’infinito, cioé non è raggiungibile mediante uno zoom standard puntato su N. Occorre usare un secondo zoom non standard e a quel grado di infinito (infinito di infinito) N è schiacciato sullo zero. Nessun microscopio standard può distinguere N da zero. Si può farlo solo puntando sullo zero un microscopio non standard nel campo visivo dello zoom non standard, in modo da ridurre il grado di infiniti ingrandimenti. Possiamo dire che M è un infinito di secondo ordine, mentre N lo è di primo. Siccome nel visualizzare N, M è andato all’infinito, occorrono infiniti segmenti ON per misurare OM. Quindi il quoziente fra i numeri M e N dà luogo a un numero infinito. Questo succede in generale, cioé se M è un infinito di ordine superiore a N.

Il secondo infinito è di ordine superiore

Per analizzare quest’ultimo caso basta invertire M e N nel rapporto precedente, oppure ricondurci al risultato visto nella tabella dei reciproci. Se M è un infinito di ordine inferiore, il rapporto fra M e N risulta infinitesimo.

Riassumendo

Il confronto fra due numeri è utile se risulta dal loro rapporto, non dalla loro differenza. Il rapporto fra due infinitesimi è indefinito. Visualizzandoli con i microscopi non standard si distinguono 3 casi: possono essere infinitesimi dello stesso ordine, oppure il primo, o il secondo, può essere di ordine superiore. Le tre situazioni portano a risultati diversi. Lo stesso accade nel rapporto fra infiniti. Questa volta invece dei microscopi, si usano gli zoom non standard.

tipo confronto
i \alpha > \beta \ \ se \ \ \frac{\alpha}{\beta} = Infinito
I A > B \ \ se \ \ \frac{A}{B} = Infinito

Esercizi

  1. Il primo esempio del capitolo ricorda la formula della resistenza equivalente nel caso di un circuito elettrico con due resistenze in parallelo. Segui l’analisi dei tipi sviluppata nel testo e applicala al circuito in questione.
  2. Di che tipo è l’espressione: \quad {{\beta+\beta^2}\over{2\beta+\beta^3}}\ ? (Se segui la tecnica spiegata all’inizio del capitolo, vedrai che il tipo risultante non è i).
  3. Di quali e quanti strumenti hai bisogno per visualizzare il numero che risulta da \frac{a+\epsilon}{a}? E da \frac{a}{a+\epsilon}?
  4. Se \alpha ,\beta ,\gamma sono infinitesimi dello stesso ordine, come disponi gli strumenti per distinguere \frac{\alpha + \beta} {\gamma} , {\alpha \beta}\over{\gamma} ? E quali sono i tipi che che risultano?
  5. Risolvi i due esercizi precedenti sostituendo i numeri infinitesimi con numeri infiniti

Distanze sulla retta iperreale

La retta e i numeri iperreali

Abbiamo usato un modello di retta che, grazie a strumenti non standard, permette di visualizzare anche i numeri non standard. I punti della retta iperreale sono in corrispondenza biunivoca con i numeri iperreali. Gli iperreali (insieme *R) sono: i numeri standard, cioé i numeri reali (insieme R), e i numeri non standard. I numeri non standard sono: gli infiniti, gli infinitesimi e una parte dei finiti non infinitesimi.

Sappiamo già che sulla retta reale ogni punto corrisponde ad un numero reale e che fra due punti, per quanto vicini, saremo sempre in grado di collocarne un terzo. La distanza di questo terzo punto dagli altri due sarà molto piccola, ma finita. Non infinitesima. Sappiamo anche che i punti sono infiniti, cioé che possiamo sempre collocare un punto più a destra o più a sinistra degli altri. Ma per quanto sia infinito l’insieme dei numeri reali, tuttavia i numeri reali infiniti non esistono. Sulla retta iperreale le cose sono diverse.

Non ci sono dimostrazioni che confermino la corrispondenza biunivoca fra i punti della retta (reale o iperreale) e i numeri corrispondenti. La assumiamo per vera, cioé come postulato implicito nella scelta del modello di retta. Se non fosse così, cioé se la retta “avesse dei buchi” o se mancassero dei numeri per esprimere la posizione di alcuni punti, la retta (reale o iperreale) sarebbe un modello inutile.

Distanze infinitesime, monadi e numeri finiti

Esistono gli infinitesimi e quindi esistono le distanze infinitesime. Un numero x è infinitamente vicino ad un numero y (si scrive x \approx y) se |x-y| è un infinitesimo. L’insieme dei numeri iperreali a distanza infinitesima da x si chiama monade di x: mon(x). mon(x) è in pratica il campo visivo di un microscopio non standard puntato su x. Fra le monadi, la principale è mon(0), infatti lo zero è “circondato” da infinitesimi. Se x è un infinitesimo, potremo scrivere x \in mon(0) o più semplicemente x\approx 0. La distanza fra due numeri standard è zero oppure è finita. Quindi fra due numeri standard a, b non può succedere che a \approx b, a meno che non coincidano. Così due numeri standard non possono appartenere alla stessa monade. È facile vedere che l’essere infinitamente vicino è una relazione di equivalenza. Per questo individua una partizione sulla retta iperreale. Le monadi ricoprono la retta senza sovrapporsi, “centrate” ognuna su un numero finito diverso. Le monadi dei numeri finiti contengono un numero standard, uno al massimo. Anche i numeri infiniti hanno proprie monadi e possono essere infinitamente vicini. Ogni numero finito x si può esprimere come x=s + \delta, con s che è la sua parte standard (s=st(x)) e mentre \delta è la sua parte infinitesima (eventualmente nulla). Se la parte infinitesima di un numero finito è nulla, il numero coincide con la sua parte standard. Invece, se è nulla la sua parte standard, il numero finito è un infinitesimo. Le parti standard dei numeri finiti si sommano come avviene per i numeri reali: sicché la somma della parti standard è la parte standard della somma. Anche le parti infinitesime di due numeri finiti sono sommabili e sappiamo, dalla tavola della somma, che la loro somma è un infinitesimo.

Distanze finite e galassie

Due numeri a distanza finita si dicono finitamente vicini. Quindi, in questo caso |x-y| è un numero finito. Come per la distanza infinitesima, anche la distanza finita è una relazione di equivalenza, che quindi individua una partizione nell’insieme *R. Tutti i numeri a distanza finita da un certo numero x costituiscono la sua Galassia: Gal(x)=\{y:|x-y|=\mbox{d}, \forall \mbox{d} \in \mbox{*R}\}. x è un qualsiasi iperreale.

Se x = 0, gli y a distanza finita da x determinano l’insieme dei numeri finiti. Gal(0) per questo motivo è detta galassia principale. Occorre ricordare che l’espressione “a distanza finita” non vuol dire che la distanza sia un numero standard, ma che è un numero finito, quindi esprimibile come \mbox{d}= \mbox{s} +\delta. La parte infinitesima può essere eventualmente nulla, ma non è detto che lo sia. Per questo la galassia principale contiene tutti i numeri finiti, standard e non standard. I numeri a distanza finita da x si visualizzano mettendo in corrispondenza di x un telescopio standard e puntandolo verso gli altri numeri della galassia.

Se x è un numero infinito, Gal(x) è l’insieme dei numeri a distanza finita da x, che sono tutti infiniti (vedi per questo la tavola della somma). Poiché i numeri infiniti sono ..infiniti, sono infinite anche le loro galassie. La retta iperreale contiene quindi infinite galassie, oltre alla galassia principale.

Distanze tali da rendere i numeri indistinguibili

Due numeri non nulli si dicono indistinguibili se la loro differenza è infinitesima rispetto a ciascuno di essi. Cioé: \frac{x-y}{x} \approx 0 e \frac{x-y}{y} \approx 0. x indistinguibile da y si scrive: x\sim y.

Immaginiamo di collocare due numeri non nulli sulla retta iperreale. Se sono infinitesimi e non si riesce a cogliere la loro distanza nel campo visivo del microscopio non standard che visualizza uno dei due, allora sono indistinguibili. Se invece sono infiniti, sono indistinguibili se lo zoom non standard, che visualizza uno dei due, non riesce a separarlo dall’altro. In pratica sono indistinguibili se non si riesce a cogliere la loro differenza nella stessa scala (di riduzione o di ingrandimento) con cui si visualizzano. È importante che i numeri (e i segmenti corrispondenti) non siano nulli, perché a qualsiasi scala il punto ha lunghezza uguale a zero e quindi il rapporto della definizione non avrebbe senso. Tornando alla definizione, da \frac{x-y}{x}\approx 0 risulta

\frac{x-y}{x}=\delta\ \rightarrow\ x-y=x\delta\ \rightarrow\ x- x\delta = y\ \rightarrow\ x(1-\delta)=y\ \rightarrow\
\frac{y}{x}= 1-\delta \ \rightarrow\ \newline \rightarrow\ st \left(\frac{y}{x}\right)= 1\ \rightarrow\ st \left(\frac{x}{y}\right)= 1.

Quindi una definizione equivalente di indistinguibili è: Due numeri si dicono indistinguibili se la parte standard del loro rapporto vale 1. Oppure, che è lo stesso: ... se il loro rapporto è infinitamente vicino a 1. Ovviamente se due numeri sono indistinguibili, sono dello stesso tipo.

Alcuni dettagli sugli indistinguibili in relazione ai loro tipi. (Ricorda che a rappresenta un numero di tipo fni, \epsilon, \delta rappresentano inn, M rappresenta un numero di tipo I, mentre x,y sono di tipo qualsiasi).

  • Aggiungere un infinitesimo ad un numero non infinitesimo produce un risultato indistinguibile: a+\delta \sim a.
  • Per due numeri di tipo fni essere indistinguibili o essere infinitamente vicini è la stessa cosa: a \sim b \Leftrightarrow a \approx b.
  • Due infinitesimi sono sempre infinitamente vicini, ma non è detto che siano indistinguibili. Per essere indistinguibili devono differire per un infinitesimo di ordine superiore: \delta + \delta^2 \sim \delta.
  • Quindi: \epsilon \sim \delta e \epsilon \approx \delta sono relazioni diverse perché la seconda è sempre vera, mentre la prima può non esserlo. Per esempio due infinitesimi dello stesso ordine come \epsilon \mbox{ e }  2\epsilon sono distinguibili perché la parte standard del loro rapporto è diversa da 1.
  • Per gli infinitesimi, l’essere indistinguibili è una condizione più impegnativa che essere dello stesso ordine.
  • Due infiniti sono indistinguibili se differiscono di un numero finito oppure di un numero infinitesimo: \newline M + a \sim M \quad M+\delta \sim M.
  • Due infiniti sono indistinguibili se differiscono di un infinito di ordine inferiore: \newline M^2 + M \sim M^2.
  • Per gli infiniti, l’essere indistinguibili è una richiesta meno impegnativa dell’essere infinitamente o finitamente vicini.

Riassumendo

Postulato: i punti della retta iperreale sono in corrispondenza biunivoca con i numeri iperreali (insieme *R). Due punti sulla retta iperreale (e i due numeri corrispondenti) possono essere infinitamente vicini o finitamente vicini. Sono due diverse relazioni di equivalenza, che ripartiscono la retta iperreale con monadi o galassie. Inoltre due punti possono essere indistinguibili, cioé così vicini che la loro distanza rapportata a ciascuno dei due è un infinitesimo.

Esercizi

  1. Dimostra che x\approx y è una relazione di equivalenza
  2. Traduci in formule i due paragrafi sulla somma di due numeri finiti.
  3. Dimostra le proprietà seguenti: \newline st \left( - x\right) = - st \left(x\right) \newline
st \left(x - y \right) = - st \left( x \right) - st \left( y \right) \newline
st(xy) =st(x) st(y) \newline
st\left(\frac{x}{y}\right) =\frac{st(x)}{st(y)},\ \mbox{se \ y \ non\ è\ un\
infinitesimo} \newline
st ( x ) > 0 \Rightarrow x > 0 \newline
x > 0 \Rightarrow st(x) \ge 0
  4. Sotto quale ulteriore condizione è vera la quarta relazione precedente?
  5. La catena di deduzioni che viene dalla definizione di indistinguibili, può essere percorsa a ritroso? E vale anche scambiando al denominatore x con y?
  6. Dimostra a partire dalla definizione che se due numeri sono indistinguibili allora il loro rapporto è infinitamente vicino a 1.
  7. Gli indistinguibili sono necessariamente dello stesso tipo: vale anche il viceversa?
  8. Una sola delle seguenti proposizioni è vera: quale? 1) Due infiniti sono indistinguibili se appartengono alla stessa monade o galassia. 2) Due infiniti appartengono alla stessa monade o galassia se sono indistinguibili
  9. Due infiniti indistinguibili sono necessariamente dello stesso ordine? E due infiniti dello stesso ordine sono necessariamente indistinguibili?
  10. Quale confronto viene rappresentato dall’immagine che segue? Descrivi il procedimento per risolverlo.
eps1_2_3

Operare con gli indistinguibili

Il vantaggio di usare numeri indistinguibili

I numeri indistinguibili sono vantaggiosi nel semplificare i calcoli con gli iperreali. L’idea che si segue è di sostituire i numeri dati in un’espressione con altri indistinguibili, con i quali il calcolo risulta più facile. Si otterrà un risultato indistinguibile dal risultato dell’espressione iniziale. In effetti è questo il metodo seguito per risolvere intuitivamente i problemi introduttivi, nei quali il risultato cercato corrisponde alla parte standard dell’espressione risolvente. Ora però vogliamo definire poche regole generali in modo che quel metodo sia applicabile generalmente.

Per iniziare

Dal capitolo precedente richiamiamo poche regole pratiche. Diremo che:

  • nella somma di due infinitesimi posso trascurare un infinitesimo di ordine superiore, es: \newline \delta + \epsilon \sim \delta, se \epsilon è di ordine superiore;
  • nella somma di un finito non infinitesimo con un infinitesimo posso trascurare l’infinitesimo, es: \newline a + \delta \sim a;
  • nella somma di un infinito con un infinitesimo posso trascurare l’infinitesimo, es: \newline M + \delta \sim M;
  • nella somma di un infinito con un finito non infinitesimo posso trascurare il finito non infinitesimo, es:\ \newline M + a \sim M;
  • nella somma di due infiniti posso trascurare un infinito di ordine inferiore, es: \newline M + N \sim M se N è di ordine inferiore.

Esempi di calcoli

  • Trovare il tipo di \frac{2M+5}{M-3} e, se si tratta di un fni, il risultato indistinguibile.

Si tratta di un rapporto fra infiniti, quindi una forma indeterminata. Con le regole degli indistinguibili si ottiene \frac{2M+5}{M-3} \sim \frac{2M}{M}=2 . È un numero di tipo fni, quindi

\frac{2M+5}{M-3} \approx 2\  \rightarrow \ st\left(\frac{2M+5}{M-3}\right)=2.

  • Analogamente, si ottiene: st(a + 3\delta + \delta^3)=st(a) perchè l’espressione indistinguibile corrispondente a quella data è a.

  • Con stessa facilità si può vedere che st\left(\frac{2+6\epsilon}{8-\epsilon^2}\right)=\frac{1}{4}.

  • Una situazione da analizzare con cura:\frac{(3+\delta)^2-9}{\delta} Se si opera pensando che la parentesi sia indistinguibile da 3, allora il numeratore è indistinguibile da 0. Ma la definizione di indistinguibili dice: Due numeri non nulli si dicono.... Quindi se uno dei numeri è 0 non si può ricorrere agli indistinguibili. Operando algebricamente si evita l’ostacolo. \frac{(3+\delta)^2-9}{\delta}= \frac{9+6\delta+\delta^2-9}{\delta}\sim \frac{9+6\delta-9}{\delta}= \frac{6\delta}{\delta}=6, cioé la frazione è indistinguibile da 6.

    Ma come ci si comporta in generale di fronte a un problema simile?

Somme algebriche fra indistinguibili

Come mi devo comportare se devo sommare o sottrarre due iperreali? La loro somma (o differenza) può essere ricavata attraverso la somma (o differenza) dei loro indistinguibili? In simboli:

Dati x \sim x'\ e\  y \sim y', è vero che: x+y \sim x'+y'\?

La risposta è: non in tutti i casi. Se x, y sono due numeri indistinguibili fra loro (quindi se vale anche x \sim y) allora:

  • se devo sommarli, non devono essere numeri opposti
  • se devo sottrarli, non posso usare gli indistinguibili al loro posto.

Esempi di calcoli e di rappresentazioni

  • \frac{3M+M^2-2M^3}{3+4M^2} contiene iperreali infiniti. Seguendo le regole sintetizzate in apertura, si trascurano gli infiniti di ordine inferiore. Quindi: \frac{3M+M^2-2M^3}{3+4M^2} \sim \frac{-2M^3}{4M^2}=\frac{-M}{2}. La rappresentazione mostra che qualsiasi zoom standard non può visualizzare i due numeri sulla retta disegnata in scala ordinaria. Invece con uno zoom non standard i due numeri entrano nel campo visivo e sembrano coincidere. Per separarli occorrerrà usare un microscopio non standard. Questo conferma la definizione del cap. precedente: la distanza fra indistinguibili non può essere visualizzata nella stessa scala in cui compaiono sulla retta.
  • In \frac{3\beta^2 + \beta^3 - 6\beta^4}{2\beta-\beta^5} si trascurano gli infinitesimi di ordine superiore. Il risultato è un infinitesimo (quindi ha la parte standard nulla) e lo si vede in figura 2. Sulla retta i numeri coincidono con 0 nel campo visivo di qualsiasi microscopio standard, coincidono fra loro (ma distinti da 0) nel campo visivo di un microoscopio non standard e restano indistinti anche applicando un qualsiasi ulteriore microscopio standard.
indist

Rappresentazioni di Iperreali indistinguibili: \frac{3M+M^2-2M^3}{3+4M^2} \sim \frac{-M}{2} (un infinito) e \frac{3\beta^2 + \beta^3 - 6\beta^4}{2\beta-\beta^5} \sim \frac{3}{2}\beta (un infinitesimo).

Esercizi svolti

Trova gli indistinguibili delle espressioni seguenti.

  1. \frac{1}{\delta}\left(\frac{1}{4+\delta}-\frac{1}{4}\right)
  2. M\left[\left(4+\frac{1}{M}\right)^2-16\right]
  3. \sqrt{M+1}-\sqrt{M}
  4. \frac{a\epsilon}{a+\epsilon}

Soluzioni:

  1. se considero 4+\delta \sim 4 il risultato della parentesi è 0. Poiché lo zero è escluso dalla relazione di indistinguibilità, devo sviluppare la differenza:
\frac{1}{\delta}\left(\frac{1}{4+\delta}-\frac{1}{4}\right)= \frac{1}{\delta}\frac{4-(4+\delta)}{4(4+\delta)}=-\frac{\delta}{4\delta(4+\delta)}=-\frac{1}{4(4+\delta)}

Ora posso applicare l’indistinguibilità. -\frac{1}{4(4+\delta)}\sim\-\frac{1}{16}

  1. \frac{1}{M} è un infinitesimo ma non posso trascurarlo nella parentesi tonda per gli stessi motivi dell’es.1. Devo svolgere i calcoli e poi cercare gli indistinguibili.

M\left[\left(4+\frac{1}{M}\right)^2-16\right]=M\left[16+\frac{8}{M}+\frac{1}{M^2}-16\right]=M\left(\frac{8}{M}+\frac{1}{M^2}\right)=8+\frac{1}{M}\sim 8

  1. Trascurando 1 nel primo radicando, si ricade nel problema dello zero. Si ricorre allora ad un trucco algebrico: moltiplicare e dividere per la stessa quantità nel modo seguente:
\sqrt{M+1}-\sqrt{M}=\left( \sqrt{M+1}-\sqrt{M} \right) \frac{\sqrt{M+1}+\sqrt{M}} {\sqrt{M+1}+\sqrt{M}}=\frac{M+1-M}{\sqrt{M+1}+\sqrt{M}}=\frac{1}{\sqrt{M+1}+\sqrt{M}} \sim \frac{1}{\sqrt{M}+\sqrt{M}}=\frac{1}{2\sqrt{M}}
che è un infinitesimo, cioé ha parte standard nulla.
  1. Guardando il denominatore, è facile ricavare che la frazione è indistinguibile da un infinitesimo e quindi la sua parte standard è nulla.

Riassumendo

L’uso degli indistinguibili è vantaggioso per semplificare i calcoli. Nello svolgere gli esercizi l’unica cautela è evitare che l’espressione si annulli e per questo si ricorre alle tecniche dell’algebra.

Esercizi

  1. Considera x \sim x' \quad y \sim y'. Dimostra: 1) xy \sim x'y'\newline 2) \frac{x}{y} \sim \frac{x'}{y'}
  2. Considera x=2+\epsilon,\  y=2,\ x'=2,\ y'=2-\epsilon^2 e dimostra che vale come esempio per la regola della differenza fra indistinguibili.
  3. Trova l’indistinguibile: \frac{\sqrt{9+\delta}-3}{\delta}
  4. Trova l’indistinguibile: \frac{2M^2-1}{M^2+M}
  5. Trova l’indistinguibile: \frac{\frac{1}{2+\delta}-\frac{1}{2}}{\delta}
  6. Trova l’indistinguibile: \frac{(1+M)^2}{M+4}
  7. Trova l’indistinguibile: \frac{(1-M^3)^2}{(M^2+1)^3}

Funzioni iperreali

Per i nostri scopi, solo in questo capitolo, indichiamo con ^*x un numero qualsiasi iperreale (x star), per distinguerlo da un qualsiasi x reale.

Finora abbiamo utilizzato gli iperreali nei calcoli più comuni, per capirne le proprietà. Li abbiamo inseriti in addizioni e sottrazioni, moltiplicazioni e divisioni, potenze, radici quadrate... Abbiamo usato le funzioni algebriche: intere, razionali e irrazionali. In questo capitolo l’uso degli iperreali viene esteso alle funzioni in genere, a quelle già incontrate e alle altre, trascendenti.

Estendere il dominio

Il dominio di una funzione è l’insieme dei numeri che la funzione utilizza per produrre i suoi risultati. Non è difficile estendere un dominio dai reali agli iperreali. Per es. un dominio così definito: A=\{x: x>-1 \land x \in R\}, l’estensione iperreale è: \newline ^*A=\{^*x: ^*x>-1 \land ^*x \in ^*R\}. \newline In questo modo l’insieme A è stato arricchito degli infiniti (in questo caso si tratta degli infiniti positivi), degli infinitesimi e di tutti gli iperreali contenuti nelle monadi di A. Si dice che ^*\mbox{A} (A star) è l’estensione iperreale di A.

Un altro esempio: l’estensione iperreale dell’intervallo chiuso [ 1 , 3 ] è l’intervallo iperreale ^*[ 1 , 3 ], cioè l’insieme dei numeri iperreali ^*x\ \mbox{con}\ 1 \le\ ^*x \le 3 .

L’estensione di un insieme di reali è l’insieme di iperreali che verificano le stesse proprietà.

Estendere la funzione

Se una funzione opera su un insieme di reali (funzione reale di variabile reale) come si comporterà dopo l’estensione iperreale del suo dominio? Noi vorremmo mantenere le sue proprietà, in modo da poter risolvere problemi come quelli dei capitoli introduttivi senza complicazioni ulteriori.

Ci sono casi facili. La funzione f(x)=\frac{1}{x}\ \mbox{per}\ x \ne 0 è definita su tutti i reali tranne zero. L’estensione del dominio non comporta problemi ed è facile calcolarla anche con gli iperreali: \newline f(\epsilon)=\frac{1}{\epsilon}\quad f(M+a)=\frac{1}{M+a}\quad f(3+\delta)=\frac{1}{3+\delta}\quad ... \newline Per altre funzioni l’estensione non è così elementare: per esempio che risultato dà \sin \delta? E varrà ancora che \newline \sin(M+\delta) = \sin M \cos \delta + \sin \delta \cos M \quad \forall M,\delta \quad \mbox{?}\newline Oppure che: \  \ln(\epsilon \delta) = \ln\epsilon + \ln\delta\ \mbox{con} \ \epsilon,\ \delta > 0?

Sarebbero tutte proprietà da ridefinire. Per non doverlo fare ad ogni estensione, assumiamo che di ogni funzione f: A \rightarrow R\ esiste l’estensione iperreale ^*f\ :\  ^*A \rightarrow ^*R\, dove ^*A è l’estensione iperreale di A e ^*f(x)=f(x),\ \forall x \in A.

Questo non implica il contrario: mentre esiste l’estensione iperreale di ogni funzione standard f(x), non è detto che ogni funzione iperreale sia il risultato di un’estensione iperreale. Per es. la funzione iperreale “parte standard di x” (^*f(^*x)=st(^*x)) non ha una funzione corrispondente nei reali. Infatti non esiste la parte standard di un numero reale. Il dominio della funzione “parte standard di x” è la galassia principale, che non è l’estensione iperreale dell’insieme R (R ha come estensione ^*R). La funzione “parte standard” associa ad un numero finito la sua parte non infinitesima: st(7+\epsilon)=7 . Il grafico alla scala ordinaria di questa funzione sembra la retta bisettrice del primo e terzo quadrante, ma è fatto da una successione infinita di tratti orizzontali infinitesimi, perché la funzione è costante su ogni monade.

y=st(x)

La funzione parte standard: y=st(x).

E osserviamo inoltre che nel campo visivo di uno zoom non standard il grafico manca: la parte standard di un infinito non esiste.

Se potessimo ignorare l’esistenza degli infinitesimi, allora la parte standard si comporterebbe come la funzione identica, perché st(7) = 7. Ma in generale la funzione identica è diversa: nei reali associa a ogni numero se stesso, \newline f(x)=i(x): x \rightarrow i(x)=x\ ,\ \forall x \in R. Nel piano cartesiano i valori di i(x) si valutano sull’asse Y, quindi y = x, cioé la ben nota retta bisettrice.

Negli iperreali la funzione identica dà per esempio ^*i(7+\epsilon)=7+\epsilon. L’estensione iperreale di y = i(x) è l’identità iperreale \newline ^*f(^*x)=^*i(^*x): ^*x \rightarrow ^*i(^*x)=^*x\ \,\ \forall ^* x \in ^*R \newline che associa ad ogni iperreale se stesso. Il grafico di tale funzione è quello di fig.2: in qualsiasi scala (nella scala ordinaria, a infiniti ingrandimenti e anche a distanza infinita) è la bisettrice del primo-terzo quadrante, come nel caso corrispondente reale.

y=i(x)

La funzione identica: y=i(x).

I sottinsiemi di *R

  • L’estensione iperreale dei naturali N è l’insieme degli ipernaturali *N.
  • L’estensione iperreale degli interi Z sarà l’insieme degli iperinteri *Z.
  • Analogamente si costruisce l’estensione *Q dei numeri iperrazionali, espressi dal rapporto fra due iperinteri.

Sui grafici

Quando mettiamo in grafico una funzione iperreale ci serviamo del piano dei numeri iperreali. Questo vuol dire che usiamo rette iperreali sia per l’ascissa che per l’ordinata. Quindi il piano iperreale è formato dai punti che sono in corrispondenza biunivoca con le coppie ordinate di numeri iperreali.

Riassumendo

Per risolvere i problemi presentati all’inizio del libro, si immagina che ogni funzione reale conosciuta abbia una corrispondente estensione iperreale, calcolata su un insieme che è anch’esso estensione iperreale del dominio della funzione originaria. Le funzioni così estese hanno le stesse proprietà delle loro corrispondenti reali. Esistono poi altre funzioni iperreali, come la funzione standard, che non sono estensione di una funzione reale. Si discute della diversità fra la funzione parte standard e la funzione identica. I grafici di tali funzioni si tracciano nel piano iperreale.

Complessi iperreali

I punti nel piano iperreale possono rappresentare numeri ipercomplessi, come punti o come vettori, esattamente come succede con i numeri complessi visualizzati nel piano reale. Ci chiediamo: quando un numero ipercomplesso è infinitesimo? Quando è infinito? E quando è finito non infinitesimo? (Mossi i primi passi, tralasceremo l’indicazione “iper” che è ovvia, e parleremo solo di complessi, parti reali e immaginarie, sottintentendo che si tratta di parti iperreali e iperimmaginarie)

Complessi infinitesimi

Proviamo a rappresentare nel piano ipercomplesso il punto P(\epsilon, \epsilon^2) o il vettore \vec v(\epsilon, \epsilon^2), corrispondenti a \epsilon + i\epsilon^2 . Immaginiamo positivi tutti gli infinitesimi, per semplificare.

infinitesimo_compl

Iperreale complesso infinitesimo \epsilon + i\epsilon^2.

Nella scala ordinaria i punti (1, 0) e (0, 1) sono distinti dall’origine. In questa scala nessun microscopio standard riesce a distinguere dallo zero il nostro numero. Dobbiamo applicare un microscopio non standard e regolare l’ingrandimento fino a vederlo separato da 0, e questo avverrà sull’asse orizzontale, perché la parte iperreale è infinitesima di ordine inferiore rispetto alla parte iperimmaginaria. Ora \epsilon + i\epsilon^2 ci pare indistinto da \epsilon perché l’ingrandimento non è sufficiente a individuare l’infinitesimo di ordine superiore, e lo stesso avviene applicando qualsiasi ulteriore microscopio standard. Con un secondo microscopio non standard, infine, sarà possibile accorgersi che la parte immaginaria non è nulla.

Un punto del piano ipercomplesso infinitamente vicino all’origine corrisponde a un numero infinitesimo. Per essere infinitesimo avrà quindi infinitesime sia la parte (iper)reale che quella (iper)immaginaria.

Complessi infiniti

Rappresentiamo nel piano ipercomplesso il punto P(M, a) o il vettore \vec v(M, a), corrispondenti a M + ia. Immaginiamo per semplicità che M e a siano positivi.

Per i nostri scopi lo zoom può risultare indatto. Infatti la caratteristica dello zoom è di abbracciare nello stesso campo visivo l’origine e un numero lontano, anche infinitamente lontano. Riducendo la scala di visualizzazione in questo modo, però, si rischia di rendere indistinguibili eventuali infiniti di ordine inferiore.

Con un telescopio non standard centriamo il campo visivo su M. Si presentano tre possibilità:

infinito_1_2_3_compl

I tre casi per un iperreale complesso infinito: M + ia.

  1. La visualizzazione è sufficiente: il telescopio, che mostra alla scala ordinaria la zona del piano ipercomplesso nei pressi di M, visualizza già la parte iperimmaginaria distinta da quella iperreale.
  2. M + ia sembra coincidere con M: abbiamo bisogno di un microscopio standard per per distinguerli e individuare il punto.
  3. M + ia non si vede, perché si vede solo M. Per farlo rientrare nel campo visivo occorrerà applicare uno zoom standard.

Un punto del piano ipercomplesso infinitamente lontano dall’origine corrisponde a un numero complesso infinito. Per essere infinito avrà quindi infinite la parte reale, la parte immaginaria o entrambe.

Per essere finito non infinitesimo, un numero ipercomplesso deve avere la parte reale e la parte immaginaria finite e almeno una delle due non infinitesima.

Il modulo e il tipo di ipercomplesso

Per classifcare il tipo di complesso iperreale, è più facile riferirsi al suo modulo.

Un numero complesso è infinitesimo, infinito o finito non infinitesimo a seconda che sia di quel tipo il suo modulo.

  • Se il punto corrispondente è interno a ogni circonferenza di centro l’origine e di raggio standard, allora il numero complesso è infinitesimo.
  • Se il punto corrispondente è esterno a ogni circonferenza di centro l’origine e di raggio standard, allora il numero complesso è infinito.
  • Se il punto corrispondente giace fra due circonferenze di centro l’origine e raggi standard, allora il numero complesso è finito non infinitesimo.

Riassumendo

Come per i complessi nel piano cartesiano dei reali, così anche gli ipercomplessi si rappresentano nel piano degli iperreali. E quindi avremo ipercomplessi infinitesimi, finiti non infinitesimi o infiniti a seconda delle loro parti (iper)reali e (iper)immaginarie, o più semplicemente, del tipo del loro modulo. La rappresentazione dei punti che corrispondono a questi numeri si fa nei modi già visti, con microscopi, telescopi e zoom.

Esercizi

  1. Visualizza nel piano ipercomplesso \delta^2 + i\delta\ \ \ -\delta+i\delta\ \ \ i\epsilon^3
  2. Visualizza nel piano ipercomplesso M - iM\ \ \ -\delta+iM\ \ \ iM^2\ \ \ a - iM\ \ \ M + i\delta

La scatola più capiente

Per apprezzare l’efficacia del calcolo con gli iperreali consideriamo alcuni esempi. Sono problemi di ottimizzazione noti, che si risovono individuando una funzione opportuna e, grazie a questa, calcolando la soluzione utile. Perverremo a una soluzione esatta, usando microscopi telescopi e zoom.

La scatola ottimale

Abbiamo un cartone quadrato di lato un metro e vogliamo costruire una scatola senza coperchio tagliando quattro quadrati uguali nei vertici del cartone e poi sollevando i 4 rettangoli rimasti intorno alla base quadrata. Il problema è: ricavare la scatola che racchiude il volume massimo.

scatola

Trova la scatola di volume massimo

È immediato osservare che se il lato dei quadrati è molto piccolo, la scatola avrà un’area di base di poco meno di un metro quadrato, ma un’altezza molto piccola e quindi un volume piccolo. Ancora, se il lato dei quadrati è vicino al mezzo metro, la scatola verrà alta quasi mezzo metro, ma l’area di base sarà piccolissima e il volume sarà pure piccolissimo. È sensato dire che la misura del taglio, cioé il lato di un quadratino, sarà un numero fra zero e mezzo metro. Ma quale numero precisamente?

Se il problema fosse impossibile, ci si potrebbe avvicinare alla soluzione per via numerica, cioé per tentativi. Si immaginano varie misure del taglio, si calcolano di conseguenza i volumi, si confrontano i risultati, si sceglie il più utile. A mano sarebbe lungo e noioso, ma con un programma al computer non sarebbe né lungo né difficile e si approssimerebbe il risultato con precisione senza dubbio sufficiente.

Risolvo con gli iperreali e l’analisi

Tuttavia abbiamo la possibilità di ottenere la soluzione esatta con semplici considerazioni geometriche e un po’ di analisi matematica. Poniamo che sia x il lato del quadrato da ritagliare. Il volume si calcola allora con V(x)={(1-2x)^2}x (area di base per altezza). I valori di x,

f_volumescatola

Grafico della funzione V(x), volume della scatola: V(x)={(1-2x)^2}x.

prossimi a zero o a mezzo metro, daranno luogo a volumi praticamente nulli. Altre misure del taglio x produrranno invece volumi crescenti, fino a un massimo, oltre il quale i risultati diminuiscono. Il grafico approssimativo della funzione rappresenta questi ragionamenti. In linea puramente ipotetica i massimi potrebbero anche essere più di uno.

x è il numero che risolve il problema. In corrispondenza di x c’è il punto di massimo. Per numeri prossimi a x (cioé che appartengono alla sua monade) i volumi saranno lievemente inferiori. I tratti infinitesimi che compongono il grafico nelle diverse posizioni saranno variamente inclinati. Ma se osserviamo il punto di massimo con un microscopio non standard vediamo che lì il grafico è indistinguibile da un tratto orizzontale. Ricordiamo che essere indistinguibili ha per conseguenza che nella scala in cui un segmento è visualizzato, un altro ipoteticamente diverso non può apparire distinto, perché differisce per infinitesimi di ordine superiore. Quindi se ci spostiamo nella monade di x, per esempio a destra, in x+\delta, anche lì visualizziamo un segmento orizzontale. Come verificare questo attraverso il calcolo?

Data la funzione del volume f(x)=4x^3-4x^2+x, ne calcoliamo i valori in x e in x+\delta e quindi calcoliamo la loro variazione. Poi useremo gli indistinguibili:

f(x+\delta)=4(x+\delta)^3-4(x+\delta)x^2 +(x+\delta)=\newline = 4x^3+12x^2\delta+12x\delta^2+4\delta^3-4x^2-8x\delta-4\delta^2+x+\delta

La variazione di risultato dovuta a f(x+\delta)-f(x) è:

f(x+\delta)-f(x)=(12x^2-8x+1)\delta+(12x-4)\delta^2+4\delta^3

Se il tratto è orizzontale, allora la variazione è esattamente nulla, quindi

(12x^2-8x+1)\delta+(12x-4)\delta^2+4\delta^3=0

Sappiamo (v. 9.4) che la somma di più infinitesimi è indistinguibile da quello di ordine inferiore, perciò l’equazione precedente si riduce a:

(12x^2-8x+1)\delta =0

che può essere vera solo per x=\frac{1}{6} \lor x=\frac{1}{2}. Il secondo valore si scarta perché non è nell’intervallo delle possibili soluzioni. Quindi la scatola ottimale si costruisce eliminando dagli angoli del foglio 4 quadretti di lato x=\frac{1}{6} rispetto al lato del foglio.

Risolvo con gli iperreali e la geometria

Si ottengono le stesse conclusioni immaginando l’aumento di volume che si ottiene con un taglio di quadretti di lato x+\delta, cioé più profondo di \delta rispetto al taglio precedente x.

inc_volume

Se il taglio è più profondo di \delta, l’aumento di volume è infinitesimo.

inc_infinitesimo

Se l’aumento di volume è infinitesimo, il nuovo volume è indistinguibile dal precedente.

Dopo la piegatura, la scatola risulta più alta e più stretta di base. In altezza guadagna un volume pari a (1-2x-2\delta)^2\delta ma perde alla base 4 parallelepipedi di volume complessivo 4(1-2x-\delta)x\delta. Solo se stiamo raggiungendo il volume massimo, le variazioni di volume sono pressoché nulle, cioé il nuovo volume è indistinguibile dal precedente. Quindi possiamo pensare che valga:

(1-2x-2\delta)^2\delta=4(1-2x-\delta)x\delta

che potremmo riscrivere, facendo uso degli indistinguibili:

(1-2x)^2\delta=4(1-2x)x\delta

Avendo detto che x \ne \frac{1}{2}, si può semplificare l’equazione e si ottiene:

1-2x=4x

da cui la soluzione.

Il percorso minimo

Il secondo esempio è un problema classico, brillantemente risolto da Erone. Noi ricaveremo la souzione esatta usando gli infinitesimi e visualizzandola con i microscopi.

Il problema

Trova il tragitto minimo per andare da A a B toccando una volta la retta.

p_maggiori

Percorsi maggiori: P \notin CD

Da un primo esame risulta ovvio che i tragitti APB sono minori se P appartiene al segmento CD, che ha per estremi le proiezioni di A e di B sulla retta.

p_minori

Percorsi minori: P \in CD

Infatti nella figura 1 è facile confrontare AP con AC e PB con BC nel primo disegno, e analogamente nel secondo disegno della figura 1. Meno facile è indicare quale sia la migliore posizione di P all’interno del segmento CD, anche se è chiaro che se si trovasse agli estremi il percorso non sarebbe il minimo (figura 2).

La soluzione geometrica

Una soluzione semplice ed elegante ci viene dalla geometria

s_geometrica

Soluzione geometrica: PB = PB’

Se costruiamo un triangolo PDB’ simmetrico di PDB rispetto alla retta, abbiamo che PB = PB’. Quindi possiamo analizzare la lunghezza del percorso AP + PB’ al posto di AP + PB, perché si tratta di due spezzate di uguale misura. Ora, fra tutte le spezzate possibili APB’, quella più breve è il segmento AB’: l’intersezione X fra il segmento e la retta è la posizione cercata. La caratteristica di questa posizione è che gli angoli disegnati in X sono tutti uguali. Quindi la soluzione è: il punto X sulla retta è tale da formare angoli uguali fra la retta e i due segmenti che formano la spezzata AXB.

La soluzione analitica

Se potessimo mettere in grafico la funzione che descrive la lunghezza del percorso APB, potremmo vedere che la funzione ha il valore minimo in corrispondenza del punto X ottimale, perché ogni altro percorso è maggiore.

p_minimo

Grafico della f risolvente: X è punto di minimo.

Puntando un microscopio non standard su X (ancora non calcolato), vediamo che il grafico appare nel campo visivo come un segmento orizzontale. Nella monade di X, qualsiasi altro punto X’ genera una misura della spezzata (e quindi un punto del grafico) diversa per ordini di grandezza superiori alla differenza XX’, quindi indistinguibile da quella calcolata per X. Possiamo perciò assumere che la differenza fra le lunghezze delle due spezzate AXB e AX’B sia nulla.

BX=AX'

Cammini indistinguibili: AX’+X’B=AX+XB

Approfondiamo il dettaglio ingrandendo la posizione di X in modo che sia distinto da X’. Nel campo visivo avremo coppie di segmenti indistinguibili da segmenti paralleli (AX con AX’ e BX con BX’). In realtà non sono paralleli, ma la differente inclinazione non risulta a questa scala di ingrandimento. Se vale il parallelismo, siamo nella condizione di minimo percorso, perché i triangoli XX’Y e XX’Y’ sono congruenti, quindi il tratto in più del segmento AX’ uguaglia il tratto in più del segmento XB. Inoltre, sempre per il parallelismo, sono congruenti gli angoli che si trovano sulla retta, con vertice X e X’.

La riflessione della luce

Al posto di questi angoli, si possono considerare quelli formati dalla normale in X con i due segmenti AX e BX, che sono congruenti in quanto complementari degli angoli precedenti. In questa descrizione, se r rappesenta una superficie riflettente e la spezzata rappresenta il percorso di un raggio luminoso, ecco che abbiamo ricavato la legge della riflessione nell’ottica geometrica.

In questo modo possiamo concludere che il raggio di luce nella riflessione percorre il cammino minimo.

Il percorso più rapido

Risolviamo un ultimo problema, affrontando ancora una volta questioni geometriche e infinitesimali, che ci permetteranno di giustificare un’altra legge della fisica.

Da A a B nel tempo più breve

Questa volta la retta orizzontale deve essere attraversata per poter raggiungere B partendo da A. La complicazione è che, oltrepassando la retta, si è costretti a una velocità diversa. In pratica:

Bisogna trovare il percorso che minimizzi il tempo nell’andare da A a B.

probl_rifrazione

Il problema (la retta orizzontale rappresenta la separazione fra mezzi diversi).

Nel problema del capitolo precedente non c’era la complicazione della velocità: tutto si svolgeva istantaneamente. Quando la velocità è costante, il percorso di tempo minimo è senz’altro il tratto più breve: un segmento AB che attraversa la retta in un punto E, all’intersezione fra il segmento e la retta.

Nelle nuove condizioni, però, il segmento AB non è sicuramente la soluzione ottimale. Infatti è conveniente che la parte più breve del percorso si trovi nel semipiano più lento, anche a costo di spezzare il segmento in due tratti disuguali. Occorre cercare P, il punto “di equilibrio” sulla retta, che pur allungando i due tratti della spezzata, lo fa in modo che il tempo perso a percorrere la parte più lenta si recuperi al meglio nella parte più veloce. Abbiamo la possibilità di costruire la soluzione esatta ricorrendo all’analisi.

Risolvo con gli iperreali e la geometria

Immaginiamo che nella parte superiore del disegno la velocità sia v_1 \ \mbox{e}\  v_2 sia nella parte inferiore e sia v_1 > v_2; per il resto seguiamo i ragionamenti del problema precedente.

Un punto X sulla retta, diverso da P, darà luogo a un tempo di percorrenza diverso. Continuando a “muovere” X sulla retta i tempi totali cambiano, trovano il valore minimo e poi aumentano. Il grafico che ne deriva è simile a quello del problema precedente.

Fermiamoci dove immaginiamo che X rappresenti la posizione cercata. Allora un punto X’ infinitamente vicino darà luogo ad un tempo diverso da quello calcolato per X, ma solo per infinitesimi di ordine superiore e quindi un tempo indistinguibile.

sol_rifrazione

La soluzione, studiando la geometria del problema e con l’aiuto dell’analisi matematica.

Puntiamo su X il microscopio non standard e ingrandiamo fino a vedere distinti X e X’. Se i tempi dei due percorsi sono indistinguibili, allora i segmenti su X e X’ provenienti da A e da B saranno indistinguibilmente paralleli. AX e AY sono tratti uguali, percorsi nello stesso tempo, mentre X’Y è il segmento che causa ritardo nel percorrere AX’, rispetto a AX. Si tratta di un ritardo infinitesimo, calcolabile in \tau_1=\frac{X'Y}{v_1} . Perché i due percorsi AB avvengano indistinguibilmente nello stesso tempo, occorre che tale ritardo sia compensato, andando verso B, dal ritardo \tau_2 =\frac{XY' }{v_2} dovuto al tratto XY’ sul segmento XB, più lungo rispetto a X’B. Ricaviamo quindi

\tau_1=\tau_2\  \rightarrow\ \frac{X'Y}{v_1}=\frac{XY'}{v_2}\ \rightarrow\ \frac{XX'\cos \alpha}{v_1}=\frac{XX'\cos \beta}{v_2}\ \rightarrow\ \frac{\cos \alpha}{v_1}=\frac{\cos \beta}{v_2}\ \rightarrow\ \frac{\cos \alpha}{\cos \beta}=\frac{v_1}{v_2}.

Il rapporto fra gli angoli fissa univocamente l’inclinazione dei segmenti rispetto alla retta e di conseguenza fissa il punto ottimale X. Quindi la soluzione è: Il percorso più rapido è una spezzata fatta da due segmenti AX e XB. I coseni degli angoli in X, fra i due segmenti e la retta, sono direttamente proporzionali alle velocità di percorrenza dei due tratti.

La rifrazione della luce

Si può riscrivere la soluzione considerando gli angoli \gamma, \delta complementari di \alpha, \beta, cioé considerando gli angoli che i due segmenti formano con la normale alla retta nel punto X . Allora la relazione diventa:

\frac{\sin \gamma}{\sin \delta}=\frac{v_1}{v_2}

Se pensiamo alla situazione fisica di un raggio luminoso che attraversa la superficie di separazione (la retta) passando per due mezzi con diversa densità, la legge individuata è la legge di Snell per la rifrazione e l’ultimo rapporto è detto indice di rifrazione fra due mezzi. Concludiamo quindi che il raggio luminoso in questa situazione non percorre il cammino più breve, ma quello più rapido.

Glossario

Estensione iperreale di una funzione standard Estensione di una funzione standard, definita sull’estensione iperreale del suo dominio.

Estensione iperreale di un insieme di numeri standard Insieme associato a ogni insieme standard e formato dai numeri iperreali che soddisfano le stesse condizioni che definiscono l’insieme dato.

Funzione standard Funzione definita su un insieme di numeri reali a valori reali.

Galassia Insieme di numeri a distanza finita tra loro. La galassia di un numero x, indicata con Gal (x) , è l’insieme dei numeri a distanza finita da x.

Galassia principale Galassia dello zero, che coincide con l’insieme dei numeri finiti.

Microscopio non-standard Strumento ottico ideale che, puntato sulla retta o sul piano o nel campo visivo di un altro strumento ottico, fornisce un’immagine ingrandita un numero infinito arbitrario di volte.

Microscopio standard Strumento ottico ideale che, puntato sulla retta o sul piano o nel campo visivo di un altro strumento ottico, fornisce un’immagine ingrandita un numero finito arbitrario di volte.

Monade Insieme di numeri infinitamente vicini tra loro.

Monade principale Monade dello zero, che coincide con l’insieme dei numeri infinitesimi.

Numero finito Numero in valore assoluto minore di almeno un numerostandard positivo e abbreviato con f.

Numero finito non infinitesimo Numero in valore assoluto compreso tra due numeri standard positivi, abbreviato con fni e indicato con una lettera latina minuscola.

Numero infinitesimo Numero in valore assoluto minore di ogni numero standard positivo, abbreviato con i.

Numero infinitesimo non nullo Numero infinitesimo diverso da zero, abbreviato con inn e indicato con una lettera greca minuscola.

Numero infinito Numero in valore assoluto maggiore di ogni numero standard positivo, abbreviato con I e indicato con una lettera latina maiuscola.

Numero iperintero Numero che appartiene all’estensione iperreale dell’insieme dei numeri interi standard.

Numero ipernaturale Numero che appartiene all’estensione iperreale dell’insieme dei numeri naturali standard.

Numero iperreale Numero che appartiene all’estensione dei numeri reali che si ottiene aggiungendo un infinitesimo positivo ed estendendo le operazioni.

Numero standard Numero reale

Parte infinitesima A ogni numero finito viene associata la sua parte infinitesima, che è la differenza tra il numero e la sua parte standard.

Parte standard Unico numero standard infinitamente vicino a un numero finito.Segmento finito Segmento minore di almeno un segmento standard

Segmento finito non infinitesimo Segmento compreso tra due segmenti standard

Segmento infinitesimo Segmento minore di ogni segmento standard

Segmento infinito Segmento maggiore di ogni segmento standard

Segmento standard Segmento la cui misura è espressa da un numero reale

Telescopio non-standard Strumento ottico ideale che fornisce un’immagine di una porzione a distanza infinita di retta o di piano o del campo visivo di un altro strumento ottico nella stessa scala della porzione vicina.

Telescopio standard Strumento ottico ideale che fornisce un’immagine di una porzione a distanza finita di retta o di piano o del campo visivo di un altro strumento ottico nella stessa scala della porzione vicina.

Zoom standard Strumento ottico ideale che, puntato di solito sull’origine della retta o del piano o del campo visivo di un altro strumento ottico, fornisce un’immagine rimpicciolita un numero finito arbitrario di volte.

Zoom non-standard Strumento ottico ideale che, puntato di solito sull’origine della retta o del piano o del campo visivo di un altro strumento ottico, fornisce un’immagine rimpicciolita un numero infinito arbitrario di volte.

Il calcolo differenziale

Introduzione

Questo testo è costruito partendo dal libro di Giorgio Goldoni “Il calcolo delle differenze e il calcolo differenziale”.

Sito di riferimento:

Pagina facebook: <www.facebook.com/pages/Il-professor-Apotema/344320422244703>

I libri del prof. Apotema: <ilmiolibro.kataweb.it/community.asp?id=104013>

Licenza

Tutti i materiali prodotti sono rilasciati sotto la licenza Creative Commons: CC-BY-SA.

Licenza: CC-BY-SA

Una premessa sul calcolo infinitesimale

Il calcolo che presentiamo ha innumerevoli applicazioni in tutti i rami della scienza. Per capirne gli scopi essenziali, facciamo un esempio fra i più facili e comuni. Sul cruscotto di un’automobile possiamo leggere i valori indicati da due strumenti: il tachimetro e il contachilometri. Il tachimetro, indicando istante per istante la velocità del moto, risolve un problema tipico del calcolo infinitesimale: conoscere la rapidità di variazione di una grandezza, in questo caso la rapidità con cui l’auto ha guadagnato spazio nel trascorrere del tempo. Il contachilometri indica la distanza percorsa fino a quel momento. Nell’automobile la distanza viene calcolata attraverso misure indirette del movimento delle ruote. Se il contachilometri mancasse, avremmo il problema di ricostruire la distanza percorsa, conoscendo istante per istante le diverse velocità con cui l’auto avanzava. Dunque i due problemi fondamentali del calcolo infinitesimale sono

  1. Data una funzione, conoscere la rapidità delle sue variazioni
  2. Dato l’insieme delle variazioni, ricostruire la funzione.

Questa dispensa si concentra sul primo problema e il calcolo che lo risolve si chiama:

  • calcolo differenziale, se riferito alle funzioni a dominio continuo, cioé il cui dominio è un intervallo della retta reale;
  • calcolo delle differenze, se riferito alle funzioni a dominio discreto, che cioé hanno per dominio l’insieme dei valori di una successione crescente di numeri reali.

Le successioni e le differenze

Funzioni a dominio discreto e successioni

Una funzione a dominio discreto f :\left\{x_k \right \} \to \mathbf{R} è una funzione il cui dominio è un insieme di valori distinti, che la variabile x assume senza variare con continuità fra l’uno e l’altro. In generale i valori di tale funzione (e quindi il codominio) saranno numeri reali. Il suo grafico nel piano cartesiano è dato da punti distinti \left(x_k,y_k\right) dove y_k = f(x_k).

Le successioni sono particolari funzioni a dominio discreto, nel senso che il loro dominio è dato dagli indici, che formano un intervallo anche infinito di numeri interi. I punti dei loro grafici avranno quindi coordinate (k,y_k) e saranno distribuiti con regolarità, perché la distanza orizzontale fra l’uno e l’altro è unitaria: corrisponde alla differenza fra due indici consecutivi.

Una successione (e in generale una funzione a dominio discreto) \left\langle y_k \right\rangle si indica in modo diverso dall’insieme \left\{y_k\right\} dei suoi valori. Per distinguere i due significati, consideriamo le due successioni \left\langle a_k \right\rangle = 1,0,1,0,1,0... e \left\langle b_k \right\rangle = 0,1,1,1,1...: sono generate da regole diverse ma hanno lo stesso insieme di valori \left\{0,1\right\}.

Le due regole sono: \left\langle a_k \right\rangle_1^{+\infty} =\begin{cases} 1, & \mbox{se }k =1 \\ 1-a_{k-1}, & \mbox{se }k>1 \end{cases}\quad e \left\langle b_k \right\rangle_1^{+\infty} =\begin{cases} 0, & \mbox{se }k =1 \\ 1, & \mbox{se }k>1 \end{cases}

Differenze e tasso di variazione

successione

Nella tabella consideriamo una successione \left\langle x_k \right\rangle_0^9 , i cui 10 termini crescono da 2 fino a 9 e poi calano a 6. Si possono valutare le differenze fra un termine e il successivo con facili sottrazioni. Le differenze sono espresse nella terza riga della prossima tabella , dove si vede che per ogni k \Delta y_k=y_{k+1}-y_k, cioè la differenza relativa al termine k-esimo si calcola partendo dal termine successivo.

Una successione.

La successione...

In questo modo si noti che se la successione non ha infiniti termini, il numero delle differenze è uno di meno rispetto al numero dei termini.

L’andamento dei termini può essere visualizzato da un semplice grafico:

Grafico della successione precedente.

...e il suo grafico.

Le le osservazioni importanti sul grafico sono due:

  • La linea spezzata che unisce i punti è disegnata per pura comodità di lettura, ma non dovrebbe esserci, perché la successione non ha valori da rappresentare fra i punti disegnati
  • Le colonne hanno pari larghezza (la base delle colonne misura 1) e per questo le differenze \Delta y_k corrispondono al tasso di variazione fra un punto e l’altro.

Come vedremo in seguito, nel caso generale di una funzione a dominio discreto il tasso di variazione non si calcola con la semplice differenza \Delta y_k, mentre questo calcolo è sufficiente per le successioni. Lo si può vedere dal grafico: infatti qui le colonne hanno uguale base e quindi solo la loro differente altezza influisce sulla pendenza del segmento che unisce due punti consecutivi, nel senso che un \Delta y_k maggiore produce inevitabilmente una pendenza maggiore. La pendenza è l’equivalente grafico del tasso di variazione.

deltay

\Delta y_k

I fattoriali decrescenti

Alcune utili regole sui rapporti incrementali discendono dall’utilizzo di un particolare tipo di prodotto fattoriale.

Sappiamo già che il fattoriale di n è n \cdot (n-1) \cdot (n-2) \cdot ... \cdot 2 \cdot 1, cioè il prodotto di un numero per tutti i suoi precedenti. Si può limitare il prodotto a p fattori. Allora la nuova funzione si chiama fattoriale decrescente di ordine p del numero k: k^{(p)}. Ecco alcuni esempi

5 ! = 5 \cdot 4 \cdot 3 \cdot 2 \cdot 1 =  120, ma: 5^{(2)} = 5 \cdot 4 = 20.

7^{(3)} = 7 \cdot 6 \cdot 5 = 210, ma 7 ! = 7 \cdot 6 \cdot 5 \cdot 4 \cdot 3 \cdot 2 \cdot 1 =  5040

Quindi, in generale: k^{(p)}=k(k-1)(k-2)...(k-p+1). Per avere almeno due fattori, si intende generalmente p>1, ma è possibile ricavare il risultato anche in situazioni meno ovvie.

Prima di tutto è ovvio che p non è un esponente. È chiaro anche che se p=k, allora k!=k^{(p)} e se invece p>k allora risultato è nullo.

Ricaviamo una formula. Poniamo k=10 e p=3. 10^{(3)}=10 \cdot 9 \cdot 8 = 10 \cdot 9 \cdot 8 \cdot \frac{7}{7} =
\frac{10 \cdot 9 \cdot 8 \cdot 7}{7} = \frac{10^{(4)}}{(10 - 3)}. Da questo esempio e da altri calcoli analoghi che puoi sviluppare per esercizio, si intuisce che vale una regola importante: k^{(p)}= \frac{k^{(p +1)}}{(k-p)} \to k^{(p+1)}= k^{(p)}(k-p).

Se applichiamo la regola a k^{(1)} ricaviamo k^{(1)}=\frac {k^{(2)}}{k-1}=\frac {k(k-1)}{k-1}=k. In modo facile si può verificare anche k^{(0)}=1

Quanto a k, se k è un intero negativo, la regola non cambia. Esempio: (-2)^{(3)}~=~(-2)(-3)(-4)=-24

Un esempio per k razionale: \left( \frac{1}{2} \right) ^{(3)}= \left( \frac{1}{2} \right) \cdot\left( \frac{1}{2} -1 \right) \cdot \left( \frac{1}{2} -2 \right)

Calcoli di differenze

Differenze per la successione quadratica

Della successione: \left\langle y_k \right\rangle_0^{+\infty}, con y_k=k^2 (oppure, che è lo stesso, della successione \left\langle k^2 \right\rangle_0^{+\infty} ) calcoliamo la decima differenza \Delta y_9. Ci sono due modi, quello che risolve il caso particolare e quello che scrive prima la formula generale e poi la applica.

  • \Delta y_9=y_{10} - y_9 = 10^2 - 9^2 = 100-81 = 19\quad , oppure
  • \Delta y_k= \Delta k^2 = (k+1)^2-k^2 = k^2 +2k + 1 -k^2= 2k+1 che nel caso specifico vale 2\cdot 9+1=19.

Il secondo modo è più significativo, perché indica una regola generale: la differenza fra due quadrati consecutivi è il successivo del doppio del primo ed è sempre dispari.

Differenze per la successione dei reciproci

Calcoliamo la formula generale di \Delta \frac{1}{k} e verifichiamo il risultato per k=8.

\Delta \frac{1}{k}= \frac {1}{k+1} - \frac{1}{k}= \frac{k - (k+1)}{(k+1)k} = \frac{-1}{k(k+1)} che se k=8 risulta -\frac{1}{72}

Per via diretta si verifica il risultato facilmente. Le differenze della successione dei reciproci saranno tutte negative, dato che \frac {1}{k+1} < \frac{1}{k}

Differenze di fattoriali decrescenti

Riassumiamo i calcoli e gli esempi per capire come si comportano le differenze nelle successioni dei fattoriali decrescenti:

p \quad \quad k^{(p)} \quad \quad \Delta k^{(p)}=(k+1)^{(p)}-k^{(p)}
0 k^{(0)}=1 1-1=0
1 k^{(1)}=k (k+1) - k = 1
2 k^{(2)}=k(k-1) (k+1)k - k(k-1) = k(k+1-k+1) = 2k
3 k^{(3)}=k(k-2)(k-1) (k+1)k(k-1) - k(k-2)(k-1) = 3k(k+1) = 3k^{(2)}
... ... ...
p k^{(p)} (k+1)^{(p)}-k^{(p)}=pk^{(p-1)}

L’ultima formula della tabella ci dà quindi la regola: \Delta k^{(p)}=pk^{(p-1)}

Differenze nelle progressioni geometriche

Fissiamo come primo esempio la progressione di ragione 2: 2^k.

\Delta 2^k=2^{(k+1)}-2^k=2 \cdot 2^k-2^k=2^k(2-1)=2^k

Il termine generale della progressione esprime quindi anche le sue differenze. Vediamo ora altre successioni con termini esponenziali \langle cq^k \rangle e le loro differenze.

\Delta cq^k = cq^{k+1} - cq^k=(q-1)cq^k

Riassumendo

  1. Le successioni e le funzioni a dominio discreto sono funzioni a valori distinti e il loro grafico è una successione di punti nel piano cartesiano.
  2. I segmenti che li uniscono hanno una pendenza che corrisponde al tasso di variazione, un numero che si calcola attraverso una nuova funzione: il cosiddetto rapporto incrementale y'_k=\frac {\Delta y_k}{\Delta x_k}.
  3. Diamo una sintesi dei casi notevoli di \Delta y_k
\quad \Delta y_k y_{k+1}-y_k=
\Delta k 1
\Delta k^2 2k+1
\Delta k^3 3k^2+3k+1
\Delta \frac{1}{k} -\frac{1}{k(k+1)}
\Delta k^{(p)} pk^{(p-1)}
\Delta 2^k 2^k
\Delta q^k (q-1)q^k

Esercizi

  1. Calcola le differenze \Delta y_{17} , \Delta y_{38}, \Delta y_{151} della successione \left\langle k^2 \right\rangle_0^{+\infty}.
  2. Calcola nei due modi la differenza \Delta y_4 della successione \left\langle y_k \right\rangle_0^{+\infty} con y_k=k^3.
  3. Calcola la quinta differenza della successione dei numeri pari. È un risultato particolare o generale?
  4. Calcola la formula generale di \Delta k!
  5. Trova i risultati per due fattoriali decrescenti a tuo piacere: se k è un intero negativo e se k è un razionale qualsiasi.
  6. Giustifica la regola dei fattoriali decrescenti esplicitando la formula.
  7. Mediante la stessa regola calcola k^{(0)}
  8. Estendi a indici negativi i fattoriali decrescenti. Calcolando k^{(-1)}\quad \, k^{(-2)}\quad \, k^{(-3)} giustifica la formula generale k^{-p)}= \frac{1}{(k+p)^{(p)}} (p si intende positivo).
  9. Aggiungi alcune righe alla tabella dei fattoriali decrescenti e calcola le differenze \Delta k^{(4)}) e \Delta k^{(5)}) in modo da giustificare la formula generale.
  10. Fissa successivamente k= -4, -3, -2, -1, 0, 1, 2, ... e calcola i valori \Delta 2^k.

L’algebra delle differenze

Immaginiamo la successione: y_k=8k(k-1)+k3^k. Come calcolare \Delta y_k? La tabella conclusiva del capitolo precedente ci mette in grado di calcolare singole parti dell’espressione, ma non il suo insieme. Infatti mancano le regole per esprimere, fra le altre, la differenza o il prodotto di successioni. Ce ne occupiamo nelle prossime righe, iniziando dai casi più semplici.

  • Se una successione è costante, le sue differenze sono tutte nulle. Infatti per \langle y_k\rangle con y_k=c, \forall k, allora \Delta y_k= y_{k+1} - y_k = c-c=0.
  • Se una successione si ricava da un’altra moltiplicando per una costante c i termini di quest’ultima, in modo da ottenere \langle cy_k\rangle, allora le sue differenze saranno:
\Delta cy_k~=~ cy_{k+1} - cy_k = c\Delta y_k.
  • Se invece la successione si ottiene dalla somma o differenza di altre due, allora si avrà: \Delta[y_k \pm z_k]= y_{k+1} \pm z_{k+1} -(y_k \pm z_k) =(y_{k+1}-y_k) \pm (z_{k+1} - z_k)=\Delta y_k \pm \Delta z_k.

Il caso del prodotto di due successioni è meno diretto ed occorre un esempio geometrico per illustrarlo.

deltay

\Delta y_k \cdot \Delta z_k

y_{k+1}=y_k+\Delta y_k e z_{k+1}=z_k+\Delta z_k sono le misure dei due lati del rettangolo in figura, la cui area misura y_{k+1} \cdot z_{k+1}=(y_k+\Delta y_k) \cdot (z_k+\Delta z_k). Passando dall’indice k all’indice k+1, le dimensioni si incrementano di \Delta y_k e \Delta z_k. L’incremento di area, cioé \Delta[y_k \cdot z_k] (la parte colorata) è dato da 3 rettangoli di area complessiva pari a: y_k\Delta z_k + \Delta y_k z_k + \Delta y_k\Delta z_k e questo è il risultato. La somma si può ridurre a due soli addendi, se scritta in uno dei modi seguenti:

  • Se una successione si ottiene dal prodotto di due successioni, la differenza sarà:
\Delta[y_k \cdot z_k]= \Delta y_k z_{k+1}+ y_k \Delta z_k =\Delta y_k z_k + y_{k+1} \Delta z_k

La formula vale anche per numeri negativi, come dimostra lo sviluppo algebrico (v. esercizi).

Anche per la differenza del quoziente è meglio ricorrere ad un esempio geometrico, accettando il vincolo di operare solo con numeri positivi. Questa volta y_k rappresenta l’area del rettangolo di base z_k. \Delta y_k rappresenta l’incremento di area, quindi la parte colorata (gnomone).

deltay

L’altezza della figura è \frac {y_k}{z_k}+ \Delta \frac {y_k}{z_k}. L’ultimo termine è l’altezza della fascia orizzontale superiore. Questa si ottiene sottraendo dallo gnomone il rettangolo basso a destra. In formula questa differenza è: \Delta y_k - \frac {y_k}{z_k}\Delta z_k La differenza, riscritta col denominatore comune, va poi divisa per la base, in modo da ottenere l’altezza. Alla fine si ha la regola:

  • Se una successione si ottiene dal rapporto fra due successioni, la diffferenza sarà: \Delta \left[\frac {y_k}{z_k} \right]=\frac {\Delta y_k z_k - y_k\Delta z_k}{z_k z_{k+1}}

Un esempio

Riprendiamo l’esercizio iniziale del capitolo e svolgiamolo. Ricordando i fattoriali decrescenti, riscriviamo: 8k(k-1)+k3^k=8k^{(2)}+k3^k. Quindi:

\Delta [8k^{(2)}+k3^k]= \Delta [8k^{(2)}]+ \Delta [k3^k] =
8 \Delta k^{(2)} + \Delta k3^k +k \Delta 3^k + \Delta k \Delta 3^k=\\
=8 \cdot 2k + 1 \cdot 3^k+ k( 2 \cdot 3^k)+ 1 (2 \cdot 3^k)=
16k + 3 \cdot 3^k +2k3^k =\\ = 16k +3^{k+1} + 2k \cdot 3^k.

Riassumendo

Oltre alle formule per calcolare le differenze fondamentali, occorrono le regole di composizione per poter risolvere espressioni con somme, prodotti, ecc.

Differenza di Risultato
funzione costante \Delta c 0
prodotto per una costante \Delta cy_k c\Delta y_k
somma algebrica \Delta[y_k \pm z_k] \Delta y_k \pm \Delta z_k
prodotto \Delta y_k \Delta z_k \Delta y_k z_{k+1}+ y_k \Delta z_k
\quad " \Delta y_k z_k + y_{k+1} \Delta z_k
rapporto \Delta \frac {y_k}{z_k} \frac {\Delta y_k z_k - y_k\Delta z_k}{z_k z_{k+1}}

Esercizi

  1. Sviluppa algebricamente il prodotto y_{k+1} \cdot z_{k+1}=(y_k+\Delta y_k) \cdot (z_k+\Delta z_k) e ricostruisci la regola.
  2. Calcola la differenza \Delta [3k^{(4)}-2k^{(3)} + k^{(2)}-8k+13]
  3. Calcola la differenza \Delta [\frac {k^{(2)}}{2^k}]
  4. Calcola la differenza \Delta [2k^{(3)}-27k^{(2)} +96k+10]

Le funzioni e il rapporto incrementale

Rapporto incrementale in funzioni a dominio discreto

Una funzione a dominio discreto in generale è diversa da una successione perché il suo dominio è una successione crescente qualsiasi, quindi non è detto che sia esclusivamente la successione degli indici.

L’esempio seguente illustra una funzione a dominio discreto f :\left\{x_k \right \} \to \mathbf{R}. La scrittura x_k, (anziché k come sarebbe per una successione) ci dice che il dominio è una successione crescente di interi e la tabella che rappresenta la funzione ha 3 righe: gli indici, i valori del dominio e i valori del codominio.

d.discreto

f è a dominio discreto

Se si vogliono valutare i tassi di variazione, le sole differenze dei valori \Delta y_k non bastano, perché vanno valutate in rapporto alle differenze \Delta x_k che sono relative ad esse. Graficamente: la diversa altezza delle colonne nel grafico va considerata in rapporto alle diverse basi. Per esempio \Delta y_1 = 10 e \Delta y_2 = 3, ma la prima differenza dà luogo ad un tasso di variazione minore, perché va rapportata alla differenza x_2-x_1=5, mentre \Delta y_2 si mette in rapporto con x_3-x_2=1.

Il rapporto fra le differenze è proprio il calcolo che consente di ottenere il tasso di variazione ed è un calcolo così importante da meritare un nome specifico: rapporto incrementale e una scrittura particolare: y'_k. In pratica il risultato si ottiene calcolando y'_k= \frac{\Delta y_k}{\Delta x_k}.

d.discreto

rapporto incrementale

y'_k si dice rapporto incrementale relativo all’indice k. Analogamente alla differenza nelle successioni, il rapporto incrementale graficamente corrisponde alla pendenza del segmento che unisce il punto di ordinata a y_k con quello di ordinata a y_{k+1}.

Un esempio

Immaginiamo x_k = 2^k e y_k=k^{(2)} per k=0..+\infty e calcoliamo y'_4.

  • Calcolo diretto: \frac {y_{k+1}-y_k}{x_{k+1}-y_k}=\frac{ y_5 -y_4}{x_5-x_4}=\frac{5 \cdot 4-4 \cdot 3}{2^5-2^4}= \frac{8}{16}=\frac{1}{2}
  • Dal generale al particolare: y'_k=\frac{\Delta y_k}{\Delta x_k}=\frac {\Delta  k^{(2)}}{\Delta 2^k}= \frac {2k}{2^k}=\frac {k}{2^{k-1}}. La formula generale consente il calcolo di qualsiasi differenza, quindi, per k=4 si ha y'_4=\frac{4}{2^3}=\frac {4}{8}=\frac{1}{2}.

Si noti che nel secondo caso \Delta y si calcola sulla base di quanto visto a proposito delle differenze.

Regole di calcolo del rapporto incrementale

Siamo quindi ad un punto importante, che vale come regola generale: il rapporto incrementale nelle funzioni a dominio discreto si calcola utilizzando le formule dei capitoli precedenti e dividendole per \Delta x_k . Dalle stesse formule derivano le regole seguenti:

  • c'=0
  • (cy_k)'=cy'_k
  • (y_k \pm z_k)'=y'_k \pm z'_k
  • (y_k z_k)'= y'_k z_k + y_{k+1} z'_k = y'_k z_{k+1} + y_k z'_k
  • \left( \frac {y_k}{z_k}\right)' = \frac{y'_k z_k - y_k z'_k}{z_k z_{k+1}}

Rapporto incrementale in funzioni a dominio continuo

Nelle successioni e in generale nelle funzioni a dominio discreto l’incremento si calcola variando l’indice k: \Delta y_k = y_{k+1}-y_k. Nelle funzioni a dominio continuo l’indice non esiste e quindi non c’è un intervallo prestabilito della variabile per calcolare l’incremento della funzione. Chiamando h l’incremento della variabile x possiamo dare la seguente definizione.

Sia f: I \to \mathbf{R}, I \subseteq R, definiamo l’incremento di f relativo al punto x e all’incremento h: \Delta f(x)= f(x+h)-f(x), con h \ne 0.

Possiamo così definire anche il rapporto incrementale della funzione, relativo al punto x e all’incremento h: \frac {\Delta f(x)}{h}=\frac{ f(x+h)-f(x)}{h}. Il rapporto ha il significato geometrico della pendenza della retta che passa per i punti (x, f(x)), (x+h, f(x+h)) ed è il tasso medio di variazione della funzione fra i due punti.

d.continuo

rapporto incrementale nella f a dominio continuo

Possiamo pensare ad un’analogia cinematica, se interpretiamo y = f(x) come la posizione all’istante x di un punto che si muove su una retta, allora la differenza \Delta f(x) rappesenta lo spostamento del punto fra l’istante x e l’istante x + h e il rapporto incrementale \frac {\Delta f(x)}{h} rappresenta la velocità media relativa all’istante x e alla durata h.

velmedia

rapporto incrementale come velocità media del punto

Note

La definizione di rapporto incrementale vale anche se l’incremento è h<0. In questo caso per la differenza di f(x) si ha f(x)-f(x+h)=-\Delta f(x). E per la differenza di x: x-(x+h)=-h. Per cui il rapporto incrementale è \frac{-\Delta f(x)}{-h}=\frac{\Delta f(x)}{h}.

negativo

rapporto incrementale con h negativo

Rapporto incrementale di funzioni note

Funzione identica
y=x

incremento di y=x

Se y=x allora \Delta y=\Delta x=(x+h)-x=h, cioè l’incremento della funzione è uguale all’incremento della variabile, quindi il loro rapporto vale 1. Come si vede anche dal grafico, il rapporto incrementale è il coefficiente angolare del segmento che unisce i due punti, che in questo caso non è secante al grafico della funzione, ma gli appartiene.

  • y=x,\quad \frac{\Delta y}{\Delta x}=\frac{\Delta x}{\Delta x} = 1

Il fatto che \Delta x=h ci permette di usare d’ora in poi \Delta x al posto di h

Funzione quadratica
y=x^2

incremento di y=x^2

Se y=x^2, allora \Delta y= \Delta x^2 = (x+\Delta x)^2 - x^2=x^2+2x\Delta x+(\Delta x)^2 -x^2 =(2x+\Delta x)\Delta x. Il disegno illustra le tre parti di cui si compone l’incremento di area di un quadrato, analogamente a quanto già visto per \Delta x_k^2. Di conseguenza:

  • y=x^2,\quad \frac{\Delta y}{\Delta x}=\frac{\Delta x^2}{\Delta x} =\frac{(2x+\Delta x)\Delta x}{\Delta x}=2x+\Delta x

Note

\Delta x^2 \ne (\Delta x)^2!!

Funzione cubica

Con la stessa tecnica e aiutandosi con il disegno che si riferisce all’incremento di volume di un cubo, si può calcolare \Delta x^3 e il relativo rapporto incrementale.

y=x^3

incremento di y=x^3

\Delta x^3 = (x +\Delta x)^3 - x^3 = x^3 +3x^2\Delta x+3x(\Delta x)^2+(\Delta x)^3 - x^3=3x^2\Delta x+3x(\Delta x)^2+(\Delta x)^3. Si ha così rapporto il incrementale :

  • y=x^3,\quad \frac{\Delta y}{\Delta x}=\frac{3x^2\Delta x+3x(\Delta x)^2+(\Delta x)^3}{\Delta x}=3x^2+3x\Delta x+(\Delta x)^2.
Funzione radice quadrata

Dalla definizione di differenza: \Delta(\sqrt{x})=\sqrt{x+\Delta x}-\sqrt{x}, da cui è facile ricavare il rappporto incrementale. Tuttavia più avanti ci sarà utile riscrivere la differenza come una frazione da razionalizzare: \sqrt{x+\Delta x}-\sqrt{x}=(\sqrt{x+\Delta x}-\sqrt{x})\frac{\sqrt{x+\Delta x}+\sqrt{x}}{\sqrt{x+\Delta x}+\sqrt{x}}=\frac{(x+\Delta x)-x}{\sqrt{x+\Delta x}+\sqrt{x}}=\frac{\Delta x}{\sqrt{x+\Delta x}+\sqrt{x}}. Da qui segue:

  • y= \sqrt{x},\quad \frac{\Delta y}{\Delta x}=\frac{1}{\sqrt{x+\Delta x}+\sqrt{x}}.
Funzione seno
y=sinx

incremento di y=sin x

Immaginando che x e x+\Delta x , con \Delta x > 0 , siano angoli del primo quadrante, si consideri nel disegno il triangolo rettangolo ABC. L’angolo acuto in B è congruente con l’angolo x+\frac{\Delta x}{2}, perché i suoi lati AB e BC sono perpendicolari a OM e OA’. Quindi BC=AB \cos (x+\frac{\Delta x}{2}). Ma le due metà di AB valgono ciascuna \sin \frac{\Delta x}{2}, e BC = BB’-AA’ =\sin (x+\Delta x) - \sin x= \Delta \sin x, quindi in conclusione: \Delta \sin x= BC=AB \cos (x+\frac{\Delta x}{2})= 2\sin\frac{\Delta x}{2}\cos (x+\frac{\Delta x}{2}) . Per cui il rapporto incrementale sarà:

  • y= \sin x,\quad \frac{\Delta y}{\Delta x}=\frac{2\sin\frac{\Delta x}{2}\cos (x+\frac{\Delta x}{2})}{\Delta x}
Funzione coseno
y=cosx

incremento di y=cos x

Per la dimostrazione si fa riferimento ad una figura analoga alla precedente, tenendo conto però che questa volta il segmento che interessa è il lato AC = A’B’. La sua misura è -\Delta \cos x e, pur essendo nel primo qudrante, è una misura negativa perché OB' = \cos(x+\Delta x) < \cos x = OA'. Abbiamo che AC=AB \sin A\hat{B}C. Riferendoci anche ai calcoli fatti per il seno per ricavare AB, alla fine vediamo che -\Delta \cos x= 2\sin\frac{\Delta x}{2}\sin (x+\frac{\Delta x}{2}), da cui

  • y= \cos x, \quad \frac{\Delta y}{\Delta x}=-\frac{2\sin\frac{\Delta x}{2}\sin (x+\frac{\Delta x}{2})}{\Delta x}

Note

Per dimostrare la formula della differenza per il seno e per il coseno anche con x e \Delta x negativi, si sviluppa la definizione di differenza e si usano le formule di prostaferesi.

Regole di calcolo del rapporto incrementale

Ricordando le regole già viste per le funzioni a dominio discreto, abbiamo le regole di calcolo seguenti:

  • \frac{\Delta c}{\Delta x} = 0
  • \frac{\Delta [cf(x)]}{\Delta x} =c\frac{\Delta f(x)}{\Delta x}
  • \frac{\Delta [f(x) \pm g(x)]}{\Delta x} =\frac{\Delta f(x)}{\Delta x} \pm \frac{\Delta g(x)}{\Delta x}
  • \frac{\Delta [f(x)g(x)]}{\Delta x} = \frac{\Delta f(x)}{\Delta x}g(x)+f(x+\Delta x)\frac{\Delta g(x)}{\Delta x} = \\ = \frac{\Delta f(x)}{\Delta x}g(x+\Delta x)+f(x)\frac{\Delta g(x)}{\Delta x} \\ = \frac{\Delta f(x)}{\Delta x}g(x)+f(x)\frac{\Delta g(x)}{\Delta x}+\frac{\Delta f(x)}{\Delta x}\frac{\Delta g(x)}{\Delta x}\Delta x
  • \frac{\Delta \left[\frac {f(x)}{g(x)}\right]}{\Delta x} =\frac{\frac{\Delta f(x)}{\Delta x}g(x)-f(x)\frac{\Delta g(x)}{\Delta(x)}}{g(x)g(x+\Delta x)}

Esercizi svolti

Calcoli diretti

Si risolvono con la calcolatrice senza fare uso delle formule.

  1. Calcolare \Delta\sqrt{x} \ \mbox{per}\ x=1\ \mbox{e}\ \Delta x = 0.2.

    Basta esplicitare le definizione \Delta \sqrt{x}=\sqrt{x+\Delta x}-\sqrt{x}= \sqrt{1.2}-\sqrt{1}=\dots

  2. Calcolare \Delta \tan x\ \mbox{per}\ x=0.88\ \mbox{e}\ \Delta x = 0.4.

    \tan 0.92 - \tan 0.88 =0.103600

I calcoli diretti sono sempre possibili se le funzioni coinvolte si trovano sulla calcolatrice. Non essendoci dati incogniti, è facile anche calcolare il rapporto incrementale.

Problema 1

Un cerchio di raggio r=5 cm viene ingrandito fino a che la sua area aumenta di 0.8 cm^2. Di quanto aumenta il suo raggio?

p_cerchio

Mettiamo in relazione l’area e il raggio e calcoliamo le differenze. La funzione è A(r)=\pi r^2. La sua differenza è \Delta A(r)=\Delta (\pi r^2)= \pi\Delta r^2=\pi[2r\Delta r+(\Delta r)^2]. Cioé: (\Delta r)^2+2r\Delta r-\frac{\Delta A}{\pi}=0

Inserendo i dati diventa (\Delta r)^2+10\Delta r-\frac{0.8}{\pi}=0, che è un’equazione di secondo grado nell’incognita \Delta r. Consideriamo solo la soluzione positiva e troviamo con l’aiuto della calcolatrice: \Delta r=-5+\sqrt{25+\frac{0.8}{\pi}}=0.025 cm

Si tratta di un problema tipico, cioé di un problema nel quale viene fornito il valore di \Delta y e viene richiesto di calcolare \Delta x tramite l’equazione \Delta y=f(x+\Delta x)-f(x). Nel problema proposto la soluzione è semplice, ma non lo è in generale e per raggiungerla occorre fare ricorso a tecniche di approssimazione che saranno spiegate più avanti.

Problema 2

Si vuole aumentare di 0.1 cm^2 la superficie di un triangolo con i lati a=5cm, b =8cm, angolo compreso \gamma= 40^\circ. Di quanto deve aumentare l’angolo \gamma?

p_tria

Anche in questo problema c’è una formula diretta che lega l’area all’angolo:

S(\gamma)=\frac{1}{2}ab \sin \gamma=20\sin\gamma=20\sin\gamma. Utilizzando le regole note per le differenze, ricaviamo: \Delta S=\Delta(20\sin\gamma)=20[\sin(\gamma + \Delta \gamma)-sin\gamma]

Inserendo i dati, l’equazione diventa:

20[\sin (40^\circ +\Delta\gamma)-\sin 40^\circ=0.1\\
\sin (40^\circ +\Delta\gamma)-\sin 40^\circ=\frac{1}{200}\\
\sin (40^\circ +\Delta\gamma)= \frac{1}{200}+ \sin 40^\circ\\
40^\circ +\Delta\gamma= \arcsin\left(\frac{1}{200}+ \sin 40^\circ\right)\\
\Delta\gamma= \arcsin\left(\frac{1}{200}+ \sin 40^\circ\right)- 40^\circ=0.375^\circ=22.5'\

La formula generale è \Delta \gamma=\arcsin\left(\frac{2\Delta S}{ab}-\sin\gamma\right)-\gamma.

L’esistenza della formula che lega direttamente le due variabili facilita enormemente la soluzione, che altrimenti richiederebbe tecniche molto più sofisticate. Ripetiamo infatti che se l’equazione è \Delta y=f(x+\Delta x)-f(x) non è per nulla scontato risalire al valore utile \Delta x a partire dal valore conosciuto di \Delta y.

Riassunto

  1. Il rapporto incrementale serve a calcolare il tasso di variazione della funzione fra due suoi valori.
  2. Graficamente corrisponde alla pendenza del segmento che unisce i due punti di ascissa x e x+\Delta x.
  3. Il rapporto incrementale si calcola come rapporto fra l’incremento della funzione e l’incremento della variabile e ha due formulazioni diverse se la funzione è a dominio continuo o a dominio discreto.
  4. Dopo avere imparato a calcolare questo rapporto nel caso di funzioni elementari, per passare a funzioni composte occorre conoscere le regole che consentono di applicare il rapporto incrementale a somme, prodotti, quozienti ecc.
  5. La tecnica di calcolare le differenze è immediatamente risolutiva nei problemi in cui una formula fornisce il legame diretto fra due variabili.

Esercizi

#. Ricava algebricamente le regole di calcolo del rapporto incrementale nelle fu nzioni a dominio discreto,

partendo dalla definizione di rapporto incrementale e utilizzando le formule sulle differenze.
  1. Spiega la nota del paragrafo 5.5.2, chiarendo perché se \frac{\Delta x}{\Delta x}=1, \frac{\Delta x^2}{\Delta x} \ne \Delta x
  2. Verifica che \frac{\Delta \frac {1}{x}}{\Delta x}= - \frac{\Delta x}{x(x+\Delta x)}
  3. Verifica che \frac{\Delta \sqrt x}{\Delta x}=\frac {1}{\sqrt{x+\Delta x}+\sqrt x}
  4. Verifica che \frac{\Delta (ax+b)}{\Delta x}= a
  5. Segui i suggerimenti della nota al paragrafo 5.5.5 e dimostra le formule delle differenze per il seno e per il coseno.
  6. Calcolare \Delta \cos x\ \mbox{per}\ x=0.88\ \mbox{e}\ \Delta x = 0.4
  7. Calcolare \Delta \frac{1}{x}\ \mbox{per}\ x=5\ \mbox{e}\ \Delta x = 1
  8. Calcolare \Delta  x!\ \mbox{per}\ x=-3\ \mbox{e}\ \Delta x = 1
  9. Un rombo ha una diagonale di 10 cm. Di quanto occorre allungare l’altra diagonale perché la sua superficie aumenti di 0.2 cm^2?
  10. Un triangolo equilatero ha l’altezza di 10 cm. Di quanto occorre allungarla perché il suo perimetro aumenti di 8 cm?

Il differenziale

Introduzione

Il tasso medio di variazione di una funzione, relativamente a un intervallo del suo dominio, non dà informazioni sulle variazioni puntuali della funzione nell’intervallo considerato.

Per le funzioni a dominio discreto, che non hanno valori fra due punti distinti successivi, il problema delle informazioni mancanti sulle variazioni all’interno dell’intervallo fra i due punti non si pone. Invece, per le funzioni a dominio continuo il tasso di variazione si può ricercare anche per intervalli molto piccoli del dominio, anche infinitamente piccoli, dato che il dominio è continuo.

Ecco quindi che per avere informazioni sul comportamento puntuale di una funzione a dominio continuo considereremo distanze infinitesime e differenze infinitesime e torneremo ad usare i numeri iperreali.

Funzioni continue

Consideriamo l’incremento \Delta f(x) relativo a un incremento infinitesimo \Delta x. In generale, non è detto che anche \Delta f(x) sia infinitesimo.

gradino

Funzione a gradino

Nel disegno, la funzione ha una discontinuità in x=0 per \Delta x positivo, perché salta improvvisamente dal valore 0 al valore 1. Eppure si tratta di una funzione a dominio continuo, cioé definita per ogni valore di x, anche quelli prossimi a 0. La sua espressione analitica è

f(x)=\begin{cases} 0, & \mbox{se }x \le 0 \\ 1, & \mbox{se }x>0\end{cases}

Una funzione di questo tipo si dice discontinua. Al contrario, si dice continua una funzione che ha incrementi infinitesimi dei suoi valori in corrispondenza di incrementi infinitesimi della variabile. Per esprimersi con precisione:

  • Una funzione a dominio continuo f : I \rightarrow \mathbf{R} si dice continua nel punto x\in I se per ogni infinitesimo \delta si ha che f(x+\delta ) - f(x) \approx 0 o, in modo equivalente, se per x' \approx x si ha che f(x' )\approx f(x) .

Diciamo allora che x è un punto di continuità per f. Intendiamo anche che f è continua in un intervallo se tutti i punti dell’intervallo sono di continuità per f.

Differenziale

Dunque, per le funzioni continue, a incrementi infinitesimi di x corrispondono incrementi infinitesimi di f(x). Per distinguere gli incrementi infinitesimi dagli incrementi standard, useremo il termine differenziale invece di differenza e useremo la lettera d invece della lettera \Delta.

  • Il differenziale della funzione continua f nel punto x, relativo all’incremento infinitesimo \delta è il numero infinitesimo df(x)=f(x+\delta ) - f(x).

Nella lettura, df(x) si legge “de effe di x” e la parola differenziale sta per “differenza infinitesimale”. Seguono i primi semplici esempi di calcolo.

Differenziale della funzione identica

Il più semplice differenziale è quello della funzione identica f(x)=x, per la quale df(x)~=~dx~=~(x+\delta)-x=\delta. Quindi potremo scrivere dx invece di \delta, per indicare l’incremento infinitesimo di x. Di conseguenza, nell’espressione di un qualsiasi altro differenziale, al posto di f(x+\delta)-f(x) potremo scrivere f(x+dx)-f(x).

Differenziale della funzione quadrato

dx^2=(x+dx)^2-x^2=x^2+2xdx+(dx)^2-x^2=2xdx+(dx)^2.

L’ultimo addendo è un infinitesimo di ordine superiore e si può trascurare. Quindi: dx^2~\sim~2xdx.

Si arriva allo stesso risultato in modo più diretto, utilizzando le formule già viste per le differenze, sostituendo dx al posto di \Delta x e eliminando gli infinitesimi di ordine superiore. Come negli esempi successivi.

Differenziale della funzione cubo

dx^3=3x^2dx+3x(dx)^2+(dx)^3\sim 3x^2dx.

Differenziale della funzione reciproca

d\frac{1}{x}=-\frac{dx}{x(x+dx)}\sim-\frac{dx}{x^2}.

Parte principale del differenziale

Come si vede dai primi esempi, dopo aver sostituito banalmente d al posto di \Delta per calcolare il differenziale di una funzione partendo dall’espressione della sua differenza, si rende più agile il risultato eliminando infinitesimi di ordine superiore. La parte che resta si chiama parte principale. C’è una regola per scegliere la parte principale di df(x) rispetto a dx?

In generale, dati due infinitesimi \epsilon,\delta, dire che \epsilon è dello stesso ordine di \delta significa che \frac{\epsilon}{\delta}=a, dove a è un finito non infinitesimo. Ne consegue che \epsilon=a\delta. Al posto di a potremmo scrivere qualsiasi altro numero indistinguibile da a, senza cambiare significato al confronto. Tutti questi fra loro indistinguibili hanno la stessa parte standard s, per cui esiste un unico numero standard s tale che \epsilon=s\delta. \quad s\delta è la parte principale dell’infinitesimo \epsilon rispetto all’infinitesimo \delta. La parte principale vale zero nel caso che \epsilon sia di ordine superiore rispetto a \delta.

I tre ultimi esempi di calcolo del differenziale rendono evidente la scelta della parte principale del risultato.

Regole di calcolo

Il calcolo del differenziale di una funzione, composta grazie a operazioni fra due funzioni, ha le stesse regole viste per il calcolo delle differenze. Ora però avremo espressioni più semplici, perché alla fine sceglieremo la parte principale del risultato. Queste le prime regole:

  • dc=0
  • d[cf(x)]=cdf(x)
  • d[f(x)\pm g(x)]=df(x) \pm dg(x)
  • d[f(x)g(x)]=df(x)g(x)+f(x)dg(x)+df(x)dg(x)\sim df(x)g(x)+f(x)dg(x)
  • d\left[\frac{f(x)}{g(x)}\right]=\frac{df(x)g(x)-f(x)dg(x)}{g(x)g(x+dx)}\sim\frac{df(x)g(x)-f(x)dg(x)}{g(x)^2}

Per chiarire la regola del prodotto, ancora una volta possiamo ricorrere alla geometria.

dfdg

incremento infinitesimo di area

Rappresentiamo il prodotto fra due funzioni, che nel disegno misurano le dimensioni di un rettangolo. L’incremento differenziale di area avrà ad un vertice un incremento rettangolare trascurabile, perchè infinitesimo di ordine superiore rispetto alle due strisce (superiore e laterale). Quindi nella quarta regola utilizzeremo l’espressione finale, indistinguibile dalla precedente.

L’ultima regola, del rapporto, viene dal fatto che g(x) è una funzione continua e quindi si può utilizzare l’ultima espressione al posto di quella esatta, indistinguibile.

Riassunto

  1. Il fatto che il dominio delle funzioni sia continuo permette di definire l’incremento infinitesimo di x (dx), infinitesimo non nullo.
  2. Se anche la funzione è continua, allora all’incremento infinitesimo della variabile è associato anche l’incremento infinitesimo della funzione: il suo differenziale df(x).
  3. Come per le differenze, i differenziali vengono espressi per le funzioni più semplici e si danno le prime regole di calcolo per le operazioni fra funzioni.
  4. La possibilità di usare quantità infinitesime ci riconduce ai numeri iperreali e si dimostra, attraverso l’uso delle parti principali, che è possibile trascurare gli infinitesimi di ordine superiore, ottenendo così espressioni più semplici rispetto a quelle delle differenze.

Esercizi

La derivata: definizione e prime regole di derivazione

Introduzione

Consideriamo l’informazione che otteniamo da un valore di velocità media fra due istanti di tempo: si tratta di un’informazione sulla media, cioé senza dettagli sulle variazioni di velocità che possono essere avvenute durante quel periodo di tempo. Per queste informazioni più puntuali dovremmo poter suddividere l’intervallo di tempo in periodi molto piccoli, in frazioni di secondo sempre minori. La velocità media relativa al periodo fra due istanti di tempo così vicini da quasi coincidere viene detta velocità istantanea, ed è quella indicata da un tachimetro.

Abbiamo già considerato, nel capitolo precedente, che il tasso medio di variazione di una funzione, relativamente a un intervallo del suo dominio, non dà informazioni sulle variazioni puntuali della funzione nell’intervallo considerato.

Questo capitolo si concentra sul modo migliore che consente di arrivare al tasso di variazione di una funzione continua, analogo alla ricerca di calcolare una velocità istantanea. Terremo conto di quanto visto nel cap.6 per l’uso delle differenze infinitesime e arriveremo a definire qualcosa di analogo alla velocità istantanea. Nel moto vario essa è una funzione che fornisce un valore finito, ad un certo istante. Nell’analisi non standard il risultato analogo, il tasso di variazione, si otterrà operando sugli iperreali.

Derivata

Esauriti i discorsi di base sulle differenze, torniamo ora al punto principale: definire il tasso di variazione relativo ad una funzione a dominio continuo. Come abbiamo visto a proposito delle funzioni a dominio discreto, si tratterà di definire il rapporto delle differenze, cioé nel nostro caso dei differenziali. Il rapporto incrementale, relativo ad un incremento infinitesimo non nullo dx, è detto rapporto differenziale, ed è un numero iperreale dato da \frac{df(x)}{dx}.

Il tasso di variazione si otterrà dalla parte standard di questo rapporto, a due condizioni:

  • che il rapporto abbia un valore finito
  • che la parte standard non cambi al cambiare di dx.

Il concetto è così importante che ha un nome particolare:

Si dice derivata di una funzione f:I\to \mathbf{R} in un suo punto di continuità x di I, la parte standard del rapporto differenziale \frac{df(x)}{dx}, purché esista con valore finito e sia indipendente dalla scelta del particolare dx usato.

Il simbolo che si usa per questo nuovo calcolo è f’(x), oppure Df(x), con il significato già detto: Df(x)= st \left(\frac{df(x)}{dx}\right). Il nome derivata ha ragioni storiche: si tratta di una nuova funzione che appunto deriva da un’altra data, esprimendo punto per punto il tasso di variazione di questa, che viene detta funzione primitiva.

Significato geometrico

Il rapporto differenziale \frac{df(x)}{dx} esprime geometricamente la pendenza della retta secante alla curva per i punti (x; f(x))\ \mbox{e}\ (x+dx;f(x+dx)), che sono fra loro infinitamente vicini. Quindi la derivata, essendo la parte standard del rapporto differenziale, sarà la pendenza della tangente al grafico della funzione, nel punto di ascissa x.

tangente

La derivata come pendenza della tangente

Quando la derivata non esiste

Prendiamo il caso di f(x)=\sqrt{x}. Il suo grafico ha tangente verticale in x =0. Infatti si tratta della funzione inversa rispetto a y=x^2, che nello stesso punto ha tangente orizzontale.

tang_verticale

in x=0 la derivata non esiste

Calcoliamo il rapporto differenziale in x =0: \frac{\sqrt{0+dx}-\sqrt{0}}{dx}=\frac{\sqrt{dx}}{dx}=\frac{1}{\sqrt{dx}}=+\infty. La parte standard del rapporto differenziale non è quindi calcolabile. Per inciso, l’infinito è positivo perché la funzione è definita solo per numeri positivi. Se un numero qualsiasi z è un infinito negativo, scriveremo z=-\infty. Nel caso di un infinito generico: z=\infty

La derivata può non esistere anche se la tangente non è verticale. E’ il caso di un punto angoloso, cioé un punto, visto al microscopio non standard, per il quale il rapporto differenziale cambia a seconda dell’infinitesimo scelto come incremento.

p_angoloso

in x=0 la derivata non esiste

Nell’esempio del disegno questo fatto è visibile anche al microscopio standard. La funzione è y=|x| e in x =0 il rapporto differenziale vale +1 se dx è positivo, -1 se dx è negativo.

In conclusione, l’esistenza della derivata si traduce nel fatto che il grafico, osservato al microscopio non standard nel punto considerato, è indistinguibile da un segmento orizzontale o obliquo (non verticale).

Primi calcoli

Per il primo esempio di calcolo, seguiamo la definizione. Data la funzione, occorrerà

  1. esprimere il differenziale df(x)
  2. scrivere il rapporto differenziale \frac{df(x)}{dx}
  3. calcolare la parte standard st \left(\frac{df(x)}{dx}\right)

Calcolo di Df(x), con f(x)=3x^2+8. La sequenza è:

  1. df(x)=d(3x^2+8)=3(x+dx)^2+8-(3x^2+8)=3x^2+6xdx+3(dx)^2+8-3x^2-8=\\ = 6xdx+3(dx)^2
  2. \frac{df(x)}{dx}=\frac{6xdx+3(dx)^2}{dx}=6x+3dx
  3. st \left(\frac{df(x)}{dx}\right)=st(6x+3dx)=6x

Quindi D(3x^2+8)=6x.

Un secondo modo è più diretto. Si calcola dapprima il differenziale e poi si utilizza solo la sua parte principale, che è indistinguibile. Al termine si scrive il rapporto differenziale e si calcola la sua parte standard. Quindi, data la stessa funzione:

  1. df(x)=d(3x^2+8)=3(x+dx)^2+8-(3x^2+8)=3x^2+6xdx+3(dx)^2+8-3x^2-8=\\ =6xdx+3(dx)^2\sim 6xdx
  2. Df(x)\sim \frac{df(x)}{dx}\sim\frac{6xdx}{dx}=6x

Il segno di indistinguibilità viene usato per esattezza, perché due espressioni indistinguibili non sono (in genere) esattamente uguali. Tuttavia per praticità è accettabile usare il segno di uguale, anche quando l’uguaglianza si riferisce alla sola parte standard. Così d’ora in avanti intenderemo che Df(x)= st \left(\frac{df(x)}{dx}\right) equivalga a Df(x)= \frac{df(x)}{dx}, anche se la prima uguaglianza è esatta mentre la seconda è approssimata.

Regole generali

Dalle regole per il calcolo del differenziale delle funzioni deduciamo facilmente le regole per il calcolo della derivata. Basta usare la definizione di rapporto differenziale.

  • Dc=0
  • D(cf(x))=cDf(x)
  • D(f(x)\pm g(x))=Df(x)\pm Dg(x)
  • D(f(x)g(x))=Df(x)g(x) + f(x)Dg(x)
  • D\left(\frac{f(x)}{g(x)}\right)=\frac{Df(x)g(x)-f(x)Dg(x)}{g(x)^2}

Note

La regola del prodotto, estesa a più funzioni, viene illustrata all’inizio del prossimo capitolo.

Derivare funzioni potenza

Ricaveremo la regola generale per gradi. Calcoliamo dapprima i differenziali, ricordando il Par.6.5. Iniziamo da d(x^2), pensando x^2=x\cdot x e applicando la regola del prodotto, poi ricominciamo con esponenti via via maggiori.

  • d(x^2)=d(x \cdot x)=dx\cdot x+x\cdot dx=2xdx
  • d(x^3)=d(x^2 \cdot x)=2xdx\cdot x +x^2\cdot dx=3x^2dx
  • d(x^4)=d(x^3 \cdot x)=3x^2dx\cdot x +x^3\cdot dx=4x^3dx
  • d(x^5)=d(x^4 \cdot x)= ... + x^4\cdot dx=5x^4dx
  • ...
  • d(x^n)=d(x^{n-1}\cdot x)= ... = nx^{n-1}dx

La riga finale, che è intuibile, può essere rigorosamente dimostrata per induzione, seguendo la stessa tecnica. Siamo ora in grado di esprimere la nuova regola:

  • D(x^n)=\frac{d(x^n)}{dx}=nx^{n-1}.

Cosa succede con esponenti negativi? La dimostrazione più breve si ottiene sostituendo l’esponente: infatti, ponendo -n=m possiamo calcolare la derivata con la regola nota: D(x^{-n})= D(x^m)=mx^{m-1} e sostituendo m=-n otteniamo la formula cercata D(x^{-n})=-nx^{-n-1}.

Note

La regola sulla derivata di una potenza ricorda molto da vicino la regola delle differenze dei fattoriali decrescenti.

Potenze a esponente razionale

La regola non cambia se la potenza ha un esponente razionale. Se segui la regola ti sarà facile concludere, per esempio, che D(\sqrt{x})=\frac{1}{2\sqrt{x}}. Si tratta di una regola di validità generale, cioé è applicabile per le potenze a esponente reale qualsiasi, ma per il momento non siamo in grado di dimostrarlo. Ci accontentiamo per ora di dimostrare la validità della regola nel caso delle radici quadrate e cubiche.

Derivare le radici

Vediamo perché D(\sqrt{x})=\frac{1}{2\sqrt{x}}. Dall’espressione della differenza \Delta\sqrt{x}=\sqrt{x+\Delta x}-\sqrt{x}, ricaviamo come differenziale: d\sqrt{x}=\sqrt{x+dx}-\sqrt{x}. Si tratta di un’espressione indistinguibile da zero. Zero è l’unico numero da evitare nelle questioni di indistinguibilità, per questo riscriviamo il differenziale come se dovesse essere razionalizzato e cerchiamo l’espressione indistinguibile: d\sqrt{x}=\sqrt{x+dx}-\sqrt{x}=\frac{dx}{\sqrt{x+dx}+\sqrt{x}}\sim \frac{dx}{2\sqrt {x}}. Ricordando la convenzione di utilizzare comunque il segno di uguaglianza, allora la derivata risulta:

  • D(\sqrt{x})=\frac{1}{2\sqrt {x}}

Questa derivata non è definita per x=0 e infatti abbiamo già verificato che il grafico della funzione y=\sqrt{x} ha tangente verticale nell’origine.

Torniamo ora alla regola della derivata della potenza per individuare una regola conseguente, specifica per le radici. Avremo:

  • D(\sqrt[n]{x})=D(x^{\frac{1}{n}})=\frac{1}{n}x^{\frac{1}{n}-1}=\frac{1}{nx^{1-\frac{1}{n}}}=\frac{1}{nx^{\frac{n-1}{n}}}=\frac{1}{n\sqrt[n]{x^{n-1}}}

(Tieni presente che l’esponente nella terza espressione \frac{1}{n}-1 è un numero negativo). Applichiamo la regola per esempio alla radice cubica:

D(\sqrt[3]{x})= D(x^\frac{1}{3})= \frac{x^{\frac{1}{3}-1}}{3}=\frac{x^{-\frac{2}{3}}}{3}=\frac{1}{3x^\frac{2}{3}}=\frac{1}{3\sqrt[3]{x^2}}

Come per la radice quadrata, anche la formula della derivata della radice cubica si può dimostrare a partire dal rapporto differenziale. La razionalizzazione “alla rovescia” in questo caso si esegue ricordando la scomposizione della differenza fra due cubi.

Siamo ora in grado di derivare espressioni di una certa complessità: polinomiali, razionali fratte, irrazionali.

Esercizi svolti

I primi esercizi vengono dettagliati minuziosamente. l’obiettivo deve essere acquisire in fretta la pratica che permette di arrivare rapidamente al risultato.

  • D(3x^2+8)=D(3x^2)+D(8)=3D(x^2)+0=3\dot 2x^(2-1)=6x.
  • D\left(\frac{5x}{2x+3}\right)=5D\left(\frac{x}{2x+3}\right)=5\left(\frac{D(x)\cdot (2x+3)-x\cdot D(2x+3)}{(2x+3)^2}\right)=5\left(\frac{2x+3-x\cdot 2}{(2x+3)^2}\right)=\frac{15}{(2x+3)^2}
  • D(x^3-5x)=D(x^3)-D(5x)=3x^2-5
  • D\frac{10}{x^3}=10D(x^{-3})=-30x^{-4}=-\frac{30}{x^4}
  • D(x\sqrt{x})=D(\sqrt{x^3}=D(x^{\frac{3}{2}})=\frac{3}{2}x^{\frac{1}{2}}=\frac{3\sqrt{x}}{2}.

Quale notazione per la derivata?

Usiamo indifferentemente tre notazioni per indicare la stessa cosa: Df(x), \frac{df(x)}{dx} e f’(x). Dato che non facciamo più distinzione fra indistinguibilità e uguaglianza, l’uso di un simbolo o dell’altro risponde solo a un criterio di comodo. Il vantaggio dell’ultimo simbolo sta nell’indicare la derivata come “funzione derivata” e quindi di poter indicare per esempio f’(2), che equivale al più laborioso Df(x) per x=2 . Il rapporto differenziale mette in evidenza la variabile e per questo è molto usato in fisica e in tecnica. Per esempio i=\frac{dq}{dt} indica che la funzione q varia in dipendenza da t, come avviene per esempio per l’intensità di corrente elettrica.

Riassunto

  1. La derivata è la parte standard del rapporto differenziale. Per calcolarla, occorre semplicemente scrivere il rapporto differenziale della funzione data e ottenere la sua parte principale.
  2. La derivata non esiste se il rapporto differenziale è un infinito oppure se dipende da un diverso differenziale dx.
  3. Le regole di calcolo della derivata di una funzione non elementare si ottengono direttamente da quelle dei differenziali.
  4. La derivata della funzione potenza segue la regola delle differenze nei fattoriali decrescenti.
  5. Graficamente, la derivata esprime la pendenza della tangente alla curva per quel punto.

Esercizi

  1. Calcola D\frac{5x}{2x+3} nei due modi descritti nel paragrafo 7.4.
  2. Calcola seguendo le regole generali di calcolo.
  3. Dimostra la regola della derivata di un prodotto.
  4. Dimostra la regola della derivata di un quoziente.
  5. Calcola D(3x^2+8) applicando le regole generali del calcolo.
  6. Dimostra che D(x^{-7})=\frac{-7}{x^8}.
  7. Seguendo la regola sulla derivata di una potenza, dimostra che D\sqrt{x}=\frac{1}{2\sqrt{x}}.
  8. Dimostra la formula della derivata della radice cubica a partire dal differenziale della funzione.
  9. Ricalcola l’ultimo esempio, seguendo la regola della derivata di un prodotto.
  10. Seguendo la regola sulla derivata di una potenza, dimostra che D\sqrt[3]{x^5}=\frac{5}{3\sqrt[3]{x^2}}.
  11. Calcola D(3x^5-8x^4+11x^3+6x^2-8x+56)
  12. Calcola D\left(\frac{3x^3-6x+8}{x^2}\right)
  13. Calcola D\left(\frac{x^2-1}{x^2+1}\right)

La tangente

In questo capitolo impariamo a calcolare e utilizzare l’equazione della retta tangente e poi prendiamo confidenza con la funzione derivata, valutando per via grafica la tangente a varie curve.

Ricerca della retta tangente

Dato che la derivata, se esiste, fornisce la pendenza della retta tangente al grafico di f(x), sarà facile scrivere l’equazione della retta tangente in x_0 a una curva f(x). L’equazione di una retta per il punto (x_0, f(x_0)) è y-f(x_0)=m(x-x_0). Il coefficiente angolare m è dato dalla derivata calcolata nel punto, quindi la tangente è:

  • y=f'(x_0)(x-x_0)+f(x_0)
eq_tangente
Esercizi svolti

1. Trova il punto della parabola x^2-5x-2 in cui la tangente è parallela alla retta 5x+y-4=0

prob_parabola

Abbiamo il risultato della derivata nel punto cercato: è -5, il coefficiente angolare della retta parallela alla tangente. Calcoliamo quindi l’espressione della derivata e cerchiamo il punto in cui essa vale -5.

f'(x)=2x-5. Perché la derivata valga -5 deve essere x=0 . In questo punto la funzione vale -2, quindi il punto cercato è (0,-2).

2. Data la funzione y=(x-1)(x+1)(x+2), trova la tangente e la normale al suo grafico nei punti di intersezione con l’asse delle ascisse.

prob_2

La funzione si azzera per x=1 , x=-1 , x=-2 . Occorre calcolare la derivata in questi punti e poi esprimere per ogni punto l’equazione della retta tangente e quella della retta normale, che avrà il coefficiente angolare antireciproco. Per il calcolo della derivata, ci sono tre vie. Si potrebbe prima esprimere il polinomio, svolgendo il prodotto, e poi derivare. Oppure si moltiplicano i due primi binomi, poi si segue la regola del prodotto:

D((x^2-1)(x+2))= 2x(x+2)+(x^2-1)\cdot 1 = ....

Il terzo modo è descritto nel prossimo paragrafo.

Il calcolo della derivata, dopo semplici passaggi algebrici, ci dà: y'=3x^2+4x-1. Nel primo punto (-2,0) avremo:

  • per la tangente y=f'(-2)(x+2)+f(-2)
  • per la normale: y=-\frac{1}{f'(-2)}(x+2)+f(-2).

Dato che f'(-2)=3 \mbox{ e } f(-2)=0 ne risulta: y=3(x+2)\mbox{ e } y=-\frac{1}{3}(x+2) per la tangente e per la normale. Per gli altri punti lo svolgimento è lo stesso.

3. Dimostra che i segmenti tangenti all’iperbole equilatera y=\frac{k^2}{x}, compresi fra gli assi coordinati, hanno per punto medio il punto di tangenza.

prob3

Calcoliamo la derivata e poi scriviamo l’eq.della tangente per un generico punto dell’iperbole \left(a,\frac{k^2}{a}\right) \mbox{ con } a>0 (limitiamoci al primo quadrante).

f'(x)=-\frac{k^2}{x^2} e per la tangente in a y=-\frac{k^2}{a^2}(x-a)+\frac{k^2}{a} .

Le intersezioni della tangente con gli assi sono in \left(0,\frac{2k^2}{a}\right) \mbox{ e } (2a,0). Allora il punto medio è M\left(a,\frac{k^2}{a}\right), che è proprio il punto di tangenza.

Derivare un prodotto di più funzioni

La terza possibilità è imparare a derivare le funzioni che contengono più prodotti. Nel caso di tre funzioni: f=f(x),\ g=g(x),\ h=h(x)

D(fgh) = D(fg)h+fgD(h)= (f'g+fg')h+fgh' = f'gh+fg'h+fgh'.

È una regola che si estende a più prodotti: si scrive una somma in cui compaiono tanti prodotti delle funzioni quante sono le funzioni e all’interno di ogni prodotto si deriva una funzione diversa. Così per esempio D(yztu)=y'ztu + yz'tu + yzt'u + yztu' dove per brevità intendiamo che y, z, t, u siano tutte funzioni di x.

Come varia la tangente

Immaginiamo di calcolare la derivata relativa a punti diversi del grafico di una funzione: otterremo diversi valori che graficamente rappresentano le diverse inclinazioni della retta tangente alla curva. Se visualizziamo una dopo l’altra queste tangenti, avremo l’impressione di “costeggiare” la curva che rappresenta la funzione. Nei nostri esempi la pendenza è una funzione continua, legata all’andamento della primitiva: si può quindi mettere in grafico sia la funzione data, la primitiva, sia la funzione derivata.

Tangenti ad una parabola

La parabola y=x^2 ha per derivata y'=2x, che è quindi una retta. I punti di questa retta rappresentano le diverse inclinazioni delle tangenti alla parabola, che al crescere di x diventano sempre meno decrescenti, raggiungono la direzione orizzontale in corrispondenza del vertice della parabola, poi aumentano sempre più la propria inclinazione, proporzionalmente a x.

tangparabola

Tangenti ad una parabola

La funzione derivata cresce quindi costantemente secondo una retta che passa per l’origine, crescendo da valori negativi a valori positivi man mano che la parabola attenua la sua decrescita, per poi risalire.

costrparabola1

Costruzione grafica della parabola

Il fatto che sia proprio una retta a descrivere la variabilità della tangente si spiega anche con la costruzione geometrica del grafico della parabola, i cui punti P si trovano all’intersezione fra due rette: la retta r , perpendicolare in Q alla direttrice e l’asse t del segmento che unisce Q al fuoco F. In questo modo t è la tangente alla parabola e il suo coefficiente angolare è dato da \frac{ax^2}{\frac{x}{2}}= 2ax, ( x è l’ascissa di Q e per ragioni di simmetria \frac{x}{2} è l’intersezione di t con l’asse orizzontale).

costrparabola2

Equazione della tangente

2ax è proprio la derivata della funzione parabola e per semplificare nel nostro esempio abbiamo preso a=1

Tangenti ad una cubica

La funzione associa ad ogni numero x il suo cubo. La funzione è crescente, quindi, procedendo da sinistra verso destra, i valori della funzione sono sempre meno negativi e i rapporti differenziali sono positivi. Per es. prendiamo per semplicità il rapporto incrementale relativamente a x=-3 : si ha \frac{\Delta y}{\Delta x}=\frac{(-2)^3-(-3)^3}{-2-(-3)}=19. E’ facile verificare che questi rapporti, pur mantenendosi sempre positivi, diminuiscono e tendono ad azzerarsi nei pressi dell’origine, per poi tornare a crescere.

tangenticubica

Tangenti ad una cubica

Di conseguenza le tangenti saranno sempre inclinate positivamente, con tendenza a diventare orizzontali vicino all’origine. Perciò il grafico della derivata non potrà essere una retta, come nel caso precedente. Dato un punto generico della cubica P(a, a^3), l’equazione della tangente per P sarà y=3a^2(x-a)+a^3. Il grafico della derivata è una parabola concava verso l’alto.

Tangenti alla funzione seno

Questa volta abbiamo una funzione oscillante, cioé crescente per alcuni valori, decrescente per altri, che quindi varia fra massimi e minimi successivi.

tangentiseno

Tangenti al grafico di \sin x

Le tangenti, di conseguenza saranno inclinate positivamente, poi sempre meno, poi diverranno orizzontali, poi inclinate negativamente, torneranno quindi di nuovo orizzontali e poi crescenti. Poi tutto ricomincerà da capo, nello stesso modo. Anche la funzione derivata è quindi una funzione periodica, legata strettamente al seno. Noi non siamo ancora in grado di esprimere questa derivata, quindi ne facciamo solo una descrizione qualitativa.

Tangenti alla funzione arcotangente

Le tangenti a questa funzione sono tutte rette crescenti (hanno pendenza positiva). La loro pendenza però cresce solo fino a 1, per poi calare gradualmente e diventare 0 all’infinito. Anche questa derivata sarà calcolata più avanti.

tangentiseno

Tangenti al grafico di \arctan x

Tangenti ad una funzione esponenziale

Le tangenti a questo grafico hanno pendenza sempre più crescente, così come sempre più crescente è la funzione 2^x.

tangentiesp

Tangenti al grafico di 2^x

Quindi il grafico della funzione derivata in un certo senso accompagna il grafico della funzione esponenziale e sembra anch’esso esponenziale, seppur leggermente diverso. Sembrerebbe quindi abbastanza facile risalire dal grafico della primitiva al grafico della derivata e anche il viceversa.

Riassunto

  1. Non è difficile, conoscendo la derivata in un punto, ricavare l’equazione della sua tangente per quel punto e tracciarla.
  2. L’insieme delle tangenti segue la curva della funzione, accompagnandola e mettendo in evidenza il suo andamento crescente o decrescente.
  3. Dall’analisi del grafico della derivata si possono quindi trarre utili informazioni sull’andamento della primitiva.

Esercizi

  1. Completa l’es. svolto 2 sul prodotto di più funzioni.
  2. Ripeti l’es. 3 sulle tangenti all’iperbole nel caso di un altro ramo di iperbole.
  3. Con l’aiuto di un software come Geogebra, disegna il grafico di y=-\frac{1}{2}x^2+4, osserva le tangenti al grafico e l’andamento della funzione tangente. Sulla stessa pagina traccia il grafico della funzione derivata.
  4. Ripeti l’es.precedente per la parabola: y=-x^2+x-1.
  5. La retta 2x+y+3 potrebbe rappresentare la derivata di quale parabola?
  6. Ripeti l’es.3 relativamente alle cubiche y= \frac{1}{5}x^3-10, \frac{1}{5}x^3-10x, y=-\frac{1}{5}x^3+10x^2 scrivendo le tue osservazioni.
  7. Quale funzione richiama il grafico della derivata della funzione y= \sin x?
  8. Traccia il grafico della funzione y=\cos x e descrivi l’andamento delle tangenti.

La derivata delle funzioni circolari e delle loro inverse

Per giustificare le formule delle derivate di funzioni circolari e delle loro inverse, faremo ampio uso dei microscopi, che rendono i risultati più immediati ed evidenti di quanto non faccia il calcolo. Useremo il calcolo soprattutto per confermare i risultati già trovati.

Derivare y=sin x

Un arco di circonferenza, ingrandito al microscopio non standard, è indistinguibile da un segmento. Quindi per ogni \delta infinitesimo non nullo, si ha \sin \delta \sim \delta

sinx=x

\sin \delta \sim \delta

Per le convenzioni già discusse nel capitolo precedente, potremo scrivere \sin \delta =\delta. Cerchiamo ora di esprimere la differenza d\sin x=\sin (x+dx)-\sin x.

dsinx

L’incremento infinitesimo di angolo dx è racchiuso fra i due raggi OA e OB, che sono indistinguibili da segmenti paralleli, e l’arco AB corrisponde all’angolo dx ed è indistinguibile da un segmento rettilineo. Nell’ingrandimento al microscopio non standard AA’ e BB’ sono segmenti distinti paralleli, e C è la proiezione di A su BB’. Allora il triangolo curvilineo ABC è indistinguibile da un triangolo rettangolo e AC è l’incremento infinitesimo di sin x, relativo all’incremento \overline{AB} = dx . y=\sin x è una funzione continua, perché associa all’incremento infinitesimo dx l’incremento infinitesimo d\sin x, dato da: d\sin x=\cos x dx. Per cui, come già si intuiva osservando l’andamento delle tangenti di una sinusoide, la derivata risulta:

  • D\sin x= \cos x

Volendo dimostrare tutto questo con il calcolo, dobbiamo ricorrere alle espressioni per le differenze del cap.5, che sono:

\Delta\sin x=2\sin\frac{\Delta x}{2}\cos (x+\frac{\Delta x}{2})\mbox{ e }\ \Delta \cos x= 2\sin\frac{\Delta x}{2}\sin (x+\frac{\Delta x}{2})

Prima di sostituire le differenze con i differenziali, dobbiamo accertarci che le due funzioni siano continue. Poiché il seno è una corda e quindi è minore dell’arco (\left|\sin\frac{\Delta x}{2}\right|\le\left|\frac{\Delta x}{2}\right|) e poichè il coseno è sempre minore di 1, o al massimo uguale, se \Delta x \approx 0,

\left |\Delta\sin x\right |=2\left |\sin\frac{\Delta x}{2}\right |\left |\cos \left(x+\frac{\Delta x}{2}\right)\right |\le 2\frac{\left |\Delta x\right |}{2}=\left |\Delta x\right |.

Allora \Delta \sin x è infinitesimo per \Delta x infinitesimo, quindi la funzione seno è continua. Per la funzione coseno il procedimento è simile, per cui possiamo scrivere: \sin\frac{dx}{2}=\frac{dx}{2} e \\ \cos\left(x+\frac{dx}{2} \right)=\cos x e infine, passando dalle differenze ai differenziali si perviene alla formula già vista:

d\sin x=2\sin\frac{dx}{2}\cos\left(x+\frac{dx}{2}\right)=2\frac{dx}{2}\cos x=\cos x dx.

Come si nota, la dimostrazione attraverso il calcolo è molto meno intuitiva. Nel seguito ne faremo uso solo se strettamente indispensabile.

Derivare y=cos x

dcosx

d\cos x

In questo disegno OB’ rappresenta \cos x e OA’ rappresenta \cos (x+dx). Ingrandito al microscopio non standard, abbiamo \overline{AC}=-d\cos x, con il segno negativo perché al crescere dell’arco il coseno diminuisce. ABC è un triangolo rettangolo con l’ipotenusa dx e l’angolo in B uguale ad x. Allora \overline{AC}=-d\cos x=(dx)\sin x, da cui si ricava che d\cos x=-\sin x dx. Da qui la regola di derivazione:

  • D\cos x=-\sin x.

Derivare y=tan x

Nel cerchio goniometrico, la tangente \tan x è il segmento FC, mentre \tan (x+dx)=\overline{FD}, sicché \overline{CD}=\tan (x+dx)-\tan x= d\tan x. In corrispondenza di CD abbiamo l’arco AB , relativo all’incremento dx dell’angolo x.

dtanx

d\tan x

Con due microscopi non standard, regolati allo stesso ingrandimento, visualizziamo i punti infinitamente vicini A \approx B \mbox{ e } C \approx D. I raggi per A e per B si vedranno paralleli e potremo disegnare il segmento CE parallelo ad AB, in modo che CED sia un triangolo rettangolo di ipotenusa d\tan x. Ne risulta che d\tan x=\frac{\delta}{\cos x}. Per ricavare \delta, vediamo che il triangolo isoscele OAB è simile a OCE e quindi vale \frac{\delta}{dx}=\frac{\overline{OC}}{\overline{OA}}=\frac{\overline{OC}}{1}=\frac{1}{\cos x}. Allora \delta=\frac{dx}{\cos x} e d\tan x~=~\frac{dx}{\cos^2 x}. Se ne conclude che: D\tan x=\frac{1}{\cos^2 x}.

Si perviene allo stesso risultato in modo tortuoso attraverso il calcolo e, in modo più interessante, usando la regola della derivata di un quoziente, applicata a \tan x = \frac{\sin x}{\cos x}, che porta anche a un risultato equivalente: D\tan x = 1 + \tan^2 x. In conclusione:

  • D\tan x=\frac{1}{\cos^2 x}= 1 +\tan^2 x.

Con la regola della derivata di un rapporto si ricavano anche le regole delle derivate delle funzioni cotangente, secante, cosecante. Dimostriamo per via geometrica solo uno di questi casi, riportando poi in sintesi tutti i risultati al termine del capitolo.

Derivare y=sec x

Il disegno è analogo a quello del caso precedente. Questa volta cerchiamo l’espressione di: d\sec x che nel disegno corrisponde al segmento DE .

dsecx

d\sec x

Per la similitudine dei triangoli CED e COF abbiamo: \frac{d\sec x}{\delta}=\frac{\overline{CF}}{\overline{OF}}=\frac{\tan x}{1}. Da cui d\sec x~=~\delta\tan x. Ma sono simili anche i triangoli isosceli OAB e OCE, da cui \frac{\delta}{dx}=\frac{\sec x}{1}. Ricavando \delta e sostituendo nella precedente, si ha infine: d \sec x=\sec x \tan x dx. La derivata è quindi:

  • D\sec x=\sec x\tan x=\frac{\sin x}{\cos^2 x}

La seconda espressione si ottiene per semplici trasformazioni goniometriche.

Derivare y=arcsin x

Nel prossimo disegno, x è il seno dell’angolo y=\arcsin x. Quindi dx è l’incremento della funzione seno, corrispondente all’incremento infinitesimo dell’angolo dy=d\arcsin x, cioé A\hat{O}B.

darcsinx

d\arcsin x

A’ e B’ sono le proiezioni di A e di B sull’asse orizzontale, quindi \overline{AA'}=x \mbox{ e } \overline{OA'}=\sqrt{1-x^2}. C è la proiezione di A su BB’ e forma così un triangolo rettangolo ABC simile a AOA’. Dalla similitudine si ricava che \frac{d\arcsin x}{dx}=\frac{1}{\sqrt{1-x^2}}, da cui deriva la regola di derivazione:

  • D\arcsin x=\frac{1}{\sqrt{1-x^2}}.

Questa derivata non è definita per x=\pm 1 e infatti per questi valori di x la funzione arcoseno ha tangente verticale.

Derivare y=arccos x

La derivata della funzione y=\arccos x si ottiene attraverso considerazioni analoghe alle precedenti. Si può avere la conferma del risultato dal fatto che la somma \arcsin x +\arccos x= \frac{\pi}{2}. Allora: \arccos x = \frac{\pi}{2}-\arcsin x e quindi

  • D\arccos x=-\frac{1}{\sqrt{1-x^2}}

dato che la derivata di una costante è nulla.

Derivare y=arctan x

darctanx

d\arctan x

Nel disegno, dx=\overline{CD} è l’incremento infinitesimo nel valore della tangente, relativo all’incremento infinitesimo di arco \overline{AB}=d\arctan x. Posizionati i due microscopi non standard come al solito, chiamiamo E la proiezione di C sul raggio prolungato OD e chiamiamo \delta=\overline{CE}. Avremo così un triangolo rettangolo DCE simile al triangolo COF. Dalla similitudine si ricava la relazione: \frac{\delta}{dx}=\frac{1}{\sqrt{1+x^2}}. Come nei casi precedenti, individuiamo altri due triangoli simili: AOB e BOC, il che ci porta a dedurre: \frac{d\arctan x}{\delta}=\frac{1}{\sqrt{1+x^2}}. Ricavando \delta dalla prima relazione e sostituendolo nella seconda, si ha il differenziale: d\arctan x= \frac{dx}{1+x^2}, e la derivata:

  • D\arctan x= \frac{1}{1+x^2}.

Derivare y=arccot x

Anche per questa derivata si può ricavare l’espressione seguendo il ragionamento fatto a proposito dell’arcocoseno. Si avrà facilmente:

  • Darc\cot x = -\frac{1}{1+x^2}.

Riassumendo

Abbiamo ricavato principalmente per via geometrica le formule dei differerenziali e delle derivate delle funzioni goniometriche e delle loro inverse.

y dy y’
\sin x \cos x dx \cos x
\cos x -\sin x dx -\sin x
\tan x \frac{dx}{\cos^2 x} \frac{1}{\cos^2 x}= 1 +\tan^2 x
\sec x \sec x\tan x dx \sec x\tan x=\frac{\sin x}{\cos^2 x}
\csc x -\frac{\cos x dx}{\sin^2 x} -\frac{\cos x}{\sin^2 x}
\cot x -\frac{dx}{\sin^2 x} -\frac{1}{\sin^2 x}=-(1+\cot^2 x)
\arcsin x \frac{dx}{\sqrt{1-x^2}} \frac{1}{\sqrt{1-x^2}}
\arccos x -\frac{dx}{\sqrt{1-x^2}} -\frac{1}{\sqrt{1-x^2}}
\arctan x \frac{dx}{1+x^2} \frac{1}{1+x^2}
arc\cot x -\frac{dx}{1+x^2} -\frac{1}{1+x^2}

Esercizi

  1. Analizza le tangenti alla cosinusoide e descrivi il loro andamento.
  2. Deduci l’espressione della derivata della tangente usando la regola della derivata del quoziente fra seno e coseno.
  3. Deduci le espressioni delle derivate della cotangente, della secante, della cosecante, utilzzando la regola della derivata del quozionte.

I differenziali, le differenze e i problemi

Quale tipologia di problema

Nel Cap.5 abbiamo risolto alcuni problemi con il calcolo delle differenze. Si tratta di problemi nei quali si chiede quale incremento \Delta x può provocare nella funzione y un certo incremento dato \Delta y=f(x+\Delta x)-f(x). Abbiamo già avvisato che si tratta di problemi in generale tutt’altro che semplici, perchè non è detto che sia possibile trovare un’espressione risolutiva esplicita.

Si cerca allora di superare le difficoltà con gli incrementi infinitesimi dy=f(x+dx)-f(x), perché già sappiamo che \frac{dy}{dx}=f'(x) e quindi dx=\frac{dy}{f'(x)} fornisce il valore dell’incognita cercata. Ma quali difficoltà comporta utilizzare gli incrementi infinitesimi rispetto agli incrementi finiti e quali relazioni legano gli uni agli altri?

Differenze e differenziali

tangente

Al microscopio non standard, il grafico della funzione nel punto di ascissa x appare indistinguibile da un segmento inclinato con pendenza f'(x). Ma sappiamo che indistinguibile non vuol dire esattamente coincidente e inoltre è una comoda convenzione dire che f'(x)=\frac{dy}{dx}, perché l’uguaglianza esatta si limita alla parte standard del rapporto differenziale. Per essere precisi si dovrebbe scrivere \frac{dy}{dx}=f'(x)+\epsilon, dove \epsilon è la parte infinitesima. Allora si ricava dy=f'(x)dx+\epsilon dx, dove l’ultimo termine è un infinitesimo di ordine superiore a dx. Affrontando un problema come quelli descritti, se utilizziamo f'(x)dx al posto di dy, commettiamo un errore che è infinitesimo di ordine superiore a dx.

L’errore è ancora maggiore, in generale non infinitesimo, se utilizziamo incrementi standard \Delta x, e tuttavia è un errore contenuto, pensando \Delta x sufficientemente piccolo.

Delta_y

Così, non riuscendo a risolvere il problema con l’equazione corretta \Delta y =f(x+\Delta x)-f(x), che esprime l’incremento della funzione, ci accontentiamo di:

\Delta y=f'(x)\Delta x

che esprime l’incremento della tangente, pur sapendo che la formula comporta un errore. Il vantaggio è che così è facile calcolare l’espressione risolutiva: \Delta x= \frac{\Delta y}{f'(x)}.

Applichiamo questa nuova strategia risolutiva agli esempi già visti (Problemi 1 e 2) e cerchiamo di valutare l’errore che comporta l’uso di quest’ultima espressione rispetto alla soluzione esatta. Infine applichiamo la formula approssimata a due problemi nuovi.

Problema 1. La corona circolare

Un cerchio ha il raggio di 5 cm. Di quanto deve aumentare il raggio perché l’area del cerchio aumenti di 0.8 cm^2?

L’area è A(r)=f(r)=\pi r^2, che ha per derivata f'(r)=2\pi r. \Delta A=0.8. La formula risolutiva dà: \Delta r=\frac{\Delta A}{f'(r)}=\frac{0.8}{2\pi 5}=0.025 cm.

Questo problema è stato illustrato nel Cap.5 e la soluzione, ricavata con il calcolo del rapporto incrementale, era: \Delta r=-5+\sqrt{25+\frac{0.8}{\pi}}=0.025. La formula dava la soluzione esatta, ma nel risultato avevamo tagliato i decimali. Ricalcoliamo entrambi i risultati con la calcolatrice e abbiamo:

Soluzione esatta: 0.025400. Soluzione approssimata: 0.025465

Quindi l’approssimazione è molto buona. In più si consideri l’immediatezza della formula risolutiva approssimata che oltretutto non ha alternativa nei casi in cui non sia possibile esprimere una formula risolutiva esatta.

prob_cerchio

Di quanto aumenta il raggio perché l’area aumenti di 0.8?

La formula approssimata \Delta A(r)=2\pi r\cdot \Delta r esprime anche un significato geometrico: si può pensare che la sottile corona circolare che rapprenta l’area aggiunta sia deformabile e corrisponda all’area di un rettangolo con la base pari alla circonferenza 2\pi r e l’altezza \Delta r.

Problema 2. Il triangolo

Riproponiamo anche questo secondo problema, del quale nel Cap.5 abbiamo già esaminato la formula risolutiva esatta.

Un triangolo di lati a, b rispettivamente uguali a 5 e 8 cm e angolo compreso di 40°, subisce un incremento di area di 0.1 cm^2. Quale incremento di angolo \Delta \gamma provoca tale incremento di area?

prob_triangolo

Di quanto aumenta \gamma perché l’area aumenti di 0.1\ cm^2?

L’area si ricava da: S=S(\gamma)=\frac{1}{2}ab \sin\gamma . Poiché il suo incremento è picccolo, utilizziamo la formula approssimata \Delta x= \frac{\Delta y}{f'(x)} che nel nostro caso diventa: \\ \Delta \gamma=\frac{\Delta S}{S'(\gamma)}=\frac{2\Delta S}{abcos\gamma}=\frac{2\cdot 0.1}{40\cos 40^{\circ}}=0.00653=0.374^{\circ}=22.4'.

Nel Cap.5 la formula risolutiva esatta era: \Delta \gamma=\arcsin\left(\frac{2\Delta S}{ab}-\sin\gamma\right)-\gamma che portava al risultato di 0.375^{\circ}=22,5'. La formula approssimata è dunque più semplice e porta ad una errore minimo, di circa una parte su 400.

Supponiamo di non conoscere le derivate e quindi nemmeno la formula approssimata \frac{2\Delta S}{abcos\gamma}. Attraverso quali considerazioni geometriche possiamo ricavarla? Dobbiamo puntare in A un microscopio standard (l’incremento \Delta \gamma è piccolo, non infinitesimo) e visualizzare il nuovo vertice A’ che si ottiene dopo avere incrementato \gamma. Il segmento BA’ riduce l’area del triangolo iniziale, mentre il segmento CA’ la aumenta. Quindi l’incremento \Delta S ottenuto grazie a \Delta \gamma è la differenza fra le aree S(A'DC)-S(ABD). Per calcolare l’area S(A’DC) la approssimiamo a quella del triangolo A’AC che a sua volta è approssimabile al settore circolare di centro C e arco b\Delta\gamma=\overline{AA'}. In conclusione S(A'DC)=\frac{1}{2}(b\Delta\gamma)b=\frac{1}{2}b^2\Delta\gamma. Fissiamo E , proiezione di A su A’B . Avremo \overline{AE}=\overline{AA'} \cos\alpha = b\Delta\gamma\cos\alpha. Approssimiamo anche il triangolo ABD al triangolo ABE e questo ,a sua volta, al settore circolare di arco AE e angolo \beta. Quindi S(ABD)=S(ABE)=\frac{1}{2}(b\Delta\gamma\cos\alpha)c=\frac{1}{2}bc\Delta\gamma\cos\alpha. La differenza (approssimata) delle due aree risulta S(A'DC)-S(ABD)=\frac{1}{2}b^2\Delta\gamma-\frac{1}{2}bc\Delta\gamma\cos\alpha=\frac{1}{2}b\Delta\gamma(b-c\cos\alpha). L’espressione tra parentesi equivale a a\cos\gamma, quindi, alla fine abbiamo \Delta S=\frac{1}{2}ab\cos\gamma\Delta\gamma, che è la stessa espressione utilizzata per risolvere il problema.

Come si vede, l’uso delle derivate ci risparmia un percorso deduttivo tutt’altro che immediato.

Problema 3. La bolla

Una bolla di sapone del raggio di 8.5 cm pesa 0.24 grammi. Quale è il suo spessore?

Si immagina che la densità dell’acqua saponata sia di 1\ \frac{g}{cm^3} e quindi la bolla ha volume di 0.24 \ cm^3. Il volume è un sottile guscio sferico, di raggio interno pari a r e spessore \Delta r molto piccolo rispetto a r. Possiamo pensare di descrivere il volume del guscio come la differenza fra due sfere concentriche: \Delta V=V(r+\Delta r)-V(r), con V(r)=\frac{4}{3}\pi r^3. Applicando la formula esatta della differenza, abbiamo: \Delta V(r)=\frac{4}{3}\pi \Delta r^3=\frac{4}{3}\pi(3r^2\Delta r+3r(\Delta r)^2+\Delta r^3) cioé un’equazione di terzo grado in \Delta r, complicata da risolvere.

Invece la formula approssimata ci dà: \Delta r =\frac{\Delta V}{V'(r)}=\frac{\Delta V}{4\pi r^2}=\frac{0.25}{4\pi (8.5)^2}=0.00026\ cm.

Note

La formula risolutiva approssimata è sempre un’equazione di primo grado in \Delta x.

Problema 4. Il numero di Eulero

Il numero di Eulero \gamma=0.577... viene utilizzato nel calcolo f(\gamma)=\gamma^{-8}cot\gamma. Qual’è il minimo numero di decimali da utilizzare in \gamma per avere un errore massimo di 0.001?

La funzione y=x^{-8}\cot x ha per derivata f'(x)=-8x^{-9}\cot x-\frac{x^{-8}}{\sin^2 x}. Se x=\gamma=0.577 e \Delta y=0.001, calcolando \Delta x=\frac{\Delta y}{f'(x)} si ottiene \Delta x = 5\times 10^{-7}, un numero con 7 cifre decimali. Quindi la risposta è 7 cifre decimali.

Verifichiamo. Con 15 cifre decimali, il numero \gamma=0.577215664901532, quindi con 7 decimali è \gamma=0.5772157. Provando a calcolare f(\gamma)=\gamma^{-8}cot\gamma con i valori \gamma=0.5772156 e \gamma~=~0.5772158 , cioé aumentando e poi diminuendo di uno l’ultima cifra decimale, si ottengono f(0.5772156)=124.619 e f(0.5772158)=124.618, che sono risultati uguali a meno di 0.001. Se riproviamo fermandoci a 6 cifre decimali e calcolando la funzione con la sesta cifra decimale variata di un’unità, stavolta i risultati differiscono di più di un millesimo.

La contrazione dell’errore

Quale ragionamento guida la soluzione del problema 4? Se usiamo una funzione con un numero approssimato x\pm\Delta x avremo un risultato anch’esso approssimato f(x\pm\Delta x)=\Delta y. Se \Delta x è piccolo possiamo usare la formula approssimata \Delta y = f'(x)\Delta x, che equivale ad approssimare il grafico della funzione nel punto di ascissa x con la tangente. La derivata avrà segno positivo o negativo a seconda che gli incrementi siano di segno concorde o discorde. Ma se consideriamo solo i valori assoluti degli incrementi, allora avremo \Delta y=\left | f'(x)\right |\Delta x. \Delta y può essere pensato come incremento oppure come approssimazione (errore assoluto) del valore della funzione, e analogamente \Delta x.

dilat_errore
  • Se la derivata vale 1 (in valore assoluto), \Delta y= \Delta x, l’errore sulla variabile è uguale all’errore sulla funzione.
  • Se \left | f'(x)\right |>1, allora la funzione dilata l’errore.
  • Se infine | f'(x) | < 1, significa che la funzione “reagisce” all’incremento \Delta x con un incremento minore: la funzione contrae l’errore.

Il metodo delle contrazioni per approssimare la soluzione delle equazioni si basa su questo principio.

Riassunto

  1. Se \Delta x è piccolo si può approssimare la formula dy~=~f'(x)dx con la formula \Delta y~=~f'(x)\Delta x. L’approssimazione è utile, a volte indispensabile, nei problemi in cui si chiede di ricavare l’incremento \Delta x che provoca un dato incremento \Delta y.
  2. L’equazione risolutiva approssimata \Delta x=\frac{\Delta y}{f'(x)} è di primo grado ed è di facile soluzione. Al contrario, non sempre è facile o possibile dedurre la formula risolutiva dall’equazione esatta \Delta y =f(x+\Delta x) -f(x).
  3. In alcuni problemi, per i quali entrambe le formule sono utilizzabili, si confronta la soluzione esatta con quella approssimata e si può verificare come la soluzione approssimata sia ampiamente sufficiente.

Esercizi

La derivata delle funzioni composte e delle funzioni inverse.

Derivata come coefficiente di dilatazione

L’equazione dy=f'(x)dx, esatta a meno di infinitesimi di ordine superiore, può essere interpretata in un nuovo modo. Se dx \mbox{ e } dy si intendono come segmenti infinitesimi, allora |f'(x)| è il coefficiente che trasforma la misura |dx| nella misura |dy|. Per esempio, se la derivata vale 2 (dy=2dx), una variazione infinitesima di x si riflette in una variazione doppia di y. Il segno della derivata ci dice se l’orientamento dei due segmenti infinitesimi è concorde o discorde. Per esempio, l’espressione dy=-3dx mostra che la variazione infinitesima di x produce una variazione tripla di y, ma di segno opposto: se x cresce, y decresce di tre volte tanto.

Funzione di funzione e sua derivata

Immaginiamo di avere una funzione f(x), definita su un intervallo I_1, f:I_1\to \mathbf{R} che trasforma x in u=f(x), e un’altra funzione g:I_2\to \mathbf{R}, con f(I_1)\subseteq I_2 che trasforma u in y=f(u). Le due funzioni si possono comporre, cioé applicare successivamente l’una ai valori dell’altra in modo che la loro composizione g\circ f trasformi x\in I_1 \mbox{ in } g(f(x))=g(u)=y\in \mathbf{R}. Se f è derivabile in x, per esempio con f'(x)= 2, e g è derivabile in u=f(x), per esempio g'(u)= -3, vuol dire che ad un incremento infinitesimo dx corrisponde un incremento doppio du=2dx e che a questo incremento infinitesimo du corrisponde un incremento triplo, ma di segno opposto, dy=-3du=-3(2dx) . Sicché alla fine l’incremento infinitesimo è dy=-6dx.

f(g(x))

y'=(g\circ f)'=f'g'

Il disegno mette i valori x del dominio di f sull’asse verticale verso il basso. Quei valori u=f(x) che fanno parte del codominio di f e che costituiscono il dominio di g sono sull’asse orizzontale. Grazie ai microscopi si può seguire il percorso che trasforma la variazione infinitesima dx nella variazione finale dy=-6dx attraverso il passaggio intermedio du=2dx .

La funzione f si deriva nel punto x, mentre la funzione g si deriva nel punto u=f(x).

g-f

Abbiamo dy=g’(u)du e du=f’(x)dx, quindi dy=g’(u)f’(x)dx. In pratica la derivata della composizione di due funzioni è il prodotto delle due derivate.

  • D(g\circ f)(x)=\frac{dy}{dx}=D(g(f(x))\cdot Df(x)

La regola è importantissima e di uso assai frequente.

Esempi
  • Derivare y=\sin x^2.

In questo esempio u=f(x)=x^2\mbox{ e } y=g(u)=\sin u. g'(u)=\cos u \mbox{ e } f'(x)=2x, quindi y'=g'(u)f'(x)=\cos x^2(2x)=2x\cos x.

  • Derivare y=sin^2 x.

Questa volta u=f(x)=\sin x \mbox{ e } y=g(u)=u^2. g'(u)=2u \mbox{ e } f'(x)=\cos x, ne risulta y'=g'(u)f'(x)=2\sin x\cos x.

Nota. Evidentemente \sin x^2 \mbox{ e } \sin^2 x sono funzioni diverse.

  • Derivare \sqrt{x^2-8x+15}.

u=f(x)=x^2-8x+15 \mbox{ e } y=g(u)=\sqrt{u}.

y'=g'(u)f'(x)= \frac{1}{2\sqrt{u}}(2x-8)=\frac{2x-8}{\sqrt{x^2-8x+15}}=\frac{x-4}{\sqrt{x^2-8x+15}}.

  • Derivare \sqrt{\frac{1}{x}}.

Sappiamo già svolgere questa derivata, con la regola delle potenze:

D\sqrt{\frac{1}{x}}=Dx^{-\frac{1}{2}}=-\frac{1}{2}x^{-\frac{3}{2}}=-\frac{1}{2x\sqrt{x}}.

La regola delle funzioni composte può essere usata anche in questo caso, anche se è meno conveniente: u=f(x)=\frac{1}{x}\mbox{ e } y=g(u)=\sqrt u.

g'(u)=\frac{1}{2\sqrt{u}} \mbox{ e } f'(x)=-\frac{1}{x^2}, quindi y'=g'(u)f'(x)= \frac{1}{2\sqrt{\frac{1}{x}}}\frac{-1}{x^2}=\frac{\sqrt{x}}{2}\frac{-1}{x^2}=\frac{-1}{2x\sqrt{x}}.

Derivare la composizione di più funzioni

La regola non cambia se la funzione si compone di più di due funzioni. Con 3 funzioni: sia f: I_1\to\mathbf{R}\mbox{ , } g: I_2\to\mathbf{R}\mbox{ , } h: I_3\to\mathbf{R}\mbox{ , con } f(I_1)\subseteq I_2\mbox{ e } f(I_2)\subseteq I_3. Allora esiste la funzione h~\circ~g~\circ~f:I_1\to\mathbf{R}, tale che (h\circ g\circ f)(x)=h(g(f(x))). Dato un x\in I_1, se u=f(x), v=g(u), y=h(v) e se queste funzioni sono derivabili, allora in corrispondenza di un incremento infinitesimo dx , le funzioni f, g, h subiranno gli incrementi du=f’(x)dx, dv=g’(f(x))du, dy=h(g(f(x)))dv e quindi dy=h'(g(f(x)))g'(f(x))f'(x)dx per cui vale ancora la regola del prodotto delle derivate (h\circ g\circ f)'(x)=h'(g(f(x)))g'(f(x))f'(x).

Esempio
  • Derivare y=\arctan^3\sqrt{x}.

Le tre funzioni sono u=\sqrt{x}\mbox{ , } v=\arctan u \mbox{ , }y=v^3. Quindi:

y'=Dv^3D\arctan u D\sqrt{x} = 3v^2\frac{1}{1+u^2}\frac{1}{2\sqrt{x}} =3\arctan^2 u\frac{1}{1+(\sqrt{x})^2}\frac{1}{2\sqrt{x}} =\frac{3\arctan^3\sqrt{x}}{2\sqrt{x}(1+x)}.

Problemi

1. Gonfiare il pallone.

Un pallone inizialmente sgonfio, viene gonfiato al ritmo di un litro al secondo. Con quale velocità sta aumentando la sua superficie dopo 5 secondi?

Poiché 1 l = 1 dm^3, il volume del pallone cresce ogni secondo di 1 dm^3 e la funzione che rappresenta il volume è V(t)=t. Per una sfera V=\frac{4}{3}\pi r^3 \mbox{ da cui }r=\sqrt[3]{\frac{3V}{4\pi}}. La superficie dipende dal raggio: S=4\pi r^2 e sostituendo r si ha: S(t)=4\pi\left(\frac{3V}{4\pi}\right)^{\frac{2}{3}}=4\pi\left(\frac{3t}{4\pi}\right)^{\frac{2}{3}}. Per sapere la velocità di espansione della superficie al quinto secondo occorre calcolare S’(5). Calcoliamo prima la derivata e poi poniamo t=5 . S'(t)=4\pi\frac{2}{3}\left(\frac{3t}{4\pi}\right)^{-\frac{1}{3}}\frac{3}{4\pi}=2\left(\frac{3t}{4\pi}\right)^{-\frac{1}{3}}. Per t=5 abbiamo: S'(5)=2\left(\frac{15}{4\pi}\right)^{-\frac{1}{3}}=1.89\ dm^2/s.

2. La distanza fra due treni.

Un treno parte alle 8 del mattino e viaggia verso Est alla velocità di 90 km/h, mentre un altro treno parte alle 9 di mattina dallo stesso punto e viaggia verso Nord alla velocità di 120 km/h. A quale velocità si stanno allontanando i due treni a mezzogiorno?

Rappresentiamo il moto dei due treni in un sistema di assi cartesiani, come nella figura.

prob_treni

Al tempo t il primo treno si trova sull’asse x alla posizione 90t, mentre il secondo treno si trova sull’asse y alla posizione 120(t-1) perché parte un’ora dopo il primo. La distanza fra i due treni è data dal Teorema di Pitagora: L(t)=\sqrt{(90t)^2+[120(t-1)]^2} di questa funzione dobbiamo calcolare la derivata rispetto al tempo e poi valutarla per t=4 (cioé 4 ore dopo la partenza).

L'(t)=\frac{8100\cdot 2t+14400\cdot 2(t-1)}{2\sqrt{8100t^2+14400(t-1)^2}}=\frac{900[9t+16(t-1)]}{30\sqrt{9t^2+16(t-1)^2}}=\frac{30(25t-16}{\sqrt{25t^2-32t+16}}.

L'(4)=\frac{30\times 84}{\sqrt{288}}=105\sqrt{2}=18.5\ km/h.

Derivare l’inversa di una funzione

Conosciamo già alcune regole di derivazione di funzioni inverse: per esempio delle radici, che sono inverse delle potenze. Ma non abbiamo individuato la regola che lega la derivata di una funzione alla derivata della sua inversa. È quello che stiamo per fare.

Sia f:I_1\to I_2 derivabile e invertibile. Esiste dunque la funzione inversa f^{-1}:I_2\to I_1. In generale, il fatto che f sia derivabile non ci assicura sull’esistenza della derivata di f^{-1}. Anzi, I_1 \mbox{ e }I_2 potrebbero anche essere disgiunti. Quindi, preso un x di I_2, non siamo certi che esista f(x) e quindi neanche f’(x) da mettere in relazione con l’eventuale (f^{-1})'(x).

Il grafico della funzione e il grafico della sua inversa sono simmetrici rispetto alla retta y=x. Grazie a questa simmetria i punti (x, f^{-1}(x)) del grafico dell’inversa trovano corrispondenza nei punti (f^{-1}(x), x)=(y,f(y)) del grafico della funzione.

D_inversa

Se puntiamo i microscopi non standard su punti corrispondenti dei due grafici, visualizziamo due segmenti che si corrispondono nella simmetria assiale y=x. Se f è derivabile in y~=~f^{-1}(x) e la derivata è diversa da zero (segmento non orizzontale), allora f^{-1} sarà derivabile in x (segmento non verticale).

Consideriamo un incremento infinitesimo dx sul grafico della inversa, che provoca un incremento df^{-1}=dy. Possiamo definire la derivata della funzione inversa Df^{-1}(x)=\frac{dy}{dx}. Ora controlliamo i differenziali simmetrici sul grafico della funzione f: si vede chiaramente che in ascissa e in ordinata sono scambiati: Df(f^{-1}(x))=Df(y)=\frac{dx}{dy}. La regola è dunque questa: le due derivate sono reciproche una dell’altra:

  • Df^{-1}(x)=\frac{1}{Df(y)}\mbox{, con }y=f^{-1}(x). Oppure: \frac{df^{-1}(x)}{dx}=\frac{1}{\frac{df(y)}{dy}}.

La derivata della funzione f^{-1} nel punto di ascissa x è il recipoco della derivata della funzione f nel punto y=f^{-1}(x).

Esempi e esercizi svolti
  • Calcolare Dy=D\sqrt{x} a partire da x=y^2: \frac{d\sqrt{x}}{dx}=\frac{dy}{dx}=\frac{1}{\frac{dx}{dy}}=\frac{1}{\frac{dy^2}{dx}}=\frac{1}{2y}=\frac{1}{2\sqrt{x}}.

Ritroviamo quindi un risultato già noto e lo stesso vedremo nei prossimi esempi.

  • Calcolare la derivata dell’arcotangente usando la formula dell’inversa.

f^{-1}(x)=y=\arctan x\mbox{. }f(y)=x=\tan y\mbox{ per }-\frac{\pi}{2}<y<\frac{\pi}{2}.

\frac{d\arctan x}{dx}=\frac{1}{\frac{d\tan y}{dy}}=\frac{1}{1+\tan^2 y}=\frac{1}{1+x^2}.

  • Calcolare la derivata dell’arcoseno:

f^{-1}(x)=y=\arcsin x\mbox{. }f(y)=x=\sin y\mbox{ per }-\frac{\pi}{2}<y<\frac{\pi}{2}.

\frac{d\arcsin x}{dx}=\frac{1}{\frac{d\sin y}{dy}}=\frac{1}{\cos y}=\frac{1}{\sqrt{1-\sin^2y}}=\frac{1}{\sqrt{1-x^2}} .

Nel trasformare \cos y=\pm\sqrt{1-\sin^2 x} abbiamo scartato i valori negativi, dato l’intervallo scelto per le y. Agli estremi di questo intervallo il denominatore si annulla, quindi la derivata dell’arcoseno non esiste per y=\pm\frac{\pi}{2}.

  • Calcolare la derivata della radice ennesima:

f^{-1}(x)=y=\sqrt[n]{x}\mbox{. }f(y)=x=y^n\ (x,y>0).

\frac{d\sqrt[n]{x}}{dx}=\frac{1}{\frac{dy^n}{dy}}=\frac{1}{ny^{n-1}}=\frac{1}{n\sqrt[n]{x^{n-1}}}.

Come si vede, la funzione non è derivabile per x=0. Anche questo risultato, come i prossimi, conferma quanto avevamo visto utilizzando la regola delle potenze.

  • Calcolare Dx^{\frac{3}{5}}, con la regola delle funzioni inverse.

f^{-1}(x)=y=x^{\frac{3}{5}}\mbox{. }f(y)=x=y^{\frac{5}{3}}.

\frac{dx^{\frac{3}{5}}}{dx}=\frac{1}{\frac{dy^{\frac{5}{3}}}{dy}}=\frac{1}{\frac{5}{3}y^{\frac{2}{3}}}=\frac{3}{5}\frac{1}{\left(x^{\frac{3}{5}}\right)^\frac{2}{3}}=\frac{3}{5x^{\frac{2}{5}}}=\frac{3}{5}x^{-\frac{2}{5}}.

  • Ricalcolare Dx^{\frac{3}{5}}, con la regola delle funzioni composte.

Pensiamo x^{\frac{3}{5}}=\sqrt[5]{x^3}. Allora u=f(x)=x^3 \mbox{ e } y=g(u)=\sqrt[5]{u}.

y'=g'(u)f'(x)= \frac{1}{5\sqrt[5]{u^4}}(3x^2)=\frac{3x^2}{5\sqrt[5]{\left(x^3\right)^4}}=\frac{3x^2}{5\sqrt[5]{x^{12}}}=\frac{3}{5\sqrt[5]{x^2}}=\frac{3}{5}x^{-\frac{2}{5}}.

Come si vede, si deve utilizzare anche la regola della derivata dell’inversa per il calcolo della radice ennesima.

Resta il dubbio che la derivata sia calcolabile solo con alcuni esponenti razionali e non con tutti. In effetti nel Cap.7 abbiamo anticipato la regola, come se valesse per tutti, ma senza dimostrarlo. Ora però siamo in grado di dimostrarlo.

  • Dimostrare che Dx^\frac{m}{n}=\frac{m}{n}x^{\frac{m}{n}-1} (il segno dell’esponente è qualsiasi).

Dx^\frac{m}{n}=D\sqrt[n]{x^m}=\frac{1}{n\sqrt[n]{\left(x^m\right)^{n-1}}}mx^{m-1}=\frac{mx^{m-1}}{n\sqrt[n]{x^{mn-m}}}=\frac{mx^{m-1}}{nx^\frac{mn-m}{n}}=\frac{m}{n}x^{m-1-\frac{mn-m}{n}}= \\ =\frac{m}{n}x^{\frac{mn-mn+m}{n}-1}=\frac{m}{n}x^{\frac{m}{n}-1}

  • Ricavare la regola della funzione inversa dalla regola della funzione composta.

Poiché la funzione composta è f(f^{-1}(x))=x, allora la derivata risulta f'(f^{-1}(x))(f^{-1})'(x)=1 e quindi, se f'(f^{-1}(x))\ne 0, ne consegue che (f^{-1})'(x)=\frac{1}{f'(f^{-1}(x))}.

In questa sintetica dimstrazione abbiamo dato per scontato che la funzione inversa sia derivabile.

Riassunto

  1. Due nuove regole per la derivata. La derivata di una funzione composta è il prodotto delle derivate delle due funzioni che la compongono.
  2. La derivata dell’inversa di una funzione è il reciproco della derivata di quest’ultima.
  3. Abbiamo applicato le due regole, fra le altre cose, anche per dimostrare quanto anticipato nel Cap. 7 sulla derivata di una radice ennesima e sulla derivata di una potenza con esponente razionale qualsiasi.

Esercizi

La derivata delle funzioni esponenziali e le derivate connesse.

Nel Cap.3 abbiamo visto che per le progressioni geometriche del tipo y_k=q^k il tasso di variazione è proporzionale alla successione stessa: \Delta q^k=(q-1)q^k, e che nel caso in cui q sia 2, allora è semplicemente uguale ad essa: \Delta 2^k=2^k.

Le funzioni esponenziali y=a^x corrispondono nel continuo alle progressioni geometriche nel discreto. Analizzando le tangenti di y=2^x nel Cap.8, abbiamo visto che il grafico delle pendenze delle tangenti accompagna il grafico della funzione, senza tuttavia coincidere. In questo capitolo concentriamo lo sguardo sulle funzioni esponenziali, per cercare

  • quale sia il numero a che rende l’espressione della derivata uguale a quella della funzione: Da^x=a^x
  • se esistono altre funzioni, oltre alle esponenziali, tali che \frac{df(x)}{dx}=f(x).

Derivata delle funzioni esponenziali

Iniziamo dal differenziale: da^x=a^{x+dx}-a^x=a^xa^{dx}-a^x=a^x(a^{dx}-1). Quindi la derivata è \frac{da^x}{dx}=\frac{a^{dx}-1}{dx}a^x. Perché la derivata risulti almeno proporzionale alla funzione, occorre che la derivata esista e che il coefficiente \frac{a^{dx}-1}{dx} non dipenda da dx ma solo da a, in modo da avere una parte standard ben precisa. Così possiamo definire provvisoriamente Da^x=c(a)a^x.

Il coefficiente c(a)=\frac{a^{dx}-1}{dx}, è stato ricavato applicando la proprietà caratteristica degli esponenziali: f(x+dx)=f(x)f(dx), per cui

\frac{df(x)}{dx}=\frac{f(x)f(dx)-f(x)}{dx}=\frac{f(dx)-1}{dx}f(x)=\frac{f(dx)-f(0)}{dx}f(x)=\frac{df(0)}{dx}f(x)=f'(0)f(x),

dato che per gli esponenziali f(0)=1. Dunque la derivata di un funzione esponenziale è direttamente proporzionale alla funzione e il coefficiente di proporzionalità è la derivata stessa, calcolata nel punto x=0

Cerchiamo adesso di capire come può essere che il coefficiente c(a) sia 1, così da raggiungere l’obiettivo che la derivata e la funzione abbiano la stessa espressione. Immaginiamo che a sia tale che \frac{a^{dx}-1}{dx}\sim 1. Allora a^{dx}-1\sim dx \to a^{dx}\sim 1+dx \to a\sim(1+dx)^{\frac{1}{dx}}.

C’è un numero che corrisponde a questa definizione ed è il numero e, la cui parte standard è e=st\left[(1+\epsilon)^\frac{1}{\epsilon}\right]. Si tratta del Numero di Nepero, la base dei logaritmi naturali, il cui valore approssimato è 1,71828... Più avanti, nella deduzione analitica del risultato che stiamo cercando, il numero e viene descritto con maggiori dettagli.

Quindi, se la funzione esponenziale è e^x\mbox{ , allora }De^x=e^x. Invece per determinare la derivata se a\ne e, dobbiamo cercare altre informazioni su c(a) ricorrendo alle proprietà degli esponenziali e alla regola della derivata del prodotto. Abbiamo:

D(ab)^x=c(ab)(ab)^x\\ D(ab)^x=Da^xb^x=c(a)a^xb^x+a^xc(b)b^x =[c(a)+c(b)](ab)^x

Ne risulta che c(ab)=c(a)+c(b). Abbiamo individuato la proprietà caratteristica del coefficiente c(a) : si comporta come una funzione logaritmica pura c(a)=\log_Ba, per cui Da^x=a^x\log_Ba.

Per coerenza con la regola appena trovata nel caso di e^x, l’unica base possibile per il logaritmo è B=e, perché \ln e = 1. Concludiamo quindi:

Da^x=a^x\ln a\quad. In particolare: De^x=e^x.

Note

Un’altra dimostrazione della regola Da^x viene proposta negli esercizi.

Unicità del risultato

Nel caso delle differenze abbiamo visto che \Delta 2^k=2^k e che lo stesso vale per y_k=c2^k. Anche nel continuo, l’esponenziale f(x)=e^x non è l’unica f(x) per cui vale \frac{df(x)}{dx}=f(x), perché avviene lo stesso per le funzioni f(x)=ce^x. Quindi le funzioni identiche alla propria derivata sono infinite e per ora sappiamo che hanno la stessa forma esponenziale ce^x. La domanda che ci poniamo è se non vi siano altri tipi di funzione con la stessa proprietà. Per capirlo procediamo dapprima costruendo il grafico di una di queste funzioni, le cui caratteristiche devono essere come quelle di ce^x, cioè

\frac{df(x)}{dx}=f(x) \mbox{ e }f(0)=c.

Infine, per raggiungere la certezza matematica dell’unicità della soluzione, dovremo approfondire la nostra conoscenza del numero e.

Costruzione grafica
tang_f'=f_12

Costruire il grafico di f(x)=ce^x: fasi 1 e 2.

tang_f'=f_34

Costruire il grafico di f(x)=ce^x: fasi 3 e 4.

1. La funzione passa per il punto generico (x,f(x)) e la tangente per quel punto con pendenza f(x) è la retta che ha coefficiente angolare \frac{f(x)-0}{x-(x-1)}=f(x), che passa per i punti ((x-1),0) e (x,f(x)).

2. Un secondo punto di tangente nota è il punto (0,c), dove la tangente è la retta di coefficiente angolare \frac{c-0}{0+1}. Questa passa per (0,c) \mbox{ e }(-1,0) .

3. Ora consideriamo \Delta x>0 vicino all’origine. Il valore corrispondente y sulla tangente appena trovata approssima il grafico della funzione. Anche rispetto a questo nuovo punto costruiamo una tangente, che interseca l’asse orizzontale in \Delta x - 1.

4. E si avanza così, verso destra (o anche verso sinistra), a piccoli passi \Delta x sull’asse x, per individuare sulla tangente un nuovo punto che approssima il grafico in (2\Delta x,f(2\Delta x)), che ci serve per disegnare una nuova tangente, sulla quale trovare un nuovo punto dopo esserci spostati a destra di un altro \Delta x, ecc. Come si vede, la costruzione approssima per segmenti tangenti il grafico di una funzione esponenziale e non c’è modo di costruire graficamente una funzione diversa a partire dalle due condizioni date.

Il procedimento grafico conduce a un risultato inevitabilmente approssimato operando nel continuo, come in questo caso. È invece un procedimento esatto se applicato alle differenze \Delta 2^k=2^k.

Delta_2^k=2^k

Costruzione per tangenti di 2^k

Infatti, nel disegno che mostra la costruzione, i punti (0,1) (1,2) (2,4) (3,8) ... si trovano sulle rette tangenti, tracciate come nel procedimento precedente, incrementando di 1 ad ogni passo il valore in ascissa. La base 2 nella successione y_k=2^k si comporta come la base e nella funzione f(x)=e^x.

Deduzione analitica

Dapprima concentriamo la nostra attenzione sul numero e per ricavare due utili proprietà.

Il numero e

La definizione usuale del numero di Eulero è e=st\left[\left(1+\frac{1}{N}\right)^N\right], con N ipernaturale infinito. Questo significa che la successione y_k=\left(1+\frac{1}{k}\right)^k individua nei suoi termini di ordine infinito valori situati nella monade di e. Per valori infiniti dell’indice, i termini della successione sono tutti finiti ed hanno la stessa parte standard: e. Assumiamo come vere queste due importanti proprietà e esaminiamo le loro conseguenze nel caso si usino numeri genericamente iperreali.

La prima conseguenza utile è che per qualsiasi s infinito positivo, non necessariamente iperintero, si ha \left(1+\frac{1}{s}\right)^s\approx e. Infatti, se s=\infty e chiamando N la parte intera di s: \lfloor s\rfloor=N ipernaturale, si ha:

N\le s<N+1 \quad\rightarrow\quad
\frac{1}{N+1}<\frac{1}{s}\le\frac{1}{N} \quad\rightarrow\quad
1+\frac{1}{N+1}<1+\frac{1}{s}\le1+\frac{1}{N}

Ne consegue:

\left(1+\frac{1}{N+1}\right)^N<
\left(1+\frac{1}{s}\right)^s\le
\left(1+\frac{1}{N}\right)^{N+1}

Il primo termine della doppia disuguaglianza appartiene alla monade di e. Infatti

\left(1+\frac{1}{N+1}\right)^{N}=
\frac{\left(1+\frac{1}{N+1}\right)^{N+1}}{\left(1+\frac{1}{N+1}\right)}
\approx\frac{e}{1}=e.

Poiché dalla definizione di e ricaviamo \left(1+\frac{1}{N+1}\right)^{N+1}\approx e e \left(1+\frac{1}{N+1}\right)\approx 1.

Per ragioni analoghe, anche l’ultimo termine della disuguaglianza appartiene alla monade di e. Infatti

\left(1+\frac{1}{N}\right)^{N+1}=
\left(1+\frac{1}{N}\right)^N\left(1+\frac{1}{N}\right)\approx e\cdot 1=e

Dunque anche il termine centrale \left(1+\frac{1}{s}\right)^s\approx e.

Si può dimostrare che lo stesso vale per qualsiasi s infinito positivo o negativo.

La seconda proprietà utile riguarda il numero \left(1+\frac{x}{s}\right)^s\mbox{, con }s=\pm \infty e x standard. Se x=0 risulta banalmente 1. Altrimenti sostituiamo ponendo y=\frac{s}{x}, che è un numero infinito al pari di s e s=xy. Risulta:

\left(1+\frac{x}{s}\right)^s=
\left(1+\frac{1}{y}\right)^{xy}=
\left[\left(1+\frac{1}{y}\right)^y\right]^x\approx e^x

In conclusione, per qualsiasi x:

s=\pm\infty \rightarrow \left(1+\frac{x}{s}\right)^s\approx e^x

Se una funzione coincide con la sua derivata allora è di tipo esponenziale

Le condizioni iniziali sono: \frac{df(x)}{dx}=f(x) \mbox{ e }f(0)=c. Prendiamo un numero x positivo (la dimostrazione non cambia nel caso negativo). Dividiamo l’intervallo 0 - x in un numero ipernaturale infinito N di parti uguali, ciascuna di ampiezza \delta=\frac{x}{N}, inserendo i punti x_0=0, \ x_1=\frac{x}{N},\  x_2=\frac{2x}{N},\ ... \ x_N=\frac{Nx}{N}=x. Tralasciando gli infinitesimi di ordine superiore a \delta, abbiamo: f(x_1)=f(x_0)+f'(x_0)(x-x_0)=f(x_0)+f'(x_0)\delta. Dato che la funzione coincide con la sua derivata, possiamo scrivere:

f(x_1)=f(x_0)+f(x_0)\delta=f(x_0)(1+\delta)

f(x_2)=f(x_1)(1+\delta)=f(x_0)(1+\delta)^2

f(x_3)=f(x_2)(1+\delta)=f(x_0)(1+\delta)^3

...

f(x_N)=f(x_{N-1})(1+\delta)=f(x_0)(1+\delta)^N

ma f(x_0)=f(0)=c,\ \delta=\frac{x}{N},\ x_N=x.

Abbiamo così dimostrato che la nostra funzione è f(x)=c\left(1+\frac{x}{N}\right)^N=ce^x.

Derivare i logaritmi

La prima conseguenza della regola trovata per gli esponenziali è la regola per i logaritmi. Poiché la funzione y=\ln x è inversa di x=e^y si può applicare la regola della derivata dell’inversa: \frac{d\ln x}{dx}=\frac{1}{\frac{de^y}{dy}}=\frac{1}{e^y}=\frac{1}{x}. La regola si applica anche al caso generale D\log_a x, perché \log_a x=\frac{\ln x}{\ln a}. Quindi: D\log_a x= D\frac{\ln x}{\ln a}=\frac{1}{x\ln a}.

exp_x_ln_x

Non è difficile visualizzare questa regola con un grafico. Le due funzioni, esponenziale e logaritmica, sono inverse l’una dell’altra e quindi i loro grafici sono simmetrici rispetto a y=x. Un punto P sul grafico della funzione logaritmo ha coordinate (x,y)=(x,\ln x). Il suo simmetrico P’ ha coordinate (y,x)=(y,e^y). La pendenza della tangente in P’ è x, il valore della funzione stessa, perché si tratta del grafico di un’esponenziale. Allora la pendenza nel punto simmetrico P sara reciproca: \frac{1}{x}. In conclusione:

  • D\log_a x=\frac{1}{x\ln a}\\ \mbox{ e in particolare } D\ln x= \frac{1}{x}

Derivare una funzione che ha per esponente un’altra funzione

Iniziamo dal caso più semplice: Dx^x. Se la si considera una potenza si ha: Dx^x=xx^{x-1}=x^x e quindi siamo di fronte ad una nuova funzione identica alla sua derivata. Se invece la si considera come un’esponenziale abbiamo: Dx^x=x^x\ln x. Però se varia la base, non è un’esponenziale e se varia l’esponente non è una potenza. Ma la formula del cambio di base ci aiuta: x^x=e^{x\ln x}. La derivata allora usa la regola degli esponenziali e delle funzioni composte:

Dx^x=De^{x\ln x}=e^{x\ln x}(1\cdot\ln x+x\frac{1}{x})=x^x(\ln x +1).

Nel caso generale si ha Df(x)^{g(x)} e si procede nello stesso modo.

Df(x)^{g(x)}=De^{g(x)\ln f(x)}=
e^{g(x)\ln f(x)}\left[g'(x)\ln f(x)+g(x)\frac{1}{f(x)}f'(x)\right]=\\
=f(x)^{g(x)}\left[g'(x)\ln f(x)+g(x)\frac{f'(x)}{f(x)}\right].

Regola finale sulle funzioni potenza.

Siamo ora in grado di dimostrare che la regola della derivata di una potenza è del tutto generale: resta la stessa anche con esponente reale qualsiasi. Occorre usare la regola degli esponenziali, la formula del cambio di base e la regola delle funzioni composte x^\alpha = e^{\ln x^\alpha }=e^{\alpha\ln x}.

Dx^\alpha = De^{\alpha\ln x}=e^{\alpha\ln x}\alpha\frac{1}{x}=
x^\alpha\frac{\alpha}{x}=\alpha x^{\alpha-1}.

Problemi

Il decadimento radioattivo

Una sostanza radioattiva decade spontaneamente, cioé riduce la propria massa liberando radioattività in proporzione alla massa residua R(t), secondo una legge che dipende dal tempo dt. Scrivi la legge matematica del decadimento.

Abbiamo: dR(t)=-kR(t)dt, con -k negativo perché si tratta di un decremento. L’equazione si riscrive come quella di una funzione proporzionale alla propria derivata \frac{dR(t)}{dt}=-kR(t), che ha per soluzioni: R(t)=ce^{-kt}. Come abbiamo visto, la costante c=R(0)=R_0 è la funzione calcolata nel punto 0, in questo caso la massa iniziale. La soluzione è quindi: R(t)=R_0e^{-kt}. k è caratteristica di ogni sostanza.

L’attenuazione luminosa

Un raggio di luce che attraversa una lastra semitrasparente subisce un’attenuazione che dipende dalla natura della lastra e dal suo spessore. Ricava la legge di Lambert Beer che mette in relazione l’intensità del raggio trasmesso con quella del raggio incidente.

Se la lastra ha uno spessore apprezzabile e riduce l’intensità luminosa per esempio del 30%, due di quelle lastre avranno una trasparenza del 70% del 70%, cioé del 49%, non del 60%. Insomma con spessori cospicui la trasparenza non è proporzionale allo spessore. La proporzionalità si conserva, a meno di infinitesimi di ordine superiore, se si immagina che la lastra sia composta da infiniti strati uguali di spessore infinitesimo. In questo caso, se ds è l’incremento di spessore infinitesimo, l’intensità della luce trasmessa I(s) diminuisce di una quantità kI(s)ds. Si ha allora dI(s)=-kI(s)ds e quindi \frac{dI(s)}{ds}=-kI(s). E’ ancora una volta un’equazione in cui si cerca l’espressione di una funzione proporzionale alla propria derivata, con f(x)=I(s), che ha per soluzione f(x)=ce^{ax}\mbox{ con }c=f(0). Cioé I(s)=ce^{-ks}=I_0e^{-ks}\mbox{, con }c=I_0 perché se lo spessore è nullo l’intensità è quella iniziale.

Riassunto

  1. Si illustra per via grafica e si dimostra per via analitica la derivata De^x=e^x e la regola più generale Da^x=a^x\ln a.
  2. La funzione e^x è la sola funzione uguale alla propria derivata, la funzione a^x è l’unica proporzionale alla propria derivata.
  3. Da questa regola conseguono quelle per le funzioni logaritmo, per le funzioni che hanno per esponente altre funzioni e la regola generale sulle funzioni potenza.

Esercizi

  1. Ricava la regola della derivata Da^x conoscendo la regola di De^x. Utilizza la regola per derivare le funzioni composte e la trasformazione a^x=e^{ln a^x}.
  2. Calcola D\sin^x x e esplicita per quali valori il risultato ha senso.
  3. Compila la lista di tutte le regole di derivazione viste fino a questo punto.

Il comportamento asintotico

Convergenza e divergenza delle successioni

Iniziamo dall’esempio noto (vedi 12.2): i termini di indice infinito della successione y_k=\left(1+\frac{1}{k}\right)^k che definisce il Numero di Nepero hanno tutti la stessa parte standard e. Si dice allora che la retta y=e è un asintoto per la successione, cioè i punti del grafico della successione, per indici infiniti, sono indistinguibili dai punti della retta.

asintoto_Nepero

Il comportamento asintotico di y_k=\left(1+\frac{1}{k}\right)^k

Si dice che la successione è asintoticamente uguale a e. In generale si dice che una successione \langle y_k\rangle_m^{+\infty} converge al numero standard s se y_N=s per ogni indice N infinito. \left(1+\frac{1}{k}\right)^k<4 per tutti i naturali k ed è crescente e il fatto che converga, come vedremo, è un esempio di quanto avviene per tutte le successioni monotone e limitate.

Due esempi

Le biglie bianche. Qual’è la probabilità di estrarre una biglia bianca da un sacchetto in cui tutte sono bianche, tranne una?

Abbiamo k+1 biglie, di cui k sono bianche. Con due biglie in tutto la frazione \frac{k}{k+1} che rappresenta la probabilità in questione, è prossima a \frac{1}{2}. Ma se consideriamo numeri sempre più grandi troviamo che la successione y_k=\frac{k}{k+1} converge a 1 (oppure che asintoticamente è uguale a 1), dato che y_N=\frac{N}{N+1}\sim \frac{N}{N}=1, quando N è ipernaturale infinito.

L’ordinamento di un vettore. Per ordinare un vettore a di k numeri uso il seguente algoritmo: confronto il primo elemento con tutti gli altri e se ad ogni confronto lo trovo maggiore, eseguo lo scambio. Quando ho finito con il primo elemento, procedo allo stesso modo con il secondo. Questo è l’algoritmo:

sort

Quale legge collega il numero di confronti y_k alla lunghezza k del vettore?

Per determinare il primo termine devo fare k-1 confronti, per il secondo i confronti sono k-2 e così via fino al penultimo, che si sistema grazie ad un confronto. Quindi in tutto i confronti sono (1+2+3+..(k-2)+(k-1))=\frac{k(k-1)}{2}. Immaginiamo un vettore infinito. Allora \frac{k(k-1)}{2}=\frac{N(N-1)}{2}\sim\frac{N^2}{2} , cioè il numero di confronti diverge positivamente ed è asintotico a \frac{N^2}{2}

Diciamo che una successione \left\langle y_k\right\rangle_m^{+\infty} diverge positivamente (negativamente) se per ogni indice infinito N si ha y_N=+\infty (y_N=-\infty).

Criterio per le successioni monotone

Teorema. Se una successione è crescente, il suo comportamento asintotico ha solo due possibilità: o diverge positivamente o converge. Le due situazioni appena descritte esemplificano questo teorema, che dimostriamo. Dobbiamo provare che i termini di indice infinito o sono infiniti oppure hanno tutti la stessa parte standard.

a) La successione diverge, supponiamo positivamente: cioè per i termini di indice infinito vale y_N=+\infty. Se per assurdo non fosse così, allora esisterebbe un indice M per cui y_M è finito, cioè esisterebbe un numero standard s tale che y_M\le s. Dato che la successione è crescente, si ha che y_k<~y_M\le s per tutti gli indici naturali k. Ora questo non è possibile che valga solo per gli indici naturali, deve valere anche per gli ipernaturali, quindi anche per M e questo contraddice l’ipotesi. In conclusione se un termine con indice infinito è infinito, lo sono anche gli altri con indice infinito.

b) Escludendo il caso a), la successione non diverge. Mostriamo allora che i termini di indici infinito hanno la stessa parte standard. Se, per assurdo, esistessero due indici infiniti M e N, con M<N tali che s_1=st(y_M)\ne st(y_N)=s_2 allora s_1<s_2 perché la successione è crescente. Fra i due numeri potrebbe allora esistere un s=\frac{s_1+s_2}{2}. Si avrebbe che y_k<y_M<s per ogni naturale k perché la successione è crescente. Dovrebbe valere lo stesso anche per l’indice infinito N. Dato che s_2>s questo è assurdo. In conclusione se la successione è crescente e non diverge, non può che convergere allo stesso valore.

Dalla doppia dimostrazione precedente ricaviamo una regola fondamentale: se una successione monotona è limitata, allora converge.

Tutto questo si applica in modo analogo alle successioni non decrescenti e anche a quelle decrescenti o non crescenti. Queste due ultime o convergono o divergono a -\infty.

In generale una successione non ha un comportamento asintotico come quelli descritti, perché non è detto che sia monotona. Per esempio la successione \left\langle(-1)^k\right\rangle_0^{+\infty}=1,-1,1,-1,..., vale 1 se k è pari, -1 se k è dispari, quindi oscilla senza convergere, nemmeno all’infinito. Invece la successione \left\langle(-2)^k\right\rangle_0^{+\infty}, per k=N oscilla fra l’infinito positivo e quello negativo, a seconda della parità di N. Un comportamento ancora diverso è quello della successione 1,2,1,3,1,4,1,5..., che alterna il comportamento convergente,a quello divergente, a seconda dell’indice. In conclusione, cerchiamo un criterio da applicare (anche) alle successioni non monotone, per identificarne il comportamento asintotico in modo stringente.

Criterio per le successioni esponenziali

Teorema. Una successione del tipo y_k=aq^k, con a e q positivi

  • converge a zero se q<1
  • converge ad a, se q=1
  • diverge positivamente, se q>1

Il primo caso si dimostra in riferimento al terzo caso. Infatti q^N=\frac{1}{(1/q)^N}, con \frac{1}{q}>1. Poiché \left(\frac{1}{q}\right)^N diverge (vedi terzo caso), allora q^N è un infinitesimo. Il secondo caso è banale. Nel terzo caso, poiché q>1, possiamo scrivere come q=1+p\ (p>0). Quindi q^k=(1+p)^k>kp. Allora q^N>Np, che è un infinito positivo, per cui, a maggior ragione, anche q^N lo è.

Criterio del rapporto e gerarchia di infiniti

Immaginiamo che il rapporto fra due termini successivi in una successione a termini positivi \frac{y_k}{y_{k-1}} sia asintoticamente uguale a un numero standard q, cioè che valga \frac{y_N}{y_{N-1}}\approx q.

  • Se q>1, la successione diverge positivamente.
  • Se q<1 la successione converge a zero,
  • mentre nulla si può dire se q=1, perché se il rapporto è indistinguibile da 1, non vuol dire che sia uguale a 1.

Proviamo questo criterio sulla successione y_k=\frac{2^k}{k^2}, che vale all’infinito y_k=\frac{2^N}{N^2}. Il rapporto da analizzare è:

\frac{y_N}{y_{N-1}}=\frac{2^N/N^2}{2^{N-1}/(N-1)^2}=
\frac{2(N-1)^2}{N^2}\sim\frac{2N^2}{N^2}=2

Quindi la successione y_k=\frac{2^k}{k^2} diverge positivamente.

Una conseguenza di questo comportamento asintotico è che 2^k è un infinito di ordine superiore a k^2. Anzi, si può dimostrare, più in generale, che se a>1, allora a^N è un infinito di ordine superiore rispetto a N^p: l’esponenziale, se la base è maggiore di 1, è un infinito di ordine superiore rispetto a qualsiasi potenza con la stessa base.

Per capire quali successioni hanno un comportamento asintotico superiore ad altre, proviamo alcuni confronti. Per esempio confrontiamo a^N con N!, usando il criterio del rapporto per la successione y_k=\frac{a^k}{k!}. Abbiamo

\frac{y_N}{y_{N-1}}=\frac {a_N/N!}{a^{N-1}/(N-1)!}=\frac{a}{N}\approx 0<1.

Poiché il rapporto converge a zero, il denominatore, cioè N!, è un infinito di ordine superiore.

Effettuati tutti i confronti, la gerarchia in ordine crescente risulta: N^p, a^N, N!, N^N.

Note

Il criterio del rapporto non vale al contrario: se la successione diverge non è detto che il rapporto sia q>1 e se converge a zero non è detto che sia q<1. C’è infatti il rischio che il rapporto risulti indistinguibile da 1, come nei casi di y_k=k e z_k=1/k

Criterio della radice

A volte si ottengono utili indicazioni sul comportamento asintotico di una successione \langle y_k\rangle_m^{+\infty} a termini positivi, calcolando la radice ennesima dei termini infiniti y_N.

Se per ogni N si ha \sqrt[N]{y_n}\approx q, allora

  • se q>1, y_k diverge positivamente
  • se q<1, y_k converge a zero

La dimostrazione di questo criterio, che omettiamo, fa riferimento al criterio delle successioni esponenziali.

Criterio del rapporto fra le differenze

Il criterio riguarda le successioni che sono quozienti di successioni con lo stesso carattere.

Se \langle y_k\rangle_m^{+\infty} e \langle z_k\rangle_m^{+\infty} sono successioni entrambe divergenti o entrambe convergenti a zero e se la successione \left\langle\frac{\Delta y_k}{\Delta z_k}\right\rangle_m^{+\infty} ha un comportamento asintotico regolare, cioè converge o diverge, allora anche la successione \left\langle\frac{y_k}{z_k}\right\rangle_m^{+\infty} ha lo stesso comportamento asintotico, cioè : \frac{y_N}{z_N}=\frac{\Delta y_N}{\Delta z_N}. La regola vale se le differenze al denominatore hanno tutte lo stesso segno

Per fare un esempio, consideriamo la successione y_k=\frac{2^k}{k}, che è data dai quozienti di due successioni entrambe divergenti. La regola ci dice che siccome \frac{\Delta y_n}{\Delta z_N}=\frac{2^N}{1}=2^N=+\infty, allora anche y_N=\frac{y_N}{z_N}=\frac{2^N}{N}\sim 2^N=+\infty

La regola è utile quando la successione asintoticamente è un rapporto fra due infiniti o fra due infinitesimi. Allora si può provare a mettere in rapporto le differenze del numeratore con le differenze del denominatore. Se questo rapporto risulta infinito oppure infinitesimo, anche la successione di partenza ha lo stesso carattere.

La regola si spiega graficamente. Supponiamo che la successione sia il rapporto fra y_k e z_k, entrambe divergenti e con le differenze \Delta z_k positive e che il rapporto fra le differenze converga: \frac{\Delta y_N}{\Delta z_N}\approx a. Mostriamo allora che converge anche \frac{y_N}{z_N}\approx a.

rapporto_diff

La regola del rapporto fra differenze nel caso in cui le due successioni

divergano

Immaginiamo di fissare nel piano cartesiano i punti (z_k, y_k). Il grafico che risulta è una spezzata che si prolunga verso destra, a causa delle differenze positive al denominatore. I segmenti di spezzata hanno pendenze date dai vari \frac{\Delta y_N}{\Delta z_N} e se queste pendenze all’infinito convergono, allora uno zoom non standard puntato sull’origine visualizza una semiretta di pendenza a che è indistinguibile da una semiretta uscente dall’origine. Per questo vale asintoticamente che \frac{y_n}{z_n}. Il fatto che la semiretta sembri partire dall’origine dipende dalla visualizzazione che ci dà lo zoom non standard, come se fosse lontano all’infinito.

rapporto_diff

La regola del rapporto fra differenze nel caso in cui le due successioni convergano

Lo stesso ragionamento si può fare se le due successioni convergono a zero, utilizzando questa volta un microscopio non standard.

Sperimentiamo la regola sul rapporto y_k=\frac{\ln k}{k}. Il rapporto delle differenze all’infinito ci dà

\frac{\Delta \ln N}{\Delta N}=\frac{\ln(N+1)-\ln N}{1}=\ln\frac{N+1}{N}\approx\ln 1=0

Ne concludiamo che \ln N è un infinito di ordine inferiore a N.

Convergenza e divergenza delle funzioni

Una funzione a dominio continuo può assumere il valore infinito agli estremi degli intervalli in cui è definita. In questo caso diremo che la funzione diverge. Vi sono funzioni che divergono per x=\infty, altre che divergono quando x appartiene alla monade di un numero finito. Vi sono invece funzioni che all’infinito, oppure quando x si avvicina indefinitamente ad un dato numero finito, assumono valori sempre più vicini a un valore finito. In questo caso si dice che convergono. Per studiare i dettagli, iniziamo da qualche esempio.

Funzioni esponenziali

Abbiamo già visto alcuni esempi di questo comportamento delle funzioni. Prendiamo per esempio, f(x)= a^x, con a>1: diverge positivamente per x=+\infty mentre converge a zero per x=-\infty. Si può anche dire che a^x diverge positivamente se x diverge positivamente ed è infinitesima se x diverge negativamente.

asintoti_a^x

Il comportamento asintotico di a^x

Potremo quindi scrivere sinteticamente per questi due casi: f(+\infty)=+\infty \mbox{ e }f(-\infty)\approx 0, e quindi, per esempio: 2^{+\infty}=+\infty\mbox{ e } 2^{-\infty}\approx 0

Ancora, una funzione si dice convergere a zero per x che diverge positivamente se per x infinito positivo si ha che f(x) è un infinitesimo. Una funzione si dice che diverge positivamente per x che diverge negativamente se per x infinito negativo si ha che f(x) è un infinito positivo.

Le funzioni divergenti non è detto che divergano solo se diverge la variabile. Vi sono funzioni il cui dominio esclude particolari valori di x, per esempio f(x)=\frac{1}{x^2-4}, definita per tutti gli x, tranne x=\pm2. In questi casi ci si chiede quale comportamento abbia la funzione se x assume valori nella monade dei numeri esclusi. Nel nostro esempio, si tratta di calcolare f(2\pm \delta)\mbox{ e }f(-2\pm\delta), con \delta infinitesimo non nullo. Uno dei calcoli è f(2+\delta)=\frac{1}{(2+\delta)^2-4}=\frac{1}{4+4\delta+\delta^2-4}=
\frac{1}{4\delta+\delta^2}\sim\frac{1}{4\delta} e il risultato è un infinito positivo o negativo, a seconda del segno di \delta. Supponiamo per semplicità che \delta sia positivo, allora avremo f(2+\delta)=+\infty\mbox{ e } f(2-\delta)=-\infty. Abbiamo quindi una funzione discontinua, che diverge (positivamente o negativamente, a seconda dei numeri che si considerano) quando la x si approssima ai valori +2 e -2.

In questi casi possiamo sottintendere \delta così: f(2+)=+\infty\mbox{ e }f(2-)=-\infty. Nel primo caso si intende dire che ci approssimiamo a x=2 per valori maggiori di 2 (o da destra), nel secondo caso per valori minori (da sinistra).

Logaritmi

Un secondo esempio di funzione divergente per x che non diverge è la funzione logaritmo, che diverge negativamente per gli x infinitesimi positivi, oltre a divergere positivamente per x che diverge positivamente. Scriveremo quindi: \log_a(0+)=-\infty\mbox{ e }\log_a(+\infty)=+\infty\ (a>1).

Funzioni circolari

Il seno e il coseno sono funzioni continue e per x divergente mantengono un comportamento irregolare: oscillante fra i valori -1 e 1. Per esempio, la funzione seno vale zero negli infiniti positivi del tipo N\pi, con N ipernaturale, mentre vale 1 negli infiniti positivi del tipo \frac{\pi}{2}+2N\pi.

asintoti_tan_x

Il comportamento asintotico di \tan x

Per la tangente, i punti interessanti sono del tipo \frac{\pi}{2}+k\pi. Poiché la funzione è periodica, consideriamo solo \frac{\pi}{2}. \tan\left(\frac{\pi}{2}-\right)=+\infty e \tan\left(\frac{\pi}{2}+\right)=-\infty. Invece per x che diverge la tangente ha un comportamento asintotico irregolare.

Il comportamento asintotico delle funzioni arcoseno e arcocoseno ...non esiste perché le funzioni sono continue e definite in un intervallo chiuso. Quindi mancano i punti di discontinuità nell’intervallo e mancano i punti infiniti per i quali studiare il comportamento asintotico. Invece l’arcotangente assume valori infinitamente vicini a \pi/2 per x che diverge positivamente e assume valori infinitamente vicini a -\pi/2 per x che diverge negativamente: \arctan(+\infty)\approx\pi/2\mbox{ e }\arctan(-\infty)\approx\-pi/2. Graficamente, questo significa che, grazie a un telescopio non standard posto orizzontalmente in \frac{\pi}{2}, il grafico della funzione arcotangente è indistinguibile da due rette orizzontali (y=\pm\pi/2) e per distinguere il grafico della funzione dalle rette occorre valersi anche di microscopi non standard.

Un caso notevole

sin_x_su_x

Grafico di f(x)=\frac{\sin x}{x}

La funzione y=\frac{\sin x}{x} non è definita in x=0, quindi è interessante studiare il suo comportamento per valori di x infinitesimi non nulli. Abbiamo già visto in esempi precedenti che per x\approx 0\mbox{, }\sin x\sim x. Quindi avremo che per x\approx 0\mbox{, }\frac{\sin x}{x}\approx 1. Mettendo la funzione in grafico, vediamo che per x che diverge la funzione è asintotica a zero, perché il denominatore diventa sempre più grande in valore assoluto e quindi il rapporto \frac{\sin}{x} dà risultati sempre più piccoli. Invece per valori di x molto piccoli, diversi da zero ma prossimi allo zero, il grafico della funzione si approssima a 1. Quando una funzione ha questo tipo di comportamento: f(a\pm\delta)\approx s, possiamo esprimerci anche in questo modo: per x\approx a \mbox{ e }x\ne a\mbox{ }f(x)\approx s oppure, sinteticamente, f(a\pm)\approx s, che nel nostro caso diventa \frac{\sin (0\pm)}{0\pm}\approx 1.

Per tornare al comportamento della funzione, osserviamo che per x=0 manca il valore della funzione, perché in quel punto non è definita, ma il valore che manca è prevedibile sulla base delle considerazioni appena fatte. Possiamo quindi risolvere la discontinuità e imporre f(0)=1, aggiungendo il risultato mancante. In conclusione con il nostro intervento ridefiniamo la funzione in questo modo:

f(x)=\begin{cases} \frac{sin x}{x}, & \mbox{se }x\ne 0 \\ 1, & \mbox{se }x=0\end{cases}

Regola di de L’Hôpital

Il caso precedente introduce una regola importante, che permette di valutare, nei casi dubbi, il comportamento asintotico del rapporto fra due funzioni. Nell’illustrare questa regola ci accorgeremo di percorrere ragionamenti simili a quelli visti a proposito del criterio del rapporto fra differenze, nelle successioni.

hopital

La Regola di de L’Hôpital

y=f(x) e z=g(x) sono due funzioni, definite per esempio su un intervallo illimitato a destra, con f(+\infty)=+\infty\mbox{ e }g(+\infty)=+\infty, sono entrambe derivabili, con g'(x) \neq 0. Se vale \frac{f'(+\infty)}{g'(+\infty)}\approx s, allora il quoziente delle funzioni ha lo stesso comportamento asintotico del quoziente delle derivate, cioè

\frac{f(+\infty)}{g(+\infty)}=\frac{f'(+\infty)}{g'(+\infty)}\approx s.

Per ogni valore di x consideriamo le coppie (z,y)=(g(x), f(x)) e mettiamo in grafico i punti relativi, con gli z come ascisse: ne risulterà una certa curva nel piano cartesiano. Il grafico si sviluppa verso destra perché g(x) è crescente (la sua derivata è positiva). Si tratta quindi del grafico di una nuova funzione, che per un certo valore x avrà pendenza

\frac{dy}{dz}=\frac{f'(x)dx}{g'(x)dx}=\frac{f'(x)}{g'(x)}\approx s.

Nel disegno, il telescopio visualizza all’infinito che il grafico della curva è indistinguibile da una semiretta che ha pendenza s. Osservando l’origine con uno zoom non standard, quindi da una distanza infinita, si vede la semiretta come se uscisse dall’origine, indistinguibile da una retta di equazione y=sz. Questo determina l’uguaglianza all’infinito fra il rapporto delle funzioni e il rapporto dei differenziali.

Nel nostro esempio abbiamo supposto g(x) crescente, ma la dimostrazione vale anche se g'(x)<0.

Si può applicare lo stesso ragionamento anche se le due funzioni convergono a zero quando x diverge all’infinito e anche quando x converge nella monade di un numero standard.

Esempio

Studiamo il comportamento asintotico della funzione f(x)=x\ln x nello zero. Si tratta di una forma indeterminata perché f(0+)=(0+)\ln(0+)=(0+)(-\infty). Riscriviamo la funzione come un rapporto: x\ln x=\frac{\ln x}{1/x}. In questo modo la forma indeterminata diventa un quoziente fra infiniti. La derivata del denominatore è -\frac{1}{x^2}, cioè è sempre negativa e possiamo applicare la regola di De L’Hôpital per determinare il comportamento asintotico della funzione: \frac{D\ln x}{D1/x}~=~\frac{1/x}{-\frac{1}{x^2}}=-x, che diventa infnitesimo per x=0+. Quindi f(0+)=0+\ln(0+)\approx 0

Gli asintoti

Una retta è un asintoto per una funzione se i loro due grafici sono indistinguibili a una distanza infinita dall’origine. Per esempio l’asse y è un asintoto per le funzioni logaritmiche e la retta y=\frac{\pi}{2} è un asintoto per l’arcotangente.

Quadro dei comportamenti asintotici

In sintesi, una funzione a dominio continuo può avere questi comportamenti:

  • f(a+)\approx s: \quad\mbox{ se }\delta>0\mbox{ allora }f(a+\delta)\approx s
  • f(a+)=+\infty: \mbox{ se }\delta>0\mbox{ allora }f(a+\delta)=+\infty
  • f(a+)=-\infty: \mbox{ se }\delta>0\mbox{ allora }f(a+\delta)=-\infty
  • f(a-)\approx s:\quad\mbox{ se }\delta>0\mbox{ allora }f(a-\delta)\approx s
  • f(a-)=+\infty: \mbox{ se }\delta>0\mbox{ allora }f(a-\delta)=+\infty
  • f(a-)=-\infty: \mbox{ se }\delta>0\mbox{ allora }f(a-\delta)=-\infty
  • f(a\pm)\approx s:\quad\mbox{ se }\delta>0\mbox{ allora }f(a\pm\delta)\approx s
  • f(a\pm)=+\infty: \mbox{ se }\delta>0\mbox{ allora }f(a\pm\delta)=+\infty
  • f(a\pm)=-\infty: \mbox{ se }\delta>0\mbox{ allora }f(a\pm\delta)=-\infty
  • f(+\infty)\approx s:\quad\mbox{ se }x=+\infty\mbox{ allora }f(x)\approx s
  • f(+\infty)=+\infty:\quad\mbox{ se }x=+\infty\mbox{ allora }f(x)=+\infty
  • f(+\infty)=-\infty:\quad\mbox{ se }x=+\infty\mbox{ allora }f(x)=-\infty
  • f(-\infty)\approx s:\quad\mbox{ se }x=-\infty\mbox{ allora }f(x)\approx s
  • f(-\infty)=+\infty:\quad\mbox{ se }x=-\infty\mbox{ allora }f(x)=+\infty
  • f(-\infty)=-\infty:\quad\mbox{ se }x=-\infty\mbox{ allora }f(x)=-\infty

Asintoti verticali, orizzontali, obliqui.

Non è detto che una funzione abbia degli asintoti, ma se ne ha possono essere di tre tipi e possono anche essere tutti e tre presenti per la stessa funzione.

Asintoti verticali
asintvert

Un asintoto verticale è una retta di equazione x=c, per cui la funzione assume valori infiniti positivi o negativi se x si avvicina infinitamente a c. Questo accade per le funzioni logaritmo, per le funzioni tangente e per tutte le funzioni per le quali è possibile uno dei casi seguenti:

f(c+)=+\infty, f(c+)=-\infty, f(c-)=+\infty, f(c-)=-\infty, f(c\pm)=+\infty, f(c\pm)=-\infty.

Una funzione può avere anche infiniti asintoti verticali.

Asintoti orizzontali
asintoriz

Gli asintoti orizzontali sono le rette di equazione y=c e possono valere le scritture:

f(+\infty)\approx c,\quad f(-\infty)\approx c,\quad f(\pm\infty)\approx c.

Il primo caso è un asintoto orizzontale destro (per es. 2^x), il secondo è un asintoto orizzontale sinistro (per es. 0.5^x). Una funzione può avere anche entrambi i tipi, ma ovviamente non più di due.

Asintoti obliqui

Una retta del tipo y=mx+q\mbox{, con }m\ne 0 è un asintoto obliquo per la funzione f(x) se f(x)\approx mx + q per valori infiniti di x. L’asintoto obliquo può essere destro, per x=+\infty, come nel disegno, o sinistro x=-\infty.

asintobliquo

Il disegno mostra che la retta, osservata nell’origine con lo zoom non standard, passa per l’origine anche se q\ne 0, perché da una distanza infinita mx+q \sim mx. Se la retta è un asintoto obliquo, per esempio destro, per x=+\infty, f(x)\sim mx+q \sim mx e quindi \frac{f(x)}{x}\approx m. All’infinito, la funzione è quindi indistinguibile da due rette: y=mx+q e y=mx . Le due rette differiscono in ordinata per q e quindi la funzione è infinitamente vicina alla prima retta e differisce dalla seconda per q\approx f(x)-mx.

Quindi l’asintoto obliquo esiste a queste ben precise condizioni. Ovviamente la funzione può andare all’infinito anche senza che vi sia un asintoto obliquo. Se invece troviamo che c’è un asintoto obliquo, non è detto che q sia diverso da zero.

Esempi

  • Studia il comportamento asintotico di y=\frac{x^3+1}{x^2-5x+6}.

Il denominatore si scompone in (x-2)(x-3), quindi la funzione non è definita per x~=~2, x~=~3. Studiamo in questi punti il comportamento asintotico.

f(2+\delta)=\frac{(2+\delta)^3 +1}{(2+\delta-2)(2+\delta-3)}\sim
\frac{9}{-\delta}=\infty.

Quindi la retta x=2 è un asintoto verticale. Quando x si avvicina a 2 da sinistra cioè x~<~2~\rightarrow~\delta~<~0 il valore della funzione cresce a +\infty. Quando x si avvicina a 2 da destra cioè x>2 \rightarrow \delta>0, il valore della funzione decresce a -\infty.

Vediamo cosa succede per x=3\\ f(3-)=f(3-\delta)=
\frac{(3-\delta)^3+1}{(3-\delta-2)(3-\delta-3)}\sim\frac{-28}{\delta}=
-\infty\\ f(3+)=f(3+\delta)=
\frac{(3+\delta)^3+1}{(3+\delta-2)(3+\delta-3)}\sim\frac{28}{\delta}=+\infty.

Quindi anche x=3 è asintoto verticale, ma questa volta il grafico della funzione va a -\infty avvicinandosi alla retta da sinistra e va a +\infty da destra.

Vediamo cosa succede agli estremi dell’intervallo: per x=\pm \infty.

Poiché f(x)=\frac{x^3+1}{x^2-5x+6}\sim\frac{x^3}{x^2}=x, f(-\infty)=-\infty \mbox{ e }f(+\infty)=+\infty. Quindi la funzione all’infinito è un infinito.

Vediamo se nell’andare all’infinito, la funzione ha un asintoto obliquo. A sinistra: f(x) all’infinito è indistinguibile da una retta di pendenza m=1, e quindi di equazione y=x+q. Per verificare se q\ne 0 studiamo il comportamento asintotico di

q=f(x)-x=\frac{x^3+1}{x^2-5x+6}-x=
\frac{x^3+1-x^3+5x^2+6x}{x^2-5x+6}=
\frac{5x^2-6x+1}{x^2-5x+6}\sim\frac{5x^2}{x^2}=5.

Quindi l’asintoto sinistro è la retta y=x+5. Anzi, poiché i calcoli non cambiano nella ricerca di un asintoto destro, la stessa retta è anche asintoto obliquo destro. Per concludere, la funzione ha due asintoti verticali e un asintoto obliquo sinistro e destro.

  • Studia il comportamento asintotico di f(x)=\frac{1}{1-e^x}.

La funzione non è definita per x=0 perché e^0 annulla il denominatore. Quindi studiamo il comportamento asintotico in 0. f(0+\delta)=\frac{1}{1-e^\delta} è un infinito negativo se \delta>0, ma positivo se \delta<0. Infatti f(\delta)=f(0+)=\frac{1}{1-e^\delta}=\frac{1}{0-}=-\infty e f(-\delta)=f(0-)=\frac{1}{1-e^{-\delta}}=\frac{1}{0+}=+\infty.

Se x è un infinito: f(-\infty)=\frac{1}{1-e^{-\infty}}\approx\frac{1}{1-0}=1 e f(+\infty)=\frac{1}{1-e^{+\infty}}=
\frac{1}{1-(+\infty)}=\frac{1}{-\infty}=0- Quindi l’asse x è un asintoto orizzontale destro, mentre la retta y=1 è un asintoto orizzontale sinistro. Per concludere ci sono due asintoti orizzontali ed uno verticale.

  • Studia il comportamento asintotico in zero di f(x)=\frac{\sin^3 x - x^3}{\tan^5 x}.

Il numeratore e il denominatore diventano infinitesimi per x\approx 0, quindi la funzione diventa una forma indeterminata, che proviamo a risolvere applicando la regola di De l’Hôpital. \frac{D(\sin^3 x - x^3)}{D(\tan^5 x)}=
\frac{3\sin^2 x\cos x-3x^2}{5\tan^4 x(1+\tan^2 x)}. È ancora il quoziente di due infinitesimi, con espressioni più complicate. Rinunciamo a sviluppare di nuovo la stessa regola e riprendiamo da capo, trasformando la funzione. f(x)=\frac{\sin^3 x - x^3}{\tan^5 x}=
\frac{\sin^3 x - x^3}{\sin^5 x}\cos^5 x. Il vantaggio è che per x infinitesimo \cos^5 x\sim 1, quindi possiamo studiare il comportamento asintotico solo di g(x)=\frac{\sin^3 x - x^3}{\sin^5 x}. Trattandosi del rapporto fra due infinitesimi, applichiamo l’Hôpital e così facciamo ogni volta che il risultato ottenuto è un rapporto fra infinitesimi (il simbolo \overset{H}{=} indica che si è usata la regola di de l’Hôpital):

\frac{D(3\sin^2 x-3x^2)}{D(5\sin^4 x)}=\frac{6\sin x \cos^2 x-3\sin^3 x-6x}{20\sin^3x\cos x}\sim \frac{6\sin x\cos^2 x -3\sin^3 x-6x}{20\sin^3 x}\overset{H}{=}\\ \overset{H}{=}\frac{6\cos^3 x-12\sin^2 x\cos x-9\sin^2 x \cos x- 6}{60\sin^2\cos x}\sim \frac{2\cos^3 x-7\sin^2x\cos x-2}{20\sin^2 x}\overset{H}{=}\\ \overset{H}{=} \frac{-6\cos^2 x\sin x-14\sin x\cos^2 x+7\sin^3 x}{40 \sin x\cos x}\sim\frac{-6\cos^2x-14\cos^2 x+7\sin^2 x}{40\cos x }\sim\frac{-20}{40}=-\frac{1}{2}

\frac{D(3\sin^2 x-3x^2)}{D(5\sin^4 x)}=
\frac{6\sin x \cos^2 x-3\sin^3 x-6x}{20\sin^3x\cos x}\sim
\frac{6\sin x\cos^2 x -3\sin^3 x-6x}{20\sin^3 x}\overset{H}{=}\\
\overset{H}{=}
\frac{6\cos^3 x-12\sin^2 x\cos x-9\sin^2 x \cos x- 6}{60\sin^2\cos x}\sim
\frac{2\cos^3 x-7\sin^2x\cos x-2}{20\sin^2 x}\overset{H}{=}\\ \overset{H}{=}
\frac{-6\cos^2 x\sin x-14\sin x\cos^2 x+7\sin^3 x}{40 \sin x\cos x}\sim
\frac{-6\cos^2x-14\cos^2 x+7\sin^2 x}{40\cos x }\sim\frac{-20}{40}=
-\frac{1}{2}

Nello sviluppare i denominatori abbiamo sempre tenuto conto che \cos x\sim 1 e per questo abbiamo inserito il simbolo di \sim al posto =. In conclusione, la funzione assume valori sempre più prossimi a -\frac{1}{2} per x sempre più prossimo a zero.

Note

Nell’applicare la regola di de l’Hôpital alla funzione g(x) avremmo potuto scegliere anche una strada sbagliata: \frac{D(\sin^3 x - x^3)}{D(\sin^5 x)}=
\frac{3\sin^2 x \cos x-3x^2}{5\sin^4 x \cos x}\overset{?}{\sim}
\frac{3\sin^2 x-3x^2}{5\sin^4 x}, dato che \cos x\sim 1.

Si tratta ancora di una forma indeterminata, alla quale applichiamo di nuovo la stessa regola.

\frac{D(3\sin^2 x-3x^2)}{D(5\sin^4 x)}=
\frac{6\sin x \cos x-6x}{20\sin^3x\cos x}\overset{?}{\sim}
\frac{6\sin x -6x}{20\sin^3 x}=
\frac{3\sin x-3x}{10\sin^3 x}\overset{H}{=}
\frac{3\cos x-3}{30\sin^2 x\cos x}\sim\\ \sim
\frac{\cos x-1}{10 \sin^2 x}\overset{H}{=}
\frac{-\sin x}{20\sin x \cos x}\sim\frac{-1}{20}

Il risultato è ottenuto applicando ripetutamente l’Hôpital e valutando che \cos x\sim 1 per x infinitesimo. L’errore sta nell’applicare questa valutazione anche nel punto sbagliato (che è segnato con ”?”), cioè al numeratore all’interno di una differenza. In quel punto il contributo di \cos x non può essere eliminato, come non può esserlo all’inizio della seconda riga. Un fattore asintoticamente indistinguibile da 1 può essere trascurato solo se moltiplica o divide tutta l’espressione, come avviene nell’individuare g(x) e per tutti i denominatori dell’esercizio.

Per chiarire, studiamo in zero il comportamento asintotico di \frac{x(1+x)+2x^2-x}{x^2}. Considerando 1+x \sim 1, la somma al numeratore si riduce e la frazione poi si semplifica, risultando infinitamente vicina a 2. Se invece si svolgono con pazienza tutti i calcoli algebrici, al termine delle semplificazioni, la frazione risulta uguale a 3 ed è il risultato corretto. La valutazione 1+x \sim 1 non va fatta in quel contesto perché con quella sostituzione si provoca la scomparsa di termini di secondo grado che sono gli unici ad influire sulla somma algebrica, dato che che quelli di primo grado si eliminano algebricamente.

Note

La regola di de l’Hôpital è di grande aiuto nell’abbassare il grado delle funzioni polinomiali, mentre diventa una complicazione in molti altri casi. Per questi occorre uno strumento più potente, cioè la regola di Taylor che si vedrà più avanti.

  • Studia il comportamento asintotico di y=x^2\left(e^\frac{1}{x}-1\right)

La funzione è definita per ogni x\ne 0. In f(0+) la funzione assume la forma indeterminata f(0+)=(0+)(+\infty). Per usare la regola di de l’Hôpital riscriviamo l’espressione della funzione e operiamo la sostituzione t=1/x:

f(x)=\frac{e^\frac{1}{x}-1}{\frac{1}{x^2}}=\frac{e^t-1}{t^2}.

Per x=0+\to t=\frac{1}{0}=+\infty \to \frac{e^t-1}{t^2}=\frac{+\infty}{+\infty}. Applicando due volte la regola di de l’Hôpital, la forma indeterminata diventa \frac{e^t}{2}, che è un infinito positivo. Dunque f(0+)=+\infty, cioè l’asse y è un asintoto verticale. Invece f(0-)=(0-)^2(e^\frac{1}{0-}-1)=(0+)(e^{-\infty}-1)=(0+)(0-1)=0-. Quindi il ramo sinistro della funzione si annulla per valori negativi quando x si approssima allo zero da sinistra, invece il ramo destro ha un asintoto verticale nell’asse y.

es4a

Gli asintoti di f(x)=x^2\left(e^\frac{1}{x}-1\right).

Per valori infiniti di x usando la stessa sostituzione si ha t=0+ e la funzione diventa

\frac{e^{0+}-1}{(0+)^2}=\frac{(1+)-1}{0+}=\frac{0+}{0+} che è una forma indeterminata, da risolvere con l’aiuto della regola di de l’Hôpital:

\frac{e^t-1}{t^2}\overset{H}{=}\frac{e^t}{2t}=\frac{e^{0+}}{2(0+)}\frac{1}{0+}=+\infty.

Per x=-\infty, se si usa la stessa procedura, sia ha f(-\infty)=-\infty. Quindi la funzione va all’infinito, agli estremi dell’intervallo di definizione.

Occorre ora verificare l’esistenza di eventuali asintoti obliqui. Per x=+\infty:

m=\frac{f(x)}{x}=x\left(e^\frac{1}{x}-1\right)=\frac{e^t-1}{t}\overset{H}{=}\frac{e^t}{1}=e^{0+}=1,

dove si utilizza la solita regola in presenza di un rapporto fra due infinitesimi. Quindi l’asintoto obliquo esiste a destra ed ha pendenza 1. Per ricavare q:

q=f(x)-mx=x^2\left(e^\frac{1}{x}-1\right)-x=\frac{e^t-1}{t^2}-\frac{1}{t}=\frac{e^t-1-t}{t^2}=\frac{e^{0+}-1-(0+)}{(0+)^2}=\\ =\frac{(1+)-1-(0+)}{0+}=\frac{(0+)-(0+}{0+} che è ancora una forma indeterminata.

Interveniamo con la regola di de l’Hôpital e otteniamo:

\frac{e^t-1-t}{t^2}\overset{H}{=}\frac{e^t-1}{2t}\overset{H}{=}\frac{e^t}{2}=\frac{e^{0+}}{2}=\frac{1}{2}.

La retta che funge da asintoto è quindi y=x+\frac{1}{2} e si può verificare che il risultato vale sia per l’asintoto obliquo destro che per quello sinistro.

In conclusione la funzione ha un asintoto verticale e un asintoto obliquo sia destro che sinistro.

es4b

L’asintoto obliquo “zoomato” nell’origine.

Il grafico riprende il disegno precedente, guardando l’origine con lo zoom che ingrandisce 250 volte. Si vede così che l’asintoto, osservato da grande distanza, sembra passare per l’origine: si mantiene il coefficiente angolare e si annulla l’intercetta all’origine, come illustrato nel 15.5.3.

Osservazione banale ma importante

La regola di de l’Hôpital si applica al rapporto fra due funzioni, ma è diversa dalla regola di derivazione del rapporto.

Confronta con attenzione le due regole:

de l’Hôpital: nei casi di indecisione e a determinate condizioni: comportamento asintotico di \frac{f(x)}{g(x)} = comportamento asintotico di \frac{Df(x)}{Dg(x)}.

Derivata: \quad D\frac{f(x)}{g(x)}=\frac{f'(x)g(x)-f(x)g'(x)}{g^2(x)}.

Riassunto

  1. Le successioni possono avere all’infinito un comportamento regolare o irregolare. Una successione che all’infinito si avvicina ad un certo valore s, si dice che converge a s oppure che s è il suo asintoto. Una successione che all’infinito raggiunge valori infiniti, si dice che diverge (positivamente o negativamente), oppure che diverge asintoticamente. Questi sono i comportamenti regolari.
  2. Illustriamo 5 criteri che aiutano a stabilire se una successione ha un comportamento regolare e quale sia. Si costruisce così una gerarchia di comportamenti asintotici: \ln N,N^p,a^N (a>1),n!, N^N è la scala degli infiniti, in ordine crescente.
  3. Un asintoto per una funzione è una retta alla quale il grafico della funzione si avvicina indefinitamente. Studiare il comportamento asintotico di una funzione significa cercare se quella retta esiste quando la x si pone agli estremi dell’intervallo di definizione.
  4. Vi sono asintoti orizzontali, verticali e obliqui e una funzione può averli tutti, oppure alcuni o nessuno. La casistica è riportata nel paragrafo 13.4.1.
  5. Nel ricercare l’asintoto si ha spesso a che fare con i casi di indeterminazione. Per risolvere le forme indeterminate viene in aiuto la regola di de l’Hôpital, che assicura, solo se sono verificate determinate condizioni, che il rapporto fra due funzioni ha lo stesso comportamento asintotico del rapporto fra le loro derivate.

Esercizi

  1. Calcolando i rapporti opportuni, dimostra la gerarchia dei comportamenti asintotici per le successioni. In particolare dimostra che il rapporto fra N^N e N! è asintotico al Numero di Nepero.
  2. Applica il criterio della radice al rapporto già noto y_k=\frac{2^k}{k^2}
  3. Descrivi il comportamento della funzione a^x \mbox{ con }0<a<1, usando i termini specifici introdotti all’inizio del capitolo.
  4. Spiega perché la tangente ha un comportamento asintotico irregolare per x che diverge.
  5. Svolgi autonomamente gli esercizi svolti negli esempi, ricavando anche i risultati che il testo sottointende.

Le derivate di ordine superiore

Differenze seconde e di ordine superiore

diff2

Le differenze seconde per la successione \left\langle y_k\right\rangle

All’inizio del corso abbiamo visto la successione \left\langle y_k\right\rangle e messo in tabella i suoi valori e le loro differenze. A quella tabella aggiungiamo una riga, per elencare le differenze delle differenze, cioé le differenze seconde, in simboli \Delta^2y_k=\Delta\left[\Delta y_k\right]=\Delta y_{k+1}-\Delta y_k. I valori delle differenze seconde si ottengono dalla penultima riga, e le differenze seconde calcolabili sono una di meno rispetto alle differenze prime.

Se troviamo un valore \Delta^2y_k=0, vuol dire che \Delta y_k=\Delta y_{k+1}, cioé nella riga superiore si trovano in corrispondenza due differenze prime consecutive uguali. A sua volta questo vuol dire che nella seconda riga fra i tre valori y_k corrispondenti c’è la stessa crescita o lo stesso calo. Quindi nel grafico della successione i tre punti in questione sono allineati, perché i due segmenti consecutivi hanno la stessa pendenza.

diff2

\Delta^2 y_5=0 perché i punti sono allineati per k=5,6,7.

Se invece \Delta^2 y_k>0, allora \Delta y_{k+1}>\Delta y_k, cioé i due segmenti hanno pendenza crescente e formano una spezzata concava verso l’alto, come i primi 3 punti del grafico. Al contrario, se \Delta^2 y_k<0, allora \Delta y_{k+1}<\Delta y_k, e la spezzata è concava verso il basso.

Le differenze seconde coinvolgono necessariamente tre punti consecutivi, come si vede da \Delta^2 y_k=\Delta y_{k+1}-\Delta y_k=(y_{k+2}-y_{k+1})-(y_{k+1}-y_k)=y_{k+2}-2y_{k+1}+y_k. Se poi \Delta^2 y_k= 0, allora y_{k+2}-2y_{k+1}+y_k=0 e la conseguenza è che y_{k+1}=\frac{y_k+y_{k+2}}{2}, cioé l’ordinata del secondo punto è la media aritmetica delle altre due ordinate. Poiché le ascisse dei tre punti sono equidistanziate, il secondo punto è il punto medio fra il primo e il terzo.

diff2

Dal punto di vista del calcolo, le differenze seconde hanno le stesse regole delle differenze prime. Quindi, data l’espressione di \left\langle y_k\right\rangle, si calcolano le differenze prime con le regole già viste nei capitoli 3 e 4, poi si applicano di nuovo le stesse regole sull’espressione risultante.

Differenze successive

Esistono (e a questo punto sono facili da calcolare) anche le differenze terze, le quarte e così via. Per esempio, non è difficile scoprire che \Delta^3y_k=y_{k+3}-3y_{k+2}+3y_{k+1}-y_k.

Abbiamo visto che le differenze prime esprimono l’idea della pendenza dei segmenti, le differenze seconde esprimono l’idea della concavità. Per le ulteriori differenze, crescendo l’ordine è sempre più arduo dare un significato geometrico al calcolo. L’indice che esprime l’ordine della differenza evoca un esponente. Infatti, guardando l’espressione che sviluppa la differenza di un certo ordine e confrontandola con l’espressione corrispondente della potenza di un binomio si scopre che l’analogia è sistematica e puntuale. Per esempio, la differenza di ordine 4 è: \Delta^4 y_k=y_{k+4}-4y_{k+3}+6y_{k+2}-4y_{k+1}+y_k e i suoi coefficienti sono i coefficienti binomiali per l’espressione (a-b)^4. L’ordine n della differenza \Delta^n y_k, pur non essendo un esponente, produce nel risultato i coefficienti che produrrebbe se fosse l’esponente di un binomio (a-b)^n.

Rapporti incrementali secondi e di ordine superiore

Nelle funzioni a dominio discreto

I rapporti incrementali sono i rapporti fra le differenze. I rapporti incrementali di ordine superiore si calcolano per le funzioni a dominio discreto in analogia con quanto abbiamo appena definito.

Data una funzione a dominio discreto f:\left\{ x_k\right\} \to \mathbf{R}\mbox{, con }f(x_k)=y_k, abbiamo

il rapporto incrementale relativo all’indice k: y'=\frac{\Delta y_k}{\Delta x_k}=\frac{\Delta f(x_k)}{\Delta x_k}

il rapporto incrementale del rapporto incrementale, o rapporto incrementale secondo: y_k''=\frac{\Delta y'_k}{\Delta x_k}.

il rapporto incrementale terzo: y_k'''=\frac{\Delta y''_k}{\Delta x_k}, e così via.

incrementi

Significato geometrico del rapporto incrementale secondo.

Analogamente a quello che si è visto per la differenza seconda nelle successioni, il significato geometrico del rapporto incrementale secondo y_k''=\frac{\Delta y'_k}{\Delta x_k} è la concavità della spezzata che unisce tre punti consecutivi della funzione. Se y_k''=0, allora i tre punti sono allineati.

Note

L’analogia stretta fra la differenza nelle successioni e il rapporto incrementale nelle funzioni a dominio discreto dipende dal fatto che anche la differenza è un rapporto incrementale, in quanto per le successioni \Delta y_k=\frac{\Delta y_k}{\Delta k} perché \Delta k = 1 (k è la successione degli indici, vedi Cap.3).

Nelle funzioni a dominio discreto, se nella funzione y_k=f(x_k) gli incrementi \Delta x_k sono fra loro uguali a \Delta x, la funzione diventa una successione di ragione \Delta x, in cui l’incremento gioca il ruolo dell’indice. Allora:

il rapporto incrementale secondo è: y_k''=\frac{\Delta y'_k}{\Delta x}=\frac{\Delta\left[\frac{\Delta y'_k}{\Delta x}\right]}{\Delta x}=\frac{\Delta^2 y_k}{(\Delta x)^2}

il rapporto incrementale terzo è y'''_k=\ ...\ =\frac{\Delta^3 y_k}{(\Delta x)^3}, e così via.

Nelle funzioni a dominio continuo

Il rapporto incrementale nelle funzioni a dominio continuo indica il tasso medio di variazione \Delta f(x) della funzione rispetto all’incremento finito \Delta x, cioé \frac{\Delta f(x)}{\Delta x}=\frac{\Delta f(x)}{h}=\frac{f(x+h)-f(x)}{h}, dove abbiamo definito con h quella particolare variazione di x.

Il rapporto incrementale secondo, potrebbe essere calcolato anche per una variazione di x eventualmente diversa da h (\Delta x=k\ne h) ed esprime il tasso medio di variazione del tasso medio di variazione.

\frac{\Delta\left[\frac{\Delta f(x)}{h}\right]}{k}=\frac{\Delta\left[\frac{f(x+h)-f(x)}{h}\right]}{k}=\frac{\frac{f(x+h+k)-f(x+h)}{h}-\frac{f(x+k)-f(x)}{h}}{k}=\frac{f(x+h+k)+f(x+h)-f(x+k)+f(x)}{hk}.

Il suo significato geometrico è quello già visto nei casi precedenti. Se il rapporto incrementale secondo è positivo, o negativo, o nullo, la spezzata che unisce i punti del grafico corrispondenti alle ascisse x, x+h, x+h+k è concava verso l’alto, o verso il basso, oppure si tratta di punti allineati.

Se h=k , e quindi i \Delta x sono uguali, siamo nella situazione più semplice, cioé al caso delle funzioni a dominio discreto, e possiamo scrivere: \frac{\Delta\frac{\Delta f(x)}{\Delta x}}{\Delta x}=\frac{\Delta^2 f(x)}{(\Delta x)^2}, indicando con

\Delta^2 f(x)=\Delta[\Delta f(x)]=\Delta[f(x+\Delta x)-f(x)]=\\ =[f(x+2\Delta x)-f(x+\Delta x)]-[f(x+\Delta x)-f(x)]= \\ =f(x+2\Delta x)-2f(x+\Delta x)+f(x)

(confronta con il 14.1.1 per i coefficienti).

Sviluppando il ragionamento come nei casi precedenti, arriviamo al rapporto incrementale di ordine n: \frac{\Delta^nf(x)}{(\Delta x)^n}.

Derivata seconda e derivate successive

Nelle funzioni a dominio continuo abbiamo anche definito il tasso di variazione puntuale, cioè relativo ad un incremento infinitesimo dx: si tratta della derivata. Seguendo le stesse logiche, definiamo:

La derivata seconda è la derivata della derivata e la indichiamo con

D[Df(x)]=D^2f(x)=f''(x).

E ricordando che la derivata è la parte standard del rapporto differenziale, quando esso è finito e la parte standard è la stessa per ogni incremento infinitesimo dx: Df(x)=st\left[\frac{df(x)}{dx}\right].

Possiamo dare la definizione equivalente:

La derivata seconda di f(x) è D^2f(x)=D[Df(x)]=st\left[\frac{df'(x)}{dx}\right], se la derivata prima è continua, il suo rapporto differenziale è finito e con la stessa parte standard per qualsiasi incremento infinitesimo dx.

Calcolare la derivata seconda di una funzione, o anche le derivate successive, purché esistano, è facile: si applicano ripetutamente le regole di derivazione viste nei capitoli precedenti.

Il significato geometrico della derivata seconda è intuibile: ci informa sulla concavità della curva in quel punto (vedi Esempio 5).

La derivata seconda ha una frequente applicazione anche in fisica: per esempio, poiché la velocità istantanea si calcola derivando l’equazione del moto, allora la derivata seconda esprime la variazione puntuale della velocità istantanea, cioè l’accelerazione istantanea. Infatti, data l’equazione del moto uniformemente accelerato s(t)=s_0+v_0t+\frac{1}{2}at^2, abbiamo:

s'(t)=v(t)=v_0+at\mbox{  e  }s''(t)=v'(t)=a.

Esempi
  1. Calcolare le derivate successive di f(x)=\cos x.

f'(x)=-\sin x\mbox{ , }f''(x)=-\cos x\mbox{ , }f'''(x)=sin x...

Quindi le espressioni delle derivate successive dipendono dai resti della divisione per 4.

D^n\cos x=\begin{cases} \cos x, & \mbox{se }n\mbox{mod}4=0 \\ -\sin x, & \mbox{se }n\mbox{mod}4=1 \\ -\cos x, & \mbox{se }n\mbox{mod}4=2 \\\sin x, & \mbox{se }n\mbox{mod}4=3\end{cases}

  1. Calcolare D^n\ln(1+x)

D\ln(1+x)=\frac{1}{1+x}\\
D^2\ln(1+x)=D\frac{1}{1+x}=-\frac{1}{(1+x)^2}\\
D^3\ln(1+x)=D\left[-\frac{1}{(1+x)^2}\right]=D\left[-(1+x)^{-2}\right]=2(1+x)^{-3}=\frac{2}{(1+x)^3}\\
D^4\ln(1+x)=D\left[2(1+x)^{-3}\right]=-6(1+x)^{-4}=-\frac{6}{(1+x)^4}\\
\mbox{ ... }\\
D^n\ln(1+x)=\frac{(-1)^{n-1}(n-1)!}{(1+x)^n}.

  1. Ricavare l’accelerazione nella legge oraria del moto armonico.
m_armonico

Il moto armonico è la proiezione sull’asse x del moto circolare uniforme. In questo moto, un punto si muove su una circonferenza di raggio R con velocità angolare \omega e con angolo iniziale \theta_0. L’angolo spazzato dal raggio al tempo t è \theta(t)=\theta_0+\omega t e l’ascissa al tempo t che corrisponde al punto mobile, estremo del raggio, vale allora: x(t)=R\cos(\omega t+ \theta_0), che è la legge oraria del moto armonico. La velocità istantanea è data dalla derivata prima e l’accelerazione dalla derivata seconda. Quindi

v(t)=x'(t)=R\left[-\sin(\omega t+ \theta_0)\right]\omega=-\omega R\sin(\omega t+ \theta_0)

a(t)=v'(t)=-\omega R \cos(\omega t+ \theta_0)\omega=-\omega^2R\cos(\omega t+ \theta_0)=-\omega^2x(t).

  1. Quale è la concavità della funzione f(x)=\ln x?
D^2\ln x=D\frac{1}{x}=-\frac{1}{x^2}<0. La derivata seconda è negativa per ogni x, quindi il grafico della funzione è concavo verso il basso.

Differenziale secondo e derivata seconda

La derivata è stata definita come Df(x)=st\left[\frac{df(x)}{dx}\right], parte standard del rapporto differenziale, e poi, per semplicità d’uso, abbiamo convenuto di usare l’uguaglianza semplice Df(x)=\frac{df(x)}{dx} poiché i due numeri sono infinitamente vicini.

Definiamo per analogia il differenziale secondo: d^2f(x)=d[df(x)]. Nel caso più generale, gli incrementi relativi ai due differenziali sono diversi, per cui si ha

d^2f(x)=d[f(x+\delta)-f(x)]=[f(x+\delta+\epsilon)-f(x+\delta)]-[f(x+\epsilon)-f(x)]=\\ =f(x+\delta+\epsilon)-f(x+\delta)-f(x+\epsilon)+f(x).

Ne consegue la definizione di derivata (anche qui per brevità ci limitiamo all’uguaglianza delle parti standard):

D^2f(x)=\frac{f(x+\delta+\epsilon)-f(x+\delta)-f(x+\epsilon)+f(x)}{\epsilon\delta}

Come sempre, perché la derivata esista, il rapporto differenziale deve essere finito e indipendente da ogni coppia \epsilon\delta. Allora la derivata è la parte standard del rapporto differenziale. Quindi, se la derivata esiste, possiamo ridurci al caso più semplice di \epsilon=\delta=dx. Abbiamo: df(x)=f(x+2dx)-2f(x+dx)+f(x), e la conseguente definizione di derivata seconda:

D^2f(x)=D\frac{df(x)}{dx}=\frac{d\left[\frac{df(x)}{dx}\right]}{dx}=\frac{d^2f(x)}{(dx)^2}=\frac{f(x+2dx)-2f(x+dx)+f(x)}{(dx)^2}.

Nessuno si sognerebbe di applicare la definizione di rapporto differenziale per calcolare la derivata seconda: molto più facile e immediato applicare due volte le regole di derivazione.

I discorsi relativi alle derivate di ordine superiore vengono di conseguenza: la derivata di ordine n è la parte standard del rapporto differenziale D^nf(x)=\frac{d^nf(x)}{(dx)^n}. Si possono omettere le parentesi al denominatore, pur di ricordarsi che n non è un esponente.

Esercizi impegnativi e un caso patologico

  1. Analizza il comportamento asintotico nello zero di y=\sin\frac{1}{x}.

Se si conosce il grafico di una funzione f(x) si può dedurre il grafico di f(\frac{1}{x}):

  • per x=\pm 1 i due grafici coincidono
  • per x>1,\ f(\frac{1}{x}) ha lo stesso andamento che ha f(x) fra 0 e 1.
  • per 0<x<1,\ f(\frac{1}{x}) ha lo stesso andamento che ha f(x) per x>1.
  • con i numeri negativi il discorso è simmetrico.

Nel nostro esercizio:

  • \sin0=0, \sin1=0.84.

Quindi per x\ge 1,\ \sin\frac{1}{x} passa da 0.84 a 0. In particolare, all’infinito \sin\frac{1}{+\infty}\approx\sin 0\approx 0 e l’asse x è asintoto orizzontale

  • per x\ge 1 \ \sin x oscilla infinitamente fra -1 e 1,

quindi per 0<x<1,\ \sin\frac{1}{x} oscilla infinitamente fra -1 e 1.

  • il grafico è simmetrico rispetto all’origine perché la funzione è dispari.
sin_1_su_x

y=\sin\frac{1}{x}.

Per evidenziare che in zero il comportamento asintotico è irregolare, cerchiamo due infinitesimi sui quali la funzione ha valori con parti standard diverse. Per esempio:

\sin\frac{1}{x}=1\mbox{ per } \frac{1}{x}=\frac{\pi}{2}+2k\pi \mbox{, cioé per }x=\frac{1}{\frac{\pi}{2}+2k\pi} che, se k è un ipernaturale infinito N, risulta x=\frac{1}{\frac{\pi}{2}+2N\pi}\approx 0.

Invece per x=\frac{1}{\frac{3\pi}{2}+2N\pi}\approx 0 si ha che \sin\frac{1}{x}\approx -1. In pratica, per N infinito, x è infinitamente vicino a zero e la funzione assume continuamente valori diversi. La funzione non è definita in zero.

  1. Analizza il comportamento asintotico di y=x\sin\frac{1}{x}.

Visto l’esercizio precedente, in cui la funzione nello zero oscilla fra -1 e 1, è facile concludere che ora f(x) oscilla fra le due rette y = x e y = -x

x_sin_1_su_x

y=x\sin\frac{1}{x}.

La funzione è pari, quindi il grafico è simmetrico rispetto all’asse y. Dato che le due rette che limitano il grafico della funzione attraversano l’origine, f(x)\approx 0 \mbox{ per } x\approx 0. Possiamo quindi rendere continua la funzione, ponendo f(0)=0.

Vediamo ora se la funzione in zero è derivabile. \frac{f(dx)-f(0)}{dx}=\frac{dx\sin\frac{1}{dx}-0}{dx}=\sin\frac{1}{dx}. Siamo al caso precedente: il rapporto differenziale assume infinite volte valori fra -1 e 1: la funzione non è derivabile. Se vogliamo avere una funzione di questo tipo derivabile in zero, dobbiamo moltiplicare per x (vedi prossimo esercizio).

Per completare l’analisi del comportamento asintotico, vediamo cosa succede all’infinito. Posto t=\frac{1}{x} abbiamo y=x\sin\frac{1}{x}=\frac{\sin t}{t}. E’ il caso già analizzato nel Cap. 13 e possiamo concludere che all’infinito (destro ma anche sinistro) il grafico ha un asintoto orizzontale in y = 1.

  1. Analizza il comportamento asintotico in zero di y=x^2\sin\frac{1}{x}.

Facendoci guidare dal caso precedente, vediamo che f(x) è schiacciata fra le due parabole.

xquad_sin_1_su_x

y=x^2\sin\frac{1}{x}.

Per questo motivo, si può renderla continua imponendo f(x)=0 \mbox{ per } x=0, come nell’es.2. Per la derivabilità, vediamo il rapporto differenziale in zero:

\frac{f(dx)-f(0)}{dx}=\frac{(dx)^2\sin\frac{1}{dx}-0}{dx}=(dx)\sin\frac{1}{dx}\approx 0 . Quindi f'(0)=0.

L’espressione della derivata risulta:

f'(x)=2x\sin\frac{1}{x}+x^2\cos\frac{1}{x}\left(-\frac{1}{x^2}\right)=
2x\sin\frac{1}{x}-\cos\frac{1}{x}.

La derivata seconda nello zero non esiste, perché la derivata prima, per quanto visto sopra, dipende da \cos\frac{1}{x}, che ha un comportamento irregolare.

Un caso patologico

Nella definizione di derivata, in questo caso di derivata seconda, c’è un dettaglio importante: il rapporto differenziale D^2f(x)=\frac{f(x+\delta+\epsilon)-f(x+\delta)-f(x+\epsilon)+f(x)}{\epsilon\delta} deve avere la stessa parte standard

per ogni coppia di infinitesimi \epsilon\delta. Se questo avviene, allora vale anche \epsilon=\delta=dx, da cui segue la definizione D^2f(x)=\frac{f(x+2dx)-2f(x+dx)+f(x)}{(dx)^2} (vale in ogni caso l’approssimazione che ci permette di usare il segno = al posto di \approx).

Ci possono essere funzioni per le quali il rapporto differenziale secondo ha un comportamento asintotico regolare solo se gli incrementi infinitesimi sono uguali. Quindi non si può dire che la derivata esiste, perché per \epsilon\ne\delta il rapporto differenziale non ha sempre la stessa parte standard.

Consideriamo la funzione f(x)=x^3\sin\frac{1}{x}+x^2 e studiamola sulla base degli esempi precedenti.

xcubo_sin_1_su_x

y=x^3\sin\frac{1}{x}+x^2.

Dal grafico, a prima vista non sembrano esserci questioni particolari, perché i valori oscillano strettamente a cavallo della cubica.

Rendiamo continua f(x) nello zero: f(0\pm)\approx 0 \to f(0)=0. Per calcolare le derivate usiamo le definizioni. Per la derivata prima, in zero:

\frac{f(dx)-f(0)}{dx}=\frac{(dx)^3\sin\frac{1}{dx}+(dx)^2}{dx}=(dx)^2\sin\frac{1}{dx}+dx\approx 0 \mbox{ e } f'(0)=0.

Per x\ne0:\ f'(x)=3x^2\sin\frac{1}{x}+x^3\cos\frac{1}{x}\left(-\frac{1}{x^2}\right)+2x=3x^2\sin\frac{1}{x}-x\cos\frac{1}{x}+2x.

13_09_bis

Il grafico di y’.

La derivata nello zero è stretta fra le rette y = x e y = 3x

Anche f'(0\pm)\approx 0 e forse possiamo calcolare la derivata seconda. Per vedere se esiste:

\frac{f'(dx)-f'(0)}{dx}=\frac{3(dx)^2\sin\frac{1}{dx}-(dx)\cos\frac{1}{dx}+2dx}{dx}=3dx\sin\frac{1}{dx}-\cos\frac{1}{dx}+2.

Il primo termine è infinitamente vicino a zero, mentre il secondo oscilla infinitamente fra -1 e 1 nella monade dello zero. Quindi, se la derivata seconda si calcola derivando la derivata prima, cioé applicando successivamente due incrementi infinitesimi diversi, allora non esiste.

Come secondo tentativo, applichiamo la formula della derivata seconda per incrementi infinitesimi uguali D^2f(x)=\frac{f(x+2dx)-2f(x+dx)+f(x)}{(dx)^2}. Per x = 0,

f(2dx)=(2dx)^3\sin\frac{1}{2dx}+2(dx)^2=8(dx)^2\sin\frac{1}{2dx}+4(dx)^2

2f(dx)=2(dx)^3\sin\frac{1}{dx}+2(dx)^2\mbox{ e }f(0)=0, per cui

\frac{d^2f(0)}{(dx)^2}=8(dx)\sin\frac{1}{2dx}+4-2(dx)\sin\frac{1}{dx}-2\approx 2

In conclusione, la derivata in zero sembra essere 2, mentre non esiste. Negli esercizi a venire ci occuperemo solo di funzioni prive di questi problemi.

Riassunto

  1. Le differenze seconde per una successione sono le differenze calcolate sulla successione ottenuta dalle differenze prime.
  2. Analogamente, i rapporti incrementali del secondo ordine per le funzioni a dominio discreto e per le funzioni a dominio continuo vengono calcolati sui rapporti incrementali del primo ordine, seguendo le stesse regole.
  3. Infine le derivate seconde si calcolano a partire dalle derivate prime, utilizzando le normali regole di derivazione. E tutto questo si ripete per le differenze, i rapporti incrementali e le derivate degli ordini successivi.
  4. La questione sottile è se per una funzione derivabile esista anche la derivata seconda o le ulteriori derivate. Controllando che esista finito il rapporto differenziale secondo nel punto in questione si risolve l’aspetto della continuità, che è l’aspetto principale e il solo di cui ci occuperemo. Mentre trascureremo il problema di garantire che il rapporto differenziale sia lo stesso per ogni incremento.
  5. Dal punto di vista grafico, la differenza, il rapporto incrementale e la derivata seconde danno informazioni locali sulla concavità della curva.

Esercizi

  1. Per ogni terna consecutiva di punti rappresentati nel primo grafico del capitolo, illustra l’andamento delle differenze seconde.
  2. Calcolare le derivate successive della funzione seno.

I Polinomi di Taylor

Nello studio del comportamento asintotico di una funzione a volte siamo in difficoltà a risolvere le forme indeterminate. Abbiamo visto che la regola di de l’Hôpital ci può aiutare in alcune di queste difficoltà, molto poco in altre. Presentiamo quindi uno strumento più potente, di utilità generale.

L’idea di base del polinomio di Taylor è di approssimare il valore di una funzione come se si dovesse misurarlo secondo una scala di infinitesimi. Nella vita quotidiana quando misuriamo un oggetto, per ottenere una misura esatta ricorriamo a unità di misura sempre più fini. Per esempio per l’altezza di una finestra usiamo il metro e otteniamo un primo valore approssimato. Poi affiniamo la misura aggiungendo un certo numero di decimetri e con questo ci avviciniamo maggiormente al valore esatto, poi contiamo i centimetri e potremmo proseguire con unità sempre più fini. Lo stesso avviene in altre situazioni concrete: pesare un casco di banane con la bilancia da cucina, dosare attentamente la quantità d’acqua per l’impasto di una torta, ecc. Per “misurare” il valore di una funzione le unità di misura sempre più fini sono i vari ordini di infinitesimi.

Un esempio

Riprendiamo un esercizio del Cap.13: studiare il comportamento asintotico nello zero della funzione f(x)=\frac{\sin^3 x-x^3}{\tan^5 x}.

Cerchiamo una scala di infinitesimi semplice e adatta al confronto. Ricordiamo a questo proposito che due grandezze si confrontano mettendole in rapporto e se il rapporto è asintoticamente una forma di indecisione possiamo valerci della regola di de l’Hôpital.

Per il denominatore, confrontiamo il valore infinitesimo della tangente con quello dell’angolo:

\frac{\tan x}{x}\overset{H}{\sim}\frac{1+\tan^2 x}{1}\sim 1.

Quindi \tan x\sim x e di conseguenza \tan^5 x \sim x^5.

Per il numeratore, sappiamo già che \frac{\sin x}{x}\sim 1. Quindi \sin x \sim x, da cui \sin^3 x\sim x^3. Ora però abbiamo un problema perché \sin^3 x-x^3\sim x^3-x^3=0 e questo non è possibile perché lo zero è escluso dalle questioni di indistinguibilità. In pratica ai fini del nostro esercizio, se ci limitiamo a valutare l’infinitesimo \sin x mediante l’infinitesimo x non abbiamo informazioni abbastanza dettagliate. È come se 1m fosse la misura di due oggetti di diversa lunghezza: con il solo metro non sapremmo apprezzare la differenza e avremmo bisogno di misurarla a decimetri, o centimetri ecc. Analogamente, per meglio valutare la differenza fra i due infinitesimi \sin x e x ricorriamo al secondo ordine, cioè confrontiamo \sin x -x\mbox{ con } x^2.

\frac{\sin x - x}{x^2}\overset{H}{\sim}\frac{\cos x -1}{2x}\overset{H}{\sim}\frac{-\sin x}{2}\approx 0.

Quindi nemmeno x^2 è un’unità di misura abbastanza infinitesima per misurare la nostra differenza. Dobbiamo ritentare con x^3:

\frac{\sin x - x}{x^3}\overset{H}{\sim}\frac{\cos x -1}{3x^2}\overset{H}{\sim}\frac{-\sin x}{6x}\overset{H}{\sim}\frac{-\cos x}{6}\sim -\frac{1}{6}.

Quindi \sin x -x\sim - \frac{x^3}{6}\mbox{ e } \sin x \sim x -\frac{x^3}{6}.

Infine abbiamo che: \sin^3 x\sim\left(x-\frac{x^3}{6}\right)^3\sim x^3-3x^2\frac{x^3}{6}+\ ...=x^3-\frac{x^5}{2}+\ ... e possiamo trascurare gli ulteriori infinitesimi, che sono di ordine superiore.

Tornando all’esercizio: f(x)=\frac{\sin^3 x-x^3}{\tan^5 x}\sim\frac{x^3-\frac{x^5}{2}-x^3}{x^5}=\frac{-\frac{x^5}{2}}{x^5}=-\frac{1}{2}, che è la soluzione già trovata nel Cap.13, ma con molta più fatica.

Caso generale

Dobbiamo valutare il comportamento asintotico di una funzione y=f(x) in un punto a del suo dominio, dove la funzione è derivabile n volte.

Costruzione della regola

La funzione è continua, quindi nella monade di a, f(x) è indistinguibile da f(a), perciò, per x\approx a, \ f(x)=f(a)+\epsilon_0(x). Si tratta di valutare l’infinitesimo \epsilon_0(x) con una scala crescente di infinitesimi nella monade di a: (x-a),\ (x-a)^2, (x-a)^3,\ .... Le valutazioni si fanno con i rapporti.

Proviamo dapprima: \frac{\epsilon_0(x)}{x-a}=\frac{f(x)-f(a)}{x-a}, che è sicuramente un rapporto fra due infinitesimi, quindi una forma indeterminata. Allora: \frac{\epsilon_0(x)}{x-a}=\frac{f(x)-f(a)}{x-a}\overset{H}{\sim}\frac{f'(x)}{1}\sim f'(a).

Dunque \epsilon_0(x)\sim f'(a)(x-a), oppure, per meglio valutare anche questa indistinguibilità: \epsilon_0(x)=f'(a)(x-a)+\epsilon_1(x), dove l’ultimo termine è infinitesimo di ordine superiore rispetto a (x - a).

Ne consegue che f(x)=f(a)+f'(a)(x-a)+\epsilon_1(x)\mbox{, con }\epsilon_1(x)=o(x-a).

Poi si prosegue, valutando \epsilon_1(x) rispetto a (x-a)^2.

\frac{\epsilon_1(x)}{(x-a)^2}=\frac{f(x)-f(a)-f'(a)(x-a)}{(x-a)^2}\overset{H}{\sim}\frac{f'(x)-f'(a)}{2(x-a)}\overset{H}{\sim}\frac{f''(x)}{2}\sim\frac{f''(a)}{2}

Per cui \epsilon_1(x)\sim\frac{f''(a)}{2}(x-a)^2, oppure \epsilon_1(x)=\frac{f''(a)}{2}(x-a)^2+\epsilon_2(x)\mbox{, con }\epsilon_2(x)=o\left[(x-a)^2\right].

Fissiamo il risultato raggiunto riscrivendo la funzione:

f(x)=f(a)+f'(a)(x-a)+\frac{f''(a)}{2}(x-a)^2+\epsilon_2(x)\mbox{, con }\epsilon_2(x)=o\left[(x-a)^2\right].

Ora deve essere valutato \epsilon_2(x)\mbox{ rispetto a }(x-a)^3.

\frac{\epsilon_2(x)}{(x-a)^3}=\frac{f(x)-f(a)-f'(a)(x-a)-\frac{f''(a)}{2}(x-a)^2}{(x-a)^3}\overset{H}{\sim}\frac{f'(x)-f'(a)-f''(a)(x-a)}{3(x-a)^2}\overset{H}{\sim}\frac{f''(x)-f''(a)}{3\cdot 2(x-a)}\overset{H}{\sim}\\ \overset{H}{\sim}\frac{f'''(a)}{3\cdot 2\cdot 1}=\frac{f'''(a)}{3!}.

Da questo segue \epsilon_2(x)\sim\frac{f'''(a)}{3!}(x-a)^3, il che ci porta a :

\epsilon_2(x)=\frac{f'''(a)}{3!}(x-a)^3+\epsilon_3(x)\mbox{, con }\epsilon_3(x)=o\left[(x-a)^3\right].

Abbiamo così ulteriormente sviluppato il polinomio che rappresenta la funzione in a

f(x)=f(a)+f'(a)(x-a)+\frac{f''(a)}{2}(x-a)^2+\frac{f'''(a)}{3!}(x-a)^3+\epsilon_3(x)\mbox{, con }\epsilon_3(x)=o\left[(x-a)^3\right].

In sintesi

Vediamo di capire il percorso e di immaginare lo sviluppo successivo.

Con x nella monade di a, i valori della funzione vengono approssimati con sempre maggiore accuratezza, facendo uso di derivate di ordine crescente e riferiti a potenze crescenti di (x - a).

  • Approssimazione di ordine zero: f(x)=f(a)+\epsilon_0(x)\mbox{. }\epsilon_0(x) è un infinitesimo.
  • Approssimazione di ordine 1: f(x)=f(a)+f'(a)(x-a)+\epsilon_1(x)\mbox{, con }\epsilon_1(x)=o(x-a).
  • Approssimazione di ordine 2: f(x)=f(a)+f'(a)(x-a)+\frac{f''(a)}{2}(x-a)^2+\epsilon_2(x), con \epsilon_2(x)=o\left[(x-a)^2\right]
  • Approssimazione di ordine 3:
f(x)=f(a)+f'(a)(x-a)+\frac{f''(a)}{2}(x-a)^2+\frac{f'''(a)}{3!}(x-a)^3+\epsilon_3(x), con \epsilon_3(x)=o\left[(x-a)^3\right].

Si può riscrivere la formula pensando che 1 = 0! = 1!, 2 = 2! e che la derivata di ordine zero equivale alla funzione:

f(x)=\frac{f^{(0)}(a)}{0!}+\frac{f'(a)}{1!}(x-a)+\frac{f''(a)}{2!}(x-a)^2+\frac{f'''(a)}{3!}(x-a)^3+\epsilon_3(x) \\ \mbox{con } \epsilon_3(x)=o\left[(x-a)^3\right].

Per l’approssimazione di ordine 4 è sufficiente aggiungere alla formula dell’approssimazione di ordine 3 l’espressione di \epsilon_3(x).

\epsilon_3(x)=\frac{f^{IV}(a)}{4!}(x-a)^4+\epsilon_4(x)

Lo stesso avviene per le approssimazioni di ordine successivo, fino al grado di approssimazione desiderato.

La regola

La formula precedente si può riscrivere in modo sintetico:

f(x)=\sum_{k=0}^N \frac{f^{(k)}(a)}{k!}(x-a)^k +\epsilon_n(x)\mbox{, con }\epsilon_n(x)=o\left[(x-a)^n\right].

Il polinomio che ne risulta si dice Polinomio di Taylor di ordine n in forma infinitesima della funzione y = f(x) nel punto a ed esprime la funzione y = f(x) nella monade di a come un polinomio di grado minore o uguale a n nelle potenze dell’infinitesimo (x - a), a meno di un infinitesimo di ordine superiore (x-a)^n.

Note

Parliamo di “polinomio di grado minore o uguale a n”, e non semplicemente di grado uguale, solo perché può succedere, come in alcuni esempi che seguono, che per un certo n la derivata della funzione sia nulla.

Note

Nel caso che a sia zero, lo sviluppo del polinomio avviene per x, al posto di (x - a) e il polinomio viene spesso chiamato con il nome di Polinomio di MacLaurin.

Esercizi e applicazioni

  1. Sviluppa la funzione seno nell’origine.

Per tornare ai calcoli dell’esercizio precedente, sviluppiamo la funzione seno per a = 0, per cui la formula generale risulta:

f(x)=f(0)+f'(0)x+\frac{f''(0)}{2}x^2+\frac{f'''(0)}{3!}x^3+\ ...\ +\frac{f^{(n)}(0)}{n!}x^n.

I coefficienti si ottengono dalla successione delle derivate, calcolate in 0.

f(x)=\sin x\ \to \  f(0)=\sin 0 = 0\quad\quad\quad\quad f'(x)=\cos x \to\ f'(0)=\cos 0 = 1\\ f''(x)=-\sin x\ \to \  f''(0)=-\sin 0 = 0\quad\quad f'''(x)=\cos x \to \ f(0)=-\cos 0 = -1

I valori 0, 1, 0 -1 si ripetono. Inseriti nel polinomio, annullano i termini di ordine pari. Per cui l’espressione diventa:

x-\frac{x^3}{3}+\frac{x^5}{5!}-\frac{x^7}{7!}+\dots

In conclusione, la funzione seno si approssima così, per esempio fino al quinto ordine:

\sin x \sim x-\frac{x^3}{3}+\frac{x^5}{5!} oppure in modo equivalente: \sin x = x-\frac{x^3}{3}+\frac{x^5}{5!}+o(x^5)

(in realtà in questo caso o(x^5)=o(x^6) perché le derivate di ordine pari sono uguali a zero).

  1. Sviluppa la funzione coseno nell’origine.

Cerchiamo prima i coefficienti:

f(x)=\cos x\ \to \  f(0)=\cos 0 = 1\quad\quad\quad\quad f'(x)=-\sin x \to\ f'(0)=-\sin 0 = 0\\ f''(x)=-\cos x\ \to \  f''(0)=-\cos 0 = -1\quad\quad f'''(x)=\sin x \to \ f(0)=-\sin 0 = 0

da cui: \cos x = 1-\frac{x^2}{2!}+\frac{x^4}{4!}-\frac{x^6}{6!}+ ...

  1. Sviluppa la funzione esponenziale naturale nell’origine.

Le derivate nello zero valgono 1, quindi: e^x = 1+x+\frac{x^2}{2!}+\frac{x^3}{3!}+\frac{x^4}{4!}+\frac{x^5}{5!}+ ...

  1. Sviluppa la funzione y=\ln(1+x) nello zero.

Nel Cap.14 abbiamo già calcolato l’espressione per le derivate successive di questa funzione: f^{(k)}(x)=(-1)^{k-1}\frac{(k-1)!}{(1+x)^k}. L’espressione ci serve per calcolare i coefficienti dello sviluppo in serie, perché nello zero f^{(k)}(0)=(-1)^{k-1}(k-1)!, quindi, dividendo per k! come è richiesto dalla formula di Taylor: \frac{f^{(k)}(0)}{k!}=\frac{(-1)^{k-1}(k-1)!}{k!}=\frac{(-1)^{k-1}}{k}=1,\ -\frac{1}{2},\ \frac{1}{3},\ -\frac{1}{4}...

Dato che f(0)=0, lo sviluppo nello zero è: x-\frac{x^2}{2}+\frac{x^3}{3}-
\frac{x^4}{4}+...(-1)^{n-1}\frac{x^n}{n} e quindi

\ln(1+x)=x-\frac{x^2}{2}+\frac{x^3}{3}-\frac{x^4}{4}+...(-1)^{n-1}\frac{x^n}{n}+o(x^n).
  1. Sviluppa la funzione y=\sqrt{1+x} nello zero fino al quarto ordine.

Per evitare calcoli pesanti è meglio riscrivere la funzione come un’esponenziale e calcolare di conseguenza le derivate in zero per esprimere i coefficienti del polinomio.

f(x)=(1+x)^{\frac{1}{2}} \to  f(0)=1\quad\quad\quad f'(x)=\frac{1}{2}(1+x)^{-\frac{1}{2}} \to f'(0)=\frac{1}{2}\\ f''(x)=-\frac{1}{4}(1+x)^{-\frac{3}{2}} \to  f''(0)=-\frac{1}{4}\quad\quad f'''(x)=\frac{3}{8}(1+x)^{-\frac{5}{2}} \to f'''(0)=\frac{3}{8}\\  f^{IV}(x)=-\frac{15}{16}(1+x)^{-\frac{7}{2}} \to  f^{IV}(0)=-\frac{15}{16}

A meno di un infinitesimo di ordine superiore a x^4, lo sviluppo della funzione nello zero è:

\sqrt{1+x}=1+\frac{x}{2}-\frac{x^2}{8}+\frac{x^3}{16}-\frac{5}{128}x^4+o(x^4).
  1. Studia il comportamento asintotico nello zero di f(x)=\frac{(e^x-1)^3\sin^2 x}{(x-\sin x)(1-\cos x)}.

Nello zero la funzione è una forma indeterminata, un quoziente di infinitesimi. Sviluppiamo il numeratore e il denominatore come polinomi nell’infinitesimo x. Le funzioni vanno sviluppate quanto è utile: per esempio nelle differenze al denominatore le funzioni si sviluppano fino al termine che rende la differenza diversa da zero. Per il numeratore:

e^x\sim 1+x \ \to\ e^x-1\sim x\ \to\ (e^x-1)^3\sim x^3\ \mbox{  e  }\ \sin x\sim x\ \to\ \sin^2 x\sim x^2 . Quindi, per il numeratore: (e^x-1)^3\sin^2 x\sim x^3x^2=x^5.

Per il denominatore, per stimare x-\sin x sviluppiamo la funzione seno fino al terzo ordine e per stimare 1-\cos x sviluppiamo il coseno fino al secondo:

\sin x\sim x-\frac{x^3}{6}\ \to\ x-\sin x\sim \frac{x^3}{6}\ \mbox{  e  }\cos x\sim 1-\frac{x^2}{2}\ \to\ 1-\cos x\sim \frac{x^2}{2}. Quindi, per il denominatore (x-\sin x)(1-\cos x)\sim\frac{x^3}{6}\frac{x^2}{2}=\frac{x^5}{12}

In conclusione abbiamo che: f(x)=\frac{(e^x-1)^3\sin^2 x}{(x-\sin x)(1-\cos x)}\sim \frac{x^5}{\frac{x^5}{12}}=12.

Confronto fra le due regole
  1. Studia il comportamento asintotico di f(x)=\frac{2\sin^2 x-\tan x}{1+\cos 4x} in x=\frac{\pi}{4}

Prima di tutto verifichiamo che si tratta di una forma indeterminata:

2\sin^2\frac{\pi}{4}-\tan \frac{\pi}{4}=2\left(\frac{1}{\sqrt{2}}\right)^2-1=0\mbox{ e }1+\cos\left(4\frac{\pi}{4}\right)=1+\cos\pi=0. Quindi in effetti nel punto desiderato la funzione è quoziente di due infinitesimi e dobbiamo risolvere la forma indeterminata.

Con la formula di Taylor

Se si studia il comportamento asintotico di una funzione nello zero, come negli esempi svolti fin qui, esprimere il polinomio di Taylor è abbastanza semplice. Questo esercizio è diverso: il polinomio può essere sviluppato secondo la definizione, oppure si può operare una sostituzione di variabile in modo da ricondursi al caso più semplice, così: posto t=x-\frac{\pi}{4}\ \to x=t+\frac{\pi}{4}, si sostituisce x nella funzione, che diventa: \frac{2\sin^2 x-\tan x}{1+\cos 4x}=\frac{2\sin^2\left(t+\frac{\pi}{4}\right)-\tan\left(t+\frac{\pi}{4}\right)}{1+\cos\left[4\left(t+\frac{\pi}{4}\right)\right]}, che è comunque una forma indeterminata.

Per il numeratore: \sin\left(t+\frac{\pi}{4}\right)=\frac{1}{\sqrt{2}}\sin t+\frac{1}{\sqrt{2}}\cos t=\frac{1}{\sqrt{2}}(\sin t +\cos t), da cui \\ 2\sin^2 x=2\frac{1}{2}(\sin^2 t+\cos^2 t+2\sin t \cos t)=1+\sin 2t.

Inoltre: \tan\left(t+\frac{\pi}{4}\right)=\frac{\tan t +1}{1-\tan t}

Sviluppiamo solo fino al primo ordine e otteniamo: 1+2\sin t\sim 1+2t e \frac{\tan t +1}{1-\tan t}\sim \frac{t+1}{1-t}, da cui: 2\sin^2 x-\tan x=1+2t-\frac{t+1}{1-t}=-\frac{2t^2}{1-t}\sim -2t^2.

Per il denominatore: 1+\cos\left[4\left(t+\frac{\pi}{4}\right)\right]=1+\cos(4t+\pi)=1-\cos 4t\sim 1-\left(1-\frac{16t^2}{2}\right)=8t^2.

Quindi: \frac{2\sin^2 x-\tan x}{1+\cos 4x}\sim \frac{-2t^2}{8t^2}=-\frac{1}{4}, per cui f\left(\frac{\pi}{4}\pm\right)=-\frac{1}{4}.

Con la regola di de l’Hôpital

Abbiamo risolto l’esercizio con la formula di Taylor al primo ordine, quando potrebbe bastare la regola di de l’Hôpital. Vediamo:

f(x)=\frac{2\sin^2 x-\tan x}{1+\cos 4x}\overset{H}{\sim}\frac{4\sin x \cos x -1 -\tan^2 x}{-4\sin 4x}, che però è ancora una forma indeterminata per x=\frac{\pi}{4}. Applichiamo di nuovo la regola: \frac{4\sin x \cos x -1 -\tan^2 x}{-4\sin 4x}\overset{H}{\sim}\frac{4\cos^2 x-4\sin^2 x-2\tan x(1+\tan^2 x)}{-16\cos 4x}.

In x=\frac{\pi}{4}, il numeratore 4\cos^2 \frac{\pi}{4}-4\sin^2 \frac{\pi}{4}-2\tan \frac{\pi}{4}(1+\tan^2 \frac{\pi}{4})=-2(1+1)=-4.

Il denominatore: -16\cos 4x=-16\cos \left(4\frac{\pi}{4}\right)=-16\cos\pi=16. E facendo il rapporto fra numeratore e denominatore si torna al risultato già trovato.

Esercizio impegnativo.
  1. Sviluppa la funzione y=\tan x nello zero fino al settimo ordine.

Se si calcolano i coefficienti del Polinomio di Taylor, impegnandosi con diligenza nelle derivate successive fino al settimo ordine, ben presto i calcoli diventano ingestibili. Perciò dopo le prime derivazioni, facciamoci guidare da una linea di ragionamento diversa.

Nello zero le derivate seconda e quarta di tan x valgono zero (provare per credere!). Da questo si intuisce, e lo dimostreremo al termine dei calcoli, che lo sviluppo del Polinomio di Taylor nello zero per la funzione tangente ha solo i termini con le potenze dispari, cioé è di questo tipo:

P(x)=ax+bx^3+cx^5+dx^7.

Utilizziamo gli sviluppi già calcolati del seno e del coseno: \sin x=x-\frac{x^3}{6}+\frac{x^5}{120}-\frac{x^7}{5040}+... e \cos x=1-\frac{x^2}{2}+\frac{x^4}{24}-\frac{x^6}{720}+... e ricordiamoci che la tangente è il rapporto fra il seno e il coseno:

\tan x \cos x = \sin x \ \to \ (ax+bx^3+cx^5+dx^7)\left(1-\frac{x^2}{2}+\frac{x^4}{24}-\frac{x^6}{720}\right)=x-\frac{x^3}{6}+\frac{x^5}{120}-\frac{x^7}{5040}.

Possiamo limitare al settimo ordine lo svolgimento dei prodotti a sinistra, quindi raccogliendo i risultati secondo le potenze di x abbiamo :

ax+\left(-\frac{a}{2}+b\right)x^3+\left(\frac{a}{24}-\frac{b}{2}+c\right)x^5+\left(-\frac{a}{720}+\frac{b}{24}-\frac{c}{2}+d\right)x^7=x-\frac{x^3}{6}+\frac{x^5}{120}-\frac{x^7}{5040}.

Confrontando i due membri dell’uguaglianza, perchè questa sia vera deve succedere che

\begin{cases}
a=1 \\
-\frac{a}{2}+b=-\frac{1}{6} \\
\frac{a}{24}-\frac{b}{2}+c= \frac{1}{120} \\
-\frac{a}{720}+\frac{b}{24}-\frac{c}{2}+d=-\frac{1}{5040}
\end{cases}

Il sistema non è difficile: si operano le sostituzioni dalla prima riga progressivamente nelle altre. Al termine si ha:

\tan x=x + \frac{x^3}{3}+\frac{2}{15}x^5+ \frac{17}{315}x^7+ o(x^8).
Parità e derivate successive

Le funzioni dispari, come il seno e la tangente, hanno un grafico simmetrico rispetto all’origine. Quindi il ramo sinistro del grafico è come se risultasse da una rotazione di 180° del ramo destro intorno all’origine. Per questo motivo, le tangenti al grafico in due punti, che si corrispondono nella simmetria, non possono che essere parallele, cioé hanno pendenza uguale. Questo avviene per tutte le coppie di punti del grafico che hanno ascissa opposta. In poche parole le derivate del ramo sinistro, punto dopo punto, sono uguali alle derivate del ramo destro. Concludiamo che la funzione derivata di una funzione dispari è una funzione pari.

derivate_parità

Invece le funzioni pari hanno il grafico simmetrico rispetto all’asse y. In questa simmetria le semirette inclinate con una certa pendenza nel semipiano destro si corrispondono con semirette di pendenza opposta nel semipiano sinistro. Quindi le tangenti al ramo destro del grafico hanno pendenza opposta rispetto alle tangenti corrispondenti al ramo sinistro. Insomma la funzione derivata di una funzione pari è una funzione dispari.

La cosa è dimostrabile. Infatti, in una funzione pari f(-x)=f(x) e in una funzione dispari f(-x)=-f(x). La derivata di una funzione pari è, calcolata in -x,

f'(-x)=\frac{f(-x+\delta)-f(-x)}{\delta}=\frac{f(x-\delta)-f(x)}{\delta} per la parità.

Se calcoliamo l’incremento opposto \epsilon=-\delta

f'(-x)=\frac{f(x+\epsilon)-f(-x)}{-\epsilon}=-\frac{f(x+\epsilon)-f(x)}{\epsilon}=-f'(x), cioé la derivata è dispari.

Nello stesso modo si dimostra la parità della derivata di una funzione dispari.

Quando si esprime una funzione con il Polinomio di Taylor, si devono calcolare derivate successive di ordine dispari e pari. Come mai lo sviluppo di una funzione, per esempio dispari come il seno, nello zero, contiene solo termini di grado dispari? Perché nello zero si annullano i termini di grado pari? La risposta è che i termini di grado pari contengono derivate che sono funzioni dispari e le funzioni dispari nello zero si annullano. Quindi solo i termini di grado dispari non si annullano perché contengono derivate di ordine dispari, che sono funzioni pari.

Vale lo stesso ragionamento per lo sviluppo nello zero delle funzioni pari, come il coseno, che è fatto solo da termini di grado pari. La derivata prima del coseno è una funzione dispari e sono dispari tutte le derivate successive di ordine dispari. Tutte queste nello zero si annullano, per cui restano solo i termini di grado pari.

Il fatto che la parità degli esponenti in una serie di potenze incarni la parità della funzione è un fatto notevole e suggestivo, non limitato alla monade di zero.

Differenza fra funzioni

Come abbiamo visto in alcuni esercizi, con il polinomio di Taylor siamo in grado di stimare la differenza di due funzioni indistinguibili nella monade del punto a, misurandola rispetto alla scala di infinitesimi di ordine crescente data dalle potenze di (x - a).

Stimiamo per esempio la differenza \sin^2 x-\sin x^2\mbox{ per }x=0\pm. Se usassimo la regola nota, che la funzione seno nello zero è asintotica all’angolo, non faremmo molti progressi. Infatti risulterebbe \sin^2 x\sim x^2\mbox{ e }\sin x^2\sim x^2 quindi fra le due funzioni non ci sarebbe differenza. Passiamo invece all’approssimazione di ordine successivo, per cui: \sin t\sim t-\frac{t^3}{6}. Allora:

\sin^2 x\sim\left(x-\frac{x^3}{6}\right)^2\sim x^2-\frac{x^4}{3}\quad\mbox{ e }\quad\sin x^2\sim x^2-\frac{(x^2)^3}{6}\sim x^2-\frac{x^6}{6}, trascurando i termini successivi nello sviluppo dei quadrati, perché di ordine superiore.

Quindi la differenza, espressa per esempio solo fino al quarto ordine è \sin^2 x-\sin x^2\sim-\frac{x^4}{3}.

Problema: area del segmento circolare.

9. Un segmento circolare a una base ha base b e altezza h. Dimostra che l’area del segmento vale approssimativamente S=\frac{2}{3}bh e la formula è tanto più precisa qanto più b è piccolo rispetto al raggio.

segmento_circolare

L’area che cerchiamo si può ottenere per differenza fra l’area del settore circolare e l’area del triangolo. L’area del settore è \frac{1}{2}r^2\theta. L’area del triangolo è

\left(r\sin\frac{\theta}{2}\right)\left(r\cos\frac{\theta}{2}\right)=r^2\sin\frac{\theta}{2}\cos\frac{\theta}{2}=\frac{1}{2}r^2\sin\theta.

Quindi: S=\frac{1}{2}r^2\theta-\frac{1}{2}r^2\sin\theta=\frac{1}{2}r^2(\theta-\sin\theta)

Abbiamo già stimato nell’es.6 la differenza fra l’angolo infinitesimo e il suo seno, sviluppando quest’ultimo in serie di Taylor fino al terzo ordine. Ricaviamo che \theta-\sin\theta=\theta - \left(\theta -\frac{\theta^3}{6}\right)=\frac{\theta^3}{6}, da cui S=\frac{1}{12}r^2\theta^3.

Vediamo ora il prodotto bh. Per b: b=2r\sin\frac{\theta}{2}\sim 2r\frac{\theta}{2}=r\theta.

Invece h=r-r\cos\frac{\theta}{2}=r\left(1-cos\frac{\theta}{2}\right)=r\left[1-\left(\frac{\theta^2}{8}\right)\right]=r\frac{\theta^2}{8}.

Quindi ho che bh=r\theta\left(r\frac{\theta^2}{8}\right)=\frac{r^2\theta^3}{8}. Alla fine: \frac{r^2\theta^3}{8}=12S=8bh\ \to\ S=\frac{2}{3}bh.

Ordine di contatto fra due curve

Il problema precedente ha una soluzione alternativa immediata, ricordando una delle prime lezioni sugli iperreali, dove si mostrava che una parabola nel suo vertice è indistinguibile da una circonferenza con il centro sull’asse, a distanza doppia del fuoco. Uno dei risultati che se ne ricavavano era che l’area del segmento parabolico è 2/3 dell’area del rettangolo circoscritto. Allora possiamo immaginare che il segmento parabolico sia indistinguibile dal segmento circolare, per cui la formula si dimostra immediatamente.

ordine_contatto

Contatto del terzo ordine fra circonferenza e parabola.

Il disegno riprende il concetto di tangenza fra due curve. Sappiamo calcolare la tangente a una curva, intesa come retta tangente, e abbiamo imparato a risolvere il problema con la derivata prima. Fra due curve però la tangenza è di ordine diverso e con questo si intende che l’approssimazione fra le due curve nel punto di tangenza è valutata meglio con le derivate di ordine superiore.

Seguendo il disegno, ricaviamo la funzione che rappresenta la semicirconferenza inferiore. Dalla circonferenza x^2+(y-r)^2=r^2 ricaviamo y-r=-\sqrt{r^2-x^2}, da cui

f(x)=r-\sqrt{r^2-x^2}.

Sviluppiamo il Polinomio di Taylor nello zero (sappiamo già che f(0)=0):

f'(x)=-\frac{1}{2}(r^2-x^2)^{\frac{1}{2}}(-2x)=x(r^2-x^2)^{\frac{1}{2}}) \to f'(0)=0\\ f''(x)=(r^2-x^2)^{\frac{1}{2}}+x\left(-\frac{1}{2}\right)(r^2-x^2)^{-\frac{3}{2}}(-2x)=r^2(r^2-x^2)^{-\frac{3}{2}}\to  f''(0)=r^2(r^2)^{-\frac{3}{2}}=\frac{1}{r}

La semicirconferenza è approssimata nello zero dal seguente Polinomio di Taylor:

g(x)=f(0)+f'(0)x+\frac{f''(0)}{2}x^2=\frac{1}{2r}x^2.

Si tratta proprio della parabola del disegno e questo dimostra che le due curve sono indistinguibili in zero. Ma quale è l’ordine del contatto? Se provi a derivare ulteriormente in zero il polinomio, troverai che la derivata terza si annulla, mentre la derivata quarta f^{IV}(0)=\frac{3}{r^3}\ne0. Poichè la prima derivata diversa da zero ha ordine 4, diciamo che il contatto è del terzo ordine. In conclusione, la curva che approssima al meglio la semicirconferenza è una cubica, non una parabola.

Supponiamo di avere due curve y=f(x)\mbox{ e }y=g(x), in contatto nel punto a. Se si intersecano, allora coincidono in a: f(a)=g(a). Se nella monade di a la loro differenza f(x)-g(x) è un infinitesimo di ordine superiore a (x-a), ma non a (x-a)^2, allora si dice che hanno un contatto del primo ordine. Se invece f(x)-g(x) è un infinitesimo di ordine superiore a (x-a)^2, ma non a (x-a)^3, allora hanno un contatto del secondo ordine, e così via.

Confrontare la differenza f(x)-g(x) con i vari infinitesimi (x-a),\quad (x-a)^2,\quad (x-a)^3,\quad ... significa calcolare i coefficienti del Polinomio di Taylor per la differenza delle due funzioni. Se il contatto è di ordine k la derivata di ordine k + 1 è la prima derivata che non si annulla.

Concludendo, possiamo dire che il Polinomio di Taylor di ordine n di una funzione è il polinomio di grado n che in un certo punto ha lo stesso valore della funzione e lo stesso valore delle sue prime derivate di grado minore o uguale a n.

Approssimare una funzione con un polinomio

Usiamo il Polinomio di Taylor come seconda funzione e cerchiamo di valutare la differenza fra i valori di una funzione data e la sua espressione secondo Taylor. Abbiamo già visto che per un valore a prefissato una funzione può essere approssimata dal relativo sviluppo con il Polinomio di Taylor, approssimazione più o meno buona a seconda del grado del polinomio. Questa volta valutiamo la differenza in generale, cioé non limitandoci alla monade di un valore a prefissato, ma anche al di fuori di essa. Il polinomio che se ne ricava viene detto Polinomio di Taylor in forma finita.

Inizialmente supponiamo per semplicità a=0 e scriviamo (fino al quarto grado, sempre per semplicità) un polinomio generico, con l’intenzione di portarlo ad approssimare la nostra generica funzione nella monade di zero:

P(x)=a_0+a_1(x)+a_2(x^2)+a_3x^3+a_4(x^4).

Taylor ci indica come esprimere i coefficienti, come abbiamo già visto:

P(x)=a_0+a_1x+a_2x^2+a_3x^3+a_4x^4\\ P'(x)=a_1+2a_2x+3a_3x^2+4a_4x^3\\ P^{''}(x)=2a_2+3\cdot 2a_3x+ 4+\cdot 3a_4x^2\\ P^{'''}(x)=3!a_3+4\cdot 3\cdot 2a_4x\\ P^{IV}(x)=4!a_4\\ P(0)=a_0=f(0) \longrightarrow a_0=f(0)\\ P'(0)=a_1=f'(0)\longrightarrow a_1=f'(0)\\ P^{''}(0)=2a_2=f^{''}(0)\longrightarrow a_2=\frac{f^{''}(0)}{2}\\ P^{'''}(0)=3!a_3=f^{'''}(0)\longrightarrow a_3=\frac{f^{'''}(0)}{3!}\\ P^{IV}(0)=4!a_4=f^{IV}(0) \longrightarrow a_0=\frac{f^{IV}(0)}{4!}\\

Nel caso di una funzione da approssimare non necessariamente nello zero, l’espressione del polinomio si ottiene con lo stesso procedimento, partendo da:

P(x)=a_0+a_1(x-a)+a_2(x-a)^2+\ ...\ +a_n(x-a)^n.

Per capire se in questo modo l’approssimazione è efficace anche al di fuori della monade di a , ricorriamo ad un parallelo cinematico: la funzione f(x) descrive il moto di un punto A sull’asse y. Il punto si allontana dall’origine o si avvicina verticalmente a seconda dei valori x. Invece il Polinomio è rappresentato sull’asse Y da un punto B.

Se il polinomio di Taylor che approssima la funzione è solo di ordine zero, è come se il moto di A fosse approssimato da un moto stazionario: B è fermo nella posizione in cui si trova A per x=a. Solo che, quando x varia, A cambia rapidamente posizione sull’asse y, mentre B resta fermo.

Se il polinomio è di ordine 1, si ha P_1(x)=f(a)+f'(a)(x-a). L’espressione è analoga alla legge del moto uniforme: s(t)=s_0+v(t-t_0): il punto B si muove a velocità costante, è sovrapposto al punto A per x=a ed ha la sua stessa velocità. Per x che si allontana da a, il punto A segue la sua legge di moto vario, mentre B in generale perderà ben presto il contatto perché la sua velocità è costante.

Se il polinomio è di ordine 2, si ha P_2(x)=f(a)+f'(a)(x-a)+ \frac{f^{''}(a)}{2}(x-a)^2. L’espressione è analoga alle legge del moto uniformemente accelerato. Per x=a, i due punti hanno la stessa posizione, la stessa velocità, la stessa accelerazione e quindi i loro moti si differenziano più lentamente rispetto ai casi precedenti.

E’ chiaro come va a finire: con l’approssimazione al terzo ordine i due moti hanno per x=a posizione, velocità, accelerazione e strappo uguali. Solo che A, per valori x diversi da a, è in generale a strappo variabile, di conseguenza si allontana da B, ma più lentamente rispetto a quanto già visto. E così si può procedere per le approssimazioni di ordine superiore.

La sostanza è che in un intervallo sufficientemente piccolo, sviluppando adeguatamente il Polinomio di Taylor si ottengono valori sufficientemente vicini a quelli della funzione. Lo si può vedere anche confrontando il grafico della funzione con quello del Polinomio di Taylor associato. Ecco due esempi di funzioni trascendenti.

exp_ord_0-3

Approssimare l’esponenziale con P(x) fino al terzo ordine.

Il primo caso è quello di f(x)=e^x e del suo sviluppo secondo Taylor nello zero. Nelle quattro immagini la linea continua è la funzione mentre la linea tratteggiata è il Polinomio.

sin_ord_0-7

Approssimare la funzione seno con P(x) fino al settimo ordine.

La seconda serie riguarda la funzione seno e il polinomio associato, sviluppato fino al settimo ordine. E’ facile accorgersi che man mano che il grado aumenta l’approssimazione migliora anche per valori di x sempre più lontani dallo zero.

Stimare l’errore

Cercheremo di dare una stima dell’errore che si commette sostituendo ad una funzione il suo sviluppo secondo Taylor, fino ad un certo grado. Così facendo incontreremo alcuni concetti nuovi ed utili.

Riprendiamo l’esempio del moto rettilineo di un punto A sull’asse y, la cui posizione è definita da f(x): quindi A(0,f(x)). Si tratta di un moto rettilineo vario, che inizia al tempo t=a e porta il punto A ad allontanarsi verticalmente da f(a) secondo la legge f(x-a) che stiamo approssimando con lo sviluppo del Polinomio di Taylor.

Come riferimento per una prima approssimazione scriviamo per analogia la legge oraria del moto rettilineo uniforme s(t)=s(t_0)+v(t-t_0). Sappiamo che s(t_0)=s_0 è lo spazio percorso inizialmente, che corrisponde al valore f(a) della funzione. v è la velocità costante, quindi è anche la velocità media tenuta dal punto materiale fra s_0 \mbox{ e } s(t): s(t)=s_0+\frac{s(t)-s_0}{t-t_0}(t-t_0). La sostituzione del simbolo v con l’espressione della velocità media rende banale tutta la formula, che una volta semplificata, è un’identità. Solo se conosciamo a priori il valore della velocità media possiamo dare un senso a questa legge del moto.

In effetti però il punto A si muove con una legge più complicata e meno prevedibile, che approssimiamo un po’ meglio con la formula del moto rettilineo uniformemente accelerato s(t)=s_0+v_0(t-t_0)+\frac{1}{2}a(t-t_0)^2. Qui la velocità media non compare, compare l’accelerazione costante che è anche l’accelerazione media tenuta dal punto nell’intervallo considerato. In ogni caso, per raggiungere la posizione s(t), sicuramente A si è mosso progressivamente dalla velocità iniziale a quella finale, raggiungendo e superando una posizione in cui aveva per un istante la velocità media. Se il moto di A segue una legge più complicata, può succedere che in quell’intervallo di tempo la velocità media venga raggiunta e superata più volte, accelerando e decelerando, ma il fatto centrale è che è impossibile evitare di raggiungere la velocità media almeno una volta.

Seguiamo lo stesso ragionamento con il Polinomio di Taylor. La funzione viene sviluppata al primo ordine in forma finita approssimativamente con f(x)=f(a)+\frac{f(x)-f(a)}{x-a}(x-a). Portando a sinistra f(a) si esprime l’errore di valutazione che si farebbe se fermasse lo sviluppo del Polinomio all’ordine zero: f(x)-f(a)=\frac{f(x)-f(a)}{x-a}(x-a). Ora, f(x) è continua, quindi assume tutti i valori f(c) mentre c varia fra a e x. C’è almeno un c per il quale f'(c)= \frac{f(x)-f(a)}{x-a}, cioé la velocità istantanea del punto risulta uguale a quella media. Allora l’errore si può stimare con l’espressione: f(x)-f(a)=f'(c)(x-a). Noi non conosciamo l’esatta posizione di c (d’altra parte, se la conoscessimo, non parleremmo più di approssimazione), sappiamo solo che deve esistere.

Proseguiamo nello sviluppo del polinomio, come abbiamo fatto per il moto uniformemente accelerato f(x)=f(a)+f'(a)(x-a)+\frac{f^{''}(c)}{2}(x-a)^2. Questo vuol dire che se ci fossimo fermati al primo ordine, l’errore sarebbe stato f(x)-f(a)-f'(a)(x-a)=\frac{f^{''}(c)}{2}(x-a)^2. Per le stesse considerazioni precedenti, è sicura l’esistenza di almeno un valore c fra a e x in cui l’accelerazione media è uguale a quella istantanea.

Proseguendo nello sviluppo, le considerazioni si ripetono. In conclusione, sviluppando il Polinomio di Taylor fino all’ordine n, si commette un errore espresso da: \frac{f^{n+1}(c)}{(n+1)!}(x-a)^{n+1}. La formula non ha soltanto un significato teorico, dato che il punto c non è a priori conosciuto. Essa è anche utile in situazioni concrete, per esempio quando si desidera che l’errore non superi un valore piccolo prefissato e grazie alla formula si determina l’ordine n di sviluppo del Polinomio, che consente di limitare l’errore.

Teoremi di Lagrange e di Rolle

Lagrange_Rolle

Significato geometrico del Teorema di Lagrange e del Teorema di Rolle

Il Teorema di Lagrange

Riprendiamo, con lieve modifica, la formula dell’errore nell’approssimazione di ordine zero: f(x)=f(a)+f'(c)(x-a)\mbox{, con }a<c<x e concentriamoci sul suo significato geometrico. La formula, riscritta come : f'(c)=\frac{f(x)-f(a)}{x-a} dice che in un punto c dell’intervallo considerato la derivata della funzione è uguale al coefficiente angolare della secante che passa per gli estremi dell’intervallo: la tangente per c e la secante per gli estremi sono parallele. Questa formula esprime il Teorema di Lagrange, secondo il quale l’esistenza di c che rende vera l’uguaglianza è garantita. I ragionamenti che abbiamo seguito rendono intuitiva l’esistenza di c e questo per i nostri scopi è sufficiente. Quindi non daremo una dimostrazione formale del teorema.

Riscriviamo di nuovo la formula con maggiore sintesi: \Delta f(x)=f'(c)\Delta x e confrontiamola con quella simile che deriva dallo sviluppo del Polinomio di Taylor: \Delta f(x)=f'(x)\Delta x. Dalle considerazioni fatte fin qui emerge che la seconda formula è approssimata, mentre la prima delle due è una uguaglianza esatta. La sua importanza risiede nel fatto che il Teorema di Lagrange garantisce l’esistenza di c.

Il Teorema di Rolle

Una facile conseguenza del Teorema di Lagrange si ottiene se la funzione assume gli stessi valori agli estremi dell’intervallo, quindi f(x)=f(a), oppure f(x)=f(x+\Delta x) o ancora \Delta f(x)=0. In questo caso il teorema diventa: esiste un valore c strettamente compreso fra a e x tale che in c la derivata si annulla. Dal punto di vista geoometrico si ha che in c la tangente è orizzontale (come la secante agli estremi). Dal punto di vista cinematico significa che se il punto ritorna alla posizione di partenza, allora si è fermato almeno una volta.

Una prima applicazione

Trova tutte le soluzioni dell’equazione e^x-x=1.

Una prima soluzione si ottiene in modo empirico: x = 0 è una soluzione perché e^0-0=1. Per sapere se ci sono altre soluzioni, e eventualmente quali siano, consideriamo la funzione f(x)=e^x-x-1. Cercare i valori per cui si annulla la funzione è come risolvere l’equazione precedente. Sappiamo già che f(0)=0, ora cerchiamo un altro x_0 \mbox{ tale che } f(x_0)=0. Se questo numero esistesse, allora per il Teorema di Rolle esisterebbe anche un valore c, fra 0 e x_0, per cui f'(c)=0. Ma f'(c)=e^x-1=0 \ \to\ c=0. In pratica non vi sono altre soluzioni oltre lo zero.

Riassunto

  1. Una funzione f(x), sempre derivabile, si può esprimere nella monade di un valore a del suo dominio, attraverso un polinomio costruito sulla serie di potenze di (x - a): il Polinomio di Taylor. I coefficienti del polinomio si ricavano dalle derivate successive della funzione.

f(x)=\frac{f^{(0)}(a)}{0!}+\frac{f'(a)}{1!}(x-a)+\frac{f''(a)}{2!}(x-a)^2+\frac{f'''(a)}{3!}(x-a)^3+ ...

  1. Più si aggiungono termini al polinomio, più l’approssimazione ai valori esatti della funzione migliora.
  2. Il Polinomio di Taylor è uno strumento efficace per studiare il comportamento asintotico di una funzione, indispensabile nei casi in cui la Regola di de l’Hôpital non è di aiuto.
  3. In genere non è necessario sviluppare il polinomio per un numero elevato di termini. Per esempio, nel valutare la differenza fra due funzioni, che è un caso comune, ci si accontenta di scrivere il Polinomio fino al primo termine non nullo, perché i successivi sono infinitesimi di ordine superiore.
  4. Attraverso semplici ragionamenti sulla simmetria, si deduce che le funzioni pari hanno per derivata una funzione dispari e le funzioni dispari hanno per derivata una funzione pari. Da qui si ricava che il Polinomio di Taylor di una funzione dispari contiene solo termini di ordine dispari e il Polinomio di Taylor di una funzione pari contiene solo termini di ordine pari.
  5. Quando due curve sono tangenti si può misurare quanto sono indistinguibili nel punto di contatto. Si esprime la differenza delle due funzioni nel punto di contatto con il Polinomio di Taylor, sviluppandola fino al primo termine non nullo. Il grado dell’ultimo termine nullo è l’ordine del contatto fra le due curve in quel punto.
  6. L’approssimazione che si ha sostituendo alla funzione il suo Polinomio di Taylor è sempre migliore man mano che aumenta il grado del Polinomio, cioé la differenza fra la funzione e il Polinomio si riduce se il grado del Polinomio è maggiore. Questa differenza è indistinguibile da zero nella monade considerata e si accresce man mano che ci si allontana da essa.
  7. Si può stimare l’errore che si commette approssimando la funzione con il Polinomo di Taylor scritto in forma finita, cioé per qualsiasi x, anche al di fuori di mon(a).
  8. Il Teorema di Lagrange garantisce che nell’intervallo considerato esiste un punto c per il quale la tangente al grafico della funzione è parallela alla secante che passa per gli estremi dell’intervallo. Il Teorema di Rolle, di conseguenza, assicura che se questa secante è orizzontale, la derivata per c non può che essere nulla.

Esercizi

  1. Sappiamo che una funzione costante ha derivata zero per ogni x. Dimostra che una funzione che ha derivata zero per ogni x è costante.

La risoluzione numerica delle equazioni

Sappiamo risolvere alcuni tipi di equazioni: quelle algebriche di 1° e 2° grado e alcune equazioni fondamentali trascendenti: con funzioni circolari, esponenziali, logaritmiche. Sappiamo anche che per molte equazioni non esiste una formula risolutiva, come avviene per le equazioni di 2° grado. In questo capitolo impareremo alcune tecniche che consentono di affrontare con successo equazioni di ogni tipo, che altrimenti sarebbero non risolvibili.

Iniziamo da un’equazione algebrica di 3° grado: x^3-8x+1=0. Sappiamo che può avere al massimo tre soluzioni. Ma siamo sicuri che esista una soluzione? Su questo possiamo essere sicuri. Consideriamo infatti la funzione f(x)=x^3-8x+1. Risolvere l’equazione significa cercare gli zeri della funzione e possiamo affermare con certezza che almeno uno zero esiste perché la funzione è continua, è asintoticamente indistinguibile da x^3 e, essendo negativa per x infinito negativo e positiva per x infinito positivo, non può che annullarsi per almeno un valore di x.

grafico_cubica

f(x)=x^3-8x+1

Il primo modo per risolvere è quello tutto tecnologico. Visualizzando il grafico della funzione si vede che ci sono tre intersezioni con l’asse x. Basta allora ingrandire opportunamente la scala orizzontale e si trovano approssimativamente le soluzioni: una soluzione pari a circa -2.9, un’altra è circa 0.1 e l’ultima circa 2.8. Anche le calcolatrici moderne danno un valido aiuto, basta immettere, oltre alla funzione, anche l’intervallo entro il quale ci si aspetta la soluzione: per esempio la soluzione compresa fra 2 e 3, calcolata in questo modo, fornisce il valore 2.76372382.

Questo sistema, comodo e efficace, non è sempre usabile. Pur ammettendo l’uso della calcolatrice, abbiamo comunque bisogno di stimare quali siano gli intervalli all’interno dei quali cercare le soluzioni e non è detto che, una volta tracciato il grafico, ci sia facile osservare il piano nei punti giusti e al giusto ingrandimento.

Se si opera solo con carta e matita, una prima ricerca degli intervalli che contengono una soluzione si può fare spezzando la funzione in due: f(x)=x^3-8x+1=g(x)-h(x), con g(x)=x^3\mbox{ e } h(x)=8x-1. In questo modo f(x)=0 diventa g(x)=h(x), cioé x^3=8x-1. Scritta così, l’equazione chiede di cercare i valori di x per i quali le due funzioni h(x)\mbox{ e }g(x) sono uguali. I grafici delle due funzioni possono essere tracciati anche a mano.

grafico_cubica_b

h(x)=g(x)\ \to \ x^3=8x-1

Si vede bene che fra 0 e 1 c’è un’intersezione e poi si intuisce che ne esistono altre due perché la cubica si impenna più rapidamente della retta. A mano si costruisce una tabella per verificare in quali intervalli i valori di una funzione scavalchino l’altra.

x h(x) g(x)
2 8 15
3 27 23
-2 -8 -17
-3 -27 -25

Poiché negli intervalli fra 2 e 3 e fra -2 e -3 i valori di una funzione superano i valori dell’altra, sicuramente in questi intervalli vi sarà almeno un valore di x che rende le due funzioni uguali.

Note

In un caso semplice come questo, si può anche evitare di spezzare f(x) in due funzioni. La tabella allora serve a evidenziare in quali intervalli la funzione cambia i suoi valori, da positivi a negativi o viceversa.

Il metodo dicotomico

A questo punto cerchiamo di migliorare la precisione, cioé individuiamo intervalli più stretti nei quali cercare le soluzioni. Un modo facile è spezzare in due gli intervalli precedenti: per esempio invece di [2,3] utilizziamo [2,2.5] e [2.5,3]. Con una tabella simile alla precedente possiamo verificare che la soluzione è contenuta nel secondo dei due intervalli. Allora agiremo (con la calcolatrice) su [2.5,3] allo stesso modo, cioè dividendolo per il suo punto medio e verificando i risultati con la tabella. Ogni volta la precisione aumenterà e potremo ripetere il procedimento a piacere, fermandoci quando avremo raggiunto il grado di precisione desiderato, cioè quando l’ampiezza dell’ultimo intervallo sarà minore dell’errore prefissato.

Tutta questa serie di operazioni sempre uguali definisce l’algoritmo dicotomico, così detto perché gli intervalli vengono ogni volta spezzati in due. L’algoritmo si può anche descrivere con un linguaggio di programmazione:

inizio
leggi (a,b,e)
ripeti
m\ \leftarrow\ \frac{a+b}{2}
se f(m)f(a)<0
allora b \leftarrow m
altrimenti a \leftarrow m
fino a che b-a<e
x \leftarrow \frac{a+b}{2}
scrivi (x)
fine

Nel listato si prevede che la funzione sia già data. Il controllo sulla differenza di segno agli estremi dell’intervallo avviene moltiplicando i valori (quinta riga). e è l’errore massimo consentito.

f(x)=0

L’algoritmo dicotomico restringe progressivamente l’intervallo in cui si trova la soluzione. Fissato il massimo errore accettabile, possiamo restringere l’intervallo fino a farlo diventare più piccolo di questo errore. Se ripetiamo infinite volte l’algoritmo, gli estremi arriveranno ad appartenere alla monade dello zero della funzione e quindi la parte standard di un estremo è lo zero della funzione. Modificando leggermente il programma possiamo stampare i valori degli estremi dell’intervallo e osservare così come quest’ultimo si restringe attorno ad un valore che possiamo considerare lo zero della funzione a meno di un errore prefissato. Ricordiamo che la funzione era definita a parte e l’errore massimo previsto era 10^{-8}.

k a_k a_k
0 2 3
1 2.5 3
2 2.75 3
3 2.75 2.875
4 2.75 2.78125
5 2.75 2.765625
6 2.75 2.765625
7 2.7578125 2.765625
8 2.76171875 2.765625
9 2.76367187 2.765625
10 2.76367187 2.76464884
... ... ...
25 2.76372379 2.76372382
26 2.76372381 2.76372382
27 2.76372382 2.76372382

Come si vede, in 27 cicli, l’algoritmo ha racchiuso la soluzione in un intervallo i cui estremi sono passati dal differire di una unità al differire meno di un centomilionesimo.

Per riassumere la sequenza delle operazioni:

1. Si separano le soluzioni, cioè si definisce per ogni soluzione un intervallo che la contenga. Questo si fa per via grafica, cercando le intersezioni del grafico con l’asse x. Spesso è comodo riscrivere la funzione come uguaglianza fra due altre funzioni e cercare i punti di ascissa che corrispondono alle intersezioni fra i loro due grafici.

2. Individuati gli intervalli, si applica l’algoritmo dicotomico, controllando che agli estremi dell’intervallo f(x) abbia segno diverso, oppure che g(x) e h(x) nell’intervallo “si scavalchino”.

f(x)=0_g(x)=h(x)

f(x)=0 oppure g(x)=h(x)

Tutto ciò si basa su due premesse: la funzione deve essere continua e deve assumere valori di segno opposto agli estremi di ogni intervallo. Lo precisiamo nel prossimo teorema.

Teorema degli zeri di una funzione continua

Il procedimento del metodo dicotomico può essere esteso infinitamente, individuando intervalli sempre più piccoli. In questo modo si giunge a dimostrare un’importante proprietà delle funzioni continue.

Se [a,b], con a<b, è l’intervallo da suddividere, le divisioni successive generano due successioni di estremi \left \langle a_k \right \rangle e \left \langle b_k \right \rangle, la prima non decrescente e la seconda non crescente. L’ampiezza del k_esimo intervallo sarà b_k-a_k=\frac{b-a}{2^k} . Le due successioni sono monotone e limitate, quindi convergenti, e all’infinito vale b_N-a_N=\frac{b-a}{2^N}\approx 0, cioè la differenza fra i due termini diventa infinitesima e quindi essi appartengono alla stessa monade e individuano lo stesso numero standard che chiameremo \overline {x}.

Immaginiamo f(a)<0 e f(b)>0 (ma il ragionamento non cambia nel caso contrario); grazie al nostro algoritmo avremo per ogni k: f(a_k)\le 0 e f(b_k)\ge 0, che vale ovviamente anche con indici infiniti. Quindi f(a_N)\le 0 e f(b_N)\ge 0. Ma abbiamo visto che a_N\approx \overline{x}\approx b_N. Qui entra in gioco la continuità della funzione, per cui a_N\approx \overline{x} \to f(a_N)\approx f(\overline{x})\le 0 e b_N\approx \overline{x} \to f(b_N)\approx f(\overline{x})\ge 0. Non potendo essere contemporaneamente maggiore e minore di zero, f(\overline{x})=0.

Il Teorema degli zeri quindi assicura che una funzione continua nell’intervallo [a,b], che assume valori di segno diverso agli estremi, ha certamente almeno uno zero in un punto interno all’intervallo.

Note

Si potrebbe dare una dimostrazione analoga anche nel caso che f(x) venga spezzata in due funzioni f(x)=h(x)-g(x), ma preferiamo cogliere l’occasione per approfondire il discorso sulle funzioni continue e pervenire in modo diverso allo stesso risultato.

Proprietà delle funzioni continue

Se due funzioni f(x),\  g(x) sono continue nel punto c, allora è continua in c anche la loro somma, la loro differenza, il loro prodotto e il loro quoziente, purché esista in c. Quindi vale:

Se per x\approx c \to f(x)\approx f(c) \mbox{ e } g(x)\approx g(c), allora

&f(x)\pm g(x)\approx f(c)\pm g(c)\\
&f(x)g(x)\approx f(c)g(c)\\
&\frac{f(x)}{g(x)}\approx \frac{f(c)}{g(c)}

Queste proprietà sono intuitive e discendono direttamente dalle proprietà della parte standard di un iperreale. Infatti c=st(x) perché è standard e x\approx c. f(c) è standard e f(x)\approx f(c), allora f(c)=st[f(x)].

La continuità in c si può anche esprimere dicendo che f[st(x)]=st[f(x)].

In riferimento alla nota precedente, la continuità della differenza consente di dimostrare il Teorema degli zeri anche nella versione in cui f(x)=g(x)-h(x).

Il metodo delle tangenti

Nel suddividere l’intervallo [a,b] alla ricerca dello zero della funzione, il metodo delle tangenti è più efficiente del metodo dicotomico, cioè raggiunge l’obiettivo più rapidamente. L’idea è di sostituire al grafico della funzione la sua tangente in un punto c vicino alla soluzione \overline{x}. L’intersezione della tangente con l’asse x determina il valore a_k, oppure b_k, che restringe l’intervallo [a,b] attorno a \overline{x}.

L’equazione della tangente in c è data dal Polinomio di Taylor del primo ordine, sviluppato per x=\overline{x}:

f(\overline{x})=f(c)+f'(c)(\overline{x}-c)

Poiché x=\overline{x} è lo zero della funzione, f(\overline{x})=0 quindi si ricava il valore (approssimato al primo ordine)

\overline{x}=c-\frac{f(c)}{f'(c)}

metodo_tangenti

Il metodo delle tangenti

Come si vede da questo primo disegno, non è detto che la posizione di c garantisca che la tangente intersechi l’asse orizzontale in modo da restringere l’intervallo [a,b]. Perché questo avvenga occorre controllare che il grafico della funzione in tutto [a,b] abbia la stessa concavità. Esaminiamo i quattro casi possibili:

metodo_tangenti_b

L’intervallo attorno a \overline{x} si restringe se le tangenti successive partono da un grafico con la concavità dello stesso tipo.

Questi quattro grafici appartengono a funzioni

  1. che hanno valori di segno diverso agli estremi dell’intervallo
  2. monotone
  3. concave sempre verso l’alto o sempre verso il basso.

La prima condizione è necessaria perché esista almeno una soluzione (Teorema degli zeri), la seconda perché la soluzione sia unica (stiamo cercando di separare le soluzioni e ci occupiamo solo di [a,b]), la terza perché le tangenti successive restringano l’intervallo approssimando la soluzione.

Ragioniamo sul primo disegno in fig.16.5, come esempio: la prima tangente è tracciata in B(b_0,f(b_0)) e, a causa della concavità, intercetta l’asse delle ascisse in un punto b_1 più vicino alla soluzione, e così avverrà con le tangenti successive, che restringeranno l’intervallo unicamente da destra.

Iterando il procedimento, si definisce una successione \left\langle b_k \right\rangle decrescente, con

b_{k+1}=b_k-\frac{f(b_k)}{f'(b_k)}

metodo_tangenti_c

È una successione monotona e limitata, che converge a un numero standard s. Per le proprietà viste sulle funzioni continue, se prendiamo le parti standard, abbiamo

st\left(b_{k+1}\right)=st\left(b_k-\frac{f(b_k)}{f'(b_k)}\right)\ \to\
s=s-\frac{f(s)}{f'(s)}

da cui f(s)=0\ \to\ s=\overline{x}.

Gli altri casi della figura 16.5 si trattano in modo analogo, perché le formule date per b_{k+1} valgono anche per a_{k+1}. Ma come scegliere quale fomula sviluppare, cioé le tangenti vanno tracciate a partire da a o da b? Se la concavità è rivolta verso l’alto sceglieremo l’estremo con ordinata positiva, altrimenti quello con ordinata negativa.

E come faremo a controllare dove si rivolge la concavità? Qui interviene una regola che svilupperemo più avanti: se la derivata seconda è positiva nell’intervallo dato, allora la concavità è rivolta verso l’alto, altrimenti è rivolta verso il basso.

Dunque i controlli preliminari da effettuare prima di applicare il metodo delle tangenti sono:

  1. Il segno agli estremi dell’intervallo: deve essere diverso.
  2. La monotonia: f'(x) costantemente positiva o negativa.
  3. La concavità: f^{''}(x) costantemente positiva o negativa.
  4. La scelta dell’estremo a cui applicare l’algoritmo, in base ai punti 1. e 3.
Un esempio

Applichiamo il metodo delle tangenti alla funzione già usata nel paragrafo del metodo dicotomico: f(x)=x^3-8x+1, anche qui per cercare la soluzione nell’intervallo [2,3].

  1. f(x) agli estremi: f(2)=-7\mbox{ , }f(3)=4
  2. f'(x)=3x^2-8, positiva nell’intervallo: la funzione è crescente.
  3. f^{''}(x)=6x, positiva nell’intervallo: concavità verso l’alto.
  4. Le tangenti si tracciano a partire da B(3,4).

Anche in questo caso, per accelerare il calcolo usiamo un algoritmo:

inizio
leggi (b,n);
per k \leftarrow 1..n esegui
b \leftarrow b-\frac{f(b)}{f'(b)};
scrivi (b);
fine

Supponiamo che i controlli siano fatti, f(b)\ ,\ f'(b) siano date e lanciamo il programma con 5 iterazioni. Ecco l’output

k b_k
0 3
1 2.78947368
2 2.76408434
3 2.76372389
4 2.76372382
5 2.76372382

Già con quattro iterazioni si perviene alla soluzione con la stessa precisione raggiunta in 27 iterazioni col metodo dicotomico.

Un’applicazione

Approssimiamo la radice quadrata con il calcolo delle tangenti. Cercare la radice quadrata del numero c positivo vuol dire risolvere l’equazione x^2=c cioé i valori positivi per cui si ha f(x)=x^2-c=0. Supponiamo per comodità c>1, allora il grafico della funzione, che è una parabola concava verso l’alto, ha vertice in V(0,-c). La soluzione cade nell’intervallo [1,c], dove le derivate prima e seconda sono positive. Allora la formula da iterare, partendo da x_0=c è:

x_{k+1}=x_k-\frac{f(x_k)}{f'(x_k)}=x_k-\frac{x_k^2-c}{2x_k}=\frac{x_k^2+c}{2x_k}=\frac{1}{2}\left(x_k+\frac{c}{x_k}\right).

Riassunto

  1. In mancanza di una formula risolutiva per ogni equazione, spesso è necessario ricorrere a metodi approssimati, che uniscono considerazioni di tipo grafico a algoritmi di calcolo, da eseguire su un computer oppure con una calcolatrice.
  2. Il primo passo è isolare le soluzioni: data l’equazione f(x)=0, nel grafico di f(x) si individuano approssimativamente gli intervalli di x che contengono le soluzioni. Se la cosa non è immediata ci si può aiutare cercando le intersezioni grafiche fra le funzioni g(x) e h(x), definite da f(x)=g(x)-h(x)=0\ \to \ g(x)=h(x).
  3. Il secondo passo è restringere gli intervalli attorno alla soluzione che contengono, progressivamente, fino a individuarla con la precisione desiderata. Questo è possibile solo se la funzione è continua, monotona negli intervalli considerati e con valori di segno discorde agli estremi (Teorema degli zeri).
  4. Abbiamo descritto due metodi per restringere gli intervalli. Il primo è il metodo dicotomico, che consiste nel dividere in due ogni intervallo e poi ripetere il procedimento solo per quella metà in cui si trova la soluzione.
  5. Il secondo è quello delle tangenti, che usa l’equazione della tangente al grafico ad un estremo dell’intervallo per individuare un nuovo estremo più vicino alla soluzione.
  6. Il metodo delle tangenti è assai più efficiente del metodo dicotomico, ma richiede anche il controllo sulla concavità del grafico, oltre a quelli sulla continuità, sulla monotonia e sul segno della funzione agli estremi.

Esercizi

  1. Applica il metodo delle tangenti al calcolo della radice cubica di un numero positivo.

Massimi, minimi e flessi

Due problemi di ottimizzazione

I due problemi seguenti orienteranno il nostro studio a prendere confidenza con le applicazioni più tipiche. Il primo problema è già stato oggetto di studio nel libro sugli iperreali.

La scatola più capiente

Partendo da un cartoncino di formato A4, si cerca di ricavare la scatola (senza coperchio) più capiente, praticando alla giusta distanza due tagli perpendicolari a lato di ogni angolo, in modo da escludere in tutto 4 quadrati uguali. Calcola al millimetro la misura dei tagli opportuna.

I fogli di formato A sono costruiti così: il foglio A0 è un rettangolo di area 1 m^2 e con lati in rapporto uguale a \sqrt{2}. Viene diviso a metà lungo il suo lato maggiore per ottenere due fogli di formato A1, i quali a loro volta vengono tagliati con lo stesso criterio, formando ciascuno due fogli di formato A2. Lo stesso avviene per i formati successivi, che indicano fogli sempre più piccoli, con l’area dimezzata rispetto ai formati precedenti. Quindi se a è il lato maggiore per esempio del rettangolo di formato A3 e b è il lato maggiore del rettangolo di formato A4, si ha che \frac{a^2}{b^2}=2\ \to\ a=b\sqrt{2}, che è anche il rapporto fra le dimensioni di uno stesso foglio. Siccome il foglio formato A0 ha area di 1\ m^2=10000\ cm^2 , il foglio di formato A4 avrà area Area(A4)=\frac{10000}{16}\ cm^2 = l\cdot l\sqrt{2}=l^2\sqrt{2}, dove l è il lato per esempio minore. Quindi a^2\sqrt{2}= \frac{10000}{16}\ \to \ a=\frac{25}{\sqrt[4]{2}}=21.02241\ cm. Moltiplicando per \sqrt{2} si ottiene l’altra dimensione, di 29.73010\ cm.

scatola

Per indicare più brevemente i calcoli poniamo a=\sqrt{2} e b=1. Una volta ottenuto il risultato lo moltiplicheremo per il vero valore di b=\frac{25}{\sqrt[4]{2}}. Le dimensioni iniziali della scatola ideale vengono accorciate di 2x, così avremo un volume pari a V=x(a-2x)(b-2x). Per cercare il volume massimo consideriamo la funzione y=f(x)=x(a-2x)(b-2x), definita nell’intervallo \left[0,\frac{b}{2}\right], perché non si può pensare di praticare il taglio oltre la metà del lato minore. Consideriamo gli estremi dell’intervallo inclusi: sappiamo che a distanza zero e a distanza \frac{b}{2} da un vertice non ha senso praticare il taglio perché il volume risulta nullo: f(0)=f\left(\frac{b}{2}\right)=0. Senza nessun taglio, la scatola non esiste e il volume è nullo. Si provano tagli via via più profondi e più distanti dai vertici, si piegano i margini, la scatola prende forma e il volume cresce. Sia arriverà ad un taglio (almeno uno) di misura \overline{x} che darà luogo al volume massimo. Il grafico di f(x), in corrispondenza di \overline{x} avrà la tangente orizzontale, perché la funzione che rappresenta il volume cresce fino al suo massimo, poi decresce. Quindi per \overline{x} la derivata della funzione si annulla.

Calcoliamo la derivata e poniamola uguale a zero: f(x)=12x^2-4(a+b)x+ab=0. È un’equazione di secondo grado, le cui soluzioni sono accettabili solo se appartengono all’intervallo dato. Le considerazioni precedenti ci dicono che almeno una soluzione deve esistere: ne abbiamo la certezza esaminando \frac{\Delta}{4}=4(a+b)^2-12ab=4(a^2-ab+b^2)=4[(a-b)^2+ab]>0. Quindi

x=\frac{2(a+b)\pm 2\sqrt{a^2-ab+b^2}}{12}=\frac{a+b\pm \sqrt{a^2-ab+b^2}}{6}

Sostituendo a=\sqrt{2} e b=1 si ottiene una sola soluzione nell’intervallo dato \overline{x}=0.192489 e infine, moltiplicando per \frac{25}{\sqrt[4]{2}} si perviene al valore 4.046580774. Il taglio ottimale risulta perciò di circa 4\  cm.

Il cilindro di area minima

Fra tutti i cilindri di volume dato, trova le dimensioni del cilindro con la minima area totale.

La formula che esprime il volume di un cilindro è V=\pi r^2h (r è il raggio, h è l’altezza). Se il volume è dato, l’altezza dipende dal raggio: h=\frac{V}{\pi r^2}. La formula della superficie totale dipende anch’essa da altezza e raggio: A=2\pi rh+2\pi r^2 e può essere riscritta come funzione che dipende unicamente dal raggio x.
:math:`y=f(x)=2\pi x\frac{V}{\pi x^2} +2\pi x^2=\frac{2V}{x}+2\pi x^2.

cil_area_min

Il primo addendo indica l’area laterale. Poiché il raggio vi compare al denominatore, vuol dire che l’area laterale è infinita se il raggio è infinitesimo, cioè il cilindro è sottilissimo e altissimo. In questo caso le due aree di base, cioè il secondo addendo, danno un contributo infinitesimo. Al contrario, se il raggio è infinito, l’area laterale risulta infinitesima e le aree di base sono infinite, cioè il cilindro è piatto e larghissimo. Fra queste due situazioni estreme ci sarà senz’altro un valore intermedio del raggio tale da rendere minima l’area totale. La funzione è definita nell’intervallo x\in (0,+\infty)

&f(\epsilon)=2\pi (\epsilon)^2+ \frac{2V}{\epsilon}=(\epsilon)+(+\infty)=+\infty\\
&f(+\infty)=2\pi (+\infty)^2+ \frac{2V}{+\infty}=(+\infty)+(0)=+\infty

f(x) ha quindi un grafico che scende dall’infinito per x prossimo a \epsilon e vi risale per x=+\infty. Il grafico ha senz’altro almeno un punto di minimo, nel quale la tangente è orizzontale, come già visto.

f'(x)=4\pi x-\frac{2V}{x^2}=0 \to 4\pi x=\frac{2V}{x^2}\to x^3=
\frac{V}{2\pi}\to x=\left(\frac{V}{2\pi}\right)^{\frac{1}{3}}

Il risultato non è tanto importante in sè, perché un semplice algoritmo, eseguito al computer, avrebbe potuto calcolarlo per ogni dato volume. E’ invece significativo perché ci dà indicazioni preziose sulla forma del solido. Mettiamo in rapporto l’altezza e il raggio:

\frac{h}{r}=\frac{\frac{V}{\pi r^2}}{r}=\frac{V}{\pi r^3}=
\frac{V}{\pi\frac{V}{2\pi}}=2

Fra gli infiniti cilindri di dato volume, quello di area minima ha l’altezza pari al diametro. La sua sezione verticale passante per il diametro è quindi un quadrato.

Note

Restando aderenti alle situazioni concrete, si danno per scontate alcune questioni teoriche (sulla continuità delle funzioni, sull’esistenza della soluzione, ecc), e i procedimenti risolutivi arrivano ai risultati senza intoppi. Non tutti i casi sono però così fortunati, quindi ora è il momento di esaminare la questione nei suoi aspetti generali.

Generalità sui massimi e sui minimi

max_min

Una funzione può avere punti di massimo e di minimo, relativi e assoluti.

Il disegno mostra il grafico di una funzione che due punti di massimo relativo in \overline{x}_1 e \overline{x}_3, di cui quest’ultimo è anche massimo assoluto, e tre punti di minimo relativo in a,\overline{x}_2, b, fra i quali a è anche minimo assoluto.

  • Massimo assoluto vuol dire f(\overline{x})\ge f(x) per tutti gli x del dominio.
  • Massimo relativo: f(\overline{x})\ge f(x) per tutti gli x del dominio, infinitamente vicini a \overline{x}.
  • Minimo assoluto vuol dire f(\overline{x})\le f(x) per tutti gli x del dominio.
  • Minimo relativo: f(\overline{x})\le f(x) per tutti gli x del dominio, infinitamente vicini a \overline{x}.

Non è detto che una funzione abbia un massimo assoluto: può averne uno, nessuno o anche infiniti e lo stesso vale per i minimi assoluti. Una funzione come la tangente, nell’intervallo \left(-\frac{\pi}{2},+\frac{\pi}{2}\right), oppure come la retta y=x nell’intervallo (0,1), non ha né massimi né minimi. Invece la funzione seno, considerata sull’asse iperrereale, ha infiniti massimi e minimi assoluti. La questione dell’esistenza certa di massimi o minimi assoluti è legata alla continuità della funzione e al fatto che l’intervallo contenga gli estremi. Questo non esclude che anche altre funzioni, discontinue oppure definite su intervalli aperti, abbiano di questi punti.

Teorema: Se una funzione f(x) è continua e definita su un intervallo chiuso e limitato [a,b], allora certamente esiste un punto \overline{x} interno all’intervallo per il quale la funzione ha un massimo (minimo) assoluto.

Dimostrazione: Consideriamo f:\ [a,b]\ \to \mathbf{R}. Poniamo a=a_0 e b=b_0. Dividiamo l’intervallo per il suo punto medio m_0=\frac{a_0+b_0}{2} e andiamo a cercare se in [a_0,m_0] esiste un punto x_0 tale che in quel punto la funzione supera (o eguaglia) i valori che assume nella seconda metà [m_0,b]: f(x_0)\ge ~f(x), ~\forall x\in [m_0,b]. Se questo x_0 esiste, allora concentriamo il lavoro successivo solo sulla prima metà di [a,b], cioè su [a_0,m_0], altrimenti ci concentreremo sulla seconda metà, [m_0,b]. Nel primo caso poniamo a_1=a_0 e b_1=m_0, nel secondo sarà: a_1=m_0 e b_1=b_0. A questo punto si ripete il procedimento: si trova il punto medio del nuovo intervallo m_1=\frac{a_1+b_1}{2} e ci si concentra sulla metà che contiene x_1 tale f(x_1)\ge f(x) per tutti gli x dell’altra metà. E così via. Con questa tecnica si costruiscono due successioni dei valori a_k e b_k, che rappresentano gli estremi sempre più vicini di intervalli che si stringono sempre più attorno al punto per il quale f(x) assume un valore maggiore o uguale a tutti quelli assunti per gli x esterni. Le due successioni sono monotone e limitate, quindi convergono (v. Par. 13.1.2). La differenza fra due termini b_k-a_k=\frac{b-a}{2^k} è infinitesima per indici infiniti: a_N\approx b_N Le due successioni convergono allo stesso numero standard \overline{x}, con a_N\le \overline{x}\le b_N e f(\overline{x})\ge f(x) per tutti gli x esterni alla monade di \overline{x}. Quindi f(x) ha in \overline{x} un punto di massimo assoluto.

Note

Il teorema vale anche per i punti di minimo assoluto. Basta infatti considerare la funzione g(x)=-f(x) e procedere con una dimostrazione analoga.

Teorema. Nei punti di massimo (minimo) interni a [a,b] la derivata si annulla.

Infatti se il punto x è di massimo, df(x)\ge 0. Per dx>0 si ha \frac{df(x)}{dx}\ge 0, mentre se dx<0 \frac{df(x)}{dx}\ge 0. La parte standard del rapporto differenziale non può essere contemporaneamente positiva e negativa, perciò f'(x)=0.

Note

Anche gli estremi dell’intervallo possono essere di massimo o di minimo, ma non è detto che la derivata in quei punti sia nulla. Per esempio questo accade per x=a nel disegno. Inoltre vi possono essere massimi e minimi per i quali la derivata non esiste, come per f(x)=|x| nell’origine.

In conclusione una funzione definita e continua su un intervallo chiuso e limitato ha certamente un massimo e un minimo assoluti e questi punti vanno cercati dove la derivata si annulla, oppure agli estremi dell’intervallo oppure dove la derivata non esiste.

Esempio 1

Cercare massimi e minimi di f(x)=x^4-2x^3+|x|-1

La funzione è continua, perché è somma di funzioni continue. All’infinito è asintotica a x^4, quindi diverge positivamente: f(\pm\infty)=+\infty. La funzione ha quindi un minimo assoluto, non un massimo assoluto, oltre ad altri eventuali massimi e minimi relativi.

Ricerca del minimo assoluto

Il punto va ricercato

  • dove eventualmente si annulla la derivata, oppure
  • dove la derivata non esiste, cioè in x=0.

Per capire quest’ultimo punto, consideriamo che f(x) è la somma di funzioni derivabili ovunque più la funzione valore assoluto, che è non derivabile nell’origine perché qui vi ha un punto angoloso. Quindi complessivamente f(x) non è derivabile nell’origine.

Calcoliamo la derivata e uguagliamola a zero. Per x>0: f'(x)=4x^3-6x^2+1=0 (cercheremo eventuali soluzioni positive). Per x<0, \ f'(x)=4x^3-6x^2-1=0 (soluzioni negative).

Soluzioni positive

Riscriviamo l’equazione come x^3=\frac{3}{2}x^2-\frac{1}{4} e cerchiamo graficamente le intersezioni eventuali fra le due curve.

Esempio_1_a

Ricerca grafica delle soluzioni positive di f'(x)=0

Si intuisce l’esistenza di due soluzioni, di cui la prima nell’intervallo [0,1] e la seconda nell’intervallo [1,2]. Ricaviamo la prima soluzione dal Teorema di Ruffini: x_1=\frac{1}{2} e la seconda abbassando il grado del polinomio: 4x^3-6x^2+1=\left(x-\frac{1}{2}\right)(4x^2-4x-2)=(2x-1)(2x^2-2x-1) L’unica soluzione positiva di 2x^2-2x-1=0 è x=\frac{1+\sqrt{3}}{2}=1.36602540.

Soluzioni negative

L’equazione 4x^3-6x^2-1=0 si può riscrivere come x^3=\frac{3}{2}x^2+1. Il metodo del confronto fra i grafici è di aiuto per capire che non esistono soluzioni negative, perché i due grafici non si intersecano per x<0.

Il valore del minimo assoluto

Dobbiamo tener conto anche di x=0, dove la derivata non esiste. Non resta che calcolare i valori di f(x) nei tre punti che possono dare luogo ad un minimo assoluto. f(0)=-1\ f((0.5)=-0.6875\ f(1.3660254)=-1.250000. È quindi quest’ultimo il valore minimo assoluto assunto dalla funzione.

Eventuali punti di massimo e minimo relativi e grafico

Abbiamo due punti da discutere: in 0 la derivata non esiste e in 0.5 la derivata è nulla. Che tipo di punti sono questi, per f(x)? Riguardando le considerazioni iniziali sulla continuità e sugli asintoti, si può intuire che il primo sia un punto di minimo relativo, il secondo di massimo relativo e per averne la prova basterebbe calcolare i valori di f(x) per x prossimi ai valori in discussione. Possiamo però applicare le tecniche già apprese e procedere in modo più completo ed elegante.

Per x\approx 0 il polinomio x^4+2x^3-|x|-1\sim |x|-1, che è la funzione valore assoluto con il vertice in (0,-1). Dunque, nella monade di zero f(x)\ge 1, il che corrisponde al fatto che per x=0 f(x) ha un minimo relativo.

Per studiare il comportamento (approssimato) di f(x) per x=0.5 usiamo lo sviluppo in serie di Taylor del secondo ordine: f(x)\sim f(0.5)+\frac{f^{''}(0.5)}{2}(x-0.5)^2. Calcolando f^{''}(0.5) si ottiene -3, quindi: f(x)=f(0.5)-\frac{3}{2}(x-0.5)^2<f(0.5), quindi per 0.5 la funzione ha un massimo relativo.

Esempio_1_b

Grafico della funzione f(x)

Ecco infatti il grafico della funzione, disegnato assieme ai grafici di y=|x|-1 e di y~=~-0.6875~-1.5(x-0.5)^2, che approssimano la funzione negli ultimi due punti considerati.

Considerazioni sulla derivata seconda

Gli ultimi calcoli, svolti con l’aiuto del polinomio di Taylor al secondo ordine, suggeriscono qualche ragionamento di grande utilità.

f(x)=\sim f(a)+\frac{f^{''}(a)}{2}(x-a)^2 è l’espressione che vale se f'(a)=0. Poiché \frac{(x-a)^2}{2} è un fattore positivo, il segno della derivata seconda, calcolata in a determina se f(x)\ge f(a) oppure f(x)\le f(a), e quindi se a è un punto di minimo o di massimo relativi. La procedura è:

In un punto in cui la derivata prima si annulla, si controlla il segno della derivata seconda. Se in quel punto la derivata seconda è positiva, si tratta di un minimo relativo. Se invece è negativa, si tratta di un massimo relativo.

Se anche la derivata seconda si annulla

In questo caso la differenza f(x)-f(a) dipende dal termine del terzo ordine del Polinomio di Taylor, perché f(x)-f(a)=\frac{f^{'''}(a)}{3!}(x-a)^3. (x-a)^3 cambia segno a seconda che x sia maggiore o minore di a e, se la derivata terza è positiva, f(x)-f(a) segue il segno di x-a. In questo caso, cioè nel caso della derivata terza positiva con le derivate prime e seconde nulle, il grafico della funzione incrocia il grafico della tangente orizzontale nel punto x=a, passando da valori inferiori a sinistra di f(a) a valori superiori, a destra. Si tratta quindi di una funzione crescente nell’intervallo, ma che in a ha un punto a tangente orizzontale. Tale punto, che non è di massimo o di minimo relativi, è chiamato punto di flesso orizzontale. Se infine la derivata terza è negativa, con la derivata prima e seconda nulle, possiamo svolgere considerazioni analoghe e individuare in a un punto di flesso orizzontale di una funzione con andamento decrescente nell’intervallo.

Se anche la derivata terza si annulla

In questo caso possiamo riprendere le considerazioni svolte al titolo precedente perché il segno di f(x)-f(a) dipende dal termine del quarto ordine del polinomio di Taylor. Se la derivata quarta è positiva abbiamo un minimo relativo, altrimenti un massimo.

Regola generale In un punto dove si annullano le derivate prima e seconda, si calcolano le derivate successive fino alla prima derivata che non si annulla. Se questa derivata è di ordine pari, si svolgono le considerazioni già viste per la derivata seconda. Se questa derivata è di ordine dispari, siamo in presenza di un punto di flesso orizzontale.

Punti di flesso

Vengono chiamati flessi i cambi di concavità del grafico di una funzione. Nei punti di flesso la tangente al grafico sembra una retta secante: la funzione si avvicina al punto di tangenza per esempio da sinistra mantenendosi più bassa, cioè per valori inferiori, concava verso il basso; superato il punto di flesso troviamo la funzione dalla parte opposta della tangente, cioè con valori maggiori e concava verso l’alto. In questo caso si dice che il flesso è ascendente. Se invece a sinistra del punto di flesso la funzione è concava verso l’alto poi interseca la “tangente” e cambia concavità rivolgendosi verso il basso e assume valori inferiori alla tangente, allora il flesso si dice discendente. I flessi possono essere orizzontali, come già visto nell’esempio, oppure obliqui, nel senso che la retta tangente è inclinata. In questi casi la derivata prima nel punto in questione è diversa da zero.

L’equazione della tangente di f(x) nel punto a è y=f(a)+f'(a)(x-a), come sappiamo. Si tratta del Polinomio di Taylor del primo ordine. La differenza fra i valori della funzione e quelli della tangente, usando il Polinomio al secondo ordine, è

f(x)-f(a)-f'(a)(x-a)\sim \frac{f^{''}(a)}{2}(x-a)^2

ed è una differenza che ha il segno di f^{''}(a), purche sia diversa da zero. Questo vuol dire che se per esempio il grafico della funzione a sinistra di a è tracciato sotto il grafico della tangente, allora resta sotto anche a destra di a. Se invece la derivata seconda è nulla e la derivata terza no, scriviamo f(x)-f(a)-f'(a)(x-a)\sim \frac{f^{'''}(a)}{3!}(x-a)^3, che, come abbiamo già visto, cambia segno in relazione a (x-a)^3, il che costringe il grafico della funzione a scavalcare la retta “tangente”.

Criterio delle derivate successive

Se per x=c si annulla la derivata seconda f''(c)=0, calcola n derivate successive, fino alla prima derivata f^n(c)\ne 0 e controlla:

  1. n è dispari: allora (c,f(c)) è un punto di flesso. Se f^n(c)> 0 il flesso è ascendente, altrimenti è un flesso discendente. Se inoltre anche f'(c)=0 il flesso è orizzontale (ascendente o discendente).

  2. n è pari:

    non avremo un flesso, ma solo indicazioni sulla concavità.

I flessi per l’esempio 1

Concludiamo l’esercizio precedente con la ricerca dei flessi. Cerchiamo quindi dove si annulla la derivata seconda e se in quel punto la prima derivata non nulla è di ordine dispari. Abbiamo per x>0\ :\ f^{''}(x)=12x(x-1), che si annulla per x=0,\ x=1. Escludiamo :x=0, dove f(x) non è derivabile, e calcoliamo f^{'''}(x)=24x-12 quindi f^{'''}(1)=12>0. Si tratta quindi di un flesso ascendente.

Esempio_1_c

Il flesso ascendente di f(x)

Si può controllare che per x<0 le uniche soluzioni possibili non sono accettabili.

Esempio 2

Individuiamo i flessi per la funzione statistica della distribuzione normale

f(x)=\frac{1}{2\pi}e^{-\frac{x^2}{2}}

Cerchiamo quindi i punti per i quali si annulla la derivata seconda, ma non la derivata terza.

f^{''}(x)=\frac{1}{2\pi}e^{-\frac{x^2}{2}}(x^2-1), che si annulla per x=\pm 1

f^{'''}(x)=\frac{1}{2\pi}x(3-x^2)e^{-\frac{x^2}{2}}, positiva per x=1 (flesso ascendente) e negativa per x=-1 (flesso discendente) come è prevedibile per la parità della funzione.

Esempio_2

I flessi della funzione distribuzione normale

Terzo problema di ottimizzazione

Si vuole ritagliare un disco di raggio dato R per farne un settore circolare da vvolgere in modo da ottenere un cono. Calcolare il settore utile a generare il cono più capiente.

cono_ottimo

Se il settore che si ricava è sottile, il cono è eccessivamente stretto e poco capiente. Lo stesso avviene per un settore eccessivamente largo, che genera un cono troppo basso. Esiste quindi una misura intermedia ottimale di angolo al centro x, che corrisponde al volume massimo del cono. Occorre trovare la relazione che lega l’angolo (in radianti) al volume del cono.

cono

La formula del volume del cono è V=\frac{1}{3}\pi r^2h, dove r è il raggio di base del cono che si genera. Questo raggio è legato alla circonferenza C=2\pi r, che è l’arco del settore circolare. Quindi 2\pi r=Rx\ \to\ r=\frac{Rx}{2\pi}. R, il raggio del disco, nel cono diventa l’apotema. Questo ci consente di ricavare l’altezza h del cono: h=\sqrt{R^2-r^2}.

La funzione da ottimizzare, che esprime il volume in funzione dell’angolo x è

f(x)=\frac{1}{3}\pi\left(\frac{Rx}{2\pi}\right)^2\sqrt{R^2-\left(\frac{Rx}{2\pi}\right)^2}
=\frac{1}{3}\pi\frac{R^2x^2}{4\pi^2}\sqrt{\frac{R^2(4\pi^2-x^2)}{4\pi^2}}=
\frac{R^3}{24\pi^2}x^2\sqrt{4\pi^2-x^2}.

La variazione della funzione è data dal variare di x^2\sqrt{4\pi^2-x^2}, che chiameremo g(x), mentre il fattore \frac{R^3}{24\pi^2} è una costante che cambia i valori della funzione ma non influisce sugli x per i quali si ha il volume massimo. Infatti g(x) e f(x) sono direttamente proporzionali. Anzi, per rendere ancora più veloce l’individuazione del punto di massimo, possiamo considerare h(x)=g^2(x)=x^4(4\pi^2-x^2). h(x) e g(x) sono entrambe definite su [0,2\pi], sono continue e derivabili all’interno dell’intervallo, sono nulle agli estremi e raggiungono il massimo assoluto per lo stesso \overline{x}, ovviamente con valori che sono uno il quadrato dell’altro.

Dal punto di vista concreto, non dovremmo considerare praticabili angoli come x=0 e x=2\pi, ma includiamo ugualmente questi valori come estremi perché definire la funzione sull’intervallo chiuso e limitato è una delle condizioni che garantiscono l’esistenza del massimo assoluto. Data la situazione, escludiamo che il punto di massimo sia un estremo dell’intervallo e cerchiamo quindi solo i punti interni per i quali si annulla la derivata.

&h'(x)=4x^3(4\pi^2-x^2)+x^4(-2x)=16\pi^2x^3-6x^5=2x^3(8\pi^2-3x^2)\\
&h'(x)=0 \ \to \ x=0 \lor x=\pm\sqrt{\frac{8}{3}\pi}

L’unica soluzione accettabile è l’ultima, positiva, e di conseguenza g\left(\sqrt{\frac{8}{3}\pi}\right)=\frac{16\pi^3}{3\sqrt{3}} e f\left(\sqrt{\frac{8}{3}\pi}\right)=\frac{2\pi^3}{9\sqrt{3}}. Per avere una risposta concreta, vediamo quanto valgono in gradi \sqrt{\frac{8}{3}\pi} radianti. \sqrt{\frac{8}{3}\pi}\cdot\frac{180}{\pi}=~294^\circ.

Usiamo le formule iniziali per ricavare il raggio r~=~\frac{R}{2}\sqrt{\frac{8}{3}}~=~R\sqrt{\frac{2}{3}} e l’altezza h~=~\frac{R}{2\pi}\sqrt{\frac{4}{3}\pi^2}=\frac{R}{\sqrt{3}} del cono ottimale. Ne consegue che il cono ottimale ha il raggio di base che è \sqrt{2} volte l’altezza.

settore_sezione

Il settore ottimale è di 294^\circ. Ne risulta una sezione conica verticale come in figura.

Riassunto

  1. I massimi e i minimi di una funzione sono i valori estremi che la funzione raggiunge in un intervallo. I massimi, come i minimi, possono essere assoluti o relativi. Sono assoluti quando sono i valori maggiori (i minori), considerando tutto l’intervallo di definizione. Sono relativi se questo avviene considerando intervalli ristretti attorno ai punti in questione. I massimi (minimi) assoluti sono anche massimi (minimi) relativi, mentre non vale il contrario.
  2. Una funzione, continua o discontinua, può avere nessuno, uno, alcuni o infiniti massimi (minimi) assoluti e relativi.
  3. L’esistenza di un massimo (minimo) assoluto è garantita per le funzioni continue definite su un intervallo chiuso e limitato, per i punti interni all’intervallo. Non è garantita agli estremi dell’intervallo e per le funzioni discontinue.
  4. Nelle condizioni del punto precedente, in almeno un punto la derivata prima della funzione è nulla. Calcolare per quali x la f'(x)=0 è la prima strategia alla quale ricorrere per trovare i punti di massimo e di minimo.
  5. Quando si annulla la derivata prima, si può indagare ulteriormente per capire la natura del punto in questione. Se in quel punto la derivata seconda è positiva, il grafico ha una concavità verso l’alto e siamo in presenza di un minimo, se è negativa la concavità è verso il basso e siamo in presenza di un massimo.
  6. La derivata prima si annulla anche nei punti di flesso orizzontale, che sono i punti in cui il grafico della funzione cambia concavità. In questo caso anche la derivata seconda si annulla nel punto.
  7. Il criterio delle derivate successive (17.6) consente in generale di individuare massimi, minimi e flessi delle funzioni pìù volte derivabili nell’intervallo (estremi esclusi)

Esercizi

  1. La capacità della scatola calcolata nel primo esempio del capitolo è di 1.13 litri. Quale è la misura del taglio che genera una scatola con la capacità di 1 litro? Scrivi l’equazione risolvente e applica i metodi approssimati per risolverla.
volume_scatola

I grafici delle funzioni

In quest’ultimo capitolo utilizziamo le conoscenze già viste, precisandole e approfondendole, e ne sviluppiamo di nuove per imparare a disegnare manualmente il grafico di una funzione. Molti software matematici, alcuni anche gratuiti e online, e molte calcolatrici scientifiche sono oggi in grado di svolgere perfettamente questo compito. Lasceremo a questi utili strumenti di calcolo la parte più macchinosa e meno attraente e terremo per noi la parte più nobile del compito, cioè la previsione e la valutazione delle proprietà del risultato.

Dettagli sul dominio

Finora abbiamo usato come dominio delle funzioni gli intervalli di numeri [a,b], oppure (a,b), o [a,b), o infine (a,b]. Con queste notazioni puntiamo l’attenzione sui numeri x : a<x<b interni all’intervallo e sottintendiamo che i numeri x: x<a \vee x>b siano esterni e che infine a,b siano i punti di frontiera del dominio. Trattandosi di numeri iperreali, cioè di numeri sui quali dobbiamo poter indagare anche con microscopi non standard, dobbiamo precisare alcune cose, che riprendiamo dal primo volume.

Una volta individuata la proprietà caratteristica di un intervallo della retta reale, sappiamo definire per estensione l’intervallo corrispondente di iperreali: si tratta dei numeri ^*x che hanno la stessa proprietà. Per esempio da un intervallo di reali I= [a,b)=\{x : a\le x<b\} passiamo a ^*I= ^*[a,b)=\{^*x : a\le ^*x<b\} di iperreali.

Sappiamo anche che ogni funzione reale di numeri reali f: D\to \mathbf{R} ha una corrispondente funzione ^*f: ^*D\to \mathbf{^*R} iperreale di numeri iperreali e che rinunciamo a scrivere cose come ^*\sin\epsilon oppure ^*\log(1+\delta) per semplicità e perché diamo per scontato che se l’argomento è un numero non standard allora stiamo usando l’estensione iperreale della funzione.

Classificazione dei punti del dominio

Dato un intervallo A e il suo complemento A' di reali, consideriamo le estensioni iperreali ^*A, ^*A'. Chiamiamo

  • punti interni di ^*A quelli per cui mon(x)\subseteq ^*A, cioè i punti che intendiamo siano contenuti in ^*A con la propria monade
  • punti esterni di ^*A quelli per cui mon(x)\subseteq ^*A', la cui monade non è contenuta a ^*A
  • punti di frontiera per ^*A quelli per cui mon(x)\cap ^*A\ne \emptyset\land mon(x)\cap ^*A'\ne \emptyset, nella cui monade ci sono sia punti di ^*A che punti del suo complemento ^*A'

I punti possono essere solo in una di queste tre situazioni, rispetto a ^*A.

Quando studiamo il comportamento asintotico di una funzione in un punto, in realtà siamo interessati ai valori che la funzione assume nei punti infinitamente vicini, quindi diversi dal punto indicato. Per esempio f(c\pm)\approx s significa f(c\pm\delta)\approx s, cioè f(x)\approx s per tutti gli x infinitamente vicini a c, ma in generale diversi da c. Infatti può anche succedere che la funzione non sia definita per x=c, mentre deve esserlo per x\in mon(c). È il caso tipico dei punti di frontiera degli intervalli aperti di iperreali, per i quali ci aspettiamo che la funzione sia definita per la monade destra di a e per quella sinistra di b. A volte invece non possiamo studiare il comportamento asintotico della funzione per x\approx c perché solo c appartiene a ^*A e non la sua monade, o meglio mon(x)\cap ^*A-\{x\}=\emptyset. Allora si dice che siamo in presenza di un punto isolato.

  • punti isolati di ^*A quei punti di frontiera per cui mon(x)\cap ^*A=\{x\}, cioè essi sono gli unici elementi comuni sia alla propria monade che all’estensione di ^*A.

In conclusione, è possibile studiare il comportamento asintotico di f(x) solo per i punti interni di ^*A e per i punti di frontiera non isolati, perché in entrambi i casi mon(x)\cap ^*A-\{x\}\ne\emptyset. Questi punti sono quelli utili per noi ed hanno un nome particolare:

  • punti di accumulazione di ^*A quei punti per cui mon(x)\cap ^*A-\{x\}\ne\emptyset, cioè punti per i quali ogni monade contiene dell’estensione di ^*A almeno un punto diverso x.

Perciò se c è un punto di accumulazione per il dominio D di f, possiamo dire che f(c\pm)\approx s se \forall x\in mon(c) \land x\in ^*D\land x\ne c\ :\  f(x)\approx s.

Per esempio, se accade che f(c+)=+\infty, si dirà che c è un punto di accumulazione destro per il quale la funzione è un infinito positivo.

Esercizio

Dato l’insieme A=\frac{k}{k+1}, k\in\mathbf{N}, definisci l’estensione di A, i suoi punti interni, esterni, isolati, di frontiera di accumulazione.

L’estensione ^*A si ottiene per k ipernaturale infinito, quindi aggiungendo i punti \frac{N}{N+1}\sim 1. Quindi 1 è un punto di accumulazione per l’insieme ^*A, mentre gli altri punti, che si ottengono per k finito, nelle loro monadi non hanno altri elementi dell’insieme esteso . Sono punti isolati e dunque sono punti di frontiera. Abbiamo quindi un insieme costituito da infiniti punti di frontiera, uno dei quali è anche di accumulazione: un insieme senza punti interni.

Note

Un punto che appartiene ad un insieme non è detto che sia interno all’insieme. All’insieme appartengono i punti interni e quelli di frontiera, fra i quali anche quelli isolati.

Immaginiamo che ^*A sia il dominio della funzione f(x)=\frac{1}{x-1}. Possiamo studiare il comportamento asintotico di f solo per x=1, cioè per i punti \frac{N}{N+1} infinitamente vicini a 1 e diversi da 1. Infatti x=1 è l’unico punto di accumulazione.

f(\frac{N}{N+1})=\frac{1}{\frac{N}{N+1}-1}=\frac{1}{-\frac{1}{N+1}}=-(N+1)=-\infty

1 è il punto di accumulazione sinistro per cui f è un infinito negativo. Si può ottenere lo stesso risultato valutando x=\frac{N}{N+1}<1 e quindi x-1 è un infinito negativo.

In aggiunta, osserviamo che il differenziale dx non è calcolabile (e quindi nemmeno la derivata), perché mancano punti interni al dominio.

Uno studio di funzione completo: esercizio guida

Sappiamo già come ricavare parecchie indicazioni sul grafico di una funzione. Sappiamo che la derivata prima ci dice se la funzione è crescente o decrescente, che i punti a derivata nulla sono o di massimo o di minimo o di flesso orizzontale, che il segno della derivata seconda ci indica la concavità. Inoltre se la prima delle derivate successive non nulle è di ordine dispari avremo un flesso ascendente per la derivata positiva (quindi funzione crescente), altrimenti discendente (quindi decrescente).

Per applicare le nostre conoscenze e completarle eseguiamo lo studio di f(x)=\frac{\ln x}{x}

Il dominio

Il dominio è parte integrante della definizione della funzione e se non viene esplicitamente indicato si assume che sia il più ampio intervallo di reali per i quali la funzione ha significato. La nostra f(x) non è calcolabile se il denominatore è zero e in più il numeratore è definito per valori x positivi. Le due condizioni (di esistenza) sono quindi

\begin{cases} x\ne 0, & \mbox{per l'esistenza del quoziente} \\ x>0, & \mbox{per l'esistenza del logaritmo}\end{cases}\ \to \ x>0

dominio

Rappresentazione del dominio di f(x)=\frac{ln x}{x}

Il disegno corrispondente è il semipiano positivo, intendendo escluso anche x=0, punto nel quale disegniamo un cerchietto vuoto.

La simmetria

Si cerca di stabilire se la funzioni ha simmetria. Ricordiamo

  • Se f(x)=f(-x) la funzione è pari e il suo grafico è simmetrico rispetto all’asse Y.
  • Se f(x)=-f(x) la funzione è dispari e il suo grafico è simmetrico rispetto all’origine.
  • f(x) non è né pari né dispari: nessuna di queste simmetrie.

Per il controllo della simmetria conviene calcolare f(-x), cioè sostituire -x ad x nell’espressione della funzione, e controllare a quale delle opzioni corrisponde il risultato. La nostra funzione non ha simmetria e lo si vede già disegnando il dominio.

Note

f(x) può avere altre simmetrie, come si vedrà nell’ultimo esercizio del capitolo. L’analisi di tutte le possibili simmetrie si può fare negli esercizi in cui si parte dal grafico per analizzare le proprietà della funzione ed è di grande aiuto perché abbrevia il lavoro.

Le intersezioni

Per avere punti di riferimento nel disegno la strategia più semplice è cercare le intersezioni del grafico con gli assi. . È meglio cercare dapprima le intersezioni con l’asse Y, infatti le intersezioni con l’asse x sono i punti per i quali f(x)=0 e non è sempre semplice trovare le soluzioni, che possono anche essere infinite.

Intersezioni con l’asse Y: nel nostro caso non esistono perché x=0 è escluso da dominio.

Intersezioni con l’asse X: le intersezioni per f(x)=0 corrispondono alle soluzioni di \ln x=0 \ \to\ x=1. Abbiamo una sola intersezione, in (1,0).

Il segno

Non sappiamo se a sinistra dell’intersezione il grafico sia nel primo o nel quarto quadrante e non sappiamo se intersecando l’asse orizzontale il grafico cambi o no quadrante. Per questo motivo cerchiamo di risolvere f(x)>0.

Se la ricerca delle soluzioni è particolarmente complessa, per le funzioni continue possiamo anche evitarla: basterà calcolare il valore di f(x) in punto fra due intersezioni consecutive, infatti fra due zeri consecutivi una funzione continua ha segno costante, altrimenti vi sarebbero ulteriori intersezioni fra i due punti .

Ma il nostro è un caso semplice: dato che il dominio è per x>0, la funzione ha lo stesso segno del logaritmo, cioè

\begin{cases} f(x)<0, & \mbox{ per }0<x<1 \\ f(x)\ge 0, & \mbox{ per }x\ge 1\end{cases}

Cancelliamo dal disegno le regioni del piano non attraversate dal grafico.

segno

Regioni del piano attraversate dal grafico

Gli asintoti

Se nel dominio vi sono punti di frontiera che sono anche di accumulazione e se vi sono punti infiniti, occorre capire il comportamento asintotico di f(x). Nel notro caso occorre calcolare f(0+) e f(+\infty).

f(0+)=\frac{\ln (0+)}{0+}=\frac{-\infty}{0+}=-\infty\\
f(+\infty)=\frac{\ln (+\infty)}{+\infty}=\frac{+\infty}{+\infty}\overset{H}{\approx}\frac{\frac{1}{x}}{1}\approx 0

Abbiamo quindi un asintoto vertivale in x=0+ e uno orizzontale in x=+\infty. Nel grafico aggiungiamo due piccoli tratti a sinistra in basso e a destra appena sopra l’asse orizzontle, per ricordarci dove passerà il disegno.

L’andamento

Il segno della derivata prima ci dirà se e in quali intervalli la funzione è crescente o decrescente; se si annulla cercheremo di capire in quali punti vi può essere un massimo o un minimo o un flesso orizzontale.

f'(x)=\frac{\frac{1}{x}x-\ln x}{x^2}=\frac{1-\ln x}{x^2}

si annulla per \ln x=1\ \to\ x=e. Che ci fosse un punto a tangente orizzontale era prevedibile, dopo lo studio del comportamento asintotico, e resta solo da capire se e dove f(x) è crescente o decrescente, anche se ormai si intuisce, dato che nel dominio è continua.

In generale può essere molto complicato risolvere f'(x)>0 e allora è consigliabile procedere come indicato per f(x)=0, sempre che la derivata sia continua. Nel nostro caso la disequazione è semplice:

& f'(x)>0 \mbox{ per } 0<x<e \mbox{ (funzione crescente)}\\
& f'(x)<0 \mbox{ per } x>e \mbox{ (funzione decrescente)}

La funzione raggiunge quindi in e=2.7 il suo massimo (assoluto), con il valore f(e)=\frac{\ln e}{e}=\frac{1}{e}=0.37 e poi decresce adagiandosi progressivamente sull’asse X.

La concavità e i flessi

È evidente che approssimandosi al massimo f(x) ha la concavità rivolta verso il basso e che per adagiarsi sull’asse orizzontale subisce un cambio di concavità. Analizziamo i dettagli con lo studio della derivata seconda.

f^{''}(x)=\frac{-\frac{1}{x}x^2-(1-\ln x)(2x)}{x^4}=\frac{2\ln x-3}{x^3}

che si annulla per \ln x=\frac{3}{2}\ \to\ x=e^{\frac{3}{2}}=4.48.

Il segno della derivata seconda, se la sua espressione è complicata ma la derivata è continua, si può ricavare seguendo i suggerimenti analoghi visti per per il segno della funzione e della derivata prima.

Il nostro caso però è di quelli semplici:

& f^{''}(x)<0 \mbox{ per } 0<x<e^{\frac{3}{2}} \mbox{ (concavità verso il basso)}\\
& f^{''}(x)>0 \mbox{ per } x>e^{\frac{3}{2}} \mbox{ (concavità verso l'alto)}

per cui in x=e^{\frac{3}{2}}=4.48 la funzione ha un flesso ascendente, con il valore di f\left(e^{\frac{3}{2}}\right)=0.33. Inoltre la derivata seconda ci conferma che x=e è un punto di massimo, perché f^{''}(e)<0.

Le conclusioni sul flesso ascendente si possono verificare anche con la derivata terza, perché f^{'''}(e)>0

disegno

Il disegno manuale del grafico di \frac{\ln x}{x}

Nei casi complicati, in cui le equazioni f(x)=0\mbox{, }f'(x)=0\mbox{, }f^{'''}(x)=0 e le disequazioni associate sono troppo laboriose, ci si affida ai software che tracciano i grafici automaticamente.

grafico

Il grafico al computer di \frac{\ln x}{x}

Tuttavia questi strumenti a volte non chiariscono le esatte posizioni dei punti caratteristici ed occorre comunque aiutarsi con i calcoli.

La curvatura

Quando il grafico è stato tracciato manualmente, resta sempre il dubbio di non avere tracciato correttamete le curve fra i punti notevoli calcolati. Cerchiamo di costruire un metodo per identificare la curvatura che il grafico corretto deve seguire in ogni punto: avremo così uno strumento di analisi e di confronto anche per le curvature disegnate dal software.

curvatura_cerchio

La curvatura più facile da analizzare è quella di un cerchio. Chi lo percorre stando sulla circonferenza deve cambiare la sua direzione di un angolo pari all’angolo spazzato dal raggio. La direzione punto per punto è data dalla direzione della tangente e la curvatura è costante, per ogni cerchio. C’è infatti un rapporto fisso fra l’arco di circonferenza percorso \Delta s e l’angolo al centro (misurato in radianti) \Delta \theta, che è dato dal raggio: \Delta s=r\Delta \theta\ \to\ \frac{\Delta\theta}{\Delta s}=\frac{1}{r}. La curvatura è la rapidità con cui si cambia direzione percorrendo l’arco e quindi è il rapporto fra angolo e arco, inversamente proporzionale al raggio. La relazione vale anche per archi infinitesimi: \frac{1}{r}=st\left(\frac{d\theta}{d s}\right).

Cerchiamo ora di adattare questi risultati iniziali a grafici con curvature qualsiasi. Il procedimento generalizza e precisa quanto già visto a proposito della ricerca del cerchio osculatore di una curva, nel libro precedente.

Tracciamo in x la tangente al grafico: sarà una retta inclinata di un angolo \theta rispetto all’orizzontale, la cui tangente goniometrica è la derivata della funzione in x: \theta=\arctan f'(x).

direzione_grafico

Per esempio, calcoliamo il raggio del cerchio osculatore alla parabola y=x^2 nel punto x=1.

f'(x)=2x\ \to \ f'(1)=2\\
\theta=\arctan 2=1.0715, cioè circa 63.4^\circ

Il calcolo non è finito, perché la derivata che abbiamo calcolato è \frac{d\theta}{dx} e non \frac{d\theta}{ds}. d s è il tratto infinitesimo di curva. Osservato al microscopio non standard, poiché dy\approx f'(x)dx, risulta

ds=\sqrt{(dx)^2+(dy)^2}\approx\sqrt{(dx)^2+f'(x)^2(dx)^2}=\sqrt{1+f'(x)^2}dx.

L’angolo (in radianti) è l’arcotangente di f'(x), perciò abbiamo: d\theta\sim\frac{1}{1+f'(x)^2}f'(x)dx e quindi:

&\frac{d\theta}{ds}=\frac{\frac{f^{''}(x)}{1+f'(x)^2}dx}{\sqrt{1+f'(x)^2}dx}
=\frac{f^{''}(x)}{\left[1+f'(x)^2\right]^\frac{3}{2}}=\frac{1}{r(x)}\\
&r(x)=\frac{\left[1+f'(x)^2\right]^\frac{3}{2}}{f^{''}(x)}

Il raggio in questo modo potrebbe anche risultare negativo, dipendendo dal segno di f^{''}(x). Il raggio negativo indicherà la curvatura concava verso il basso, il raggio positivo indicherà la curvatura verso l’alto.

Tornando alla parabola, applicando la formula il raggio risulta r(x)=\frac{\left[1+4x^2\right]^\frac{3}{2}}{2}. Quindi al suo vertice la curvatura della parabola ha un raggio di r(0)=\frac{1}{2}, che corrisponde al risultato ottenuto nel primo libro.

Ora è facile disegnare il cerchio osculatore al vertice della parabola. La formula però è utile per disegnare il cerchio in qualsiasi punto della curva, purché si sappia in quale posizione fissare il centro. Vediamo come trovare la posizione del centro.

vettore_tang

La direzione della tangente si può rappresentare tramite il versore \hat t che punta nella direzione positiva degli assi. Le sue componenti, secondo il coseno e il seno dell’angolo, sono

t_x=\frac{dx}{ds}=\frac{1}{\sqrt{1+f'(x)^2}}\mbox{ e  }t_y=\frac{f'(x)dx}{ds}=\frac{f'(x)}{\sqrt{1+f'(x)^2}}

Trovate le componenti del versore tangente, calcoliamo quelle del versore \hat n perpendicolare alla curva in quel punto. Dato che il raggio è perpendicolare alla tangente, \hat n punta al centro del cerchio osculatore. Abbiamo

n_x=-t_y=-\frac{f'(x)dx}{ds}=\frac{f'(x)}{\sqrt{1+f'(x)^2}}\mbox{ e  }n_y=t_x=\frac{1}{\sqrt{1+f'(x)^2}}
versore_normale

Trovata la direzione del centro, la sua posizione si ottiene moltiplicando le componenti del versore normale per la lunghezza del raggio.

x_c=x+r(x)n_x\mbox{ e }y_c=f(x)+r(x)n_y

Operate le sostituzioni e svolti i calcoli, risulta:

\begin{cases}
 & x_c=x-\frac{f'(x)\left[1+f'(x)^2\right]}{f^{''}(x)} \\
 & y_c=f(x)+\frac{1+f'(x)^2}{f^{''}(x)}
\end{cases}

che sono le coordinate del centro del cerchio osculatore, relative a qualsiasi punto del grafico e per qualsiasi concavità, purché, ovviamente, la derivata seconda non si annulli. In questo caso non vi sarebbe nessuna concavità e il cerchio osculatore avrebbe un raggio infinito.

cerchio_oscul

Applichiamo le due formule alla solita parabola, per trovare il centro del cerchio osculatore relativo al punto di ascissa x. Una volta svolti i calcoli avremo:

\begin{cases}
 & x_c=-4x^3 \\
 & y_c=\frac{1}{2}+3x^2
\end{cases}

Prendiamo un software di geometria interattiva (Geogebra, DrGeo, Cabri, ecc), disegniamo la parabola e costruiamo l’animazione che al variare di x disegna il cerchio osculatore per mezzo delle formule che calcolano i centri e i raggi.

cerchi_oscul

Cerchi osculatori della parabola y=x^2

Osservazioni su alcune curvature

Le stesse formule, applicate alla sinusode danno luogo al disegno seguente

oscul_sin

Cerchi osculatori della sinusoide

Il disegno mostra raggi verticali di lunghezza unitaria per x=\frac{\pi}{2}. Infatti i calcoli ce lo confermano:

r(x)=\frac{\left[1+f'(x)^2\right]^\frac{3}{2}}{|f^{''}(x)|}=
\frac{(1+\cos^2 x)^\frac{3}{2}}{|\sin x|}

dove usiamo il valore assoluto per non dover dipendere dal tipo di concavità positiva o negativa segnalata dalla derivata seconda. Per x=\frac{\pi}{2} si ha

r\left(\frac{\pi}{2}\right)=\frac{\left(1+\cos^2 \frac{\pi}{2}\right)^\frac{3}{2}}{\left|\sin \frac{\pi}{2}\right|}=1

Il raggio di curvatura per la sinusoide è minimo quando vale 1, in corrispondenza dei massimi e dei minimi della funzione, dove c’è il massimo di curvatura. Si possono allora trovare i massimi di curvatura di un grafico attraverso la ricerca del cerchio osculatore di raggio minimo.

Per esempio, relativamente al grafico del logaritmo, abbiamo:

y=\ln x\mbox{ , }f'(x)=\frac{1}{x} \mbox{ , }f^{''}(x)=-\frac{1}{x^2}\\
r(x)=\frac{\left[1+f'(x)^2\right]^\frac{3}{2}}{|f^{''}(x)|}=
\frac{\left(1+\frac{1}{x^2}\right)^\frac{3}{2}}{\left|-\frac{1}{x^2}\right|}=
\frac{(x^2+1)^\frac{3}{2}}{x}

La funzione r(x) calcolata per il logaritmo è un infinito positivo sia in x=0+ sia in x~=~+\infty, quindi è garantita l’esistenza di un minimo assoluto, che possiamo trovare annullando la derivata prima: r'(x)=0. Svolgendo i calcoli, si trova che deve essere 2x^2-1=0\ \to\ x=\frac{1}{\sqrt{2}} che, inserito nella formula del raggio, fornisce il valore di circa 2.6.

Concludiamo che il calcolo differenziale fornisce anche un metodo che consente di calcolare la curvatura dei grafici delle funzioni.

oscul_log

Il cerchio osculatore minimo e il punto di massima curvatura per la funzione logaritmo.

Un grafico di funzione al computer

Tracciando il grafico di una funzione con il computer il risultato è immediato e tutte le informazioni utili sembrano già disponibili. In realtà non tutte sono evidenti, e occorre qualche calcolo per ricavarle. Vediamo un esempio

Questo è il grafico della funzione y=\cos^3x+\sin^3x.

coscubo+sencubo_a

Il grafico di y=\cos^3x+\sin^3x tracciato con Derive.

Periodicità e simmetrie

Alcune proprietà della funzione si cominciano a vedere dopo una variazione di scala:

coscubo+sencubo_b

Il grafico precedente dopo la dilatazione della scala orizzontale.

Si tratta di una funzione periodica. Era un fatto intuibile, dato che la funzione è somma di cubi di funzioni periodiche. Il periodo è T=2\pi e diamo per scontato che f(x) sia definita su tutto l’asse reale.

Note

Bisogna però osservare che la periodicità va sempre verificata: non è detto che la somma di due funzioni periodiche, con lo stesso periodo, sia una funzione periodica e, se lo è, che abbia periodo uguale a quello delle funzioni.

Il grafico ha altre simmetrie, oltre alle simmetrie per traslazione, secondo i vettori multipli di \vec c[2\pi,0], dovute alla sua periodicità. Infatti i punti di intersezione con l’asse delle ascisse sono centri per rotazioni di 180^\circ, che riportano la figura su se stessa. Inoltre le rette verticali passanti per i minimi della parte superiore e per i massimi di quella inferiore sono assi di simmetria per il grafico. E poi l’asse orizzontale è asse di una glisso-simmetria fra la parte positiva e quella negativa del grafico.

Intersezioni

Per x=0, f(0)=1, quindi la prima intersezione con gli assi è in (0,1). Per le intersezioni con l’asse X bisogna risolvere

\cos^3 x+\sin^3 x=0\\
(\cos x+\sin x)(\cos^2x-\sin x \cos x+\sin^2 x)=0\\
\cos x+\sin x=0\\
\tan x=-1\ \to\ x=-\frac{\pi}{4}+k\pi.

La prima intersezione con l’asse orizzontale è in (-\frac{\pi}{4},0), le successive e le precedenti seguono il variare di k. Le intersezioni più vicine a x=-\frac{\pi}{4}+k\pi si hanno per k=\pm 1 e sono x=-\frac{5\pi}{4} e x=\frac{3\pi}{4}. Data la simmetria centrale del grafico, basta analizzarlo nell’intervallo \left[-\frac{\pi}{4},\frac{3\pi}{4}\right] che rappresenta mezzo intervallo di periodicità. Poi si estenderanno le conclusioni all’altra metà periodo.

intervallo

In aggiunta, si vede che gli assi verticali di simmetria si trovano in x=\frac{\pi}{4} +k\pi, quindi si può ancora dimezzare l’intervallo su cui studiare la funzione, che si riduce a \left[\frac{\pi}{4},\frac{3\pi}{4}\right].

Massimi e minimi

Osservando il grafico, ci aspettiamo che la derivata si annulli in x=\frac{\pi}{4}\mbox{, }x=\frac{\pi}{2} e per quest’ultimo punto sembra ci sia un massimo assoluto.

f'(x)=0\ \to \ &3\sin^2 x\cos x - 3\cos^2x\sin x=0`\\
&\sin x \cos x(\sin x-\cos x)=0

Nell’intervallo che consideriamo f'(x) si annulla per \cos x=0 e per \sin x-\cos x=0. Le soluzioni sono dunque x=\frac{\pi}{2}\mbox{, }x=\frac{\pi}{4}, come previsto. I valori corrispondenti della funzione sono f\left(\frac{\pi}{4}\right)=0.70 e f\left(\frac{\pi}{2}\right)=1. Quest’ultimo valore poteva essere ricavato direttamente dal grafico, sulla base della simmetria assiale della curva.

Viste le simmetrie, abbiamo che nell’intervallo \left[-\frac{\pi}{4},\frac{3\pi}{4}\right] f(x) cresce da \left(-\frac{\pi}{4},0\right) fino a (0,1) (massimo assoluto), poi decresce fino al minimo relativo nel punto \left(\frac{\pi}{4},\frac{1}{\sqrt{2}}\right), poi cresce fino ad un nuovo massimo assoluto in \left(\frac{\pi}{2},1\right) e infine decresce.

L’analisi può essere estesa ad un intero periodo, mediante una simmetria centrale, di centro \left(-\frac{\pi}{4},0\right). L’intervallo diventa allora \left[-\frac{5}{4}\pi,\frac{3}{4}\pi\right] e nella metà periodo che ora si aggiunge a sinistra rispetto a prima, i minimi assoluti negativi sono i corrispondenti dei massimi positivi già calcolati e il massimo relativo negativo è il corrispondente del minimo relativo già visto.

Analisi della derivata prima
f_f'

Grafico della funzione e della sua derivata prima

Aggiungendo al grafico della funzione anche quello di y=f'(x), vediamo che questo

  • raggiunge i valori estremi in corripondenza delle intersezioni per cui f(x)=0 , che sono i punti di massima pendenza, in valore assoluto
  • interseca sei volte l’asse orizzontale, in corrispondenza dei massimi e dei minimi di f(x).

Se f'(x) cambia segno ripetutamente vuol dire che f(x) cambia concavità e questo preannuncia la presenza di flessi.

Analisi della derivata seconda

La derivata seconda è f^{''}(x)=6\sin x\cos^2 x-3\sin^3x+6\cos x\sin^2 x-3\cos^3 x. Cerchiamo gli zeri di questa funzione.

&6\sin x\cos^2 x-3\sin^3x+6\cos x\sin^2 x-3\cos^3 x=0\\
&\sin x\cos x(\sin x+\cos x)-3(\sin x +\cos x)(\sin^2 x-\sin x \cos x+\cos^2 x)=0\\
&-3(\sin x +\cos x)(\sin^2 x-3\sin x \cos x+\cos^2 x)=0

Il prodotto si azzera, nell’intervallo \frac{\pi}{4}\le x\le \frac{3}{4}\pi, se

&\sin x +\cos x=0 \ \to\ \tan x=-1\ \to\ x=\frac{3}{4}\pi\\
&\sin^2 x-3\sin x \cos x+\cos^2 x=0 \ \to \ \tan^2 x-3\tan x+1=0\ \to\ \\
& \to \ \tan x=\frac{3\pm\sqrt{5}}{2}\ \to \ x=\arctan\frac{3+\sqrt{5}}{2}

f_f''

Grafico della funzione e della sua derivata seconda

Anche la derivata seconda si azzera sei volte in un periodo, cambiando segno. La funzione quindi cambia concavità. In un periodo ci sono due punti di flesso dove f(x)=0 e altri quattro, a due a due simmetrici rispetto al minimo positivo e al massimo negativo.

Curvatura

L’espressione della curvatura k(x)=\frac{f^{''}(x)}{\left[1+f'(x)\right]^\frac{3}{2}} è così complicata che è meglio che sia Derive a calcolarla.

k(x)=\frac{3(2\sin x \cos^2 x+\cos x(3\sin^2 x-1)-\sin^3 x)}{(-18\sin^3 x\cos^3 x+9\sin^2 x \cos^2 +1)^\frac{3}{2}}

Chiediamo direttamente al software di tracciare il grafico della curvatura insieme a quello della funzione.

f_curvatura

Grafico della funzione e della curvatura

Gli zeri dell’espressione della curvatura sono gli stessi della derivata seconda, sono i punti a curvatura nulla, cioè i tratti rettilinei del grafico della funzione e corrispondono ai punti di flesso. La curvatura è massima, in valore assoluto, nei punti di massimo e di minimo della funzione, dove il raggio del cerchio osculatore è minimo.

Note

Perché diciamo che nei punti di flesso il grafico ha un tratto rettilineo? Tutto dipende dai punti di contatto fra il grafico e la tangente. In genere la tangente in un punto a al grafico della funzione si distanzia ben presto dalla funzione: nei punti a+dx le differenze fra i valori della tangente e quelli della funzione sono infinitesimi di ordine superiore a dx, in genere dell’ordine di (dx)^2. Nei punti di flesso, però, queste differenze sono dell’ordine di (dx)^3, quindi il contatto è molto più alto perché nella monade di a nemmeno un microscopio che vede gli infinitesimi dell’ordine di (dx)^2 riesce distinguere queste distanze.

Confrontiamo il grafico della derivata seconda con quello della curvatura.

f''_curvatura

Grafico della derivata seconda e della curvatura

I due grafici si distinguono: i punti di massima curvatura non sono quelli in cui è massima la derivata seconda. Infatti la derivata seconda dà una misura della concavità, non della curvatura.

Riassunto

  1. Le funzioni iperreali hanno per dominio intervalli di numeri che sono estensione di intervalli reali. Gli intervalli estesi contengono numeri standard e non standard (infiniti, infinitesimi) e mantengono le stesse proprietà date per gli intervalli reali.
  2. Rispetto al dominio, un punto può essere interno, esterno o di frontiera. Si dice interno all’estensione di un intervallo, il punto la cui monade vi è inclusa. Si dice di frontiera il punto nella cui monade vi sono sia punti interni che punti esterni.
  3. Si dice isolato il punto di frontiera per il quale l’intersezione fra la sua monade e l’intervallo è data solo dal punto stesso. Se invece oltre al punto, nell’intersezione cadono altri punti della monade, allora il punto si dice di accumulazione.
  4. Il procedimento che porta a disegnare manualmente nel modo più preciso il grafico di una funzione, si chiama studio di funzione. Consiste dei seguenti passi: 1. Definizione del dominio; 2. Analisi delle simmetrie; 3. Calcolo delle intersezioni con gli assi; 3. Studio del segno delle funzione; 5. Studio del comportamento asintotico. 6. Studio dell’andamento e ricerca dei massimi e dei minimi; 7. Analisi delle concavità e ricerca dei punti di flesso.
  5. Per completare le informazioni precedenti è possibile approfondire il lavoro con l’analisi delle curvature del grafico. Attraverso opportuni calcoli è anche possibile calcolare il raggio e il centro del cerchio osculatore ad un punto qualsiasi del grafico.
  6. I software dedicati sono utili e potenti strumenti per il tracciamento dei grafici. Non sempre consentono di definire con precisione i punti notevoli e quindi spesso il loro lavoro deve essere integrato con gli strumenti del calcolo differenziale.

Esercizi

  1. Definisci il punto c come punto di accumulazione sinistro nei tre casi in cui questa definizione ha senso.
  2. Ripercorri tutte le fasi dell’esercizio guida, esplicitando anche i calcoli sottintesi.
  3. Applica le formule per il calcolo della curvatura al grafico della sinusoide, di cui puoi osservare il disegno nel testo.
  4. Svolgi i calcoli indicati dal testo per trovare il raggio di massima curvatura della funzione logaritmo e applica al caso del logaritmo le formule per trovare le coordinate del centro.

Il calcolo integrale

Introduzione

Questo testo è costruito partendo dal libro di Giorgio Goldoni “Il calcolo delle somme e il calcolo integrale ”.

Sito di riferimento:

Pagina facebook: <www.facebook.com/pages/Il-professor-Apotema/344320422244703>

I libri del prof. Apotema: <ilmiolibro.kataweb.it/community.asp?id=104013>

Licenza

Tutti i materiali prodotti sono rilasciati sotto la licenza Creative Commons: CC-BY-SA.

Licenza: CC-BY-SA

Una premessa

Indices and tables