# Nombres de Bell - l'explosion combinatoire

Marc Lorenzi

20 mai 2021

In [None]:
import matplotlib.pyplot as plt
import math

**Remarque.** Dans ce qui suit, nous aurons quelquefois Ã  estimer la complexitÃ© d'une fonction. Pour Ã©valuer cette complexitÃ©, nous compterons le nombre d'opÃ©rations arithmÃ©tiques (addition, multiplication, ...) effectuÃ©es par la fonction. Nous nous contenterons d'estimations, sans entrer dans les micro-dÃ©tails.

## 0. Fonctions basiques

La fonction `power_dn` prend en paramÃ¨tres deux entiers naturels $x$ et $k$. Elle renvoie

$$x^{\underline k}=x(x-1)\ldots(x-k+1)$$

La complexitÃ© de cette fonction est $O(k)$.

In [None]:
def power_dn(x, k):
    p = 1
    for i in range(k): p *= (x - i)
    return p

In [None]:
print([power_dn(5, k) for k in range(10)])

Pour tout entier naturel $n$, on a

$$n!=n^{\underline n}$$

La complexitÃ© de la fonction `fact` ci-dessous est $O(n)$.

In [None]:
def fact(n):
    return power_dn(n, n)

In [None]:
print([fact(k) for k in range(10)])

Pour tout $n\in\mathbb N$, et tout $k\in[0,n]$,

$$\binom n k=\frac{n^{\underline k}}{k!}$$

La complexitÃ© de la fonction `binom` ci-dessous est $O(k)$.

In [None]:
def binom(n, k):
    return power_dn(n, k) // fact(k)

In [None]:
print([binom(6, k) for k in range(7)])

## 1. Partitions, premiÃ¨re approche

Dans tout le notebook nous reprÃ©senterons un ensemble (fini) en Python par la liste de ses Ã©lÃ©ments. Nous ne chercherons pas l'efficacitÃ© absolue (mais nous ne nous contenterons pas non plus d'Ã©crire n'importe quoi !). L'idÃ©e sous-jacente Ã  ce qui va suivre est la suivante :

Lorsqu'on cherche Ã  dÃ©nombrer certaines quantitÃ©s relatives Ã  un ensemble $E$, on procÃ¨de souvent de la faÃ§on suivante :

- Si $E=\emptyset$, c'est facile.
- Sinon, on se donne $a\in E$ et on pose $E'=E\setminus \{a\}$. On cherche ensuite Ã  se ramener Ã  un dÃ©nombrement relatif Ã  $E'$.

### 1.1 Partitions d'un ensemble

Soit $E$ un ensemble. Une *partition* de $E$ est un ensemble $P$ de parties de $E$ vÃ©rifiant

- $(P_1)\quad \forall A\in P, A\ne \emptyset$
- $(P_2)\quad \forall A,B\in P, A\ne B\implies A\cap B=\emptyset$
- $(P_3)\quadÂ \bigcup_{A\in P}A=E$

Nous noterons $\text{Part}(E)$ l'ensemble des partitions de $E$.

### 1.2. CrÃ©er toutes les partitions

Remarquons que 

$$\text{Part}(\emptyset)=\{\emptyset\}$$

car l'unique partition de $\emptyset$ est la partition vide $\emptyset$.

Soit maintenant $E$ un ensemble non vide. Soit $a\in E$. On a $E=E'\cup\{a\}$ oÃ¹ $|E'|=|E|-1$. Les partitions de $E$ sont obtenues de la faÃ§on suivante :

- On choisit la partie de la partition $P$ qui contient $a$. Cela revient Ã  choisir une **partie** $A$ de $E'$.
- Pour chaque partition $P$ de la **diffÃ©rence** $E'\setminus A$, $P\cup \{A\cup\{a\}\}$ est une partition de $E$.
- Toutes les partitions de $E$ sont de cette forme.

Il nous suffit donc d'Ã©crire 

- une fonction qui renvoie les **parties** d'un ensemble.
- une fonction qui renvoie la **diffÃ©rence** de deux ensembles.

Voici la fonction `parties`. Elle prend en paramÃ¨tre un ensemble $E$ et renvoie l'ensemble des parties de $E$.

- Si $E=\emptyset$, $\mathcal P(E)=\{\emptyset\}$.
- Sinon, soit $a\in E$. Soit $E'=E\setminus \{a\}$. Les parties de $E$ sont alors

    - Les parties de $E'$.
    - Les ensembles $A\cup\{a\}$ oÃ¹ $A$ est une partie de $E'$. 

In [None]:
def parties(E):
    if E == []: return [[]]
    else:
        a = E[-1]
        E1 = E[:-1]
        P1 = parties(E1)
        return P1 + [P + [a] for P in P1]

In [None]:
parties([1, 2, 3])

Que vaut $\mathcal P(\mathcal P(\mathcal P(\mathcal P(\emptyset))))$ ? Jupyter refuse d'afficher le rÃ©sultat. Alors Ã©crivons la rÃ©ponse dans un fichier.

In [None]:
ps = parties(parties(parties(parties(parties([])))))
ps = str(ps)
n = len(ps)
print(n)
f = open('beurk.txt', 'w')
nblig = n // 80
for k in range(nblig):
    f.write(ps[80 * k: 80 * (k + 1)])
    f.write('\n')
f.write(ps[80 * nblig:-1])
f.close()

Le fichier en question fait $9$Mo. Un Ã©diteur de texte finira par l'ouvrir, aprÃ¨s quelques souffrances.

Et voici la fonction `difference`. Elle prend en paramÃ¨tres deux ensembles $E$ et $F$ et renvoie l'ensemble $E\setminus F$. Cette fonction illustre bien la phrase Â« Nous ne chercherons pas l'efficacitÃ© absolue Â» : mÃªme si son code ne fait qu'une ligne, sa complexitÃ© est en $O(|E|\times |F|)$.

In [None]:
def difference(E, F):
    return [x for x in E if x not in F]

In [None]:
difference([1, 2, 3, 4, 5, 6], [1, 3, 5])

La fonction `partitions` est maintenant Â« immÃ©diate Â». Elle prend en paramÃ¨tre un ensemble $E$. Elle renvoie l'ensemble des partitions de $E$, c'est Ã  dire une liste de listes de listes.

In [None]:
def partitions(E):
    if E == []: return [[]]
    else:
        a = E[-1]
        E1 = E[:-1]
        s = []
        for A in parties(E1):
            s1 = [P + [A + [a]] for P in partitions(difference(E1, A))]
            s = s + s1
        return s

In [None]:
ps = partitions([1, 2, 3, 4, 5, 6])
print(len(ps))
print(ps)

### 1.3. Les nombres de Bell

Le $n$iÃ¨me nombre de Bell est 

$$B_n=|\text{Part}(E)|$$

oÃ¹ $E$ est un ensemble de cardinal $n$. La fonction `partitions` permet Ã©videmment de dÃ©terminer $B_n$ mais il est relativement absurde de **calculer toutes les partitions** pour savoir combien il y en a ! Soyons plus rusÃ©s.

On a Ã©videmment $B_0=1$. Soit maintenant $E$ un ensemble de cardinal $n+1$, oÃ¹ $n\in\mathbb N$. Soit $a\in E$. Ã‰crivons $E=E'\cup \{a\}$ oÃ¹ $E'$ est de cardinal $n$. De faÃ§on Â« informelle Â», comme nous l'avons dÃ©jÃ  vu, une partition $P$ de $E$ est construite comme suit :

- On choisit $k\in [0,n]$.
- On choisit une partie $A$ de $E'$ de cardinal $k$ : il y a $\binom n k$ possibilitÃ©s.
- On partitionne $E'\setminus A$ : il y a $B_{n-k}$ possibilitÃ©s puisque cet ensemble est de cardinal $n-k$.

Ainsi,

$$B_{n+1}=\sum_{k=0}^n\binom n k B_{n-k}=\sum_{k=0}^n\binom n k B_{k}$$

La fonction `bell` prend un entier $N$ en paramÃ¨tre. Elle renvoie la liste $[B_0,B_1,\ldots,B_N]$.

In [None]:
def bell(N):
    bs = [1]
    for n in range(N):
        s = 0
        for k in range(n + 1):
            s += binom(n, k) * bs[k]
        bs.append(s)
    return bs

In [None]:
print(bell(10))

Voici $B_{300}$.

In [None]:
print(bell(300)[-1])

### 1.4 ComplexitÃ©

Remarquons le petit temps d'attente. Notre fonction `bell` est assez inefficace. Notons $C_N$ la complexitÃ© du calcul de la liste $[B_0,\ldots,B_N]$. Sans donner trop de dÃ©tails, estimons $C_N$ :

La boucle sur $k$ calcule les $n+1$ coefficients binomiaux $\binom n k$. Chacun de ces coefficients est calculÃ© en temps $O(k)$ et, Â« donc Â», la boucle sur $k$ s'exÃ©cute en temps 

$$O\left(\sum_{k=0}^n k\right)=O(n^2)$$

Chaque itÃ©ration sur $n$ prend donc un temps $O(n^2)$, et $n$ varie de 0 Ã  $N$. Â« Ainsi Â», 

$$C_N=O\left(\sum_{n=0}^N n^2\right)= O(N^3)$$

Nous ferons mieux bientÃ´t, en Â« descendant Â» Ã  $O(N^2)$. Pour l'instant, il serait dÃ©raisonnable de calculer, par exemple, le milliÃ¨me nombre de Bell, puisque $1000^3= 1$ milliard.

## 1.5 Graphe

Les nombres de Bell deviennent vite trÃ¨s trÃ¨s gros. Voici, en coordonnÃ©es logarithmiques, le graphe de $B_n$ en fonction de $n$.

In [None]:
plt.rcParams['figure.figsize'] = (12, 6)

In [None]:
def plot_bell(n):
    bs = bell(n)
    plt.semilogy(range(n + 1), bs, 'k')
    plt.grid()

In [None]:
plot_bell(100)

## 2. Partitions, une meilleure approche

### 2.1 Partitions de cardinal fixÃ©

Pour tout ensemble $E$ et tout entier naturel $k$, notons $\text{Part}_k(E)$ l'ensemble des partitions de $E$ en $k$ sous-ensembles.

Soit $E$ un ensemble fini de cardinal $n$.

Si $E=\emptyset$, $\text{Part}_k(E)=\emptyset$ si $k\ne 0$ et $\{\emptyset\}$ si $k=0$.

Supposons $E\ne\emptyset$. 

- On a alors $\text{Part}_0(E)=\emptyset$. 
- Si $k\ge 1$, soit $a\in E$. Ã‰crivons $E=E'\cup \{a\}$ oÃ¹ $E'$ est de cardinal $n-1$. Les partitions de $E$ de cardinal $k$ sont de deux types :

    - Celles oÃ¹ $\{a\}$ est l'un des Ã©lÃ©ments de la partition. Elles sont obtenues en prenant les partitions de $E'$ de cardinal $k-1$ et en rajoutant Ã  ces partitions le singleton $\{a\}$.
    - Les autres. Elles sont obtenues en prenant les partitions de $E'$ de cardinal $k$ et en rajoutant $a$ Ã  l'un des Ã©lÃ©ments de ces partitions.

In [None]:
def partitions1(E, k):
    if E == []: 
        if k == 0: return [[]]
        else: return []
    elif k == 0: return []
    else:
        a = E[-1]
        E1 = E[:-1]
        ps1 = partitions1(E1, k - 1)
        qs1 = [P + [[a]] for P in ps1]
        ps2 = partitions1(E1, k)
        qs2 = []
        for P in ps2:
            qs2 = qs2 + ajouter(P, a)
        return qs1 + qs2

La fonction `ajouter` fait l'opÃ©ration compliquÃ©e. Elle prend en paramÃ¨tre une partition $P$ (de cardinal, disons, $k$) et un objet $a$. Elle renvoie le liste des $k$ partitions obtenues en rajoutant $a$ Ã  l'un des Ã©lÃ©ments de $P$.

In [None]:
def ajouter(P, a):
    s = []
    for X in P:
        P1 = []
        for Y in P:
            if Y == X: P1.append(Y + [a])
            else: P1.append(Y)
        s.append(P1)
    return s

In [None]:
print(partitions1([1, 2, 3, 4, 5], 3))

### 2.2 Les nombres de Stirling

Pour tout ensemble fini $E$ de cardinal $n$ et tout $k\in\mathbb N$, notons

$${n\brace  k}=|\text{Part}_k(E)|$$

Les nombres $n \brace k$ sont les *nombres de Stirling* (de deuxiÃ¨me espÃ¨ce). En reprenant la discussion du paragraphe prÃ©cÃ©dent, il est facile d'obtenir des relations de rÃ©currence.

- Si $n=0$, ${n\brace k}=1$ si $k=0$ et $0$ sinon.
- Si $n\ge 1$, soit $a\in E$. Ã‰crivons $E=E'\cup \{a\}$ oÃ¹ $E'$ est de cardinal $n-1$. Les partitions de $E$ sont de deux types :

    - Celles oÃ¹ $\{a\}$ est un Ã©lÃ©ment de la partition. Elles sont obtenues en prenant les partitions de $E'$ de cardinal $k-1$ et en rajoutant Ã  ces partitions le singleton $\{a\}$. Il y en a ${n - 1 \brace k - 1}$.
    - Les autres. Elles sont obtenues en prenant les partitions de $E'$ de cardinal $k$ et en rajoutant $a$ Ã  l'un des Ã©lÃ©ments de ces partitions. Pour chaque partition de $E'$ on peut donc crÃ©er $k$ telles partitions de $E$. Il y a donc au total $k{n - 1\brace k}$ telles partitions. Ainsi,
    
$${n\brace k} = {n - 1\brace k - 1} + k {n - 1\brace k}$$

La fonction `stirling` renvoie la matrice des $n\brace k$ pour $0\le n\le N$ et $0\le k\le N$.

In [None]:
def stirling(N):
    s = (N + 1) * [None]
    for n in range(N + 1):
        s[n] = (N + 1) * [0]
    s[0][0] = 1
    for n in range(1, N + 1):
        for k in range(1, n + 1):
            s[n][k] = s[n - 1][k - 1] + k * s[n - 1][k]
    return s

In [None]:
N = 10
st = stirling(N)
for n in range(N + 1):
    for k in range(N + 1):
        print('%6d' % st[n][k], end ='')
    print()

### 2.3 Retour aux nombres de Bell

On a bien entendu pour tout entier $n$,

$$B_n=\sum_{k=0}^n{n\brace k}$$

La fonction `bell1` reprend le code de la fonction `stirling`, mais utilise un espace en $O(N)$ au lieu de $O(N^2)$. Elle renvoie la liste $[B_0,\ldots, B_N]$.

In [None]:
def bell1(N):
    bs = (N + 1) * [None]
    s = (N + 1) * [0]
    s[0] = 1
    bs[0] = 1
    for n in range(1, N + 1):
        s1 = (N + 1) * [0]
        for k in range(1, n + 1):
            s1[k] = s[k - 1] + k * s[k]
        s = s1
        bs[n] = sum(s)
    return bs

In [None]:
bell1(10)

La fonction `bell1` est beaucoup plus efficace que la fonction `bell` que nous avions Ã©crite au dÃ©but du notebook. Clairement, sa complexitÃ© est en $O(N^2)$ puisque nous avons deux boucles imbriquÃ©es sur $n$ et $k$. Bien entendu, les opÃ©rations arithmÃ©tiques se font sur de trÃ¨s grands entiers, et une Ã©tude plus poussÃ©e de la complexitÃ© devrait prendre en compte les tailles de ces entiers.

Voici le 1000Ã¨me nombre de Bell.

In [None]:
bell1(1000)[-1]

## 3. Annexe - La taille des nombres de Bell

Les nombres de Bell $B_n$ deviennent trÃ¨s vite grands lorsque $n$ augmente. TrÃ¨s grands comment ?

Il est possible de donner des estimations de $B_n$. En voici, sans dÃ©monstration.

### 3.1 DÃ©veloppement asymptotique 

Le dÃ©veloppement asymptotique ci-dessous est dÃ» Ã  De Bruijn (1958).

$$\frac{\ln B_n}n=\ln n-\ln\ln n-1+\frac{\ln\ln n}{\ln n}+\frac 1 {\ln n}+\frac 1 2\left(\frac{\ln\ln n}{\ln n}\right)^2+O\left(\frac{\ln\ln n}{\ln n}\right)^2$$

On peut en dÃ©duire que pour tout $\varepsilon>0$ et tout entier $n$ assez grand,

$$\left(\frac{n}{e\ln n}\right)^n<B_n<\left(\frac{n}{e^{1-\varepsilon}\ln n}\right)^n$$

La fonction `bornes` renvoie le minorant et le majorant de l'inÃ©galitÃ© ci-dessus. Elle est l'exemple ultime d'une fonction qui ne sert Ã  rien.

In [None]:
def bornes(n, eps):
    if n <= 1: return (1, 1)
    x = (n / (math.e * math.log(n))) ** n
    y = (n / (math.e ** (1 - eps) * math.log(n))) ** n
    return (x, y)

In [None]:
bornes(200, 1e-1)

Le problÃ¨me de ces inÃ©galitÃ©s est qu'elles ne sont vraies que pour $n$ voisin de l'infini.

En clair, on ne sait pas si les valeurs renvoyÃ©es par `bornes` encadrent $B_n$ : Pour tous $n,\varepsilon$, la valeur renvoyÃ©e est correcte ... ou pas.  Par exemple, il n'est pas certain que $B_{200}$ soit bien entre les deux rÃ©els que nous venons de calculer. D'ailleurs, il n'y est pas ðŸ˜€.

In [None]:
math.log(bell1(200)[-1], 10)

Voici, en noir, les nombres de Bell, et en rouge les bornes censÃ©es encadrer ceux-ci. Selon les valeur de `eps`, la courbe noire est entre les courbes rouges ... ou pas.

In [None]:
def tracer_bell_mino_majo(n, eps):
    xs = range(n + 1)
    ys = bell1(n)
    bs = [bornes(x, eps) for x in xs]
    zs = [z[0] for z in bs]
    ts = [z[1] for z in bs]
    plt.semilogy(xs, ys, 'k')
    plt.semilogy(xs, zs, 'r')
    plt.semilogy(xs, ts, 'r')
    plt.grid()

In [None]:
tracer_bell_mino_majo(100, 0.5)

### 3.2 Un majorant effectif

Voici un majorant **effectif** de $B_n$, c'est Ã  dire un majorant vrai pour tout entier $n$. Ce rÃ©sultat est dÃ» Ã  D. Berend et T. Tassa (2010).

Pour tout entier $n\ge 1$,

$$B_n<\left(\frac{0.792 n}{\ln (n + 1)}\right)^n$$

In [None]:
def majorant(n):
    if n == 0: return 1
    else:
        x = (0.792 * n / math.log(n + 1)) ** n
        return x

In [None]:
majorant(200)

In [None]:
math.log(bell1(200)[-1], 10)

Voici, en noir, les nombres de Bell, et en rouge le majorant de Berend et Tassa.

In [None]:
def tracer_bell_majo(n):
    xs = range(n + 1)
    ys = bell1(n)
    zs = [majorant(x) for x in xs]
    plt.semilogy(xs, ys, 'k')
    plt.semilogy(xs, zs, 'r')
    plt.grid()

In [None]:
tracer_bell_majo(100)

*Bibliographie.*

- D. Berend, T. Tassa, Improved Bounds on Bell Numbers and on Moments of Sums of Random Variables - Journal of Probability and Mathematical Statistics Vol. 30, Fasc. 2 (2010), pp. 185-205.