Le son numérique, mp3

Ecole Polytechnique
Electronique, composants & systèmes
Le son numérique
La compression audio
MPEG Layer 3
Guillaume Rincé
X96

I Le principe de la conversion numérique
La conversion numérique consiste à convertir un signal analogique en une
série de bits. Cette conversion consiste à prélever un certain nombre
d’échantillon à une fréquence dite « fréquence d’échantillonnage »puis à les
coder sur un certain nombre de bits. Selon le résultat souhaité, on définit la
fréquence d’échantillonnage et le nombre de bits. Le schéma ci-dessous illustre
l’influence de ces deux facteurs.
Une chaîne complète de traitement numérique comporte :
??Conversion analogique / numérique
??Un éventuel traitement des données numériques (stockage, filtrage, …)
??Conversion numérique /analogique
I.1 L’échantillonnage du signal
L’échantillonnage du signal analogique est une étape très importante de la
conversion numérique car le choix de la fréquence d’échantillonnage détermine
la qualité du son converti. L’oreille humaine perçoit les sons d’une fréquence
inférieure à 20 kHz. Par conséquent, à partir d’une fréquence d’échantillonnage
supérieure à 40 kHz – lefacteur 2 provient des problèmes de repliement traités
25

plus loin – toutes les fréquences audibles seront restituées. Si l’on veut coder la
voix humaine dont les fréquences sont inférieures à 8 kHz, il faudrait en théorie
échantillonner à 16 kHz. En réalité, la voix est compréhensible même si on
détruit les hautes fréquences, c’est pourquoi l’échantillonnage de qualité
téléphoniques’effectue en général à 8 kHz.
Le principe de l’échantillonnage est de prendre des échantillons du signal
analogique à la fréquence d’échantillonnage. Le dispositif ci-dessous permet
d’échantillonner le signal analogique e(t).
????

s(t)
+
e(t)
– ????
Le signal ?????est un signal rectangulaire de fréquence la fréquence
d’échantillonnage. Plus la largeur des raies est faible, plusl’échantillonnage sera
de bonne qualité.
????
t
25

On prend pour signal d’entrée e(t) un signal sinusoïdal à 500 Hz. Le
signal ?????d’échantillonnage a une fréquence de 10 kHz. En sortie s(t) on obtient
le signal ci-dessous.
On échantillonne à une fréquence 20 fois plus rapide que la fréquence du
signal d’entrée, on a donc 20 échantillons par période du signal d’entrée. Ilest
aussi intéressant de regarder la transformée de Fourier du signal de sortie.
Si l’on visualisait la transformée de Fourier du signal d’entrée, on
trouverait une raie pure à la fréquence de ce signal, 500 Hz. Dans la transformée
du signal de sortie, on retrouve tous les 10 kHz, la fréquence d’échantillonnage,
deux pics situés relativement par rapport aux multiples de la fréquenced’échantillonnage à -500 Hz et à +500 Hz, la fréquence du signal d’entrée.
25

Cette transformée de Fourier permet de mettre en évidence les deux
problèmes posés par l’échantillonnage. Tout d’abord, on voit ici l’intérêt du
facteur 2 qu’il est nécessaire d’avoir entre la fréquence maximale du signal
d’entrée et la fréquence d’échantillonnage. En effet, si on ne respecte pas cette
règle,les pics autour de deux multiples consécutifs de la fréquence
d’échantillonnage se recouvrent. Pour reconstruire le signal d’origine, il faut
pouvoir filtrer le signal échantillonné pour isoler une série de pics. Or, il n’existe
pas de filtre parfait, il faut donc qu’il y ait un certain espace entre la fin d’une
série de pic et la suivante pour que le filtre puisse couper. Par exemple, dansle
cas de l’échantillonnage qualité CD, on échantillonne à 44,1 kHz, ce qui laisse
une plage de 2 kHz entre deux séries de pics consécutifs.
I.2 Le blocage
Le blocage consiste à transformer le signal non pas en signal
échantillonné, mais en signal crénelé. En fait, entre deux prises d’un échantillon,
le signal bloqué reste à la valeur de l’échantillon qui vient d’être pris….