Vidéo analogique

Le principe de la vidéo, différemment de celui du cinéma, repose sur sa capacité à transmettre des images animées à distance.
Les phénomènes du monde réel que nous percevons (notamment, le mouvement et le son) sont quasiment tous continus, c'est-à-dire que lorsque ces phénomènes sont quantifiables, ils passent d'une valeur à une autre sans discontinuité. Une grandeur analogique varie ainsi en continu dans une plage donnée. L'information analogique peut prendre une infinité de valeurs et être représentée par une courbe (fonction du temps) traduisant le phénomène perçu.

L'image

La vidéo analogique est basée sur le principe du balayage. Une caméra balaye l'image bidimensionnelle qu'elle a devant elle par un faisceau d'électrons (3 faisceaux, rouge, vert et bleu, pour la couleur) qui se déplace très rapidement de gauche à droite et plus lentement de haut en bas, produisant un signal électrique fonction du temps. Elle enregistre ainsi l'intensité lumineuse, et à la fin du balayage (nommé "trame"), le faisceau revient à l'origine pour recommencer. Le récepteur va recevoir cette intensité fonction du temps, la lecture et la restitution de chaque image s'effectuant (dans le cas d'une télévision à tube cathodique) selon ce même balayage séquentiel ligne par ligne.

Les paramètres précis de ce balayage varient d'un pays à l'autre, mais deux grandes familles existent en raison de la fréquence du courant domestique (50 Hz en Europe, 60 Hz aux États-Unis):

  • Système PAL/SECAM (Phase Alternating Line / SEquentiel Couleur Avec Mémoire) en Europe
    Le système utilise 625 lignes/50 Hz (dont seulement 576 sont affichées, les autres lignes représentant le temps nécessaire au faisceau d'électron pour remonter du bas de l'image vers le haut), un rapport vertical/horizontal de 4/3 et 25 images par seconde,
  • Système NTSC (National Television Standards Committee) en Amérique et au Japon
    Norme de codage de la vidéo en couleur mise au point aux USA dans les années 1950. Le système utilise 525 lignes/60 Hz (483 sont affichées) et 30 images par seconde.

Toutefois, pour une cadence de balayage (nombre d'images par seconde) de 25 ou 30 images complètes, le balayage de l'écran par le spot (point lumineux) produit un effet de clignotement : au moment où le bas de l'image est formé (pleine luminosité), l'intensité du haut de l'image a légèrement baissé. Pour éviter une perception de clignotement, et plutôt que d'augmenter la cadence de balayage qui aurait représenté un coût matériel supplémentaire et aurait alourdi la bande passante, l'astuce consista à balayer les lignes de l'image en deux temps : un premier balayage ("trame", "field" en anglais) pour les lignes impaires, puis un second balayage pour les lignes paires, de cette façon on obtient artificiellement 50 "images" (60 en Amérique et Japon) par seconde et l'œil ne perçoit plus de clignotement. On appelle cela l'entrelacement. Une image complète ("frame" en anglais) est alors, en fait, constituée de deux trames (deux balayages).
Les caméras adoptèrent elles aussi cet entrelacement du balayage : les deux prises de vues (une par demi-image, lignes impaires puis lignes paires) sont distantes dans le temps.
Dans le cas des moniteurs informatiques dont l'affichage des images se fait à une fréquence plus élevée (60 à 70 images par secondes), l'entrelacement n'est plus nécessaire car la fluidité est de fait augmentée. On parle alors de balayage progressif : chaque trame ("trame progressive") correspond à une image entière (et plus seulement à une demi-image). Les caméras dites progressives suivent naturellement la même logique en capturant les images dans leur intégralité.

Les images sont restituées via les tubes cathodiques.

Le son

Le son est une onde produite par la vibration mécanique d'un support fluide ou solide et propagée grâce à l'élasticité du milieu environnant sous forme d'ondes longitudinales.
Ainsi, l'onde sonore est une variation de la pression de l'air qui fait vibrer le tympan de notre oreille, créant ainsi le son entendu.

Le son est constitué de 3 composantes :

  • l'amplitude (déploiement en hauteur de la courbe), exprimée en décibels (dB). L'amplitude est proportionnelle à la quantité d'énergie produite par la vibration de l'air (pression de l'air). Elle définit l'intensité (ou "volume" ou "puissance") du son.
  • la fréquence, exprimée en hertz (Hz). Elle représente le nombre d'oscillations ("cycles" ou "périodes") de pression d'air par seconde. Un son aigu présente une haute fréquence et un son grave, une basse fréquence. L'oreille humaine est un récepteur qui ne perçoit que certaines fréquences comprise dans une bande de 20 Hz à 20 Khz. En musique, la fréquence est désignée sous le terme de "hauteur".
  • le timbre (sonorité) : il donne la coloration spécifique d'un son.


Un son pur (ou son simple), comme celui du diapason, correspond à une onde sinusoïdale dont la fréquence et l'amplitude sont constantes (sinusoïde parfaite).
Tout son (excepté donc le son pur) est le plus souvent une onde complexe combinant plusieurs ondes simples (ondes de fréquence donnée)  : il résulte de la somme de ces sinusoïdes. L'analyse de Fourier consiste à décomposer le son en une somme de vibrations sinusoïdales de fréquence croissantes.
Si le son est un "son musical" au sens acoustique du terme, c’est à dire créé par un mouvement vibratoire périodique, le son peut être considéré comme la superposition de sons simples harmoniques, les "harmoniques", dont les fréquences sont des multiples entiers de la fréquence d’un son de base, appelée la "fondamentale" (sinusoïde de plus basse fréquence : fréquence la plus grave). C'est cette combinaison d'harmoniques qui caractérise le timbre spécifique du son. Le son pur n'est composé que de la fondamentale.
Le bruit est une onde apériodique (aucun motif de base ne se répète).


L'enregistrement sonore est l'opération qui consiste à transformer un son (analogique) en un signal électrique afin de pouvoir le diffuser (téléphone, ondes radio, télévision, etc) ou d'en garder une trace de façon durable sur un support en vue de pouvoir le rediffuser. Le microphone, grâce à une membrane couplée à une bobine électrique, transforme les variations de pressions caractéristiques des ondes sonores acoustiques (vibrations mécaniques de l'air) en un signal électrique toujours proportionnel (capable de traduire les mêmes variations) et continu.
Si l'on désire enregistrer le son, le signal issu du microphone est amplifié linéairement et envoyé sur la tête d'enregistrement. Celle-ci produit un champ magnétique - proportionnel au signal électrique - qui va polariser les minuscules grains d'oxyde de fer de la bande magnétique qui défile devant elle. Lorsque le support physique peut prendre des valeurs continues, on parle d'enregistrement analogique. Par exemple une cassette vidéo, une cassette audio ou un disque vinyle sont des supports analogiques. L'enregistrement de signaux simultanés de plusieurs microphones enregistrés sur plusieurs pistes parallèles de la même bande magnétique rend possible la stéréophonie et le mixage.

Le haut-parleur retransformera la variation électrique en vibration acoustique pour restituer le son d'origine.

Inconvénient du signal analogique

Le signal analogique est très sensible à son environnement. Sa dégradation est facile (l'analogique véhicule un signal qui s'affaiblit à chaque maillon de la transmission) et la correction de cette dégradation difficile voire impossible. Un signal analogique qui circule dans des fils ou des ondes radio, à travers le monde subit, ainsi, des déformations au cours de son voyage. De même un signal sonore enregistré sur une bande magnétique, puis copié plusieurs fois subira une perte de qualité. Des signaux parasites ou du bruit de fond peuvent également s'ajouter au signal d'origine, etc.
C'est en grande partie de là que la vidéo numérique tire ses avantages.

Liens pour approfondir

» GLOSSAIRE