Avec des langages compilés comme C et C++, la compilation est certes la plus emblématique des phases de traitement d'un code source pour le traduire en code exécutable sur machine, mais ce n'est pas la seule :

elle est précédée par la phase de prétraitements, laquelle est mise en œuvre par le préprocesseur, étudié au chap. C4‑III ;
elle est suivie par les phases d'assemblage puis d'édition de liens, cette dernière permettant de réunir différents fichiers objets issus de compilations séparées pour, typiquement, former un fichier exécutable.

Par ailleurs, la phase de compilation elle‑même n'est pas un processus monolithique : elle se décompose en plusieurs étapes – analyse lexicale, analyse syntaxique, analyse sémantique… – chacune faisant appel à un algorithme spécifique.

On appelle chaîne de compilation W à la fois la succession de tous ces traitements et l'ensemble des outils logiciels qui les assurent – c'est pourquoi en anglais on emploie le terme plus général de toolchain W. Que l'on procède en ligne de commande ou dans un environnement intégré de développement, il est toujours possible de choisir de nombreuses options pour chacune des grandes étapes de la production d'un code exécutable. Ces options peuvent sembler sans importance pour des petits programmes, mais elles deviennent de plus en plus cruciales :

à mesure que la taille des programmes augmente, et qu'il devient contre‑productif de recompiler l'ensemble du code source à la moindre modification ;
lorsque les programmes doivent s'exécuter sur différentes plateformes et qu'il faut tenir compte de la spécificité de chacune.

Pour un technicien en informatique qui se forme à la programmation, avoir un minimum de connaissances sur la chaîne de compilation est indispensable. C'est en particulier le cas pour bien comprendre les principes de la programmation modulaire et la production de son code exécutable par une compilation séparée d'objets répartis sur plusieurs fichiers, certains issus de bibliothèques de composants logiciels réutilisables. (Ces aspects seront traités dans les chapitres suivants.)

Dans ce chapitre, on expérimente uniquement, sur un PC à système d'exploitation Linux, la chaîne de compilation GCC déjà brièvement présentée au chapitre C1‑II .

Sous Windows, avec la chaîne de compilation MinGW, on obtient des résultats un peu différents, car le système de fichiers n'a pas la même organisation, notamment en termes d'emplacements ou en ce qui concerne les bibliothèques dynamiques (extension dll).

Le sujet est complexe, il est donc abordé dans le présent chapitre seulement dans une perspective de découverte, et non pas de détailler les différentes méthodes d'analyse lexicale ou syntaxique. Dans cet objectif, on présente :

les chaînes de compilation GCC, en ce qu'elles constituent des exemples représentatifs de ce qui existe, et ce d'autant plus qu'elles sont utilisées dans le cadre de ce module de formation ;
la notion générale de compilateur, la variété de ceux qui existent pour les langages C et C++ et les différents types de compilation qui peuvent être mis en œuvre ;
les différentes étapes de la compilation, que l'on décompose généralement en trois phases – front‑end, middle‑end et back‑end ;
l'édition de liens et les notions de bibliothèques statiques et dynamiques.

En complément de ce cours, pour se faire une idée du fonctionnement de la chaîne de compilation et de ce que constitue le code exécutable correspondant à un code source, on pourra visionner les vidéos (en anglais) ciblées par les liens ci‑dessous :

Philip O. Duncan – Frame of Essence – How do computers read code? Y ;
Ben Eater – Comparing C to machine language Y ;
EmbeddedArmDev – Introduction to Compiling for Linux with gcc Y.

Et pour un panorama plus technique, on pourra consulter les liens suivants .

Les chaînes de compilation GCC

Les chaînes de compilation GCC – GNU compiler collection – ont été brièvement présentées au chapitre C1‑II . Dans le cadre des exercices de ce module de formation au langage C, on en a proposé une utilisation rudimentaire typiquement via une commande système de la forme ci‑dessous :

gcc fichier source -o fichier exécutable

et on n'est pas entré dans les détails de son déroulement.

Mais maintenant que les principaux éléments du langage C ont été abordés et que les programmes à coder se complexifient, il est pertinent de faire une présentation détaillée de GCC en mettant en évidence ses différentes étapes dans le cadre d'une utilisation assez simple sur un poste de travail.

Au delà d'une utilisation plus experte de la commande gcc, cette présentation va permettre d'introduire et illustrer de façon pratique les différents concepts de la compilation au sens large.

Synoptique de la commande `gcc`

Dans un souci de simplicité pédagogique, on ne présente ici en détail la commande gcc que dans le cadre d'une compilation native (cf. chap. C1‑I ) d'un code source en langage C sur un poste de travail à système Linux. Au delà de quelques différences mineures sur les extensions des fichiers, on obtient un déroulement similaire, aussi bien :

pour un programme source codé en C++ (avec la commande g++) ;
ou si l'on travaille sur une machine à système Windows.

En revanche, la mise en œuvre est plus complexe dans le cas d'une compilation croisée W, c'est‑à‑dire lorsque l'architecture de la machine cible est différente de celle du poste de travail. Pour s'en convaincre, il suffit de consulter par exemple le script d'une compilation générée par l'application Arduino IDE (cf. chap. C1‑III ).

Une succession de liens symboliques

La commande gcc opère par une succession de liens symboliques (cf. chap. S1‑III ) qui, selon les paramétrages et les variantes d'invocation saisies par le codeur, aboutit à des fichiers exécutables spécifiques pour :

une version d'une chaîne de compilation GCC ;
une architecture de machine cible.

Par défaut – c'est‑à‑dire sans paramétrage ni variante particulière – la commande gcc appelle :

la version la plus récente parmi celles installée sur le poste de travail ;
la chaîne de compilation native (cf. chap. C1‑I ).

Sur un poste de travail à système Linux, on arrive à localiser le fichier exécutable de la chaîne de compilation GCC en procédant typiquement comme ceci :

which gcc
gcc est /usr/bin/gcc
ls -l /usr/bin/gcc
lrwxrwxrwx 1 root root 6 août   5  2021 /usr/bin/gcc -> gcc-11
ls -l /usr/bin/gcc-11
lrwxrwxrwx 1 root root 23 mai   13  2023 /usr/bin/gcc-11 -> x86_64-linux-gnu-gcc-11
ls -l /usr/bin/x86_64-linux-gnu-gcc-11
-rwxr-xr-x 1 root root 928584 mai   13  2023 /usr/bin/x86_64-linux-gnu-gcc-11

Ici, on aboutit à un exécutable (environ 930 ko) qui est le programme pilote (driver) de la version 11 de GCC pour une machine cible à système GNU/Linux sur une architecture x86 W de largeur 64 bits.

Si l'on souhaite employer une autre version et/ou produire du code exécutable pour une autre architecture de machine cible, il faut saisir une commande de la forme :

machine-gcc-nº de version

sachant que le préfixe machine et le suffixe nº de version sont l'un et l'autre optionnels (il n'est pas obligatoire de coder les deux, tout dépend des cas d'utilisation).

Un exemple typique est celui d'une commande de compilation de programme Arduino (cf. infra ).

Un programme pilote

Le fichier exécutable d'une chaîne de compilation GCC ciblé par la commande gcc est un programme pilote – en anglais, driver program W.

À partir d'un ensemble de spécifications par défaut codées dans un fichier et des options d'invocation saisies par le codeur, ce pilote lance successivement l'exécution des composants logiciels de la chaîne de compilation préalablement sélectionnée.

Comme le montre la figure ci‑dessous qui décrit un cas générique de compilation native, les différents composants logiciels d'une chaîne de compilation GCC sont les suivants.

Détaillons maintenant ces différents composants :

cc1 est un gros exécutable (environ 26 Mo) qui réunit le préprocesseur et le compilateur du langage C.

Sur un poste de travail à système Linux, on le trouve dans le dossier :
/usr/lib/gcc/x86_64-linux-gnu/n/ ( n étant le numéro de version gcc)

Entre le préprocesseur et le compilateur, aucun fichier intermédiaire n'est généré par défaut : le flux de tokens pré‑traités par le préprocesseur (cf. chap. C4‑III ) alimente directement le compilateur via une mémoire tampon. Cependant, diverses options permettent de générer un ou plusieurs fichiers intermédiaires de code source pré‑traité portant par défaut l'extension .i.

À partir du code source, l'exécutable cc1 génère un ou plusieurs fichiers intermédiaires, dits de code d'assemblage ou pseudo‑code objet et portant par défaut l'extension .s. Ces fichiers sont constitués d'instructions de bas niveau exprimées dans un langage d'assemblage W. Ils sont compréhensibles par un codeurs expérimentés, mais ils sont néanmoins fastidieux à lire. Ils contiennent déjà des instructions spécifiques à l'architecture de la machine cible.

as est en fait lien symbolique vers le composant logiciel assembleur requis pour l'architecture sélectionnée.

Dans le cadre d'une compilation native sur un poste Linux x86 64 bits, ce lien symbolique appelle l'exécutable x86_64-linux-gnu-as, placé dans le dossier /usr/bin. C'est un petit fichier (moins de 500 ko).

À partir du code d'assemblage produit par le compilateur, la commande as génère un ou plusieurs fichiers intermédiaires, dits de code objet et portant par défaut l'extension .o. Ces fichiers sont constitués d'instructions machines qui ne peuvent être exécutées que par un processeur compatible avec l'architecture de la machine cible. Ils sont très difficiles à examiner, même pour un codeur expérimenté.

collect2 est un autre programme pilote qui, via le lien symbolique nommé ld, lance l'éditeur de liens requis pour l'architecture sélectionnée.

Sur un poste de travail à système Linux, on trouve usuellement collect2 (petit fichier de 300 ko) dans le même dossier que cc1, à savoir :
/usr/lib/gcc/x86_64-linux-gnu/n/ ( n étant le numéro de version gcc)
Dans le cadre d'une compilation native sur un poste Linux x86 64 bits, ld pointe sur l'exécutable x86_64-linux-gnu-ld.bfd (1,7 Mo) qui est placé dans le dossier /usr/bin.

À partir du code objet produit par l'assembleur et d'autres fichiers objets issus de bibliothèques de fonctions déjà compilées, ld génère le fichier exécutable du programme. On verra infra qu'il peut procéder selon deux types d'édition de liens, soit statiques, soit dynamiques.

Par défaut, les fichiers intermédiaires générés par la chaîne de compilation sont temporairement stockés – sous Linux, directement dans le répertoire /tmp/ – et ils sont automatiquement supprimés à la fin du processus d'exécution de la commande de compilation. Toutefois, la commande gcc offre diverses alternatives d'exécution :

On peut produire le fichier exécutable en conservant tous les fichiers intermédiaires à l'aide de l'option -save-temps. En plus des fichiers de code d'assemblage et de code objet, on obtient alors également les fichiers du code source pré‑traité par le préprocesseur.

On peut aussi interrompre la chaîne de compilation à ses différentes étapes intermédiaires respectivement via les options :

-E pour une interruption avant compilation ;
-S pour une interruption avant assemblage ;
-c pour une interruption avant édition de liens.

Dans tous les cas, l'argument qui suit l'option -o détermine le nom et le chemin du fichier de sortie interrompue.

A contrario, il est possible de faire opérer la commande gcc sans fichiers intermédiaires grâce à l'option -pipe. Les différents composants logiciels de la chaîne communiquent de l'un à l'autre via une mémoire tampon, ce qui améliore la vitesse de traitement mais augmente le coût mémoire du poste de travail durant le processus de compilation.

Par ailleurs, on peut obtenir dans le terminal l'affichage du compte rendu d'exécution de la commande gcc ci‑dessous grâce à l'option -v (ou --verbose).

Pour être analysé en détail, sous Linux, ce flux d'affichage peut être :

redirigé dans un fichier via un opérateur de redirection comme >& (cf. chap. S1‑IV ) ;
filtré par une commande comme grep via un opérateur de redirection comme |& (cf. chap. S1‑IV ).

Considérons le programme trivial « Hello, World! » typiquement codé en langage C comme ci‑dessous, et stocké dans un fichier nommé hello.c :

#include <stdio.h>

int main(void)
{
  printf("Hello, World!\n");
  return 0;
}

Dans un terminal de commandes en ligne sous Linux, voici le compte‑rendu de compilation que l'on obtient grâce à l'option -v :

gcc -v hello.c -o hello
Using built-in specs.
COLLECT_GCC=gcc
COLLECT_LTO_WRAPPER=/usr/lib/gcc/x86_64-linux-gnu/11/lto-wrapper
OFFLOAD_TARGET_NAMES=nvptx-none:amdgcn-amdhsa
OFFLOAD_TARGET_DEFAULT=1
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Ubuntu 11.4.0-1ubuntu1~22.04' --with-bugurl=file:///usr/share/doc/gcc-11/README.Bugs --enable-languages=c,ada,c++,go,brig,d,fortran,objc,obj-c++,m2 --prefix=/usr --with-gcc-major-version-only --program-suffix=-11 --program-prefix=x86_64-linux-gnu- --enable-shared --enable-linker-build-id --libexecdir=/usr/lib --without-included-gettext --enable-threads=posix --libdir=/usr/lib --enable-nls --enable-bootstrap --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-gnu-unique-object --disable-vtable-verify --enable-plugin --enable-default-pie --with-system-zlib --enable-libphobos-checking=release --with-target-system-zlib=auto --enable-objc-gc=auto --enable-multiarch --disable-werror --enable-cet --with-arch-32=i686 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-offload-targets=nvptx-none=/build/gcc-11-XeT9lY/gcc-11-11.4.0/debian/tmp-nvptx/usr,amdgcn-amdhsa=/build/gcc-11-XeT9lY/gcc-11-11.4.0/debian/tmp-gcn/usr --without-cuda-driver --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu --with-build-config=bootstrap-lto-lean --enable-link-serialization=2
Thread model: posix
Supported LTO compression algorithms: zlib zstd
gcc version 11.4.0 (Ubuntu 11.4.0-1ubuntu1~22.04) 
COLLECT_GCC_OPTIONS='-v' '-o' 'hello' '-mtune=generic' '-march=x86-64'
 /usr/lib/gcc/x86_64-linux-gnu/11/cc1 -quiet -v -imultiarch x86_64-linux-gnu hello.c -quiet -dumpbase hello.c -dumpbase-ext .c -mtune=generic -march=x86-64 -version -fasynchronous-unwind-tables -fstack-protector-strong -Wformat -Wformat-security -fstack-clash-protection -fcf-protection -o /tmp/ccVmnVGD.s
GNU C17 (Ubuntu 11.4.0-1ubuntu1~22.04) version 11.4.0 (x86_64-linux-gnu)
  compiled by GNU C version 11.4.0, GMP version 6.2.1, MPFR version 4.1.0, MPC version 1.2.1, isl version isl-0.24-GMP

GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
ignoring nonexistent directory "/usr/local/include/x86_64-linux-gnu"
ignoring nonexistent directory "/usr/lib/gcc/x86_64-linux-gnu/11/include-fixed"
ignoring nonexistent directory "/usr/lib/gcc/x86_64-linux-gnu/11/../../../../x86_64-linux-gnu/include"
#include "..." search starts here:
#include <...> search starts here:
 /usr/lib/gcc/x86_64-linux-gnu/11/include
 /usr/local/include
 /usr/include/x86_64-linux-gnu
 /usr/include
End of search list.
GNU C17 (Ubuntu 11.4.0-1ubuntu1~22.04) version 11.4.0 (x86_64-linux-gnu)
  compiled by GNU C version 11.4.0, GMP version 6.2.1, MPFR version 4.1.0, MPC version 1.2.1, isl version isl-0.24-GMP

GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
Compiler executable checksum: 50eaa2331df977b8016186198deb2d18
COLLECT_GCC_OPTIONS='-v' '-o' 'hello' '-mtune=generic' '-march=x86-64'
 as -v --64 -o /tmp/ccyJXws5.o /tmp/ccVmnVGD.s
Version de l'assembleur GNU 2.38 (x86_64-linux-gnu) utilisant la version BFD (GNU Binutils for Ubuntu) 2.38
COMPILER_PATH=/usr/lib/gcc/x86_64-linux-gnu/11/:/usr/lib/gcc/x86_64-linux-gnu/11/:/usr/lib/gcc/x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/11/:/usr/lib/gcc/x86_64-linux-gnu/
LIBRARY_PATH=/usr/lib/gcc/x86_64-linux-gnu/11/:/usr/lib/gcc/x86_64-linux-gnu/11/../../../x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/11/../../../../lib/:/lib/x86_64-linux-gnu/:/lib/../lib/:/usr/lib/x86_64-linux-gnu/:/usr/lib/../lib/:/usr/lib/gcc/x86_64-linux-gnu/11/../../../:/lib/:/usr/lib/
COLLECT_GCC_OPTIONS='-v' '-o' 'hello' '-mtune=generic' '-march=x86-64' '-dumpdir' 'hello.'
 /usr/lib/gcc/x86_64-linux-gnu/11/collect2 -plugin /usr/lib/gcc/x86_64-linux-gnu/11/liblto_plugin.so -plugin-opt=/usr/lib/gcc/x86_64-linux-gnu/11/lto-wrapper -plugin-opt=-fresolution=/tmp/ccjA7sO4.res -plugin-opt=-pass-through=-lgcc -plugin-opt=-pass-through=-lgcc_s -plugin-opt=-pass-through=-lc -plugin-opt=-pass-through=-lgcc -plugin-opt=-pass-through=-lgcc_s --build-id --eh-frame-hdr -m elf_x86_64 --hash-style=gnu --as-needed -dynamic-linker /lib64/ld-linux-x86-64.so.2 -pie -z now -z relro -o hello /usr/lib/gcc/x86_64-linux-gnu/11/../../../x86_64-linux-gnu/Scrt1.o /usr/lib/gcc/x86_64-linux-gnu/11/../../../x86_64-linux-gnu/crti.o /usr/lib/gcc/x86_64-linux-gnu/11/crtbeginS.o -L/usr/lib/gcc/x86_64-linux-gnu/11 -L/usr/lib/gcc/x86_64-linux-gnu/11/../../../x86_64-linux-gnu -L/usr/lib/gcc/x86_64-linux-gnu/11/../../../../lib -L/lib/x86_64-linux-gnu -L/lib/../lib -L/usr/lib/x86_64-linux-gnu -L/usr/lib/../lib -L/usr/lib/gcc/x86_64-linux-gnu/11/../../.. /tmp/ccyJXws5.o -lgcc --push-state --as-needed -lgcc_s --pop-state -lc -lgcc --push-state --as-needed -lgcc_s --pop-state /usr/lib/gcc/x86_64-linux-gnu/11/crtendS.o /usr/lib/gcc/x86_64-linux-gnu/11/../../../x86_64-linux-gnu/crtn.o
COLLECT_GCC_OPTIONS='-v' '-o' 'hello' '-mtune=generic' '-march=x86-64' '-dumpdir' 'hello.'

Ce compte‑rendu étant complexe même pour un programme si simple, il ne serait pas pertinent d'en exposer ici tous les détails. Pour faciliter le repérage, les lignes d'invocation des trois composants logiciels – cc1, as et collect2 – ont été artificiellement mises en jaune. On peut y retrouver les chemins des deux fichiers intermédiaires, dont les noms sont générés aléatoirement après le préfixe cc :

/tmp/ccVmnVGD.s (code en langage d'assemblage) ;
/tmp/ccyJXws5.o (code objet).

Si l'on effectue la compilation avec l'option -save-temps et qu'on liste le contenu du répertoire, on obtient :

gcc -save-temps hello.c -o hello
ls
hello  hello.c  hello.i  hello.o  hello.s

où apparaissent 5 fichiers, à savoir dans l'ordre, le fichier exécutable, le fichier source, et les 3 fichiers intermédiaires :

hello.i (code source prétraité)
hello.s (code d'assemblage)
hello.o (code objet)

Sous Linux, on trouve dans le répertoire /usr/bin les fichiers de diverses commandes alternatives de la chaîne de compilation GCC, notamment les suivantes.

cpp invoque le préprocesseur seul. Elle est équivalente à gcc -E (cf. chap. C4‑III ).
cc est par défaut équivalente à gcc. En fait, il s'agit d'un lien symbolique vers /etc/alternative/cc qui, sauf s'il est modifié, est lui‑même un lien symbolique vers /usr/bin/gcc. Contre‑intuitivement, cc n'invoque donc pas le compilateur seul.

Pour invoquer le compilateur seul, il faut employer la commande gcc avec l'option -fpreprocessed qui précise que le fichier source est déjà prétraité ou n'a pas besoin de prétraitements, quelle que soit son extension.

Les noms des exécutables cc1 et collect2, qui pourraient sembler étranges, sont l'héritage des conventions de nommage adoptées dès les premières évolutions de GCC.

cc1 est l'abréviation de C compiler, le numéro « 1 » se référent au fait qu'il s'agit du premier composant de la toolchain ;
collect2 a été nommé ainsi pour évoquer le fait que ce composant logiciel collecte les fichiers objets pour les lier en un exécutable (ou un fichier de bibliothèque partagée) ; son numéro « 2 » découle du fait que lorsqu'il a été conçu comme un composant séparé du compilateur, il intervenait après cc1 (et depuis, as s'est intercalé entre les deux).

Pour mettre en évidence que le driver collect2 appelle bien l'éditeur de liens ld, il faut saisir la commande de compilation gcc avec l'option -Wl,-v qui applique l'option -v spécifiquement à l'éditeur de lien. Dans l'exemple supra, on obtient alors la sortie suivante :

  gcc -Wl,-v hello.o -o hello
  collect2 version 11.4.0
  /usr/bin/ld -plugin /usr/lib/gcc/x86_64-linux-gnu/11/liblto_plugin.so -plugin-opt=/usr/lib/gcc/x86_64-linux-gnu/11/lto-wrapper -plugin-opt=-fresolution=/tmp/ccp6jvQy.res -plugin-opt=-pass-through=-lgcc -plugin-opt=-pass-through=-lgcc_s -plugin-opt=-pass-through=-lc -plugin-opt=-pass-through=-lgcc -plugin-opt=-pass-through=-lgcc_s --build-id --eh-frame-hdr -m elf_x86_64 --hash-style=gnu --as-needed -dynamic-linker /lib64/ld-linux-x86-64.so.2 -pie -z now -z relro -o hello /usr/lib/gcc/x86_64-linux-gnu/11/../../../x86_64-linux-gnu/Scrt1.o /usr/lib/gcc/x86_64-linux-gnu/11/../../../x86_64-linux-gnu/crti.o /usr/lib/gcc/x86_64-linux-gnu/11/crtbeginS.o -L/usr/lib/gcc/x86_64-linux-gnu/11 -L/usr/lib/gcc/x86_64-linux-gnu/11/../../../x86_64-linux-gnu -L/usr/lib/gcc/x86_64-linux-gnu/11/../../../../lib -L/lib/x86_64-linux-gnu -L/lib/../lib -L/usr/lib/x86_64-linux-gnu -L/usr/lib/../lib -L/usr/lib/gcc/x86_64-linux-gnu/11/../../.. -v hello.o -lgcc --push-state --as-needed -lgcc_s --pop-state -lc -lgcc --push-state --as-needed -lgcc_s --pop-state /usr/lib/gcc/x86_64-linux-gnu/11/crtendS.o /usr/lib/gcc/x86_64-linux-gnu/11/../../../x86_64-linux-gnu/crtn.o
  GNU ld (GNU Binutils for Ubuntu) 2.38

Quant à savoir pourquoi le driver gcc n'invoque pas lui‑même directement ld mais collect2, il faut entrer dans des considérations historiques et pratiques. Dans les versions antérieures à GCC 2.5.8, toute la chaîne de compilation était intégrée de façon monolithique dans le programme cc1. Puis, avec la diversification des langages pris en charge (Fortran, C++, Ada, Go, etc.), il devenait rationnel de faire appel à un éditeur de liens externe, tout particulièrement ld d'Unix (antérieur à GCC et qui peut être utilisé pour d'autres langages compilés que C). Le processus de choix de l'éditeur de lien a donc été implémenté dans un programme séparé nommé collect2.

Cas d'une compilation en C++

Dans le cas d'un programme codé en langage C++, la chaîne de compilation GCC opère selon les mêmes principes via la commande g++ qui invoque le compilateur spécifique cc1plus (avec, à l'instar de cc1, un préprocesseur intégré).

Les autres composants logiciels de la chaîne de compilation sont les mêmes que ceux invoqués par la commande gcc : as et collect2 (ld).

Par ailleurs, les extensions des noms de fichiers reconnues ou employées par défaut sont différentes de celles que reconnaît cc1 ; à savoir :

.cpp, .cp, .c++, .cp, .cxx .CPP ou même .C pour les fichiers de code source d'implémentation ;
.hh, .hp, .hpp, .h++, .HPP ou même .H pour les fichiers de code source d'en‑tête « personnels », c'est‑à‑dire non standards ;

(pour mémoire, les fichier d'en‑tête de la bibliothèque standard du C++ n'ont pas d'extension – cf. chap. C2‑I )

.ii pour les fichiers intermédiaires de code source pré‑traité par le préprocesseur.

Comme en langage C (cf. supra ), considérons le programme trivial « Hello, World! » typiquement codé en C++ comme ci‑dessous, et stocké dans un fichier nommé hello.cpp :

#include <iostream>

int main()
{
  std::cout << "Hello, World!" << std::endl;
  return EXIT_SUCCESS;
}

Dans un terminal de commandes en ligne sous Linux, voici le compte‑rendu de compilation que l'on obtient avec les options -v et -save-temps :

g++ -v -save-temps hello.cpp -o hello
Using built-in specs.
COLLECT_GCC=g++
COLLECT_LTO_WRAPPER=/usr/libexec/gcc/x86_64-linux-gnu/13/lto-wrapper
OFFLOAD_TARGET_NAMES=nvptx-none:amdgcn-amdhsa
OFFLOAD_TARGET_DEFAULT=1
Target: x86_64-linux-gnu
Configured with: ../src/configure -v --with-pkgversion='Ubuntu 13.3.0-6ubuntu2~24.04' --with-bugurl=file:///usr/share/doc/gcc-13/README.Bugs --enable-languages=c,ada,c++,go,d,fortran,objc,obj-c++,m2 --prefix=/usr --with-gcc-major-version-only --program-suffix=-13 --program-prefix=x86_64-linux-gnu- --enable-shared --enable-linker-build-id --libexecdir=/usr/libexec --without-included-gettext --enable-threads=posix --libdir=/usr/lib --enable-nls --enable-bootstrap --enable-clocale=gnu --enable-libstdcxx-debug --enable-libstdcxx-time=yes --with-default-libstdcxx-abi=new --enable-libstdcxx-backtrace --enable-gnu-unique-object --disable-vtable-verify --enable-plugin --enable-default-pie --with-system-zlib --enable-libphobos-checking=release --with-target-system-zlib=auto --enable-objc-gc=auto --enable-multiarch --disable-werror --enable-cet --with-arch-32=i686 --with-abi=m64 --with-multilib-list=m32,m64,mx32 --enable-multilib --with-tune=generic --enable-offload-targets=nvptx-none=/build/gcc-13-fG75Ri/gcc-13-13.3.0/debian/tmp-nvptx/usr,amdgcn-amdhsa=/build/gcc-13-fG75Ri/gcc-13-13.3.0/debian/tmp-gcn/usr --enable-offload-defaulted --without-cuda-driver --enable-checking=release --build=x86_64-linux-gnu --host=x86_64-linux-gnu --target=x86_64-linux-gnu --with-build-config=bootstrap-lto-lean --enable-link-serialization=2
Thread model: posix
Supported LTO compression algorithms: zlib zstd
gcc version 13.3.0 (Ubuntu 13.3.0-6ubuntu2~24.04) 
COLLECT_GCC_OPTIONS='-v' '-save-temps' '-o' 'hello' '-shared-libgcc' '-mtune=generic' '-march=x86-64'
 /usr/libexec/gcc/x86_64-linux-gnu/13/cc1plus -E -quiet -v -imultiarch x86_64-linux-gnu -D_GNU_SOURCE hello.cpp -mtune=generic -march=x86-64 -fpch-preprocess -fasynchronous-unwind-tables -fstack-protector-strong -Wformat -Wformat-security -fstack-clash-protection -fcf-protection -o hello.ii
ignoring duplicate directory "/usr/include/x86_64-linux-gnu/c++/13"
ignoring nonexistent directory "/usr/local/include/x86_64-linux-gnu"
ignoring nonexistent directory "/usr/lib/gcc/x86_64-linux-gnu/13/include-fixed/x86_64-linux-gnu"
ignoring nonexistent directory "/usr/lib/gcc/x86_64-linux-gnu/13/include-fixed"
ignoring nonexistent directory "/usr/lib/gcc/x86_64-linux-gnu/13/../../../../x86_64-linux-gnu/include"
#include "..." search starts here:
#include <...> search starts here:
 /usr/include/c++/13
 /usr/include/x86_64-linux-gnu/c++/13
 /usr/include/c++/13/backward
 /usr/lib/gcc/x86_64-linux-gnu/13/include
 /usr/local/include
 /usr/include/x86_64-linux-gnu
 /usr/include
End of search list.
COLLECT_GCC_OPTIONS='-v' '-save-temps' '-o' 'hello' '-shared-libgcc' '-mtune=generic' '-march=x86-64'
 /usr/libexec/gcc/x86_64-linux-gnu/13/cc1plus -fpreprocessed hello.ii -quiet -dumpbase hello.cpp -dumpbase-ext .cpp -mtune=generic -march=x86-64 -version -fasynchronous-unwind-tables -fstack-protector-strong -Wformat -Wformat-security -fstack-clash-protection -fcf-protection -o hello.s
GNU C++17 (Ubuntu 13.3.0-6ubuntu2~24.04) version 13.3.0 (x86_64-linux-gnu)
	compiled by GNU C version 13.3.0, GMP version 6.3.0, MPFR version 4.2.1, MPC version 1.3.1, isl version isl-0.26-GMP

GGC heuristics: --param ggc-min-expand=100 --param ggc-min-heapsize=131072
Compiler executable checksum: c81c05345ce537099dafd5580045814a
COLLECT_GCC_OPTIONS='-v' '-save-temps' '-o' 'hello' '-shared-libgcc' '-mtune=generic' '-march=x86-64'
 as -v --64 -o hello.o hello.s
Version de l'assembleur GNU 2.42 (x86_64-linux-gnu) utilisant la version BFD (GNU Binutils for Ubuntu) 2.42
COMPILER_PATH=/usr/libexec/gcc/x86_64-linux-gnu/13/:/usr/libexec/gcc/x86_64-linux-gnu/13/:/usr/libexec/gcc/x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/13/:/usr/lib/gcc/x86_64-linux-gnu/
LIBRARY_PATH=/usr/lib/gcc/x86_64-linux-gnu/13/:/usr/lib/gcc/x86_64-linux-gnu/13/../../../x86_64-linux-gnu/:/usr/lib/gcc/x86_64-linux-gnu/13/../../../../lib/:/lib/x86_64-linux-gnu/:/lib/../lib/:/usr/lib/x86_64-linux-gnu/:/usr/lib/../lib/:/usr/lib/gcc/x86_64-linux-gnu/13/../../../:/lib/:/usr/lib/
COLLECT_GCC_OPTIONS='-v' '-save-temps' '-o' 'hello' '-shared-libgcc' '-mtune=generic' '-march=x86-64' '-dumpdir' 'hello.'
 /usr/libexec/gcc/x86_64-linux-gnu/13/collect2 -plugin /usr/libexec/gcc/x86_64-linux-gnu/13/liblto_plugin.so -plugin-opt=/usr/libexec/gcc/x86_64-linux-gnu/13/lto-wrapper -plugin-opt=-fresolution=hello.res -plugin-opt=-pass-through=-lgcc_s -plugin-opt=-pass-through=-lgcc -plugin-opt=-pass-through=-lc -plugin-opt=-pass-through=-lgcc_s -plugin-opt=-pass-through=-lgcc --build-id --eh-frame-hdr -m elf_x86_64 --hash-style=gnu --as-needed -dynamic-linker /lib64/ld-linux-x86-64.so.2 -pie -z now -z relro -o hello /usr/lib/gcc/x86_64-linux-gnu/13/../../../x86_64-linux-gnu/Scrt1.o /usr/lib/gcc/x86_64-linux-gnu/13/../../../x86_64-linux-gnu/crti.o /usr/lib/gcc/x86_64-linux-gnu/13/crtbeginS.o -L/usr/lib/gcc/x86_64-linux-gnu/13 -L/usr/lib/gcc/x86_64-linux-gnu/13/../../../x86_64-linux-gnu -L/usr/lib/gcc/x86_64-linux-gnu/13/../../../../lib -L/lib/x86_64-linux-gnu -L/lib/../lib -L/usr/lib/x86_64-linux-gnu -L/usr/lib/../lib -L/usr/lib/gcc/x86_64-linux-gnu/13/../../.. hello.o -lstdc++ -lm -lgcc_s -lgcc -lc -lgcc_s -lgcc /usr/lib/gcc/x86_64-linux-gnu/13/crtendS.o /usr/lib/gcc/x86_64-linux-gnu/13/../../../x86_64-linux-gnu/crtn.o
COLLECT_GCC_OPTIONS='-v' '-save-temps' '-o' 'hello' '-shared-libgcc' '-mtune=generic' '-march=x86-64' '-dumpdir' 'hello.'

Comme dans l'exemple en langage C (cf. supra ), on y retrouve l'invocation de trois composant logiciels :

cc1plus, qui regroupe le préprocesseur et le compilateur spécifiques au C++ ;
as et collect2, respectivement l'assembleur et l'éditeur de liens – les mêmes que ceux invoqués en C.

Par ailleurs, du fait que l'option -save-temps a été invoquée, on récupère 3 fichiers intermédiaires dans le répertoire de projet :

hello.ii (code source prétraité)
hello.s (code d'assemblage)
hello.o (code objet)

Une multitude d'options

La commande gcc dispose d'un très grand nombre d'options, certaines étant générales et d'autres spécifiques à tel ou tel composant (préprocesseur, compilateur, etc.) ou aspect de la chaîne de compilation (avertissements, débogage, optimisation, etc.).

Sur un poste de travail Linux, on peut bien entendu consulter la page du manuel (cf. chap. S1‑III ) de la commande gcc.

Mais il est sans doute plus efficace de consulter le site web de GCC qui propose un récapitulatif thématique des options de cette commande sur la page web accessible au lien suivant . On peut ensuite obtenir les détails de chacune des via les liens fournis pour chaque catégorie d'options.

Par ailleurs, on peut énoncer les considérations générales suivantes sur les options de la commande gcc :

Une option commençant par le préfixe -f détermine un choix binaire – la lettre‑code « f » faisant référence au mot flag, c'est‑à‑dire un drapeau (cf. chap. C3‑III ). En règle générale, il s'agit d'une option qui est indépendant de la machine‑cible.

Exemple. L'option -fsigned-char impose que le type char soit systématiquement considéré comme signé (car ce n'est pas le cas par défaut pour toutes les implémentations – cf. chap. C3 II ).

Une option commençant par le préfixe -W peut appartenir à diverses catégories :

Il peut s'agir d'une option relative à certains avertissements émis par la chaîne de compilation – la lettre‑code « W » faisant référence au mot warning.

Exemple. L'option -Werror convertit tout avertissement en erreur (avec, le cas échéant, un abandon du processus de compilation) – cf. chap. C1‑II ;

Mais il peut aussi s'agir option spécifique adressée à l'un des 4 composants logiciels de la chaîne de compilation, lequel est indiqué par une lettre‑code – à savoir p pour le préprocesseur, c pour le compilateur, a pour l'assembleur et l pour l'éditeur de lien – qui suit immédiatement le préfixe -W et qui immédiatement suivi d'une virgule puis du code de l'option.

Exemple. L'option -Wa,-v explicite la version de l'assembleur dans le terminal d'exécution de la commande gcc.

Dans une option, le préfixe -no (-fno s'il s'agit aussi d'une option de type flag) détermine le choix opposé à celui exprimé par le reste du code de l'option.

Exemple. L'option -no-integrated-cpp inhibe le préprocesseur intégré à cc1 ou cc1plus dans la phase de compilation (ce qui peut être nécessaire lorsque l'on souhaite recourir à un autre préprocesseur, comme GNU M4 W).

Les prétraitements avec CPP

Rappelons (cf. chap. C4‑III ) qu'à partir d'un code source réparti sur différents fichiers, le préprocesseur CPP effectue de nombreux prétraitements, à la fois implicites (suppression des commentaires, ajout des marques de lignes…) et explicites (inclusions de fichiers, expansions des macros…) – ces derniers étant codés par des directives.

Intégré dans les exécutables cc1 et cc1plus (avec quelques spécificités), le préprocesseur CPP produit un flux de tokens prétraités à destination du compilateur.

Le préprocesseur CPP peut être invoqué seul via l'option -E de la commande gcc – ou alternativement via la commande cpp – pour effectuer seulement les prétraitements des fichier source.

Si l'option -o n'est pas utilisée, alors la commande cpp (ou gcc -E) génère par défaut pour chaque fichier source d'implémentation (.c) un fichier de sortie avec le même nom que le fichier source, et avec l'extension .i. Cette extension permet à la commande gcc d'identifier tout fichier dont les prétraitements sont déjà effectués.

En principe, l'extension .i donc être impérativement donnée au nom du fichier de sortie en cas d'utilisation de l'option -o dans la perspective d'une compilation ultérieure de ce fichier. Néanmoins, quelle que son extension, il est possible d'indiquer au compilateur qu'un fichier a déjà été prétraité, en utilisant l'option -fpreprocessed.

Divers exemples d'invocation de la commande cpp ont été donnés au chapitre C4‑III . Toutefois, dans ce chapitre, on a étudié assez peu d'options de la commande cpp : seulement celles pour opérer le transcodage des caractères du fichier source et du fichier de sortie dans un format spécifié .

En fait, la commande cpp possède beaucoup d'options, dont on peut trouver la liste détaillée au lien suivant C. S'il n'est pas question ici de les présenter toutes, il est quand même utile d'en mentionner certaines. En particulier, lors de l'invocation de cpp ou gcc, on utilise fréquemment les options suivantes.

L'option -I immédiatement suivie (sans espace de séparation) d'un chemin absolu ou relatif depuis le répertoire de projet spécifie un autre répertoire dans lequel le préprocesseur est invité à rechercher d'éventuels fichier à inclure via une directive #include. Cela permet notamment de déporter ces fichiers dans un répertoire différent de celui de compilation, sans avoir à modifier les directives d'inclusion dans le code source.

La pratique usuelle consistant à placer les fichiers d'en‑tête dans un sous‑répertoire nommé include directement créé dans le répertoire de projet, l'option se code alors -Iinclude (cf. l'exemple proposé au chap. C4‑V ) – à ne pas confondre avec l'option suivante.

L'option -include suivi d'un chemin absolu ou relatif permet d'inclure un autre fichier source, c'est‑à‑dire d'ajouter « à la volée » une directive #include (chap. C4‑III ). Un exemple est traité ci‑après.
L'option -D suivie d'une définition de la forme :
expression d'identification=fragment de code
permet de créer une macro‑définition, c'est‑à‑dire d'ajouter « à la volée » une directive #define (chap. C4‑III ). Un exemple est traité ci‑après.

Attention : si la macro‑définition comporte des arguments, alors dans l'expression d'identification ou du fragment de code, toute occurrence de parenthèse ( – ou ), ou de caractères spéciaux comme " \ etc. – doit être immédiatement précédée du symbole \, formant ainsi une séquence d'échappement pour rendre la commande de compilation compatible avec le langage de script du terminal d'exécution (typiquement, bash).

Grâce à ces options, on peut lors de la compilation changer ponctuellement certains prétraitements opérés sur un programme, sans avoir à modifier le fichier source.

Considérons le programme académique constitué du fichier d'implémentation returnA.c ci‑dessous :

#include "defineA.h"

int main(void)
{
  return A;
}

et du fichier d'en‑tête defineA.h ci‑dessous (placé dans le même dossier de compilation) :

#define A 5

Artificiellement, invalidons la directive d'inclusion (ligne nº 1) en la mettant en commentaire dans le fichier source returnA.c comme ci‑dessous :

//#include "defineA.h"

int main(void)
{
  return A;
}

Tel quel, ce code source n'est plus compilable puisque l'identificateur A n'est plus défini. Néanmoins, on peut y remédier grâce aux options de CPP mentionnées supra. Par exemple :

Pour inclure « à la volée » le fichier d'en‑tête defineA.h dont on avait supprimé l'inclusion dans le code source, on peut saisir la commande :

  gcc -include "defineA.h" returnA.c -o returnA

Pour définir « à la volée » l'identificateur A dont on avait supprimé la définition dans le code source, on peut saisir la commande :

  gcc -D A=5 returnA.c -o returnA

Comme souligné, cet exemple purement académique reste évidemment très « artificiel ». Pour comprendre l'utilité de ces options, il faut imaginer une situation réelle où l'on aurait à compiler un programme en opérant des modifications sans éditer le code source.

La compilation avec GCC

Comme déjà souligné, le compilateur est le cœur de la chaîne de compilation. Via de nombreuses étapes, il traduit le flux de tokens prétraités par le préprocesseur en un ou plusieurs fichiers de pseudo‑code objet exprimé en langage d'assemblage – c'est pourquoi on parle également de code d'assemblage.

Ce pseudo‑code objet, déjà spécifique pour l'architecture de la machine cible, est destiné à être ensuite traduit en véritable code objet par l'assembleur.

Lancée avec l'option -S, la commande gcc arrête ses traitements juste après la phase de compilation ; autrement dit, elle n'invoque ni l'assembleur, ni l'éditeur de lien.

Elle accepte aussi bien des fichiers sources non encore prétraités (.c et .h) que des fichiers déjà prétraités d'extension .i (pour lesquels seule la compilation proprement dite est alors effectuée).
Elle attribue par défaut à chaque fichier de sortie de code d'assemblage le même nom que son fichier source d'implémentation correspondant et l'extension .s. Évidemment, il est possible spécifier tout autre nom et/ou extension via l'option -o (output).

L'intérêt de produire du code d'assemblage dans un fichier intermédiaire est de pouvoir y apporter des optimisations avant de le fournir à l'assembleur. C'est une pratique courante dans l'industrie logicielle.

Par défaut, le compilateur de GCC produit du code d'assemblage en langage « gas », c'est‑à‑dire le langage qu'interprète le GNU assembler (cf. infra ) pour produire du code objet. Sans entrer dans les détails, il est utile de quelques règles de syntaxe pour comprendre la structure d'un programme, qui se présente comme une suite de lignes, le plus souvent présentées pour le codeur avec un seul niveau d'indentation, qui n'est pas sémantique (l'assembleur les ignore).

Dans du code d'assemblage, on trouve trois types de lignes : des directives, des instructions et des étiquettes.

Les directives (mot transparent) sont des lignes spécialement destinées à l'assembleur pour générer les différentes composantes du code objet (sections, fonctions, données, métadonnées, tables). Indentées, elles débutent par le caractère . (c'est ainsi que l'assembleur les identifie).
Les instructions – en anglais, statements – sont des lignes destinées au processeur de la machine cible. Indentées, elles débutent par un mot‑clef parmi ceux du jeu d'instructions du processeur, par exemple mov, push, pop, etc.
Les étiquettes – en anglais, labels – sont des repères définis dans le code, destinés à se voir attribuer une adresse dans le code objet. Non indentées, elles sont simplement formées d'un identificateur suivi du caractère :.

Par ailleurs, un programme en code d'assemblage met en œuvre essentiellement deux concepts fondamentaux : les sections et les symboles.

Les sections forment des parties distinctes du fichier d'assemblage qui, chacune, regroupent des instructions ou des données appartenant à une même catégorie.

Exemples (cf. chap. C4‑II ).

La section .text regroupe toutes les instructions des fonctions du programme.
La section .data regroupe toutes les variables globales du programme

Les symboles sont des identificateurs qui, chacun, désigne une adresse et/ou un objet (au sens large) du programme.

Exemple : main est le symbole qui désigne la fonction principale du programme.

On voit que, pour interpréter un code en langage d'assemblage, il est impératif de ne pas confondre des noms de sections et les directives, qui commencent les unes et les autres par le caractère ., sachant de plus qu'une directive codée simplement comme :
.text
est en fait l'abréviation de la directive :
.section .text
qui s'interprète par :
« Passer au codage de la section .text, en la créant si ce n'est pas déjà fait. »

Enfin pour couronner le tout, en langage gas, le caractère . a également un 3^e emploi : en certaines occurrences, il symbolise le compteur de position – en anglais, program location counter (PLC) qui compte le nombre d'instructions dans une fonction.

Reprenons l'exemple académique précédent en le simplifiant pour le réduire à une forme minimale d'un programme qui retourne la valeur 5 (sans recours à une pseudo‑constante ni à aucun un fichier d'en‑tête) :

int main(void)
{
  return 5;
}

Enregistré dans un fichier source nommé return5.c, on le compile avec :

l'option -S pour ne pas aller plus loin que la compilation et simplement générer le fichier de code d'assemblage ;
l'option -fno-asynchronous-unwind-tables pour ne pas générer certains symboles de débogage qui, ici, compliqueraient inutilement le code généré.

gcc -S -fno-asynchronous-unwind-tables return5.c

On obtient alors un fichier de sortie nommé par défaut return5.s qui contient le code d'assemblage du programme ci‑dessous :

  .file  "return5.c"
  .text
  .globl  main
  .type  main, @function
main:
  endbr64
  pushq  %rbp
  movq  %rsp, %rbp
  movl  $5, %eax
  popq  %rbp
  ret
  .size  main, .-main
  .ident  "GCC: (Ubuntu 11.3.0-1ubuntu1~22.04) 11.3.0"
  .section  .note.GNU-stack,"",@progbits
  .section  .note.gnu.property,"a"
  .align 8
  .long 1f - 0f
  .long 4f - 1f
  .long 5
0:
  .string "GNU"
1:
  .align 8
  .long 0xc0000002
  .long 3f - 2f
2:
  .long 0x3
3:
  .align 8
4:

À l'aide des rudiments de syntaxe donnés supra , on peut faire les observations suivantes.

Les lignes nº 1 à 4 sont des directives qui, dans l'ordre, demandent à l'assembleur de :

mémoriser nom du fichier source ;
commencer la section .text ;
y créer le symbole global nommé main ;
attribuer à ce symbole le type @function.

La ligne nº 5 est l'étiquette qui repère le début du code de la fonction main.
Les lignes nº 6 à 11 sont les instructions formant le code de la fonction main. La plus significative est celle de la ligne nº 9 qui place (movl est l'abréviation de move long) la valeur 5 dans le registre %eax.
La ligne nº 12 est une directive qui calcule la taille de la fonction main. L'expression .-main exprime la différence entre le compteur de position . et la position dans le code de l'étiquette main:.

Pour ne pas alourdir inutilement l'exposé, on ne détaille pas les directives et étiquettes suivantes.

On peut se faire une idée des optimisations que l'on peut apporter à un pseudo‑code objet, observons par exemple un programme minimal pour effectuer une opération similaire, à savoir retourner la valeur 7 (juste pour ne pas confondre avec le programme return5 précédent) :

  .text
  .global _start
_start:
  movq     $60, %rax   # system call nb 60 = exit (accumulator register)
  movq     $7,  %rdi   # return code 7            (destination index register)
  syscall              # invoke operating system  (using %rax & %rdi as arguments)

Enregistré dans un fichier nommé return7.s, ce programme peut être testé via le script d'assemblage, d'édition de liens et d'exécution suivant :

#!/bin/bash
as return7.s -o return7.o
ld return7.o -o return7
./return7
echo $?

Remarques. Dans le script ci‑dessus, si l'on souhaite utiliser la commande gcc -c à la place de as, il faut remplacer la ligne nº 2 par celle ci‑dessous :

gcc -c -nostdlib -nostartfiles -nodefaultlibs return7.s

Les options de compilation

Sans surprise, c'est le compilateur qui fait l'objet de la très grande majorité des options de la commande gcc. Même s'il n'est pas question de les détailler ni même de les énumérer toutes, il est utile d'en connaître quelques unes – au moins celles qui sont décrites ci‑après.

Bien entendu, on a les options essentielles qui ont été présentées dès le chapitre C1‑II :

-std=version permet de sélectionner une version de la norme du langage C ou C++ que le code source doit respecter .
-Wall -Wextra et -Werror rendent le compilateur plus exigeant en matières d'avertissements .

De plus, il existe l'option -w qui, au contraire, supprime l'affichage de tous les avertissements. Vivement déconseillée en programmation, elle est néanmoins utilisée par défaut par le logiciel Arduino IDE par souci de facilité d'emploi pour les codeurs débutants (cf. infra ).

On peut aussi dores et déjà évoquer certains options pour l'optimisation du code exécutable :

-O immédiatement suivi d'un chiffre ou d'une lettre qui détermine le type ou le niveau général d'optimisation que le compilateur est autorisé à mettre en œuvre.

L'option usuellement choisie est -O2 – on parle d'optimisation dite de « niveau 2 ».
L'option -O0 – et on parle alors d'optimisation dite de « niveau 0 » – spécifie l'absence d'optimisation. Elle garantit une compilation plus rapide mais, en contre‑partie une exécution moins rapide ou une taille d'exécutable plus grande.

Et il existe aussi l'option -Os (s pour size) qui oriente l'optimisation du code pour obtenir un code objet de taille la plus réduite possible. C'est l'option choisie par le logiciel Arduino IDE pour compiler les programmes de l'utilisateur en raison du volume mémoire très réduit offert par les cartes à microcontrôleur pour héberger le programme utilisateur (cf. infra ).

Pour plus de détails sur les options d'optimisation, on se reportera à cette page de référence .

-march=nom et -cpu=nom indique précisément au compilateur l'architecture et le processeur de la machine‑cible (ces options sont complexes, cf. cette page de référence pour plus de détails ).

Enfin, on peut aussi déjà citer l'option -g, qui est très importante car, dès le code d'assemblage, elle génère toutes sortes de symboles pour permettre le débogage du programme, non seulement lors de l'exécution (cf. infra ), mais aussi lors des autres phases de la chaîne de compilation (cf. infra ).

L'assemblage avec AS

L'assembleur utilisé par défaut par la chaîne de compilation GCC est communément appelé AS ou GAS W (abréviation de GNU Assembler). C'est un programme de petite taille (inférieure à 500 ko) fourni dans le paquet binutils W des distributions GNU/Linux.

À partir d'un fichier de code d'assemblage (de type texte), l'assembleur produit un fichier de code objet (de type binaire) qui, entre autres, traduit chaque instruction du code d'assemblage en instruction(s) machine spécifique(s) pour l'architecture ciblée.

De plus, un fichier objet contient des éléments supplémentaires à celui du fichier d'assemblage dont il est issu : un en‑tête, une ou plusieurs tables des symboles ainsi que des informations de relocalisation et de débogage.

Lancée avec l'option -c, la commande gcc arrête ses traitements juste après la phase d'assemblage ; autrement dit, elle n'invoque pas l'éditeur de lien.

Elle accepte aussi bien des fichiers sources (prétraités ou non) que des fichiers de code d'assemblage d'extension .s (pour lesquels seul l'assemblage est alors effectué).
Elle attribue par défaut à chaque fichier de sortie de code objet le même nom que son fichier source ou d'assemblage correspondant et l'extension .o. Néanmoins, il est possible de spécifier tout autre nom et/ou extension via l'option -o.

On peut également procéder avec la commande as mais uniquement si l'on part de fichiers de code d'assemblage.

Par défaut, les fichiers objets générés par l'assembleur AS sont au format ELF W – pour executable and linkable format. Plus précisément, il s'agit de fichiers ELF dits relocalisables, c'est‑à‑dire destinés à former du code exécutable par édition de liens.

Reprenons le cas du programme académique constitué du fichier source return5.c aussi minimal que possible :

int main(void)
{
  return 5;
}

À partir de son fichier de code d'assemblage return5.s généré supra , procédons à la génération du code objet via la commande commande de compilation gcc -c return5.s. Elle produit un fichier nommé par défaut return5.o de 976 ko, dont on peut vérifier le type à l'aide de la commande file (cf. chap. S1‑III S) :

file return5.o 
return5.o: ELF 64-bit LSB relocatable, x86-64, version 1 (SYSV), not stripped

Il s'agit donc bien d'un fichier au format ELF où les données sont adressées sur 64 bits et encodées avec la convention de petit‑boutisme (LSB – cf. chap. C3‑I ).
Le code objet est généré pour une machine à architecture x86‑64 avec un système d'exploitation de la branche SysV W (Unix, Linux…).
C'est un fichier relocalisable, c'est‑à‑dire destiné à former du code exécutable par édition de liens (cf. infra ).

Avec un éditeur de code comme Sublime text, il est tout à fait possible de consulter son contenu (cf. ci‑dessous la première moitié) qui se présente sous la forme d'une suite de lignes de 16 octets affichés en hexadécimal.

7f45 4c46 0201 0100 0000 0000 0000 0000
0100 3e00 0100 0000 0000 0000 0000 0000
0000 0000 0000 0000 5001 0000 0000 0000
0000 0000 4000 0000 0000 4000 0a00 0900
f30f 1efa 5548 89e5 b805 0000 005d c300
4743 433a 2028 5562 756e 7475 2031 332e
332e 302d 3675 6275 6e74 7532 7e32 342e
3034 2e31 2920 3133 2e33 2e30 0000 0000
0400 0000 1000 0000 0500 0000 474e 5500
0200 00c0 0400 0000 0300 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0100 0000 0400 f1ff
0000 0000 0000 0000 0000 0000 0000 0000
0b00 0000 1200 0100 0000 0000 0000 0000
0f00 0000 0000 0000 0072 6574 7572 6e35
2e63 006d 6169 6e00 002e 7379 6d74 6162
002e 7374 7274 6162 002e 7368 7374 7274
6162 002e 7465 7874 002e 6461 7461 002e
6273 7300 2e63 6f6d 6d65 6e74 002e 6e6f
7465 2e47 4e55 2d73 7461 636b 002e 6e6f
7465 2e67 6e75 2e70 726f 7065 7274 7900
0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000
1b00 0000 0100 0000 0600 0000 0000 0000
0000 0000 0000 0000 4000 0000 0000 0000
0f00 0000 0000 0000 0000 0000 0000 0000
0100 0000 0000 0000 0000 0000 0000 0000
2100 0000 0100 0000 0300 0000 0000 0000

Bien entendu, pour le codeur, à moins d'être un expert en compilation, ce contenu est très difficile à interpréter. Mais sachant quelques bases sur le format ELF et à l'aide d'outil de désassemblage (cf. infra ), il ressort que :

les 64 premiers octets (4 lignes), en bleu, constituent l'en‑tête ELF W ;
les 16 octets suivants, en rouge, constituent la section .text du programme – ici réduite au code objet de la fonction main ;
les octets restants sont des données nécessaires pour toute édition de liens ultérieure : table des symboles, table des sections, méta‑informations de relocalisation et de débogage.

Pour visualiser en détail la correspondance entre le code objet de la section .text et les instructions en langage d'assemblage qu'elles traduisent, on peut utiliser l'environnement d'analyse en ligne Compiler Explorer développé par Matt Godbolt. Dans notre exemple, il faut :

dans la colonne de gauche, sélectionner le langage C et coller le code source du programme ;
dans la colonne du milieu, sélectionner le compilateur (ici, x86-64 gcc 11.3) et cocher le paramètre (menu ⚙) :
☑ Compile to binary object

On obtient alors le code d'assemblage de la fonction main avec, au dessus de chaque ligne, les valeurs hexadécimales des octets correspondants dans le code objet – ceux de la ligne en rouge dans le code supra :
5548 89e5 b805 0000 005d c3
comme l'illustre la capture d'écran ci‑contre.

Analyse et désassemblage d'un fichier objet

Un environnement comme Compiler Explorer ne permet pas d'analyser la totalité d'un fichier objet, mais seulement sa section text. Toutefois, dans le cadre d'un débogage ou d'une rétro‑ingénierie, il est parfois nécessaire d'obtenir plus d'informations d'un tel fichier, en particulier d'en extraire les tables des symboles. Or un fichier binaire reste très difficile à lire, même pour un codeur expérimenté et avec l'aide d'un éditeur de code hexadécimal.

Avec le package HexViewer sous Sublime Text, le fichier objet issu de l'exemple précédent de programme académique qui retourne simplement la valeur 5 (cf. supra ) apparaît comme sur la capture d'écran ci‑dessous (512 premiers octets seulement) :

En plus de la colonne centrale qui reproduit le code hexadécimal du fichier par lignes de 16 octets, l'affichage produit deux autres colonnes :

La colonne de gauche, en caractères rouges affiche les adresse de décalage des lignes du code objet, c'est‑à‑dire le numéro d'ordre hexadécimal de leur premier octet.
La colonne de droite en caractères gris affiche seulement l'interprétation en code ASCII des octets du fichier. Cela permet de repérer certains éléments (données de type chaîne de caractère, nom des sections…) mais n'apporte pas de visualisation de la table des symboles.

Heureusement, il existe des outils d'analyse et de désassemblage qui permettent de reconstituer sous une forme intelligible un fichier objet.

Certains outils sont des logiciels à part entière – par exemple, IDA Pro W, Ghidra W, Radare2 W…
D'autres outils sont des composants qui peuvent s'intégrer sous forme de commandes en ligne ; sous Linux, on trouve notamment nm, size, objdump et readelf, qui font tous partie du paquet binutils W.

Une brève présentation de ces quatre commandes Linux se justifie par leur grande utilité. En effet, elles ont l'avantage d'être disponibles dès lors que la paquet binutils est installé, et d'être faciles à employer (dans le cadre d'une utilisation peu experte).

nm W – pour name mangling – permet essentiellement d'afficher la table des symboles d'un fichier objet ou exécutable, en précisant pour chaque symbole son adresse et la section dans laquelle il est inclus (avec les lettres T R D B, etc.) – cf. chap. C4‑II . Pour plus de détails sur ses différentes options, on pourra consulter sa page de manuel .
size permet d'afficher la taille des différentes sections d'un fichier objet ou exécutable. Avec l'option -G (pour le style GNU), cette commande présente les résultats sous la forme d'un tableau dont la ligne d'en‑tête est :

     text	   data	    bss	    total	filename

et où chaque ligne qui suit est la liste tabulée des tailles des segments principaux (exprimées en octets) des fichiers auxquels la commande est appliquée. Mais attention :

la colonne data somme la taille du segment data sans la section .bss mais avec la taille du segment rodata (s'il existe) ;
la colonne bss donne la taille de la section .bss ou du segment bss (s'il existe).

Pour plus de détails sur les différentes options de la commande size, on pourra consulter sa page de manuel .

objdump W – pour object dumping – est un outil de désassemblage applicable aux fichiers objets ou exécutables compilés pour toutes sortes d'architectures de machine cible (x86, ARM, MIPS…). Cette commande possède un très grand nombre d'options dont on peut consulter les détails sur sa page de manuel .

Plusieurs exemples académiques d'utilisation de cette commande sont proposés infra , lors de l'étude de l'édition de liens.

readelf W est un autre outil de désassemblage, mais applicable seulement aux fichiers objets ou exécutables compilés au format ELF , donc très bien adaptée pour les fichiers générés par GCC. Cette commande possède un grand nombre d'options dont on peut consulter les détails sur sa page de manuel .

Des exemples élémentaires d'utilisation de cette commande sont donnéq ci‑après et plus loin , lors de l'étude de l'édition de liens.

Poursuivons l'analyse du fichier objet return5.o généré supra du programme académique qui retourne simplement la valeur 5, dont on reproduit ci‑dessous le début du code visualisé avec Sublime Text.

On peut par exemple utiliser la commande readelf -h pour décoder en détail l'en‑tête du fichier (ELF header) :

readelf -h return5.o
ELF Header:
  Magic:   7f 45 4c 46 02 01 01 00 00 00 00 00 00 00 00 00 
  Class:                             ELF64
  Data:                              2's complement, little endian
  Version:                           1 (current)
  OS/ABI:                            UNIX - System V
  ABI Version:                       0
  Type:                              REL (Relocatable file)
  Machine:                           Advanced Micro Devices X86-64
  Version:                           0x1
  Entry point address:               0x0
  Start of program headers:          0 (bytes into file)
  Start of section headers:          336 (bytes into file)
  Flags:                             0x0
  Size of this header:               64 (bytes)
  Size of program headers:           0 (bytes)
  Number of program headers:         0
  Size of section headers:           64 (bytes)
  Number of section headers:         10
  Section header string table index: 9

On obtient ainsi nettement plus d'information qu'avec la commande file. En particulier, on peut voir que le fichier comporte maintenant 10 sections.

On peut également employer la commande readelf -W -S pour afficher au format large les sections du fichier (ELF sections), en filtrant la sortie à l'aide de la commande grep (cf. chap. S1‑IV ) pour ne s'intéresser qu'aux plus essentielles :

readelf -W -S return5.o | grep -E "Name|text|data|bss"
  [Nr] Name              Type            Address          Off    Size   ES Flg Lk Inf Al
  [ 1] .text             PROGBITS        0000000000000000 000040 00000f 00  AX  0   0  1
  [ 2] .data             PROGBITS        0000000000000000 00004f 000000 00  WA  0   0  1
  [ 3] .bss              NOBITS          0000000000000000 00004f 000000 00  WA  0   0  1

On peut ainsi voir que :

la section .text (qui a été crée dès la compilation – cf. supra ) commence à l'adresse Ox40 (offset) et va jusqu'à l'adresse Ox4f (offset + size) ;
les sections .data et .bss commencent à l'adresse Ox4f mais sont vides (size 0) puisque le programme source ne déclare aucune donnée.

Ces adresses coïncident exactement avec les numéros d'ordre hexadécimaux des octets qu'on peut visualiser ci‑dessus dans la colonne de gauche avec l'éditeur Sublime Text.

Les options de l'assembleur

Comme tous les programmes de la chaîne de compilation GCC, l'assembleur dispose de diverses options. Toutefois, comme l'assembage est une étape assez « linéaire » de transcodage du code d'assemblage en code machine, les options sont peu nombreuses et assez peu déterminantes pour le résultat final de la génération du code exécutable, comparativement à celles de compilation ou d'édition de liens.

Conformément à la syntaxe générale des options spécifiques aux composants logiciels de GCC (cf. supra ), celles relatives à l'assembleur se codent comme suit :
-Wa,option code

Parmi ces options, on doit citer l'option -a, qui est utile pour la mise au point du programme : elle affiche dans le terminal d'exécution (ou éventuellement dans un fichier) la correspondance entre le code objet généré en sortie par l'assembleur et le code d'assemblage pris comme entrée. De plus, elle peut être assortie de diverses sous‑options, chacune activée par une lettre‑code :

d pour afficher les directives de débogage ;
h pour afficher les repères du code source (fonctionne uniquement si l'option globale -g de génération des symboles de débogage est codée dans la commande – cf. supra ) ;
l pour afficher les numéros de ligne du listing et éventuellement du code source ;
i pour afficher le contenu des fichiers d'en‑têtes inclus dans le programme ;
s pour afficher la table des symboles inclus dans le programme ;
g pour afficher les informations générales de débogage ;
n pour supprimer les sauts de page qui sont ajoutés par défaut (no form feeds).

Ainsi, pour activer toutes ces sous‑options, on code donc -Wa,-adhlisgn.

Par ailleurs, il est possible de rediriger la sortie dans un fichier de listing, spécifié par son chemin, en codant immédiatement après le code de l'option :
=chemin

Reprenons le cas le plus simple du programme académique qui retourne simplement la valeur 5, en partant du fichier en code d'assemblage return5.s généré supra , sans symboles de débogages (on pourrait tout aussi bien partir du fichier source return.c, à condition d'invoquer l'option -fno-asynchronous-unwind-tables).

En l'absence des symboles de débogage (motivé par le souci de simplicité), on invoque donc seulement l'option d'assemblage -Wa,-aln, de sorte que la commande ci‑dessous, en plus de générer le fichier objet nommé par défaut return5.o, produit en sortie standard la correspondance entre le code objet et et le code d'assemblage dont il est issu.

gcc -c -Wa,-aln return5.s
   1                  .file  "return5.c"
   2                  .text
   3                  .globl  main
   4                  .type  main, @function
   5                main:
   6 0000 F30F1EFA     endbr64
   7 0004 55           pushq  %rbp
   8 0005 4889E5       movq  %rsp, %rbp
   9 0008 B8050000     movl  $5, %eax
   9      00
  10 000d 5D           popq  %rbp
  11 000e C3           ret
  12                  .size  main, .-main
  13                  .ident  "GCC: (Ubuntu 13.3.0-6ubuntu2~24.04.1) 13.3.0"
  14                  .section  .note.GNU-stack,"",@progbits
  15                  .section  .note.gnu.property,"a"
  16                  .align 8
  17 0000 04000000     .long  1f - 0f
  18 0004 10000000     .long  4f - 1f
  19 0008 05000000     .long  5
  20                0:
  21 000c 474E5500     .string  "GNU"
  22                1:
  23                  .align 8
  24 0010 020000C0     .long  0xc0000002
  25 0014 04000000     .long  3f - 2f
  26                2:
  27 0018 03000000     .long  0x3
  28                3:
  29 001c 00000000     .align 8
  30                4:

Dans cette sortie standards, on distingue 4 colonnes qui affiche dans l'ordre :

les numéros de ligne dans le listing (sous‑option l) ;
les adresses de décalage des éléments du code objet ;
le code objet ;
le code d'assemblage correspondant.

Et on retrouve bien le code objet de la fonction main (mis en évidence en rouge comme précédemment ).

L'édition de liens avec LD

L'éditeur de liens utilisé par défaut par la chaîne de compilation GCC est communément appelé LD W. C'est un programme de taille moyenne (environ 1,7 Mo) fourni dans le paquet binutils W des distributions GNU/Linux.

À partir de fichiers de code objet compilés spécialement par le codeur ou issus d'une bibliothèque partagée, sauf options spécifiques, l'éditeur de liens produit un seul fichier de code exécutable pour la machine cible sélectionnée par la commande de compilation.

Pour mémoire, le programme pilote collect2 et le lien symbolique ld qu'il appelle sont introduits supra .

Lors qu'elle est invoquée sans option restrictive comme -E, -S ou -c, la commande gcc exécute tout ou partie de la chaîne de compilation jusqu'à l'édition de liens.

Elle accepte aussi bien des fichiers sources (prétraités ou non) que des fichiers de code d'assemblage d'extension .s ou des fichiers de code objet d'extension .o.
Elle donne par défaut au fichier de sortie de code exécutable le nom a.out. Évidemment, il est possible et même recommandé de spécifier un autre nom (et extension) via l'option -o (output).

Pour effectuer l'édition de liens seule, c'est‑à‑dire en partant de fichiers de code objet, il est possible dans des cas simples de procéder en invoquant directement la commande ld, mais dans la pratique, il est vivement recommandé d'employer gcc.

Dans tous les cas, l'édition de liens incorpore, dans le fichier exécutable d'un programme, le code objet issu de la compilation du ou des fichiers d'implémentation du programme.

En revanche, pour exploiter le code objet des fonctions issues de bibliothèques (qu'elles soient standards ou non), il existe deux types d'éditions de liens, l'une dite statique, l'autre dite dynamique.

Le choix entre ces deux types d'édition de liens a des conséquences majeures en termes de volume mémoire et d'autonomie du fichier exécutable.

Édition de liens statiques

En édition de liens statiques, le code objet de chacune des fonctions de bibliothèque utilisées dans un programme est incorporé dans son fichier exécutable. Cette tâche est accomplie par l'éditeur de liens de la chaîne de compilation.

Cela produit un fichier exécutable qui est très volumineux mais qui présente l'avantage d'être autonome.

Plus précisément, le fichier exécutable produit par édition de liens statiques peut s'exécuter sur n'importe quelle machine cible d'architecture compatible avec celle choisie à l'assemblage, sans avoir à se soucier de l'installation des bibliothèques de fonctions utilisées par le programme machine. C'est donc typiquement un choix opéré pour la production d'applications logicielles pour leurs versions dite « stand alone ».

Avec les commandes gcc ou ld, l'édition de liens statiques n'est pas choisie par défaut, il faut employer l'option -static pour la mettre en œuvre.

Faisons l'expérience avec le programme trivial « Hello, World! » dont le fichier source hello.c fait appel à la fonction printf issue de la bibliothèque standard.

#include <stdio.h>

int main(void)
{
  printf("Hello, World!\n");
  return 0;
}

Sous Linux, la commande :

gcc hello.c -static -o hello-static

génère un fichier exécutable hello-static d'environ 800 ko !

ls -l hello-static
-rwxrwxr-x 1 fg fg 785304 march  1 16:20 hello-static

De plus, la commande file (cf. chap. S1‑III S) permet de vérifier qu'il s'agit bien d'un fichier lié statiquement :

file hello-static
hello-static: ELF 64-bit LSB executable, x86-64, version 1 (GNU/Linux), statically linked, BuildID[sha1]=8e9a3b339abcb3ce39aea1734091f86da6fcc1cf, for GNU/Linux 3.2.0, not stripped

Ce fichier peut donc être exécuté sur toute machine à architecture x86‑64, même si la bibliothèque standard du langage C n'y est pas installée. On peut le vérifier à l'aide de la commande readelf -d qui liste ses éventuelles dépendances (ici, il n'y en a pas) :

readelf -d hello-static

There is no dynamic section in this file.

En procédant au désassemblage de ce fichier exécutable à l'aide de la commande objdump (cf. supra ) comme ci‑dessous :

objdump -D hello-static > hello-static.dump

et en ouvrant le fichier de redirection hello-static.dump (qui fait plus de 200 000 lignes) dans un éditeur de code, on peut relever des aspects essentiels. En particulier, en recherchant le symbole <main>, on trouve le code objet de la fonction principale du programme (placé dans la section .text) :

0000000000401745 <main>:
  401745: f3 0f 1e fa           endbr64 
  401749: 55                    push   %rbp
  40174a: 48 89 e5              mov    %rsp,%rbp
  40174d: 48 8d 05 b0 68 09 00  lea    0x968b0(%rip),%rax        # 498004 <_IO_stdin_used+0x4>
  401754: 48 89 c7              mov    %rax,%rdi
  401757: b8 00 00 00 00        mov    $0x0,%eax
  40175c: e8 2f 9e 00 00        call   40b590 <_IO_printf>
  401761: b8 00 00 00 00        mov    $0x0,%eax
  401766: 5d                    pop    %rbp
  401767: c3                    ret    
  401768: 0f 1f 84 00 00 00 00  nopl   0x0(%rax,%rax,1)
  40176f: 00

Dans ce code, on trouve un appel de la fonction printf (symbole _IO_printf) référencé à l'adresse 40b590. Et en descendant à cette adresse, on trouve le code objet (partiel) de la fonction _IO_printf :

000000000040b590 <_IO_printf>:
  40b590: f3 0f 1e fa           endbr64 
  40b594: 48 81 ec d8 00 00 00  sub    $0xd8,%rsp
  40b59b: 49 89 fa              mov    %rdi,%r10
  40b59e: 48 89 74 24 28        mov    %rsi,0x28(%rsp)
  40b5a3: 48 89 54 24 30        mov    %rdx,0x30(%rsp)
  40b5a8: 48 89 4c 24 38        mov    %rcx,0x38(%rsp)
  40b5ad: 4c 89 44 24 40        mov    %r8,0x40(%rsp)
  40b5b2: 4c 89 4c 24 48        mov    %r9,0x48(%rsp)
  40b5b7: 84 c0                 test   %al,%al
  40b5b9: 74 37                 je     40b5f2 <_IO_printf+0x62>
  40b5bb: 0f 29 44 24 50        movaps %xmm0,0x50(%rsp)
  40b5c0: 0f 29 4c 24 60        movaps %xmm1,0x60(%rsp)
  40b5c5: 0f 29 54 24 70        movaps %xmm2,0x70(%rsp)
  40b5ca: 0f 29 9c 24 80 00 00  movaps %xmm3,0x80(%rsp)
  40b5d1: 00 
  40b5d2: 0f 29 a4 24 90 00 00  movaps %xmm4,0x90(%rsp)
  40b5d9: 00 
  40b5da: 0f 29 ac 24 a0 00 00  movaps %xmm5,0xa0(%rsp)
  40b5e1: 00 
  40b5e2: 0f 29 b4 24 b0 00 00  movaps %xmm6,0xb0(%rsp)
  40b5e9: 00 
  40b5ea: 0f 29 bc 24 c0 00 00  movaps %xmm7,0xc0(%rsp)
  40b5f1: 00 
  40b5f2: 64 48 8b 04 25 28 00  mov    %fs:0x28,%rax
  40b5f9: 00 00 
  40b5fb: 48 89 44 24 18        mov    %rax,0x18(%rsp)
  40b600: 31 c0                 xor    %eax,%eax
  40b602: 48 8b 3d e7 a0 0b 00  mov    0xba0e7(%rip),%rdi        # 4c56f0 <stdout>
  40b609: 48 89 e2              mov    %rsp,%rdx
  40b60c: 31 c9                 xor    %ecx,%ecx
  40b60e: 48 8d 84 24 e0 00 00  lea    0xe0(%rsp),%rax
  40b615: 00 
  40b616: 4c 89 d6              mov    %r10,%rsi
  40b619: c7 04 24 08 00 00 00  movl   $0x8,(%rsp)
  40b620: 48 89 44 24 08        mov    %rax,0x8(%rsp)
  40b625: 48 8d 44 24 20        lea    0x20(%rsp),%rax
  40b62a: c7 44 24 04 30 00 00  movl   $0x30,0x4(%rsp)
  40b631: 00 
  40b632: 48 89 44 24 10        mov    %rax,0x10(%rsp)
  40b637: e8 74 30 00 00        call   40e6b0 <__vfprintf_internal>
  40b63c: 48 8b 54 24 18        mov    0x18(%rsp),%rdx
  40b641: 64 48 2b 14 25 28 00  sub    %fs:0x28,%rdx
  40b648: 00 00 
  40b64a: 75 08                 jne    40b654 <_IO_printf+0xc4>
  40b64c: 48 81 c4 d8 00 00 00  add    $0xd8,%rsp
  40b653: c3                    ret    
  40b654: e8 27 67 04 00        call   451d80 <__stack_chk_fail>
  40b659: 0f 1f 80 00 00 00 00  nopl   0x0(%rax)

qui contient lui‑même d'autres instructions d'appel de sous‑programmes qui implémentent divers aspects de la fonction printf.

Remarques.

L'incorporation en intégralité dans le fichier exécutable du code objet de la fonction printf, même s'il est volumineux (car c'est une fonction complexe), ne suffit pas à expliquer pourquoi le fichier est si gros en comparaison du fichier exécutable usuellement produit par édition de liens dynamiques (environ 16 ko – cf. infra ).

Pour le comprendre, procédons à l'édition de liens statiques de l'exemple de programme minimal return5 (cf. supra ), qui ne fait appel à aucune fonction de bibliothèque :

  gcc return5.c -static -o return5-static
  ls -l return5-static
  -rwxrwxr-x 1 fg fg 785240 March  1 16:50 return5-static

On voit qu'elle produit quand même un fichier exécutable presque aussi gros.

En effet, la chaîne de compilation fait appel à un grand nombre de fonctions de bas niveau qui sont systématiquement utilisées dans le code exécutable du moindre programme.

Le fichier exécutable peut être un peu allégé en le débarrassant de ses symboles de débogage :

soit lors de la compilation avec la commande gcc en activant l'option -s (à ne pas confondre avec l'option -S majuscule présentée supra pour arrêter le processus avant l'assemblage) ;
soit après la compilation, en lui appliquant la commande strip (cf. infra ) avec l'option -s.

Néanmoins, le gain sur la taille du fichier est seulement d'environ 10 % dans notre exemple.

  strip -s return5-static
  ls -l return5-static
  -rwxrwxr-x 1 fg fg 706584 March  1 17:01 return5-static

Autrement dit, on doit retenir que l'édition de liens statiques produit inévitablement des très gros fichiers exécutables, même pour des petits programmes source.

Édition de liens dynamiques

En édition de liens dynamiques, le code objet des fonctions de bibliothèque n'est pas incorporé dans le fichier exécutable. Pour chaque appel d'une telle fonction, l'éditeur de liens de la chaîne de compilation ne fait qu'inscrire une référence externe temporaire qui sera résolue lors de l'exécution.

Il en résulte un fichier exécutable beaucoup plus petit qu'avec l'édition de liens statiques. C'est la raison principale pour laquelle c'est la technique adoptée par défaut avec la commande gcc.

Mais en contre‑partie, ce fichier n'est pas autonome pour son exécution, il dépend d'autres composants externes – et c'est pourquoi on parle de dépendances – qui doivent être chargés en mémoire partagée lors de l'exécution du programme.

Plus en détails, c'est seulement durant l'exécution du programme qu'un autre composant logiciel, l'éditeur de liens dynamique W (dynamic linker) intervient :

il résout les références externes en déterminant l'adresse en mémoire vive des fonctions de bibliothèque appelées ;
et si ce n'est pas encore fait, il charge en mémoire partagée W (shared memory) le code objet des fonctions appelées (qui doivent avoir été compilées préalablement).

Cela suppose aussi que le code objet exploité ait été compilé avec l'option PIC (position independant code), ce qui est le cas des fichiers de bibliothèque partagée (cf. chap. C4‑VI ).

Outre la légèreté, l'édition de liens dynamiques apporte d'autres avantages significatifs :

Elle optimise la mémoire vive utilisée sur la machine cible, puisque le code objet des fonctions de bibliothèque utilisées par le programme est partagé en mémoire. Ce code objet peut donc être aussi utilisé par d'autres programmes s'exécutant en parallèle, sans duplication nécessaire.
Elle désynchronise les mises à jour du programme et des bibliothèques qu'il l'utilise. Ainsi, le programme peut bénéficier des mises à jour des bibliothèques sans recompilation nécessaire pour lui‑même.

Reprenons le même programme trivial « Hello, World! » que supra et effectuons une compilation usuelle avec gcc, sans option particulière, comme ci‑dessous :

gcc hello.c -o hello

Cette commande génère un fichier exécutable hello de seulement 16 ko environ (à comparer avec les 800 ko obtenus supra en édition de liens statiques ).

ls -l hello
-rwxrwxr-x 15960 fg fg 1 march  1 17:20 hello

De plus, la commande file (cf. chap. S1‑III S) permet de vérifier qu'il s'agit bien d'un fichier lié dynamiquement. Elle précise également que l'éditeur de liens dynamique à utiliser (ou interpréteur) est ld-linux-x86-64.so.2.

file hello
hello: ELF 64-bit LSB pie executable, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, BuildID[sha1]=7a679a407ced3b9a8a9ffa9eb6679be44d44094a, for GNU/Linux 3.2.0, not stripped

Pour d'exhiber ses dépendances, on peut procéder à l'analyse de ce fichier ELF à l'aide de la commande readelf -d (cf. supra ), filtrée sur le mot NEEDED, comme ci‑dessous :

readelf -d hello | grep NEEDED
0x0000000000000001 (NEEDED)          Shared library: [libc.so.6]

Le fichier requis pour l'exécution du programme est la bibliothèque partagée libc.so.6 (l'extension « so » dans son nom signifiant shared object) : c'est la bibliothque standard du langage C, en version 6.

En procédant au désassemblage du fichier exécutable à l'aide de la commande ci‑dessous :

objdump -D hello > hello.dump

et en ouvrant le fichier de redirection hello.dump dans un éditeur de code, on constate que la fonction main a presque le même code objet que dans la version liée statiquement (cf. supra ) :

0000000000001149 <main>:
    1149: f3 0f 1e fa           endbr64 
    114d: 55                    push   %rbp
    114e: 48 89 e5              mov    %rsp,%rbp
    1151: 48 8d 05 ac 0e 00 00  lea    0xeac(%rip),%rax        # 2004 <_IO_stdin_used+0x4>
    1158: 48 89 c7              mov    %rax,%rdi
    115b: e8 f0 fe ff ff        call   1050  <puts@plt>
    1160: b8 00 00 00 00        mov    $0x0,%eax
    1165: 5d                    pop    %rbp
    1166: c3                    ret

La différence majeure se trouve dans l'appel de la fonction puts (put string) qui :

vient en substitution de la fonction printf (l'éditeur de liens a optimisé le code objet car, en l'absence de spécifications de conversion dans la chaîne de format, l'emploi de puts revient au même) ;
se présente via le symbole <puts@plt> qui indique que la référence est à chercher dans la procedure linkage table (PLT).

Et en remontant à l'adresse 1050, on trouve non pas le code de la fonction puts mais une instruction de saut (bnd jmp pour bound jump) sur l'adresse relative de son code dans la bibliothèque standard du langage C.

0000000000001050 <puts@plt>:
    1050: f3 0f 1e fa           endbr64 
    1054: f2 ff 25 75 2f 00 00  bnd jmp *0x2f75(%rip)        # 3fd0 <puts@GLIBC_2.2.5>
    105b: 0f 1f 44 00 00        nopl   0x0(%rax,%rax,1)

Les différents types de fichiers ELF sous Linux

À la lumière des développements précédents, on peut maintenant faire une synthèse des observations sur les fichiers au format ELF sous Linux.

Un fichier ELF (executable and linkable format) peut être de l'un des trois types suivants, inscrit dans son en‑tête :

Il peut être relocalisable (en anglais, relocatable). C'est typiquement le cas s'il est directement issu de la phase assemblage dans la chaîne de compilation (cf. supra ). Il est utilisable par l'éditeur de liens pour générer un programme exécutable.

Produit via la commande gcc, il porte par défaut l'extension .o (comme object).

Il peut être exécutable, lorsqu'il est produit par édition de liens statique ou dynamique, sans option particulière (cf. supra ). Usuellement nommé sans extension, on peut considérer qu'il constitue en quelque sorte le « fichier principal » d'un programme exécutable – voire son fichier unique dans le cas d'une édition de liens statiques.

Enfin, il peut être ce qu'on appelle une bibliothèque partagée (shared object – d'où l'acronyme so dans le nom de son fichier), lorsqu'il est produit par édition de liens dynamiques avec l'option -shared. Il peut être chargé en mémoire partagée pour être exploité par des programmes, et on peut alors considérer qu'il en constitue alors un « fichier auxiliaire ».

De plus, un fichier objet ELF peut contenir ou non des symboles de débogage, ce qui est indiqué dans son en‑tête et explicité par les mentions not stripped ou stripped de la commande file.

En phase de développement (mise au point du programme), il est évidemment pertinent de conserver ces symboles qui sont produits par défaut par la chaîne de compilation.
En phase de production (distribution logicielle), il est d'usage de supprimer ces symboles, ce qui allège l'exécutable et complique une éventuelle rétro‑ingénierie de la concurrence. Sous Linux, cela se fait avec la commande strip W.

Enfin, un fichier exécutable ELF peut être ou non à positionnnement indépendant – en anglais, position independent executable, abrégé PIE –ce qui est indiqué dans son en‑tête et explicité par la mention présente ou non du sigle pie (position independant executable) de la commande file. Comme une bibliothèque partiagée, il peut alors être chargé à n'importe quelle adresse en mémoire, ce qui facilite le travail du chargeur de programme et réduit les risques d'attaque par débordement de buffer.

Par défaut, les exécutables générés en édition de liens dynamiques sont PIE, car les éventuels inconvénients de cette caractéristique (adressage indirect par GOT/PLT, donc moindre vitesse d'exécution et taille de fichier plus élevée) sont peu perceptibles avec les processeurs modernes.
En revanche, et encore par défaut, les exécutables générés exclusivement en édition de liens dynamiques ne sont pas PIE. C'est typiquement le cas pour des programmes embarqués sur microcontrôleur ou des éléments de noyau de système d'exploitation.

Les options de l'éditeur de liens

Même si l'édition de liens est moins complexe que la compilation, elle n'en est pas moins une étape décisive de la génération du code exécutable d'un programme, avec à la clef des choix à faire. La commande gcc dispose pour cela de nombreuses options, qui sont décisives en termes de résultat final – notamment le type de fichier produit. Seules les plus importantes de ces options sont récapitulées ci‑après.

On a d'abord les options pour le choix du type d'édition de liens :

L'option -static permet de choisir une édition de liens statiques pour un programme exécutable – sinon, par défaut, gcc met en œuvre une éditions de liens dynamiques.
L'option -shared permet de choisir une édition de liens dynamiques pour une bibliothèque (partagée) – sachant que pour l'édition de liens d'une bibliothèque statique, il faut utiliser l'archiveur ar.

On a également des options pour contrôler certains aspects secondaires du code objet ou exécutable produit par l'édition de liens :

L'option -s (pour strip) permet de débarrasser le code objet de ses symboles de déboggage au moment de l'édition de liens. Cela évite de recourir ensuite à la commande strip (cf. supra ).
Les options -pie et -no-pie permettent de forcer l'éditeur de liens à générer un exécutable qui soit respectivement PIE ou non (cf. supra ).

On a ensuite des options pour guider l'éditeur de liens – ainsi que le chargeur de programme – dans la localisation des fichiers de bibliothèques exploités par un exécutable.

L'option -L immédiatement suivie (sans espace séparateur) d'un chemin indique à l'éditeur de liens un répertoire où sont rangés des fichiers de bibliothèque – qu'elles soient statiques ou dynamiques.
L'option -l immédiatement suivie (sans espace séparateur) du nom de base du fichier de bibliothèque sans son préfixe lib et sans son extension indique à l'éditeur de liens un tel fichier – qu'il s'agisse d'une bibliothèque statiques ou dynamiques.
L'option -Wl,-rpath= immédiatement suivie (sans espace séparateur) d'un chemin permet, dans le cas d'utilisation d'une bibliothèque partagée, d'incorporer dans le fichier exécutable l'emplacement de cette bibliothèque, afin qu'il puisse être renseigné au moment de l'exécution (« rpath » est l'abréviation de runtime library search path).

On a enfin quelques options pour faciliter le débogage de l'édition de liens :

L'option -Wl,--verbose permet d'afficher les détails du déroulement de l'édition de liens dans le terminal où elle est effectuée.
L'option -Wl,--trace permet d'afficher les noms des fichiers manipulés durant l'édition de liens, dans le terminal où elle est effectuée.

L'option -s (strip) est à ne pas confondre avec -S qui arrête la chaîne de compilation juste après la production d'un fichier de code d'assemblage (cf. supra ).
L'option -pie est à ne pas confondre avec -fpie, laquelle s'applique à la phase de compilation (pas à l'édition de liens) et ne doit elle‑même pas être confondue avec l'option -fpic qui est requise pour la génération des bibliothèques partagées (cf. chap. C4‑VI ).
Pour approfondir les connaissances sur l'édition de liens, on pourra se reporter à la série de vidéos proposées par la chaîne Embeddedarmdev Y.

On trouvera également aux liens suivants des explications intéressantes sur l'usage la LTO (link‑time optimization), activé par défaut dans GCC depuis la version 4.5.

Emploi de GCC par Arduino

Rappelons qu'un programme téléversé sur une carte Arduino est un exécutable produit par une chaîne de compilation GCC en langage C++ (chap. C2‑I ). Toutefois, c'est un cas d'usage plus complexe que les exemples présentés auparavant car, fondamentalement, tout programme Arduino est multi‑fichiers. En effet :

le fichier source .ino codé par l'utilisateur – celui qui contient la définition des fonctions setup et loop – n'est pas le fichier source principal du programme mais un fichier d'implémentation auxiliaire ;
quand au fichier source principal main.cpp, il est fourni de façon transparente pour l'utilisateur par le logiciel Arduino IDE.

De plus, pour chaque nouveau programme, le logiciel Arduino IDE procède à la création d'une bibliothèque statique des fonctions du noyau du framework, pour ne plus avoir à les recompiler ensuite après modifications du programme utilisateur.

On se reportera donc au détails des chapitre C4‑V et C4‑VI consacrés respectivement à la programmation multi‑fichiers et à la programmation modulaire pour

Rappelons également que lorsque l'on clique sur le bouton « téléverser » l'environnement de développement Arduino IDE utilise une chaîne de compilation GCC spéficiquement développée pour chaque famille de carte à microcontrôleur (chap. C2‑I ).

Mais par ailleurs, afin de rendre son utilisation accessible à des non‑spécialistes, avant toute compilation, l'IDE Arduino effectue des traitements préliminaires spécifiques sur le code source, un peu à la manière d'un préprocesseur (mais qui n'ont rien à voir avec les traitements mis en œuvre par CPP).

Ces traitements sont opérés en arrière‑plan, ils sont transparents pour l'utilisateur de l'IDE. Ils sont spécifiquement adaptés à chaque famille de carte Arduino.

L'IDE commence par créer un répertoire temporaire de compilation dans l'espace réservé à cet effet par le système d'exploitation du poste de travail (sous Linux, typiquement /tmp/arduino_build_xxxxxx/ où xxxxxx est un nouveau numéro généré automatiquement). Ce n'est donc pas le répertoire de projet.

Dans un sous‑répertoire nommé sketch du répertoire temporaire de compilation :

Le fichier source principal de compilation est créé par copie directe du fichier « standard » main.cpp A (réf. pour les cartes à cœur AVR).

Pour mémoire, c'est dans ce fichier qu'est codée (par les développeurs d'Arduino) la fonction main qui appelle les fonctions setup et loop (cf. chap. C2‑I ).

Un fichier d'implémentation auxiliaire d'extension .cpp est construit par concaténation – c'est‑à‑dire mise bout‑à‑bout – du contenu tous les fichiers sources d'extension .ino placés dans le répertoire de projet :

en commençant par le fichier principal du projet, celui identifié par homonymie avec le répertoire de projet, où l'utilisateur a codé les fonction setup et loop ;
puis en procédant par ordre alphabétique pour les autres fichiers (mais pas les éventuels fichiers ayant une autre extension comme .cpp ou .h).

Dans ce fichier auxiliaire, divers traitements sont effectués :

ajout en première ligne la directive #include <Arduino.h> ;
génération des prototypes de toutes les fonctions définies dans ces fichiers.

Enfin, tous les autres fichiers sources (.h, .cpp etc.) présents dans le répertoire de projet sont incorporés mais sans y effectuer des modifications significatives (seules des directives de marquage de lignes #line sont ajoutées).

C'est seulement après tout cela, lorsque le répertoire de compilation est prêt, qu'une chaîne de compilation GCC est invoquée en C++ avec une commande complexe (cf. infra ).

Analyse du log d'une compilation Arduino

Exécution d'un programme compilé

Notion d'environnement d'exécution

Bibliothèque d'exécution

Bibliothèque CRT0

Le chargeur de programme

Le point d'entrée d'un programme

En rappel du chap. C2‑I , et sauf codage spécifique d'une option de compilation spécifique, la fonction main est par défaut le point d'entrée du programme.

Plus précisément, sachant que toutes les déclarations des données globales ont forcément été traitées par allocation mémoire dans les segments de la zone statique, la première instruction machine exécutée au lancement du programme correspond à la première instruction codée dans la fonction main.

Code source du programme altEntryPoint.c

#include <stdio.h>
#include <stdlib.h>


void entryPoint(void) {
  printf("Aternative entry point!\n");
  exit(1);
}

int main(void) {
  printf("Main\n");
  return 0;
}

Fichier de code d'assemblage _start_def.s pour définir le symbole _start

.global _start

.text
_start:
  # Call the entry point function
  call entryPoint

  # Exit the program
  mov $0, %ebx   # Exit code 0
  mov $1, %eax   # Exit syscall number
  int $0x80      # Perform syscall

gcc -nostartfiles altEntryPoint.c _start_def.s -o altEntryPoint
./altEntryPoint
Entry
echo $?
1

Débogage d'un programme

La compilation

Notions générales de compilateur et d'implémentation

En informatique, un compilateur W (en anglais, compiler) est un logiciel qui, à partir d'un code source, exprimé dans un langage de haut niveau, dit langage source, produit un code objet dans un langage de bas niveau, dit langage cible, spécifique pour une machine donnée dite machine cible .

En langages C et C++ :

le code dit « source » n'est pas exactement celui saisi par le ou les programmeurs, il a déjà subi les traitements opérés par le préprocesseur ; en particulier, les fichiers sources primaires (typiquement, les fichiers d'en‑tête de module de bibliothèque – d'extension .h en C) ont été incorporés dans les fichiers sources principaux (typiquement .c ou .cpp), via des directives #include ;

on parle d'unité de compilation (en anglais, translation unit W) pour désigner le fichier résultat de chaque fichier source primaire traité par un préprocesseur CPP ;

le code dit « objet » est composé en langage binaire, dit « machine » (et non pas en langage d'assemblage) ; toutefois, il ne constitue pas encore un code exécutable : il reste à assembler tous les objets compilés, étape qu'on appelle l'édition de liens, pour former le fichier exécutable.

On emploie souvent – y compris dans ce chapitre – le terme de « compilateur » pour désigner la chaîne de compilation dans son ensemble, c'est‑à‑dire en incluant l'éditeur de liens. Cela vient du fait que le compilateur est considéré comme le composant principal de cet ensemble logiciel.

Notion d'implémentation

Cette notion a déjà été abordée au chapitre C1‑II .

On appelle implémentation d'un programme l'association d'une chaîne de compilation (avec une version précise de chacun de ses composants logiciels) et d'une machine‑cible pour laquelle est engendré le code exécutable de ce programme.

En matière de compilation, c'est essentiellement le microprocesseur ou le microcontrôleur – avec son jeu d'instructions – qui fait la spécificité d'une machine cible.

À la variété des compilateurs s'ajoute celle, potentiellement assez vaste, des machines cibles qui peuvent exécuter un programme donné, avec toutes les combinaisons imaginables. Il en faut avoir conscience pour comprendre qu'il est difficile d'énoncer des « vérités absolues » en matière de production de code exécutable.

Les différents types de compilation

Avant d'étudier les différentes étapes de la compilation, il faut avoir conscience que ce qui pourrait sembler un simple aspect technique de la programmation constitue en réalité, à lui tout seul, un vaste domaine dont l'histoire, bien que relativement récente en comparaison avec d'autres domaines techniques, est extrêmement riche. Le foisonnement des langages de programmation et des recherches et développements menés pour dominer la complexité grandissante des logiciels à produire en est le reflet. En termes de puissance et de complexité, un abîme sépare les premiers ordinateurs de la fin des années 1950 et les machines que nous utilisons quotidiennement (téléphones portables, etc.)

Il n'est donc pas possible de détailler ici toutes les techniques de la compilation, ni évoquer des développements essentiels comme les compilateurs de compilateurs. On se contentera de simplement de relever quelques aspects transversaux.

Compilation native versus croisée

Une compilation d'un programme ne peut être effectuée que sur une machine capable d'exécuter un compilateur du langage employé. Typiquement, on emploie un ordinateur.

Lorsque cet ordinateur est identique à la machine cible, on parle de compilation native (en anglais, native compilation).

Il ne s'agit pas nécessairement d'une seule et même machine, mais de toutes les machines ayant une architecture matérielle similaire et des systèmes d'exploitation suffisamment compatibles entre eux pour que le programme.

A contrario, si l'ordinateur sur laquelle s'effectue la compilation présente des différences significatives avec la machine cible, on parle de compilation croisée W (en anglais, cross compilation) .

Les situations de compilation croisée ne sont pas aussi rares que pourrait le penser un débutant en programmation :

c'est toujours le cas lorsqu'on programme une carte à microcontrôleur ; typiquement, on utilise un ordinateur comme terminale de programmation, équipé du logiciel Arduino IDE, qui lui-même intègre les compilateurs AVR‑GCC et AVR‑G++ (cf. supra ) ;

d'ailleurs, si l'on souhaite programmer une carte carte exogène à la marque Arduino (par exemple, une carte Espressif, Teensy ou Wemos…) avec Arduino IDE, il faut préalablement télécharger et intégrer le compilateur spécifique pour le microcontrôleur embarqué sur une telle carte ;

c'est aussi le cas lorsqu'on développe une application pour smartphone ; en effet, même s'il possède une architecture matérielle puissance et un système d'exploitation multi‑tâches, un smartphone ne dispose pas d'une interface utilisateur appropriée pour coder (l'écran est trop petit, d'autant plus qu'il est partagé avec le clavier…).

Pour la programmation des cartes à microcontrôleurs, une chaîne de compilation GCC est commode car elle prend en charge plusieurs langages et une grande variété de compilateurs, pour toutes sortes de machines et systèmes d'exploitation.

Compilation simple passe versus multi‑passes

Historiquement, la compilation d'un programme était une tâche lourde pour les ordinateurs, dont les ressources en calculs et en mémoire étaient très limitées. On a donc créé des langages comme Pascal W, qui est contraignant dans sa forme (tous les types et toutes les variables globales doivent être déclarées au début du programme) pour simplifier la compilation, et en particulier d'effectuer de nombreuses tâches d'analyse en intégralité avec une une seule passe, c'est‑à‑dire une seule lecture du fichier source.

Mais avec les progrès vertigineux accomplis en micro-électronique (la fameuse loi de Moore W), on a commencé à s'affranchir de ces contraintes. Ainsi un langage comme C permet de déclarer une variable n'importe où dans le code source et de répartir ce dernier sur plusieurs fichiers. En contrepartie, la compilation nécessite plusieurs passes pour pouvoir déterminer toutes les adresses des données et fonctions, restées inconnues lors de la première passe.

Étapes de la compilation

La compilation est un processus très complexe qui nécessite une succession de traitements, chacun faisant appel à un algorithme spécifique.

Dans les compilateurs récents des langages généralistes comme C et C++, on distingue trois grandes parties, respectivement dites frontale (front‑end), centrale (middle‑end) et arrière (back‑end).

Partie frontale (front‑end)

La partie frontale (dite encore souche) de la compilation est, en principe, indépendante de la machine cible. Elle consiste en une analyse lexicale, syntaxique et sémantique du langage pour aboutir à la production d'un code intermédiaire.

L'analyse lexicale W, en anglais lexing, supprime les commentaires et les séparateurs blancs surnuméraires (si cela n'a pas déjà été fait par le préprocesseur), puis décompose le code en une séquence de jetons (en anglais, token, d'où l'expression « tokénisation » du code), chaque jeton étant identifié par une catégorie précise (identificateur, mot-clé, séparateur, etc.). Tous les identificateurs sont listés dans un tableau appelé table des symboles W.

L'analyse lexicale permet déjà de détecter certaines erreurs de codage : identificateurs mal formés, symbole non autorisé, etc.

L'analyse syntaxique W, en anglais parsing, transforme la séquence de jetons issue de l'analyse lexicale en un arbre syntaxique. Ce dernier représente les aspects structurels du code par des nœuds hiérachisés et des liaisons entre nœuds : par exemple, pour une bifurcation if, on a un nœud racine en liaison directe avec trois nœuds : 1) l'expression de la condition, 2) le bloc d'instructions ddans l'affirmative (si la condition est évaluée vraie, 3) le bloc d'instructions dans la négative (si la construction est évaluée fausse) W.

L'analyse syntaxique permet de détecter des erreurs comme l'absence d'une expression attendue (par exemple, à cause d'un oubli des parenthèses), la malformation d'un bloc, etc.

L'analyse sémantique W, en anglais , complète l'arbre issu de l'analyse syntaxique et la table des symboles générés lors de l'analyse lexicale. En particulier :

elle fait correspondre à chaque identificateur sa déclaration ou une définition via une étiquette (en anglais, label), c'est‑à‑dire un symbole élémentaire qui deviendra par la suite une adresse ;
avec un langage à typage statique comme C ou C++, elle vérifie la bonne concordance des types des opérations d'affectation et procède à l'initialisation des variables ;

L'analyse syntaxique permet notamment de détecter les absences et les conflits de déclarations, les erreurs de typage.

En l'absence d'erreurs détectées précédemment, la génération de code intermédiaire composé dans un langage intermédiaire W – de bas niveau mais indépendant de la machine cible – produit, pour chaque unité de compilation, un fichier destiné à la partie centrale de la compilation.

Composition du code intermédiaire

La composition du code intermédiaire généré par la compilation frontale diffère déjà considérablement du code source. En particulier :

les déclarations des types ne sont plus présentes, mais elles ont été prises en compte dans la déclarations des variables pour calculer l'espace mémoire nécessaire à chacune ;
les déclarations des variables globales ont été traitées par des allocations mémoire ; celles des variables locales par des instructions d'allocation mémoire ; de la sorte, l'accession à la valeur d'une variable pour des opérations de lecture et d'écriture s'effectue soit par son adresse, soit encore par une étiquette s'il s'agit d'une variable externe à l'unité de compilation ;
de même, les fonctions sont des parties de code identifiées par l'adresse de leur première instruction ou une étiquette s'il s'agit d'une fonction externe à l'unité de compilation (par exemple, définie dans une bibliothèque) ;
les instructions structurées (boucles, etc.) sont décomposées en instructions élémentaires de tests et de sauts à des adresses ou des étiquettes.

Partie centrale (middle‑end)

La partie centrale de la compilation est d'abord consacrée à d'autres tâches d'analyse et de vérification :

analyse des contraintes d'antériorité entre les instructions pour pouvoir éventuellement les exécuter de façon parallèle (sur un processeur multi-cœurs) W ;
analyse des alias associés aux allocations mémoire (liste des pointeurs ciblant une même adresse) W, etc.

Mais en plus, la partie centrale procède à l'optimisation du code intermédiaire sans pour autant faire intervenir les spécificités de la machine cible. Notamment :

elle calcule les expressions constantes et propage leur valeur dans le code ; ainsi, toute occurrence de constante déclarée est remplacée par sa valeur, comme le fait le préprocesseur avec les pseudo-constantes ;
elle identifie et élimine les branches mortes du code, c'est‑à‑dire les instructions qui ne seront jamais exécutées, par exemple parce qu'elles sont conditionnées par une expression toujours fausse ;
elle délocalise hors des boucles des instructions invariantes qui n'ont pas besoin d'être répétées (par exemple, la déclaration d'une variable locale, mais pas son affectation) ;

La partie centrale fournit à la partie arrière, pour chaque unité de compilation, un fichier de code intermédiaire optimisé qui, en principe, ne dépend ni du langage source, ni de la machine cible.

Partie arrière (back‑end)

Enfin, la partie arrière de la compilation est celle qui traduit le code intermédiaire optimisé en un code objet composé avec le jeu d'instruction de la machine cible. Elle procède également à un certain nombre d'optimisations spécifiques à son architecture. En particulier :

elle attribut respectivement aux variables statiques les plus sollicitées dans le programme (et en langages C/C++, celles déclarées de la classe register ) des registres du microprocesseur, et ce dans la limite des registres disponibles ; les autres variables statiques n'obtiennent qu'un espace mémoire dans le segment .data ;
elle réorganise certaines séquences d'instruction pour améliorer les performances de vitesse : par exemple, plutôt que de multiplier ou diviser une valeur entière par 2ⁿ, elle décale son mot mémoire de n rangs, respectivement vers la gauche ou la droite (ce qui est plus rapide que le traitement d'une opérateur binaire, puisque le processeur ne travaille que sur un seul registre) ; en anglais, on parle de peephole optimization W.

L'assemblage – le langage machine

L'édition de liens

Notion d'éditeur de lien

Schématiquement, un éditeur de liens (en anglais, linker) est un logiciel qui assemble les différents fichiers objets issus :

de la compilation des fichiers sources d'un programme (les unités de compilation),
de bibliothèques déjà compilées,

pour former :

soit un fichier exécutable sur la machine cible,
soit un nouveau fichier objet de bibliothèque,

C'est une tâche beaucoup moins complexe que la compilation. C'est pourquoi un éditeur de lien est rarement un logiciel isolé : il est le plus souvent associé à un compilateur et, s'il est indépendant du ou des langages sources dont sont issus les fichiers objets, il procède en fonction de la machine cible (même s'il y a moins de spécificités que pour la compilation). Bien évidemment, la collection GCC inclut un éditeur de lien, désigné ld. Très polyvalent, il admet de nombreuses options et s'adapte à la plupart des plate-formes.

Déroulement de l'édition de liens

Chaque fichier objet est notamment constitué :

d'une section data qui stocke des valeurs à des adresses mémoires ordonnées ;
d'une section text qui stocke des instructions à des adresses mémoires ordonnées ;
d'une table des symboles qui met en relation les étiquettes et des adresses mémoires ;
des informations de relocalisation des données dans les instructions, avec le recensement des dépendances lorsqu'un symbole qui y figure est externe ;
d'un en‑tête dont la premier champ est le nom du fichier et qui récapitule la longueur du segment data et du segment text.

Dans le futur fichier exécutable, l'édition de liens consiste à :

concaténer les sections .data de tous les fichiers objet et inscrire la somme des longueurs de ces segments dans l'en‑tête du fichier exécutable ;
concaténer les sections .text de tous les fichiers objet et inscrire la somme des longueurs de ces segments dans l'en‑tête du fichier exécutable ;

et ce faisant, d'effectuer un nouvel adressage absolu des données et des instructions tout en complétant les adresses manquantes dans les instructions (sauts, etc.) pour satisfaire aux dépendances dans les informations de relocalisation.