Depuis le 22 mai, plus de 800 000 étudiants se connectent sur la plateforme ParcoursSup qui décidera de leur avenir dans l’enseignement supérieur. Le premier jour d’appel, seuls 54 % des étudiants se sont vus proposer une formation. Et lorsque la procédure a été suspendue le 18 juin pour les épreuves du baccalauréat ce taux plafonnait à 78 %. La phase complémentaire qui s’est ouverte le 26 juin doit permettre de trouver une solution pour les candidats toujours en attente d’affectation. Pourtant avec APB, le système précédent, 81 % des élèves s’étaient vu proposer une formation dès le premier jour. Dans cette tribune, Paul Ghorra et Clément Schaff, data scientist chez BCG GAMMA, se sont penchés sur les algorithmes qui régissent ces affectations.

ParcoursSup a été pensé avec deux principes, en rupture avec Admission Post Bac. La première différence avec l'ancienne version est que toutes les filières sont désormais sélectives : les formations classent les candidats en fonction des attendus pédagogiques définis pour chaque filière. Au contraire, dans Admission Post Bac l’affectation dans les filières non-sélectives reposait sur un système de priorité en fonction, par exemple, du lieu de résidence de l'étudiant allié à un tirage au sort.

Capture d'écran du site d'Admission Post Bac qui a été remplacé par ParcoursSup pour affecter les étudiants aux formations post-bac.

La seconde différence se trouve dans la manière dont les étudiants établissent leurs voeux. Dans la nouvelle plateforme, ParcoursSup, les étudiants ne doivent plus classer leurs choix a priori, mais en listent 10 sans ordre de priorité. Ce n’est que lorsqu'ils sont appelés par plus d’une filière qu’ils doivent choisir, en fonction de leurs préférences, celle qu'ils préfèrent.

Les universités choisissent leurs étudiants

Une fois que les étudiants ont listé leurs dix voeux et que les universités ont classé les élèves, l’affectation suit l’algorithme de Gale-Shapley plus connu sous le joli nom de « mariages stables ». Un algorithme qui était déjà utilisé pour les filières sélectives dans Admission Post Bac.

Celui-ci permet de garantir la stabilité de l’affectation. Il fait en sorte qu’il n’existe pas de couples étudiant/formation qui préféreraient échanger leurs places. Si l’on revient à l’analogie avec les mariages, la stabilité est équivalente à l’absence de divorce : même si l’un des conjoints préfère le conjoint d’un autre, ce dernier préfère à coup sûr son propre conjoint.

Une autre des spécificités : la priorité a été donnée aux universités et non aux étudiants. Comme pour les étudiants en médecine, à l'issue du concours de l'internat, c'est l'université qui choisit ses étudiants. Auparavant, dans les universités et les filières non-sélectives c'était aux étudiants de choisir, les formations n'avaient pas leur mot à dire. Il s’agit donc d’un changement radical décidé par le gouvernement et voté par les députés, dont l’analyse dépasse largement le cadre de l’algorithmique ou de la data science.

Un algorithme plus rapide mais moins efficace

La seconde différence avec APB est celle qui fait couler le plus d’encre : auparavant les étudiants classaient a priori leurs voeux, désormais ils n’ont à se poser la question que si un conflit se présente (lorsque plusieurs filières acceptent leurs candidatures). Il est bien plus facile de répondre à la question : « Préférez-vous les pommes ou les poires ? » plutôt qu’à : « Pouvez-vous classer tous les fruits existant sur terre par ordre de préférence ? ».

Un mois plus tard il restait des places dans les universités et beaucoup d'étudiants n'étaient affectées à aucune formation

Ce changement a des conséquences importantes sur la vitesse de convergence de l’algorithme. Avec Admission Post Bac, les premières itérations étaient simulées par l'algorithme : le classement des voeux d'un étudiant permettait de savoir, a priori, quelles seraient les filières qu'il aurait plus de chances d'accepter et celles qu'il pourrait refuser. ParcoursSup est donc censé être plus rapide et plus efficace pour attribuer aux étudiants des filières. Cependant, un mois plus tard, il restait des places dans les universités et beaucoup d'étudiants n'étaient affectés à aucune formation.

Des universités mal préparées, faute de temps

Comment l'expliquer ? D’une part le temps de convergence de l'algorithme de ParcoursSup est bien plus long qu’Admission Post Bac car les étudiants les moins bien classés doivent attendre que ceux qui les devancent refuse explicitement les propositions.

D’autre part, les étudiants étaient limités à 10 choix potentiels sur ParcoursSup (contre 24 pour APB), et les universités, en appliquant l'algorithme des mariages, les classaient. Certaines universités ont eu moins de candidats qu’elles n’ont de places, et certains étudiants n’ont eu aucune proposition. Cette limite est une conséquence pragmatique de l’absence de critère unique et objectif pour classer les candidats. Chaque filière a dû interpréter les règlements publiés quelques semaines seulement avant le début de la procédure pour définir les modalités de classement.

Capture d'écran du site parcoursup.fr

Finalement, la procédure paraît certes plus transparente, mais au prix d’une incertitude plus grande, dans une période où les lycéens préparent le bac. Or, en informatique, le résultat d’un algorithme est important, mais sa vitesse d'exécution l’est tout autant. On ne peut qu’espérer que la prochaine version demandera un classement a priori : il ne s’agit pas d’un critère modifiant le résultat, seulement la vitesse à laquelle on l’atteint. Une fraction de seconde contre quelques semaines.

SUR LE MÊME SUJET :

> Plateforme APB : l'algorithme en débat

> Les algorithmes au service de la santé publique

> « La France a tout pour être une nation d’avant-garde sur la question éducative ! »

> « On a décidé de hacker l'éducation nationale ! »

Illustration de une : Tim Gouw on Unsplash.