
Les offres d’emploi en ligne : mirage ou levier?
Introduction
Les offres d’emploi en ligne (OEL) sont partout : sur LinkedIn, Indeed et d’autres plateformes, sur les sites Web d’entreprises… De plus en plus de personnes intéressées par le marché du travail y ont recours afin d’obtenir des informations à jour. Cela soulève une question essentielle : dans quelle mesure ces offres reflètent-elles véritablement la demande de main-d’œuvre?
Les données issues des OEL servent souvent à combler les lacunes bien réelles des statistiques sur le marché du travail de Statistique Canada. Elles permettent d’obtenir des informations plus détaillées et plus récentes. Toutefois, comme toute source émergente, elles présentent certaines limites, particulièrement en ce qui a trait à leur représentativité. C’est pourquoi le CIMT a cherché à évaluer s’il était possible d’en améliorer la fiabilité. Pour ce faire, nous avons comparé les données des OEL à celles de l’Enquête sur les postes vacants et les salaires (EPVS) de Statistique Canada.
Le résultat? Un projet pilote prometteur qui offre des repères concrets pour interpréter cette source de données potentiellement riche de manière éclairée, rigoureuse et pertinente.
Les données des OEL : pourquoi sont-elles utiles?
Les entités gouvernementales, les établissements d’enseignement et les milieux de la recherche dépendent de plus en plus des données provenant des OEL pour éclairer leurs décisions. Les parties prenantes du CIMT soulignent par ailleurs souvent les avantages de ces données : elles s’obtiennent rapidement et en temps quasi réel et sont plus détaillées que celles de Statistique Canada.
Paradoxalement, les principales limites des données de Statistique Canada, telles que les délais de diffusion, découlent précisément de leurs plus grandes qualités. Ces données font l’objet d’une vérification statistique rigoureuse et sont soumises à des procédures complexes de pondération, qui assurent leur représentativité à l’échelle des régions, des secteurs d’activité et des groupes démographiques. Des règles strictes de confidentialité sont appliquées pour protéger les individus et éviter les interprétations erronées basées sur de petits échantillons.
Ces garanties sont essentielles. Sans elles, nous risquerions de tirer des conclusions erronées, surtout dans le cas de petites collectivités ou de groupes sous-représentés. Cette rigueur statistique a toutefois ses contreparties : une granularité réduite et des délais de diffusion plus longs.
À l’inverse, les données tirées des offres d’emploi en ligne s’obtiennent presque instantanément et offrent un niveau de détail plus élevé. Elles ne font cependant pas l’objet des mêmes précautions méthodologiques, ce qui pose la question de leur fiabilité et de leur valeur pour éclairer les décisions.
Quel est le potentiel de ces sources?
Les données tirées des offres d’emploi en ligne complètent celles de Statistique Canada. Elles donnent accès à des informations plus récentes et plus adaptables sur les tendances du marché du travail. Elles sont particulièrement précieuses pour les personnes vivant dans des collectivités de petite taille ou isolées, où les données peuvent être rares ou désuètes.
Les données des OEL sont généralement soumises à moins de restrictions en matière d’utilisation et de confidentialité que celles provenant de Statistique Canada. Elles sont de haute fréquence et dynamiques, et offrent un portrait quasi instantané de l’état de la demande de main-d’œuvre. Cet aspect constitue un atout particulièrement utile en période de transformation rapide du marché du travail.
Des données imparfaites : quels compromis?
Comme pour les données de Statistique Canada, celles provenant des OEL présentent certaines limites.
Le principal inconvénient de ces données est qu’elles ne sont pas pondérées, ce qui peut entraîner un manque de représentativité. Cela pose problème lorsqu’on les utilise comme indicateur indirect des postes vacants, une mesure parfois utilisée pour estimer la demande de main-d’œuvre. Les postes vacants sont en effet une construction économique encadrée par des critères stricts établis par Statistique Canada, garantissant ainsi leur interprétation rigoureuse et fiable. Les données des OEL, quant à elles, proviennent d’une méthode d’échantillonnage différente, ce qui peut entraîner une surreprésentation ou une sous-représentation de certaines professions. Des biais ou des erreurs d’interprétation peuvent en découler lorsque ces données sont mal comprises ou mal utilisées.
Cela dit, la surreprésentation et la sous-représentation sont fréquentes dans les sources de données et ne constituent pas nécessairement une faiblesse. En fait, ces techniques sont couramment utilisées dans les enquêtes de Statistique Canada afin d’obtenir des renseignements plus fiables sur les petites collectivités ou les groupes sous-représentés. Elles sont essentielles au processus de collecte de données. Un jeu de données est considéré comme représentatif s’il a été pondéré.
Dans le cas d’une surreprésentation ou d’une sous-représentation délibérée, la pondération permet d’ajuster les résultats afin que l’analyse reflète fidèlement la population réelle, et non la structure biaisée de l’échantillon initial.
Pourquoi la pondération est-elle essentielle?
Imaginons une province où une communauté donnée représente 5 % de la population. Pour garantir la confidentialité et recueillir un nombre suffisant de réponses en vue d’une analyse fiable et représentative, les chercheurs et chercheuses peuvent décider de suréchantillonner ce groupe afin qu’il forme 10 % de l’échantillon total, soit le double de sa proportion réelle. Une fois les données recueillies, une pondération permet de ramener ce pourcentage à 5 %, afin que les résultats reflètent fidèlement la réalité démographique. Sans cette pondération, la représentation de ce groupe – et, par ricochet, de l’ensemble de la population – serait faussée.
Dans les ensembles de données statistiques solides, plusieurs niveaux de pondération peuvent être appliqués pour tenir compte de facteurs comme l’âge, la région ou le revenu. La pondération ne constitue donc pas un simple ajustement technique : elle est indispensable à la fiabilité des analyses. Or, c’est précisément ce qui fait défaut à la plupart des données extraites des offres d’emploi en ligne, qui ne sont généralement pas pondérées.
Peut-on améliorer la fiabilité des données tirées des offres d’emploi en ligne?
Le CIMT a testé une combinaison de modèles statistiques avancés et d’algorithmes d’apprentissage machine, en appliquant différentes fonctions de pondération, afin d’évaluer s’il était possible d’améliorer la qualité des données issues des offres d’emploi en ligne – notamment en les comparant aux résultats de l’Enquête sur les postes vacants et les salaires (EPVS) de Statistique Canada.
Les résultats sont prometteurs. En combinant certaines méthodes, nous avons réussi à réduire les marges d’erreur de 15 %, ce qui démontre un fort potentiel d’amélioration de la fiabilité de ces données. Bien que notre modèle actuel n’intègre pas encore de pondérations propres à un secteur ou à une région, nous pensons qu’un tel raffinement permettrait d’obtenir des résultats encore plus précis, rendant les données des OEL plus fiables pour éclairer les décisions fondées sur les données.
Pourquoi l'amélioration de la qualité des offres d'emploi en ligne est dans notre intérêt collectif
Les données issues des offres d’emploi en ligne offrent déjà un complément utile dans l’ensemble des outils qui permettent de mieux comprendre le marché du travail. Leur souplesse et leur accessibilité ouvrent la voie à de nouvelles possibilités d’innovation – particulièrement lorsque des méthodes statistiques sont mises en œuvre pour en améliorer la fiabilité.
Alors que le marché du travail canadien traverse une période potentiellement instable, il est dans l’intérêt de toutes et tous de veiller à ce que les données des OEL soient non seulement accessibles, mais aussi fiables et dignes de confiance. Les conséquences d’une mauvaise interprétation des données ne sont pas théoriques : elles sont concrètes, et elles touchent de vraies personnes.
Des retombées concrètes
Ce travail aura des retombées considérables :
- Les gouvernements doivent disposer de données fiables et à jour sur les postes vacants pour orienter leurs stratégies de développement économique et de la main-d’œuvre, répondre aux pénuries de compétences et s’adapter à l’évolution du contexte socioéconomique.
- Les organismes de développement de la main-d’œuvre, qui soutiennent directement les personnes en recherche d’emploi et les employeurs en interprétant la demande de main-d’œuvre pour éclairer les décisions, s’appuient sur les estimations de postes vacants pour établir des liens concrets entre les chercheurs et les chercheuses d’emploi et les possibilités réelles du marché.
- Les établissements postsecondaires s’appuient sur les tendances liées aux postes vacants pour élaborer et orienter leurs programmes. Une interprétation plus rigoureuse des données issues des OEL permettrait d’aligner plus efficacement l’offre de formation sur les besoins des employeurs. Dans un contexte de baisse des inscriptions et d’incertitude financière, disposer de données fiables sur la demande de main-d’œuvre est crucial, tant pour les établissements que pour les économies locales qu’ils soutiennent.
Une lecture plus rigoureuse des données des OEL améliore la planification, l’orientation et les retombées pour l’ensemble de la société canadienne.
Une démonstration concluante, mais le travail ne fait que commencer
Ce rapport présente une preuve de concept claire : il montre qu’il est bel et bien possible de développer une méthode de pondération fiable et crédible pour les données tirées des offres d’emploi en ligne. Mais cette avancée marque le début du travail, non sa fin.
Nous espérons que cette démarche pose les bases d’un cadre concret pour améliorer la qualité et la fiabilité des données issues des OEL. La méthode combinée que nous avons testée a permis de réduire les marges d’erreur de 15 %, ce qui témoigne d’un réel potentiel. Avec des ajustements supplémentaires, ces approches pourraient permettre de rapprocher des données à haute fréquence et en temps quasi réel des estimations du marché du travail fondées sur des méthodes statistiques éprouvées.
Ce travail est particulièrement utile pour les gouvernements, les milieux de l’éducation et de la recherche qui cherchent à enrichir les sources de données existantes. Pour en savoir plus sur les méthodes, les résultats et leurs applications, consultez le rapport complet (disponible en anglais; une version française sera publiée prochainement). Nous publierons bientôt un guide sur les OEL, un outil conçu pour aider les utilisateurs et utilisatrices à interpréter et à exploiter ces données de manière éclairée et responsable.