Skip to content

Aperçu du tableau de bord des offres d'emploi en ligne au Canada

Un aperçu du Tableau de bord des offres d'emploi en ligne au Canada qui inclut un guide d'utilisation, les informations disponibles, les mises en garde, les limites et la méthodologie.

Table des matières

Aperçu

Le CIMT et Vicinity Jobs ont fait équipe pour fournir de l’information sur le marché du travail à propos d’offres d’emploi en ligne issues de partout au Canada par l’entremise de notre tableau de bord interactif. Il est possible de chercher le nombre d’offres d’emploi près de chez soi, en temps quasi réel, par région (p. ex., la province ou la ville) et par profession. Vicinity Jobs recueille, nettoie et structure les offres d’emplois afin de recenser les exigences des postes énumérées par les employeurs dans leurs offres, notamment les compétences, les domaines de connaissances, les outils et les technologies. Ces données sont recueillies et mises à jour mensuellement depuis janvier 2018.

Vous pouvez découvrir ici comment utiliser le tableau de bord et quelles données sont couvertes. Nous avons également répondu à certaines questions courantes (FAQ), mais si vous ne trouvez pas la réponse que vous cherchez, veuillez nous envoyer un courriel à info@lmic-cimt.ca.

Données et perspectives

Les données proposent des informations actualisées sur les offres d’emploi publiées en ligne et leurs exigences, dont les compétences. Chaque mois les données, glanées dans des milliers de sites et des babillards d’emploi à l’échelle du Canada, identifient les nouvelles offres d’emploi uniques en ligne. En plus d’être très actuelles, ces données couvrent la grande majorité des offres d’emploi publiées en ligne.

Toutefois, il y a également des mises en garde et limites importantes quant à l’utilisation et l’interprétation des données. Par exemple, toutes les offres d’emploi ne sont pas annoncées en ligne. Celles qui le sont concernent généralement des emplois dans des centres urbains et dans des professions orientées vers les services. En outre, les exigences associées à chaque offre d’emploi en ligne sont basées sur ce que l’employeur a précisé dans son offre. Ces informations ne permettent pas de déterminer l’importance relative de l’exigence de travail pour l’emploi, mais elles peuvent indiquer la fréquence à laquelle cette exigence apparaît dans des offres d’emplois similaires (p. ex., celles qui concernent la même ville et la même profession). De même, il est possible que certaines exigences du poste n’aient pas été spécifiées par l’employeur s’il juge que « cela va de soi ».

Contexte

Le Conseil de l’information sur le marché du travail (CIMT) vise à améliorer l’accessibilité, la fiabilité et l’actualité de l’information sur le marché du travail (IMT) afin de faciliter la prise de décision des employeurs, des travailleurs, des chercheurs d’emploi, des universitaires, des décideurs, des éducateurs, des professionnels en développement de carrière, des étudiants, des parents et des populations sous-représentées. Ce tableau de bord interactif offre des informations accessibles, claires et pratiques sur les liens entre les exigences de travail et les offres d’emploi en ligne dans tout le Canada.

Dès 2018, le CIMT a mené une série d’enquêtes ciblées pour interroger les Canadiens au sujet de leurs besoins en matière d’information sur le marché du travail. Nous avons constaté que les exigences de travail et de compétences étaient le type d’IMT le plus recherché par presque tous les groupes interrogés, après l’information sur les salaires et traitements.

Vicinity Jobs est une entreprise canadienne d’analyse de mégadonnées et de technologies de recherche sur Internet. Sa mission consiste à fournir des solutions technologiques en matière d’information sur le marché du travail. Vicinity Jobs recueille et analyse chaque mois diverses offres d’emploi en ligne et utilise une technique d’apprentissage automatique appelée traitement du langage naturel (TLN) pour extraire les exigences professionnelles et les exigences de travail de chaque offre d’emploi.

Comment puis-je utiliser ces informations?

Le tableau de bord interactif permet aux utilisateurs d’explorer les offres d’emploi et les exigences de travail affichées en ligne dans l’ensemble du Canada depuis 2019. Ainsi, le tableau de bord offre, par profession et par zone géographique, une vue détaillée de ce que les employeurs canadiens disent rechercher chez d’éventuels nouveaux employés.

Que puis-je trouver dans le tableau de bord?

Le tableau de bord offre deux façons de consulter les données des offres d'emploi en ligne. Dans la vue « Titre de poste », les utilisateurs effectuent une recherche par profession. Ils peuvent effectuer une recherche générale (le champ de recherche du titre de poste est alors laissé vide) ou une recherche spécifique (un titre de poste est alors saisi dans le champ de recherche). Les utilisateurs doivent ensuite choisir un lieu (p. ex., une province ou une ville) et une période de temps (p. ex., un mois, une année ou un trimestre) pour effectuer la recherche. S’il s’agit d’une recherche générale, l'utilisateur verra une liste de tous les titres de poste, ainsi que le nombre total d'offres et le taux de croissance annuel pour chaque profession dans le lieu choisi et pour la période sélectionnée. S’il s’agit d’une recherche spécifique, l'utilisateur ne verra que la profession spécifiée dans la liste des résultats. En cliquant sur un titre de poste dans cette liste, il verra alors les exigences professionnelles qui lui sont associées pour le même lieu et la même période.

Dans la vue « Exigence de travail », les utilisateurs effectuent une recherche par exigence de travail plutôt que par titre de poste. Les utilisateurs peuvent effectuer une recherche générale ou spécifique en saisissant une exigence de travail dans le champ de recherche. Ensuite, après avoir sélectionné le lieu et la période, ils obtiendront soit une liste complète des exigences de travail, soit une seule exigence de travail (selon le type de recherche effectuée), ainsi que le nombre d'offres d'emploi en ligne comportant cette même exigence de travail, et la variation annuelle. En cliquant sur une exigence de travail de la liste, les titres de poste associés à l'exigence de travail sélectionnée pour le même lieu et la même période s'afficheront.

Exemple 1 : Affichage des titres de poste, recherche générale

  1. Ne rien inscrire dans le champ de recherche Titre de poste.
  2. Dans le champ Lieu, pour la Province, choisissez « Nouvelle-Écosse », puis « Cap-Breton ».
  3. Dans Période, choisissez l’année 2019, et dans Trimestre, « T1 ».
  4. Cliquez sur « Recherche ».
  5. Résultats :
    • Le tableau « Offres d’emploi » affiche deux professions : Infirmières diplômées et Vendeur – commerce de détail. On constate que, à Cap-Breton, au premier trimestre (T1) de 2019, il y a eu 90 offres d'emploi en ligne pour des infirmières diplômées et 60 offres d'emploi en ligne pour des vendeurs – commerce au détail. De plus, cela représente une augmentation de 12,5 % par rapport au premier trimestre de 2018 pour les infirmières diplômées et une diminution de 25 % pour les vendeurs – commerce au détail.
    • Il suffit de cliquer sur « Infirmières diplômées » pour afficher le second tableau, « Exigences de travail ». Nous remarquons, entre autres, que les compétences en communication, le leadership, la résolution de problèmes et le travail d'équipe sont les quatre principales compétences mentionnées dans 53 %, 35 %, 34 % et 30 % de tous les postes d’infirmières autorisés annoncés au Cap-Breton au cours du premier trimestre de 2019.

Exemple 2 : Affichage des exigences de travail, recherche spécifique

  • Dans le champ de recherche, indiquez « Microsoft PowerPoint » afin de mener une recherche spécifique par exigence de travail.
  • Dans le champ Lieu, pour la Province, choisissez « Québec » et pour le lieu, indiquez « Tous ».
  • Dans Période, saisissez l’année 2019 et choisissez « Année seulement » pour récupérer les résultats de toute l’année.
  • Cliquez sur « Recherche ».
  • Résultats :
    • Le tableau « Exigences de travail » affiche un seul élément : Microsoft PowerPoint. On constate que cette exigence est classée dans « Outils et technologie ». En 2019, 7 400 offres d’emploi en ligne au Québec mentionnaient « Microsoft PowerPoint » au nombre des exigences. Les données du tableau de bord commençant en 2019, la variation annuelle n’est assortie d’aucune valeur.
    • Il suffit de cliquer sur « Microsoft PowerPoint » pour afficher le second tableau « Exigences de travail ». Nous remarquons, entre autres, que les annonces de postes d’adjoints administratifs (7 700), d’agents administratifs (3 300), de professionnels de la publicité, du marketing et des relations publiques (2 700), et de directeurs des ventes (2 400) indiquaient « Microsoft PowerPoint » au nombre des exigences de travail plus fréquemment que les autres professions au Québec, en 2019.

Veuillez noter que sur le tableau de bord, vous pouvez également sélectionner le niveau de détail de la profession – le « Niveau de la CNP »". Le système de Classification nationale des professions (CNP) du Canada est une structure hiérarchique à quatre niveaux de groupes de professionnels, le plus grand niveau de détail étant disponible pour les 500 professions du « groupe de base » (CNP à 4 chiffres). Vous trouverez de plus amples informations sur la CNP dans notre foire aux questions (FAQ).

Que dois-je savoir d’autre?

N’oubliez pas que les données comportent toujours certaines mises en garde et limites importantes, notamment les suivantes :

  1. Les offres d’emploi en ligne sont liées aux postes vacants, mais distinctes de ces derniers. Par exemple, parfois, des employeurs (p. ex., les gouvernements) recherchent du personnel avant qu’un poste ne soit officiellement vacant afin de créer un « bassin » de candidats à partir duquel ils peuvent embaucher. Par ailleurs, de nombreux postes vacants ne sont jamais affichés, ils sont pourvus à l’interne ou par le recrutement de bouche à oreille.
  2. La liste des exigences de travail indiquée ne montre pas l’importance de l’exigence pour cette profession. Parfois, les employeurs énumèrent des qualifications qui sont « souhaitables, mais pas essentielles » sans le préciser. De même, il arrive qu’une exigence soit considérée comme « allant de soi » et qu’elle ne soit donc pas citée.

Consultez notre section Mises en garde et limites pour obtenir des précisions sur ces éléments et les considérations supplémentaires dont il faut tenir compte dans l’utilisation du tableau de bord.

Comment utiliser le tableau de bord?

  1. Sélectionner l’onglet « Profession » ou « Exigence de travail » pour choisir comment regrouper les offres d’emploi en ligne.

 

  1. Sélectionner la zone géographique qui vous intéresse (p. ex., province, territoire et/ou ville) à l’aide du menu déroulant.

 

  1. Sélectionner la période qui vous intéresse (p. ex., année, trimestre ou mois) à l’aide du menu déroulant. 

 

Une liste d’offres d’emploi en ligne organisées par profession ou exigences de travail (selon l’onglet sélectionné à l’étape 1), classées selon le nombre d’offres dans la zone géographique et la période choisies, alimentera la fenêtre de recherche. Vous pouvez ensuite utiliser le menu déroulant « catégorie d’emploi »1 ou « exigence de travail »2 ou la fonction de recherche pour affiner la liste.

 

  1. Cliquer sur une profession ou une exigence de travail dans le premier tableau pour afficher les exigences ou les professions les plus fréquemment associées à votre sélection pour cette zone géographique et cette période.

Quelles sont les informations disponibles?

Le tableau de bord interactif permet aux utilisateurs d’explorer des informations granulaires et actuelles sur le marché du travail en rapport avec les offres d’emploi en ligne. Pour n’importe quelles période (à partir de janvier 2019) et région géographique, l’utilisateur est en mesure d’explorer le type et la fréquence des exigences de travail (précisées par les employeurs dans chaque offre d’emploi). Les utilisateurs peuvent aussi consulter l’éventail des offres d’emploi en ligne par profession. Pour chaque profession, le pourcentage d’offres d’emploi en ligne liées à des exigences de travail spécifiques est également inclus.

Le CIMT classe ces exigences de travail en quatre catégories basées sur la Taxonomie des compétences et capacités d’Emploi et développement social Canada (EDSC) : compétences, connaissance, outils et technologie et autres. Il est à noter que la taxonomie d’EDSC englobe sept catégories de compétences et de capacités. Nous avons regroupé les intérêts, les capacités et attributs personnels, les activités professionnelles et le contexte de travail dans la catégorie « autre ».

Comment les informations sont-elles recueillies?

Les données relatives aux offres d’emploi en ligne sont fournies par Vicinity Jobs, une entreprise canadienne d’analyse de mégadonnées et de technologies de recherche sur Internet. Elle recueille et analyse les offres d’emploi figurant sur divers sites web et babillards d’emplois puis associe chaque offre à une profession et à un ensemble d’exigences de travail. Ces exigences de travail (au nombre de plus de 40 000, mais seulement 2 500 apparaissent régulièrement) sont définies par la taxonomie propriétaire de Vicinity qui sert à catégoriser les descriptions en texte libre dans les offres en ligne.

Les données du tableau de bord commencent en janvier 2019 et se poursuivent jusqu’à aujourd’hui. Ces informations en temps quasi réel sur les emplois affichés et leurs exigences sont disponibles par profession détaillée (code à quatre chiffres de la Classification nationale des professions [CNP]) et par groupes professionnels plus globaux, par mois, trimestre ou année et par lieu de travail. À l’heure actuelle, il y a 78 emplacements sous-provinciaux ou sous-territoriaux, qui s’appuient sur les Régions économiques de Statistique Canada, à quelques exceptions près.

Mises en garde et limites

Les données tirées de Vicinity Jobs qui figurent dans notre tableau de bord offrent un vaste ensemble d’informations en temps quasi réel sur les offres d’emploi en ligne et les exigences de travail qui y sont associées. Comme pour tout ensemble de données, il est important de tenir compte des mises en garde et des limites associées à ces informations. En bref, il existe deux types de mises en garde et de limites étroitement liées : 1) l’interprétation des données et 2) la collecte des données. Pour en savoir plus sur la façon dont les offres d'emploi en ligne peuvent faire un complément aux données officielles du marché du travail, consultez notre rapport conjoint avec EDSC et Statistique Canada

Interprétation des données

Offres d’emploi et postes vacants

Le tableau de bord présente un échantillon des offres d’emploi en ligne relevées par Vicinity Jobs. Bien que cet échantillon soit important, par définition, il ne constitue qu’un sous-ensemble de toutes les offres d’emploi. Même si de nombreux employeurs recrutent activement en ligne, les offres d’emploi ne coïncident pas exactement avec les postes vacants.

Les postes vacants désignent le nombre de postes disponibles qu’un employeur souhaite pourvoir. La principale source de données permettant de mesurer leur nombre au Canada est l’Enquête sur les postes vacants et les salaires (EPVS)en vertu de laquelle un poste vacant est défini comme un emploi qui est ou deviendra vacant au cours du mois et pour lequel l’employeur recrute activement à l’extérieur de l’organisation.

Même si de nombreux employeurs recrutent activement par le biais d’offres d’emploi en ligne, les deux concepts sont distincts. Premièrement, les offres d’emploi ne sont pas toutes publiées en ligne. Deuxièmement, un dénombrement des offres d’emploi (en ligne et hors ligne) peut sous-estimer le nombre réel de postes vacants, car il est possible que les employeurs cherchent à pourvoir plusieurs postes vacants par le biais d’une seule offre. Troisièmement, le dénombrement des offres d’emploi peut surestimer les postes vacants, par exemple, si l’employeur maintient l’offre d’un poste qu’il ne cherche pas à pourvoir dans l’immédiat (auquel cas l’offre ne représente pas techniquement un poste vacant tel que défini par l’EPVS). De manière générale, le nombre des offres d’emploi dans le tableau de bord devrait être différent d’un dénombrement complet des postes vacants dans l’ensemble du pays.

 

Variations brutes et variations nettes de la demande de main-d’œuvre

Lorsqu’on évalue un secteur ou une profession en croissance, on pense (souvent implicitement) à la variation nette de la demande de main-d’œuvre. Par exemple, « Combien de nouveaux emplois en conception web y aura-t-il cette année? » est une question sur la variation nette de l’emploi. Inversement, la variation brute de la demande d’emploi comprend ces nouveaux emplois, plus les postes laissés vacants en raison du roulement du personnel (c’est-à-dire les cas où le titulaire d’un poste quitte son poste).

Cette distinction est importante, car on peut seulement utiliser les offres d’emploi en ligne, avec une certaine prudence, comme des approximations de la variation brute de la demande de main-d’œuvre et non pas nette. Dans le cas des offres d’emploi en ligne, il n’y a aucun moyen de savoir si le poste résulte de la croissance de l’organisation ou s’il s’agit de pourvoir un poste existant qui est vacant. Ainsi, on ne devrait pas estimer la santé économique de différentes professions simplement à partir de la croissance du nombre d’offres d’emploi en ligne; la croissance peut ici refléter soit un dynamisme économique, soit un roulement de personnel particulièrement élevé.

 

La fréquence des exigences de travail n’indique pas nécessairement leur importance

Chaque mois, Vicinity Jobs recueille, nettoie et structure des centaines de milliers d’offres d’emploi en ligne provenant de partout au Canada, pour en extraire des données telles que la profession, le lieu et les exigences de travail. L’un des principaux avantages est que les exigences de travail tirées des offres d’emploi en ligne reflètent le langage utilisé par les employeurs.

Toutefois, il faut interpréter cette utilisation réelle de la langue avec prudence. D’abord, il n’est pas garanti que les employeurs mentionnent explicitement toutes les exigences de travail dans les offres d’emploi. Dans de nombreux cas, ils supposent que certaines exigences sont implicitement évidentes pour les candidats potentiels. Ensuite, il n’y a aucun moyen de savoir quelles exigences sont essentielles pour le poste, ni les compétences nécessaires pour effectuer le travail avec succès. Les données permettent seulement d’observer que certaines exigences sont plus fréquemment mentionnées par les employeurs dans les offres d’emploi en ligne.

Par exemple, Microsoft Excel a été associé à 22 % des offres d’emploi en ligne pour les économistes, recherchistes et analystes des politiques économiques (CNP 4162) en 2019. Cela signifie-t-il que les 78 % restants n’ont pas besoin d’Excel? Probablement pas. Et même pour les 22 % d’offres d’emploi mentionnant Excel, il n’y a aucune information sur le niveau d’expertise requis par l’employeur.

 

Exigences de travail et compétences professionnelles

On parle couramment des « compétences » recensées dans les données des offres d’emploi en ligne. Cependant, le terme « compétences » ne désigne pas toutes les exigences de travail; il a une définition précise. Les données du tableau de bord sont organisées en quatre catégories d’exigences de travail, elles-mêmes reposant sur la Taxonomie des compétences et des capacités d’EDSC :

  • Compétences : Capacités acquises que doit avoir une personne pour bien accomplir un travail ou une fonction, jouer un rôle ou effectuer ses tâches.
  • Connaissance : Ensembles organisés d’information servant dans l’exécution des tâches et des activités dans un domaine particulier.
  • Outils et technologie : Catégories d’outils et technologies utilisés pour effectuer les tâches du travail.
  • Autres : Exigences de travail qui ne sont pas couvertes dans les trois autres catégories : Activités du travail, Contexte de travail, Habiletés et attributs personnels.

Les exigences de travail d’un poste particulier sont une combinaison de compétences (p. ex., la pensée critique ou la résolution de problèmes), la connaissance d’un domaine (p. ex., la budgétisation ou les systèmes électriques) et l’utilisation d’un outil ou d’une technologie particulière (p. ex., Excel ou les diodes).

Compte tenu de la nature des catégories d’exigences de travail, à la fois interreliées, mais distinctes, on doit faire preuve de prudence lorsqu’on extrapole les données des offres d’emploi en ligne présentées dans le tableau de bord pour tirer des conclusions quant aux compétences requises par les employeurs ou celles qui manquent sur le marché du travail.

Collecte de données

Représentativité/biais

Lors du traitement du contenu des offres d’emploi en ligne, les données peuvent être biaisées en faveur de certains secteurs d’activité, professions, régions, tailles d’entreprises et niveaux de scolarité requis. Même si Vicinity Jobs s’efforce de saisir toutes les offres d’emploi en ligne vérifiables, c’est impossible à garantir.

 

Marché de l’emploi caché

De nombreux employeurs recrutent à l’interne ou par des moyens informels comme le bouche-à-oreille. Ces sources de demande de main-d’œuvre ne peuvent pas être évaluées à partir des données d’offres d’emploi en ligne. Il est également possible qu’elles ne soient pas incluses dans les données de l’enquête sur les postes vacants.

 

Qualité des données

Les données sont recueillies à partir des offres d’emploi en ligne par le biais d’algorithmes de balayage qui visent à fournir un ensemble complet d’informations sur les offres d’emploi. Les organisations qui collectent des données de cette manière développent généralement des algorithmes propriétaires pour nettoyer et structurer les données brutes. Les informations recueillies sont donc structurées différemment selon les fournisseurs, même si les données proviennent essentiellement du même ensemble d’offres d’emploi en ligne. Malgré ces différences, l’assurance de la qualité demeure une partie essentielle du processus. À cette fin, Vicinity Jobs teste et révise fréquemment ses algorithmes de collecte, de nettoyage et de structuration des données brutes, en se basant à la fois sur des contrôles internes d’assurance de la qualité et sur les commentaires réguliers de partenaires, dont le CIMT.

 

Double affichage des offres d’emploi

L’un des principaux problèmes en matière de qualité des données liés aux offres d’emploi tirées de sources en ligne est que bien des employeurs publient la même offre sur un certain nombre de sites; en fait, on estime que 80 % des affichages sont des doublons. Pour éviter le double (ou multiple) comptage des offres d’emploi, la déduplication – qui consiste à supprimer les offres d’emploi apparaissant sur plusieurs sites – est essentielle. Le processus n’est cependant pas parfait. Vicinity Jobs supprime environ 95 % des offres d’emploi en double chaque mois. Mais de légères variations dans une même offre, y compris dans la mise en page du site, font que certaines échappent à ce contrôle.

Méthodologie

Pour la plupart des objectifs, les principales données d’intérêt lors de la collecte et de l’analyse du texte brut des offres d’emploi en ligne sont les exigences de travail et les appellations d’emploi. Pour y arriver, les données doivent relier les offres d’emploi à une profession (ou à une appellation d’emploi) et à un ensemble d’exigences de travail. Le processus pour ce faire se divise en quatre grandes étapes : 1) la collecte, 2) le nettoyage, 3) la structuration, et 4) l’extraction des données.

Bien que les quatre étapes se déroulent dans l’ordre, le peaufinage et l’optimisation de chaque étape nécessitent souvent de revoir les résultats d’une partie tout en testant itérativement une autre partie. Par exemple, les étapes 3 et 4 (structuration et extraction) peuvent produire des informations précieuses qui permettront ensuite d’augmenter la précision des algorithmes de déduplication utilisés à l’étape 2 (nettoyage).

La méthode en quatre étapes, qui sert à transformer les offres d’emploi en ligne en informations et idées utiles sur le marché du travail, est décrite ci-dessous.

 

Étape 1 : Collecte de données

La collecte de données désigne le processus d’acquisition du texte des offres d’emploi en ligne, telles que celles qui sont affichées sur des sites d’emplois comme le Guichet-Emplois de Service Canada, des sites d’agrégateurs d’emplois ou directement sur des sites d’entreprises. La collecte de données implique généralement une variété d’approches, dont le moissonnage du web (technique de téléchargement de texte brut des sites) et l’accès au contenu des sites par la connexion API spécialisée de l’hôte. Dans tous les cas, les données recueillies sont accessibles au public sans frais. La méthode souvent utilisée à cette fin est appelée analyse du modèle d’objet de document (DOM), qui permet à un utilisateur d’extraire des parties d’une page web en fonction de sa structure HTML. Plus précisément, les programmes de collecte de données peuvent récupérer le contenu dynamique d’une page web en faisant référence, par exemple, aux sélecteurs de feuilles de style en cascade (CSS) associés à des parties spécifiques de la page.

Il est important de noter que les protocoles d’assurance qualité sont mis en œuvre dès cette étape initiale grâce à la sélection des sites qui doivent être surveillés. Puisque les sites varient nettement en matière de fiabilité des offres d’emploi affichées (p. ex. entre le site de recrutement d’une entreprise et des offres d’emploi sur Kijiji), Vicinity Jobs choisit ses sources d’offres d’emploi en effectuant un examen et une validation systématiques avant d’amorcer la collecte de données.

 

Étape 2 : Nettoyage des données

Après avoir téléchargé le texte brut, il faut le traiter sous une forme propice à une analyse statistique plus poussée. On appelle ce processus « l’extraction de caractéristiques ». En ce qui concerne les données textuelles, ce traitement comprend des tâches telles que la simplification de la ponctuation, la conversion des mots du pluriel au singulier, le remplacement des abréviations et la mise en minuscules des lettres.

Une autre phase du processus de nettoyage porte sur la suppression des doublons ou des fausses offres d’emploi. Environ 30 % des pages web sont des quasi-doublons (Henzinger, 2006), et dans le cas des offres d’emploi en ligne, les entreprises publient souvent leurs offres dans plusieurs sites, ce qui fait grimper le taux estimé de doublons jusqu’à 80 % (Jijkoun, n.d.). Les contenus dupliqués peuvent fausser les résultats lorsqu’on essaie de relever les exigences de travail les plus fréquemment demandées ou d’estimer le nombre d’offres d’emploi sur le marché du travail.

La déduplication, c’est-à-dire le processus d’élimination des offres d’emploi en double, est réalisée grâce à un algorithme de traitement du langage naturel pour former des modèles statistiques appelés « classificateurs », qui permettent de prédire si deux offres d’emploi renvoient au même poste. Parmi les données de Vicinity Jobs, il s’avère qu’à peu près la moitié de toutes les offres d’emploi brutes sont des doublons qui sont supprimés.

 

Étape 3 : Structuration des données

Une fois que les données des offres d’emploi sont recueillies et nettoyées, elles sont prêtes à être structurées et organisées en un ensemble précis de classifications ou de catégories.

Un exercice particulièrement important est la classification des offres d’emploi selon une taxonomie standard des professions, comme les systèmes de la Classification nationale des professions (CNP) au Canada ou de la Standard Occupational Classification (SOC) aux États-Unis. La plupart des algorithmes qui créent cette correspondance entre le texte brut et les classifications professionnelles le font en examinant l’appellation d’emploi dans l’annonce. Cette approche est limitée en raison de la forte variabilité des appellations d’emploi utilisées par les employeurs. Par exemple, un « programmeur » peut renvoyer à la catégorie CNP 2173 « ingénieurs/ingénieures et concepteurs/conceptrices en logiciel » ou à la catégorie 2174 « programmeurs/programmeuses et développeurs/développeuses en médias interactifs », selon les exigences réelles du poste. De même, on attribue les catégories de la CNP différemment en fonction du secteur. Par exemple, on attribuerait à un emploi de représentant commercial différents codes à quatre chiffres de la CNP selon que celui-ci est dans le secteur des services financiers, du commerce de détail ou de gros. Des approches plus avancées utilisent à la fois l’appellation et la description de l’emploi pour guider le processus de classification.

Une méthode de mise en correspondance des appellations d’emploi avec les professions nécessite une liste de référence des appellations d’emploi connues et un corpus de termes employés pour décrire les professions. Une de ces ressources est l’index 2010 de l’Office for National Statistics (ONS) du Royaume-Uni, qui recense près de 30 000 variantes d’appellations d’emploi dans tous les groupes de base professionnels. De même, on pourrait faire appel aux profils de la CNP, qui donnent des exemples d’appellations d’emploi pour chaque profession. Ces listes de référence servent à nettoyer davantage le texte des appellations d’emploi en supprimant du titre de l’annonce les mots qui n’existent pas dans la liste des appellations connues. Ensuite, ces appellations d’emploi sont mises en correspondance avec une taxonomie standard des professions.

Une approche plus récente consiste à déployer des techniques d’apprentissage automatique pour construire un classificateur de texte afin d’associer les offres d’emploi aux codes des professions (p. ex., ceux de la CNP). Après avoir nettoyé les appellations d’emploi comme on l’a décrit auparavant, on convertit le texte en vecteurs de nombres (un processus appelé « plongement de mots »). Un des modèles les plus simples et souples pour le plongement de mots est le modèle du sac de mots, qui se base sur la méthode d’encodage 1 parmi n (one-hot) pour transformer le texte en vecteurs mathématiques. Une fois le texte converti en représentations vectorielles, on implante un modèle d’apprentissage supervisé. Cela nécessite un ensemble de données (appellations et descriptions des emplois affichés en ligne) pour lesquelles la classification professionnelle est déjà connue. Dans le cas du système européen WoLMIS, une équipe d’experts sélectionne des sites d’où les offres d’emploi sont téléchargées chaque semaine pendant plusieurs mois, puis étiquetées manuellement selon le système européen de classification des professions. Les offres d’emploi étiquetées sont ensuite testées selon les données à l’aide d’un classificateur linéaire de type machine à vecteurs de support (SVM). Lorsqu’on a bâti le classificateur et mesuré son efficacité, on peut l’utiliser sur les données recueillies pour attribuer des codes professionnels.

L’utilisation de données provenant d’offres d’emploi en ligne sert aussi à obtenir des informations sur les exigences (p. ex., les compétences) des employeurs. Cela nécessite souvent de structurer le texte brut de la description d’emploi dans un format plus significatif. Comme pour la classification des offres d’emploi en unités professionnelles, le texte brut des compétences peut être classé selon une taxonomie prédéfinie.

 

Étape 4 : Extraction des données

L’étape finale du processus consiste à extraire des informations des données structurées obtenues. En ce qui a trait aux exigences de travail, cela peut par exemple prendre la forme du calcul de celles qui sont le plus fréquemment demandées par profession et par zone géographique. Par ailleurs, puisque les « exigences de travail » constituent une vaste catégorie, il est utile de les organiser davantage en une classification hiérarchique. Pour ce faire, nous classons les exigences de travail en quatre catégories basées sur la Taxonomie des compétences et capacités d’Emploi et Développement social Canada (EDSC) : compétences, connaissance, outils et technologie et autres. La taxonomie complète comprend sept catégories, mais nous avons regroupé le domaine d’intérêt, les habiletés et attributs personnels, les activités du travail et le contexte de travail dans la catégorie « autres ».

Classification

L’approche de Vicinity Jobs pour relier les offres d’emploi à la CNP

Vicinity Jobs met en œuvre un processus itératif qui vise d’abord à mettre en correspondance les offres d’emploi à la CNP en fonction de leur appellation d’emploi, puis à affiner la concordance en utilisant des points d’ancrage supplémentaires selon le contenu de chaque offre et les informations connues sur l’employeur (p. ex., le secteur d’activité). Ce processus s’appuie sur la base de connaissances propriétaire de Vicinity Jobs qui englobe des dizaines de milliers d’appellations d’emploi. À l’origine, cette base de connaissances a été compilée à partir des sources de spécifications de la CNP disponibles. (p. ex., les profils professionnels d’EDSC), puis peaufinée à l’aide des offres d’emploi historiques. On perfectionne ensuite le lien entre l’offre d’emploi et un code CNP en incorporant des connaissances contextuelles (p. ex., certaines appellations d’emploi ne peuvent être attribuées qu’à certaines professions dans certains contextes précis).

Pour cerner les contextes appropriés, l’algorithme de Vicinity Jobs tente d’attribuer les offres d’emploi aux secteurs d’activité. Il le fait notamment en faisant correspondre les données sur les employeurs (telles que le nom de l’employeur et l’URL) à des profils d’employeurs connus stockés dans une vaste base de données actualisée d’employeurs canadiens connus.

Une fois les offres d’emploi classées selon les codes à quatre chiffres de la CNP, il reste un ensemble d’offres non attribuées dont le contenu et les appellations d’emploi ne sont pas suffisamment précis, ou dont la nature ne permet pas l’attribution à un seul code à quatre chiffres de la CNP. Plutôt que de forcer ou de deviner le classement, l’algorithme essaie d’attribuer le plus grand nombre d’offres possible à la catégorie professionnelle générale la moins précise (les codes à un chiffre de la CNP).

 

Taxonomie des exigences de travail de Vicinity Jobs

Afin d’assurer que les rapports sur les exigences de travail et les certifications professionnelles de Vicinity Jobs répondent à ses normes de qualité tout en restant représentatifs des aspects uniques des marchés du travail canadiens, l’entreprise a établi une taxonomie des exigences de travail (dont les compétences). Elle rassemble des données détaillées de ses clients et partenaires et des informations provenant de sources publiques telles que la taxonomie des technologies et des outils O*NET, des mots clés structurés relatifs aux compétences publiés par certains sites et d’autres données sur les exigences de travail rassemblées à partir d’offres d’emploi et de recherches en ligne au Canada.

Après avoir compilé une première version de sa taxonomie des exigences de travail, Vicinity Jobs se sert d’un algorithme propriétaire pour enrichir et préciser ses connaissances sur les exigences de travail et les constructions linguistiques qui les représentent. Ce processus comporte une séquence d’étapes itératives, où chaque itération comprend un test de la base de connaissances par rapport à un large ensemble de contenu d’offres d’emploi non structuré afin de relever les exigences de travail, puis un examen manuel des données obtenues et une rétroaction pour perfectionner les algorithmes.

La base de connaissances qui en résulte incorpore des dizaines de milliers d’exigences de travail et de certifications professionnelles. Elle comprend non seulement des étiquettes et des combinaisons de mots clés distinctifs, mais aussi un cadre complexe d’interdépendances sous-jacentes et de définitions de contexte nécessaires pour garantir un recensement précis des exigences de travail. Par exemple, le système sait que certaines exigences de travail et certifications professionnelles peuvent s’appliquer à n’importe quel emploi, tandis que d’autres ne concernent que des professions particulières.

 

La catégorisation des compétences et autres exigences de travail du CIMT

Les données de Vicinity Jobs fournissent une liste d’exigences de travail tirées des offres d’emploi en ligne qu’on a nettoyées selon une liste propriétaire d’exigences prévalidées. Dans le tableau de bord du CIMT, nous affinons davantage cette liste pour distinguer les compétences des autres exigences. Cette distinction est importante parce qu’il existe une ambiguïté de longue date quant à la notion de compétences et à la manière dont elles sont définies. La Taxonomie des compétences et capacités d’EDSC regroupe les caractéristiques des emplois ou des travailleurs en sept domaines : 1) compétences, 2) habiletés et attributs personnels, 3) connaissance, 4) domaine d’intérêt, 5) contexte de travail, 6) activités du travail et 7) outils et technologie. En nous basant sur ces domaines, nous avons reclassé les compétences de Vicinity Jobs en quatre groupes : 1) compétences, 2) connaissance, 3) outils et technologie et 4) autres. Le tableau 1 présente des exemples de différences entre les quatre catégories.

Tableau 1 : Exemples d’exigences de travail classées selon les quatre catégories du CIMT

Compétences Connaissance Outils et technologie Autres
1. Capacité à apprendre

2. Aptitudes à communiquer

3. Pensée critique

1. Méthode des 5 S

2. Langue néerlandaise

3. Marketing numérique

1. Épandeurs d’engrais

2. Moniteurs de surveillance fœtale

3. Google Docs

1. Blogger

2. Relations publiques

3. Gestion de projet

Références

Henzinger, M. (2006, 6-11 août). Finding near-duplicate web pages: A large-scale evaluation of algorithms (Trouver des quasi-doublons de pages web : une évaluation à grande échelle des algorithmes). Compte rendu de la 29e édition annuelle de la ACM SIGIR Conference on Research and Development in Information Retrieval (SIGIR ’06). Seattle, WA, États-Unis (p. 284-291). doi:10.1145/1148170.1148222

Jijkoun, V. (n.d.). Online job postings have many duplicates. But how can you detect them if they are not exact copies of each other? (Les offres d’emploi en ligne ont de nombreux doublons. Mais comment les détecter si elles ne sont pas des copies exactes les unes des autres?). Textkernel.

 

Notes

  1. Il existe dix catégories d’emplois, chacune étant associée au premier chiffre du code à quatre chiffres d’une profession.
  2. Il y a quatre catégories d’exigences de travail qui sont basées sur la Taxonomie des compétences et des capacités de l’EDSC. Il s’agit des catégories « compétences », « capacités », « outils et technologie » et « autres ».

Questions ou commentaires?

Veuillez entrer votre nom.
Veuillez entrer un message.

Sign up for Our Newsletter

Nous contacter

Pour toute question ou commentaire, contactez-nous et nous vous répondrons dans les plus brefs délais

613-695-0699

410, avenue Laurier Ouest,
bureau 410
Ottawa, Ontario K1R 1B7

Demandes des médias :
nadine.purdy@lmic-cimt.ca
Veuillez entrer votre nom.
Veuillez entrer un message.
Veuillez vérifier le captcha pour prouver que vous n'êtes pas un robot.