Données locales, granulaires pour débutants

Par Young Jung | mars 15, 2019

Lors de ma première journée au CIMT, j’ai été chaleureusement accueilli par l’équipe de recherche et d’analyse. Mes nouveaux collègues étaient ravis de me parler de leurs projets de collecte et d’analyse de données— mais ils l’ont fait en utilisant des termes étranges comme ROP, AdT, PLLEMT, et LG. Bien que j’aie été un peu dépassé par le nombre d’acronymes, l’un d’eux s’est démarqué : LG. Après quelques hésitations, j’ai finalement eu le courage de demander à mes collègues ce que LG voulait dire dans le contexte de l’information sur le marché du travail (IMT). Ils m’ont expliqué qu’il s’agit d’IMT « locale, granulaire » – l’une des principales priorités lorsqu’il s’agit de produire de l’IMT pour les Canadiens et les Canadiennes.

J’avais pensé que les deux termes étaient synonymes, mais, comme me l’a expliqué ma nouvelle équipe, au CIMT, locale et granulaire font en fait référence à des concepts distincts :

Le caractère local est la plus petite région géographique pour laquelle on dispose de renseignements fiables sur le marché du travail.
La granularité désigne les catégories selon lesquelles l’information sur le marché du travail est organisée. On peut y penser comme ayant deux composantes :

1.Les catégories du marché du travail telles que la situation sur le marché du travail (employé ou chômeur) ou les groupes professionnels. Cela détermine la disponibilité de variables telles que le taux de chômage et le salaire moyen par profession.

2.Les catégories sociodémographiques telles que le sexe, l’âge, le statut d’immigration, parmi tant d’autres. Ce type de granularité précise quelles variables du marché du travail sont disponibles de façon fiable pour des sous-populations bien précises du marché du travail (p. ex. le chômage des jeunes).

Une fois expliquées, les catégories LG avaient un sens. Mais très vite, j’ai pris connaissance de deux autres catégories que le CIMT utilise pour déterminer la qualité des données, soit la fréquence et l’actualité. La fréquence réfère aux périodes pour lesquelles des données sont disponibles tandis que l’actualité des données réfère au délai entre la période de référence et la période où les données sont rendues disponibles (p. ex les informations de l’année d’imposition 2015 sont disponibles comme données anonymisées en 2017, c’est-à-dire deux ans plus tard). Les quatre caractères utilisés pour évaluer les données sont énuméré dans le tableau 1, au-dessous.

Tableau 1 : Comparaison des caractères de l’IMT

Qu’est-ce qui est disponible?

L’Enquête sur la population active (EPA) est l’une des sources d’information sur le marché du travail les plus populaires et les plus utilisées au Canada. Produite mensuellement, elle fournit certaines des données les plus fiables et les plus à jour sur le marché du travail, y compris le taux de chômage, le niveau d’instruction et le revenu du travail.

Comme toute enquête, l’EPA comporte certaines limites. Bien que l’EPA interroge environ 60 000 ménages à travers le pays chaque mois, l’échantillon n’est pas assez grand pour obtenir des estimations fiables pour les plus petits groupes ou régions. Par exemple, nous pouvons estimer les variables du marché du travail pour la région du Grand Toronto selon le sexe et l’âge, mais pas pour une petite région de Toronto, comme Scarborough. Cela signifie que l’EPA peut faillir à fournir les détails dont ont besoin les décideurs locaux, les professionnels du domaine et les autres intervenants qui se concentrent sur des contextes très spécifiques (lire : locaux, granulaires). Pour eux, nous avons dû explorer d’autres sources de données.

Un aperçu de ce qui est possible

Il existe plusieurs ensembles de données pertinentes sur l’information sur le marché du travail au Canada (voir le blogue de ma collègue Behnoush). Nous avons recensé le Fichier sur la famille (FFT1) de l’impôt sur le revenu, le Recensement de 2016 sur la population et, éventuellement, les fichiers de l’assurance-emploi comme des ensembles de données qui pourraient fournir de l’information très locale et granulaire sur le marché du travail. Le contenu de ces ensembles de données, ainsi que de l’EPA, est résumé dans le tableau ci-dessous.

La grande différence entre l’EPA et ces trois ensembles de données est la taille — et dans le monde de l’information sur le marché du travail, c’est important. Avec un ensemble de données plus important, il est possible de regrouper les données de façon plus fine sans sacrifier la fiabilité de leurs estimations. Bien sûr, des améliorations ne sont possibles que si les variables de groupement granulaires sont présentes; par exemple, vous ne pouvez pas observer le taux de chômage des immigrants si ce groupe n’est pas identifié dans l’ensemble de données. Étant donné que le Recensement est riche en variables sociodémographiques, l’établissement d’un lien avec les données fiscales et les données de l’assurance-emploi au fil du temps permettrait de produire de l’IMT locale et granulaire.

L’établissement de liens entre les ensembles de données de recensement et les ensembles de données administratives soulève à juste titre la question de la sécurité des données et de la protection de la vie privée. Pour ces ensembles de données individuelles et leurs liens potentiels, le CIMT — comme tous les chercheurs — est assujetti à des protocoles stricts de protection de la vie privée et des données qui sont supervisés par Statistique Canada à chaque étape du processus. Bien que l’IMT locale et granulaire soit essentielle à l’élaboration de bonnes politiques, elle ne doit pas nécessairement mettre en péril la protection de la vie privée des Canadiens et des Canadiennes.

Aller de l’avant

La possibilité d’obtenir davantage d’IMT locale et granulaire à partir des ensembles de données du recensement et des données administratives est évidente, mais ces sources sont beaucoup moins souvent mises à jour que l’EPA. Pour un aperçu actuels des marchés du travail du Canada, l’EPA continuera d’être la source la plus à jour. Pour obtenir l’information la plus détaillée sur les marchés du travail du Canada, la voie à suivre consistera à établir des liens avec de vastes ensembles de données. L’appariement des données de recensement avec les données administratives pourraient augmenter la taille de l’échantillon et la granularité de l’information du marché du travail. L’équipe du CIMT et moi avons hâte de travailler avec Statistique Canada pour en faire l’analyse.

Young Jung est économiste au CIMT. Il fournit actuellement un soutien analytique sur un large éventail de questions liées au marché du travail afin d’aider à comprendre et à promouvoir le développement du marché du travail.

Laissez un commentaire Annuler la réponse