Composition de l’équipe
Sohana Dhinsa, Salma Ibrahim, Mehak Sahjwani, Sneha Latha Parasuraman
Résumé du projet
HOUSED est un outil de simulation propulsé par l’apprentissage automatique qui aide les refuges et les autorités publiques à anticiper le nombre de personnes qui se retrouveront à la rue au cours de la prochaine année. En fournissant des prévisions fondées sur les données, HOUSED favorise une planification en amont et une prise de décision éclairée afin de garantir une meilleure répartition des ressources et une optimisation des services d’aide et de soutien.
Mots-clés
Itinérance, régression, prédictions fondées sur les données, prévisions
Lien vers la présentation
Contexte
À Edmonton comme ailleurs au Canada, l’itinérance est un enjeu pressant qui ne cesse de s’aggraver. Cette situation ne peut être expliquée par une cause unique, mais découle d’un ensemble complexe de facteurs socioéconomiques. Selon le dénombrement Tout le monde compte 2020-2022 effectué par le gouvernement du Canada, le nombre de personnes en situation d’itinérance à l’extérieur des refuges a grimpé de 88 % entre 2020 et 2022, ce qui rend compte de la détérioration de cette crise. Selon plusieurs critiques récentes des systèmes d’entrée coordonnés, cette hausse s’expliquerait par des inégalités d’accès aux services, le manque de fiabilité des outils d’évaluation, l’inefficacité des stratégies d’intervention et la difficulté à orienter les personnes vers un logement réellement adapté à leurs besoins (source : « Coordinated Access and Coordinated Entry System Processes in the Housing and Homelessness Sector: A Critical Commentary on Current Practices »).
Plus que des chiffres, ces lacunes systémiques touchent de réelles vies humaines. Privées de logement sûr et de soutien adéquat, les personnes en situation d’itinérance doivent composer avec des traumatismes, la pauvreté, des troubles de santé mentale, la dépendance ou même des maladies graves, tout en faisant face à la discrimination, au racisme et à la criminalisation. Elles sont trop souvent jugées « indésirables, à risque ou difficiles à prendre en charge », au point que plusieurs en viennent à intérioriser leur statut de personnes itinérantes, convaincues que le système lui-même les maintient dans cette impasse : « Les gens ont accepté leur situation, ils vivent dans la rue, ils s’identifient comme itinérants. Ils ont le sentiment que le système les maintient là où ils sont, et il est difficile de les convaincre de passer à autre chose » (Quirouette, M. [2016]. « Managing Multiple Disadvantages »).
Cet enjeu est exacerbé par un manque de données fiables et comparables, qui freine la capacité d’action concertée des autorités et des acteurs et actrices de première ligne. Condamnées à des nuits froides et à une existence précaire, privées de la dignité d’un toit qu’elles peuvent appeler leur chez-soi, trop de personnes passent entre les mailles du filet. Notre projet ne se limite pas à un simple exercice d’analyse des données, mais vise à outiller les autorités afin qu’elles puissent tenir compte des tendances socioéconomiques pour prendre des décisions rapides et éclairées, propres à aider les gens à enfin sortir de l’itinérance.
Liste des technologies utilisées
Pile technologique
- Langages et cadres : Python (Pandas, NumPy, Scikit-Learn, Matplotlib, Seaborn)
- Environnement de développement : Jupyter Notebook
- Sources de données : portail de données ouvertes de la Ville d’Edmonton, Société canadienne d’hypothèques et de logement (SCHL), bases de données du gouvernement de l’Alberta
- Gestion des versions et collaboration : Google Docs, Google Collab, Notion
Développement du projet
Le projet HOUSED a été élaboré en trois grandes étapes. La première étape a consisté à mener des recherches sur le volet éthique et à consulter les parties prenantes. Des membres de notre équipe ont communiqué avec des refuges et organismes de bienfaisance pour personnes en situation d’itinérance, tout en sollicitant l’avis d’un comité d’éthique pour encadrer rigoureusement notre démarche. Nous nous sommes rendues dans divers refuges de la région pour rencontrer les acteurs et actrices de première ligne engagés dans la lutte contre l’itinérance dans notre ville.
La deuxième étape a consisté à recueillir les données nécessaires à l’analyse. Nous avons réuni des informations provenant de sources fiables telles que le gouvernement de l’Alberta, le gouvernement fédéral, Statistique Canada et le Conseil canadien de l’itinérance. Nous avons recherché des données concernant les taux de pauvreté, de chômage et d’inoccupation des immeubles, puis les avons converties en un jeu de données chronologiques conforme aux exigences de notre modèle.
Enfin, nous sommes passées à l’étape de la modélisation. Nous avons utilisé un modèle de régression linéaire afin de prédire les variations de la population en situation d’itinérance selon divers contextes économiques. Par exemple, notre outil permet aux décideuses et décideurs — nos principaux utilisateurs — d’évaluer l’impact potentiel d’une hausse de 10 % du taux de pauvreté et d’une baisse de 15 % de l’emploi sur l’augmentation du nombre de personnes dans la rue. HOUSED offre ainsi une méthode inédite pour aborder l’itinérance, en mettant la puissance des modèles d’IA au service de la prédiction de scénarios.
Impact et innovation
Nous avons relevé un manque flagrant de solutions pour contrer le problème de l’itinérance. Celles qui sont en place se résument à des interventions de dernière minute pour composer avec une population itinérante toujours croissante. L’originalité de HOUSED réside dans son approche proactive : en exploitant les capacités prédictives de l’apprentissage automatique, l’outil offre aux autorités des données éclairantes pour concevoir des initiatives et des lignes directrices réellement porteuses. Conçu pour identifier les facteurs socioéconomiques les plus déterminants, notre modèle fournit aux responsables des informations claires et exploitables. Au lieu d’utiliser des modèles opaques de type « boîte noire », nous avons opté pour une approche par régression linéaire afin que les pouvoirs publics puissent facilement mesurer le poids de chaque variable dans les prévisions. Cette méthode garantit des résultats limpides, accessibles et directement utilisables aux fins de l’élaboration de politiques éclairées.
Défis
Notre principal défi a été de réunir des données fiables, précises et suffisamment volumineuses pour entraîner le modèle. Plusieurs ensembles de données étaient incomplets, désuets ou incompatibles avec nos exigences. Au lieu d’inventer des chiffres ou de gonfler artificiellement nos données, nous avons misé sur la qualité plutôt que sur la quantité et n’avons retenu que les données dignes de confiance. Un autre défi de taille a consisté à déterminer les facteurs socioéconomiques à intégrer. Pour ce faire, nous avons soumis chaque facteur à une analyse poussée en examinant sa corrélation avec l’itinérance afin de dégager les grandes tendances et de retenir les facteurs les plus déterminants pouvant constituer un jeu de données à la fois fiable et précis.
Un autre défi majeur a été de composer avec les considérations éthiques liées aux données et aux retombées concrètes du projet sur le terrain. Nous avons tenu plusieurs rencontres avec Rose Landry, gestionnaire, Gouvernance de l’IA, Affaires juridiques et gouvernance de l’IA chez Mila, afin de discuter des risques et des stratégies d’atténuation possibles. Nous avons également mené une recherche approfondie sur les meilleures pratiques en matière d’IA éthique et échangé avec des personnes œuvrant dans des refuges, des représentantes et représentants du secteur public et des ONG travaillant directement auprès des populations en situation d’itinérance. Ces entretiens nous ont permis de recueillir une diversité de points de vue sur la réalité des personnes que notre projet vise à soutenir, dans le but de garantir une démarche avisée et responsable.
Sur le plan technique, l’un de nos principaux défis a consisté à intégrer la variable « année » dans notre modèle de régression linéaire qui, par défaut, ne reconnaît pas la dimension temporelle. Après avoir consulté notre mentor et notre assistante d’enseignement, nous avons décidé d’utiliser des variables différées pour représenter efficacement la progression dans le temps. Nous avons également testé d’autres modèles, dont les réseaux MLCT (réseau à mémoire à long et court terme) et les forêts aléatoires, pour voir si la précision s’en trouvait améliorée. En fin de compte, la régression linéaire a surpassé les autres approches en produisant les résultats les plus exacts pour notre jeu de données.
Ce que nous avons appris et accompli
Ce projet nous a permis d’évoluer aussi bien sur le plan technique que sur le plan humain. Pour le volet technique, nous avons approfondi plusieurs concepts liés à l’apprentissage automatique, examiné leurs forces et faiblesses, et appliqué un modèle de régression linéaire enrichi par une sélection rigoureuse des variables, une analyse des résidus et des variables différées afin d’optimiser la qualité des prédictions.
Travailler ensemble a été l’un des meilleurs aspects du projet. Notre équipe, hautement collaborative, a su mettre à profit les forces de chacune — qu’il s’agisse de la préparation des données, de la modélisation ou des échanges avec les utilisateurs et utilisatrices. L’une des étapes marquantes a été notre rencontre avec des refuges locaux, qui nous ont fourni un éclairage concret et confirmé que les résultats de notre modèle étaient en phase avec la réalité du terrain.
Plus que tout, nous avons pris conscience de la responsabilité éthique inhérente à la science des données appliquée aux enjeux sociétaux. Nous avons privilégié la transparence afin que chacun et chacune puisse comprendre comment les prédictions étaient établies. Nous avons également veillé à limiter les biais dans les données, sans jamais perdre de vue que derrière chaque donnée se trouve une vraie personne. Cette prise de conscience a orienté chacune des décisions que nous avons prises en cours de route.
Prochaines étapes
Nous avons eu un immense plaisir à travailler ensemble sur ce projet. Cette belle expérience nous a révélé les retombées positives que peuvent avoir l’intelligence artificielle et l’apprentissage automatique. Nous avons aussi découvert qu’une équipe soudée et passionnée peut accomplir de grandes choses. Nous avons énormément appris les unes des autres, ce qui nous a permis de grandir à la fois comme personnes et comme équipe. Ce projet, cette équipe et ce laboratoire occuperont toujours une place spéciale dans nos cœurs.
Remerciements et Références
Remerciements
Ce projet n’aurait été possible sans l’aide et les conseils de nombreuses personnes formidables. Nous tenons d’abord à remercier notre assistante d’enseignement, Rohini Das, et notre mentor, Rafael Madrigal, qui nous ont accompagnées à chaque étape et qui ont su nous offrir des commentaires précieux tout au long du processus. Nous tenons également à remercier nos autres assistants d’enseignement, Afia Afrin et Jake Tuero, de même que James Dang, chef de produit à l’Amii, et Rose Landry, gestionnaire, Gouvernance de l’IA, Affaires juridiques et gouvernance de l’IA à Mila, pour leurs conseils et leur expertise.
Toute notre gratitude va à Jennifer Addison, à Yorsa Kazemi, à Juliana Virani, à Erika Hudon-Kaide, à Warren Johnston et à tous les autres qui ont soutenu ce programme, de même qu’à Kashish Aggarwal pour ses conseils précieux, et à l’équipe de l’Amii, qui a écouté notre présentation avec patience et encouragements. Merci aussi à Heba Iftikhar et à Jean Bruce Koua, qui ont aidé à nous mettre en relation avec les bonnes personnes. Nous avons grandement apprécié nos échanges avec Brett Case, directeur des services de soutien au logement, Jennifer Legate, gestionnaire des initiatives liées aux politiques de programmes au sein du gouvernement de l’Alberta, et Dan Zimmerman, responsable communautaire chez Boyle Street Community Services.
Enfin, nous remercions chaleureusement le CIFAR, Google DeepMind, Mila – Institut québécois d’intelligence artificielle, l’Alberta Machine Intelligence Institute (Amii), l’Institut Vecteur, la Manuvie, Osmo et tous nos autres commanditaires d’avoir rendu ce projet possible.
Références
- Ecker, J., Brown, M., Aubry, T., Pridham, K. F., & Hwang, S. W. (2022). « Coordinated Access and Coordinated Entry System Processes in the Housing and Homelessness Sector: A Critical Commentary on Current Practices », Housing Policy Debate, vol. 32, no 6, p. 876-895. https://doi.org/10.1080/10511482.2022.2058580
- Ahajumobi, E. N. (2017). Homelessness in Calgary From the Perspectives of Those Experiencing Homelessness (Order No. 10641408). Accessible à partir de la Canadian Business & Current Affairs Database; ProQuest Dissertations & Theses Global. (2002280126). https://login.ezproxy.library.ualberta.ca/login?url=https://www.proquest.com/dissertations-theses/homelessness-calgary-perspectives-those/docview/2002280126/se-2
- Quirouette, M. (2016). « Managing Multiple Disadvantages: The Regulation of Complex Needs in Emergency Shelters for the Homeless », Journal of Poverty, vol. 20, no 3, p. 316-339. https://doi.org/10.1080/10875549.2015.1094774
- Logement, Infrastructures et Collectivités Canada (2022). Tout le monde compte 2020-2022 : Résultats du troisième dénombrement ponctuel coordonné de l’itinérance au Canada à l’échelle pancanadienne. https://logement-infrastructure.canada.ca/homelessness-sans-abri/reports-rapports/pit-counts-dp-2020-2022-results-resultats-fra.html
- Edmonton Social Planning Council. E4: Number of Homeless Persons, Edmonton City. https://edmontonsocialplanning.ca/social-well-being/e-built-environment/e4-built-environment/
- Logement, Infrastructures et Collectivités Canada. Tableau 2.2.31 : Statistiques du marché de la location pour l’Alberta. https://www03.cmhc-schl.gc.ca/hmip-pimh/fr - Profile/1/1/Canada
- Gouvernement de l’Alberta. Employment rate. Alberta Economic Dashboard. https://economicdashboard.alberta.ca/dashboard/employment-rate/
- Gouvernement de l’Alberta. Unemployment rate. Alberta Economic Dashboard. https://economicdashboard.alberta.ca/dashboard/unemployment-rate/
- Community Research Group. Edmonton poverty rates data [Google Sheets]. https://docs.google.com/spreadsheets/d/1Id1-Y1w5ulbcfNF3cK4Q8q_BcGcQyUXc/edit?gid=346873818
- Statistique Canada. Statistiques du faible revenu selon l’âge, le sexe et le type de famille économique [tableau 11-10-0135-01]. https://www150.statcan.gc.ca/t1/tbl1/fr/tv.action?pid=1110013501&request_locale=fr
- Gouvernement du Canada (24 juillet 2025). Taux annuels d’insolvabilité. Portail gouvernement ouvert. https://ouvert.canada.ca/data/fr/dataset/0e52f1b0-089a-430e-bbd1-1367d7328a2e
- Statistique Canada (2023). Profil du recensement, Recensement de la population de 2021. Catalogue de Statistique Canada no 98-316-X2021001. https://www12.statcan.gc.ca/census-recensement/2021/dp-pd/prof/index.cfm?Lang=F