Solutions immobilières
Moteur d'estimation de prix et loyer : analyse des performances
- Quelles sont les performances du moteur d’estimation de Yanport ?
- Y a-t-il des différences de performance en fonction de la zone géographique, de la typologie ou encore du marché ?
- Comment ces performances se répercutent-elles sur l’indice de fiabilité ?
Cette analyse répond à ces questions en toute transparence. En particulier, nous décomposons les performances de notre moteur d’estimation suivant le marché (location, transaction), la typologie (maison, appartement) et le département. Côté transaction, l’erreur médiane est de 8.87% pour les appartements et 11.18% pour les maisons. Pour la location, ces erreurs sont respectivement de 6.70% et 7.20%.
Nous montrerons également le lien des performances avec notre indice de fiabilité compris entre 0 et 100. Nous avons notamment observé qu'à mesure que le score de fiabilité augmente, l'erreur médiane, sur des biens non utilisés dans l'estimation du modèle, diminue. Ce résultat clair fait de notre indice de fiabilité, ainsi que de la fourchette d’estimation, des outils précieux pour nos utilisateurs.
Le moteur d’estimation de Yanport : pointu, interprétable et transparent
L’offre de moteurs d’estimation immobilière a explosé ces dernières années à la suite de la multiplication des sources de données et de la démocratisation de méthodes statistiques avancées au sein des entreprises. Il peut être difficile de s’y retrouver d’autant que les sociétés proposant des moteurs d’estimation ne communiquent que très peu sur les performances de ces derniers.
Fort d’un historique de données unique, sur le locatif comme sur la transaction, l'équipe Yanport a développé un algorithme basé sur l’état de l’art de l’apprentissage automatique (machine learning) et de l’intelligence artificielle. Cette méthode permet d’une part, d’extraire un maximum d’informations pertinentes et d’autre part, de découper finement l’ensemble de données en fonction de l’adresse, de la typologie ou d’autres caractéristiques des biens.
Dans une précédente analyse, nous mettions en évidence l’importance de l’interprétabilité des estimations ainsi que la façon dont notre solution permet aux utilisateurs de comprendre l’effet des caractéristiques sur le loyer ou le prix estimé. Sachant qu’aucun algorithme n’est parfait, un autre élément fondamental, et tout autant gage de transparence, implique une prise de recul sur les performances des modèles et l’évaluation des estimations fournies. C’est le rôle de notre indice de fiabilité qui, comme nous le verrons plus bas, donne une idée de l’erreur potentielle associée à une estimation.
Analyse des performances : la localisation, la typologie et le marché
Parmi les sources potentielles d'erreurs dans une estimation, on retrouve la dispersion élevée de la variable que l'on cherche à estimer, ou encore un nombre d'observations trop faible. Ces règles s'appliquent évidemment aussi bien à l’estimation des loyers qu’à l’estimation des prix. Prenons la distinction entre location et transaction. Même s’ils sont interconnectés, comme nous l’avons illustré dans notre article sur la tension de marché, la dispersion des loyers est différente de celle des prix. Ne serait-ce que parce que les loyers sont plus souvent réglementés (avec l’encadrement), ou encore parce que certaines caractéristiques, influençant le loyer ou le prix, sont moins variées en location. Par exemple, l'ensemble des biens mis en location ne contient normalement pas de biens à rénover ou de passoires énergétiques (en tout cas de moins en moins). Ou encore, sur l’ensemble des maisons en vente, la surface de terrain est beaucoup plus variable que sur l’ensemble des maisons en location. En quelques mots, une plus grande diversité de caractéristiques entraîne une plus grande dispersion de loyers/prix et donc un besoin de plus d’observations (de qualité) pour estimer les relations entre les variables.
Ainsi, l’erreur médiane de notre moteur d’estimation est de 6.81% pour la location et de 10.67% pour la transaction. Le tableau ci-dessous montre que l’erreur d’estimation dépend de la typologie du bien. Côté location, l’erreur médiane est de 6.70% pour les appartements et 7.20% pour les maisons. Pour la transaction, ces erreurs sont respectivement de 8.87% et 11.18%.
Tableau 1 | Erreur médiane d’estimation par type de bien et marché (en %)
Tableau 2 | Location : meilleures et pires performances par département (erreur médiane en %)
Tableau 3 | Transaction : meilleures et pires performances par département (erreur médiane en %)
Les cartes ci-dessous permettent de visualiser les erreurs médianes par marché, département et type de bien pour la France métropolitaine. Notons que les échelles entre la location et la transaction sont différentes.
Figure 1 | Location : erreur absolue médiane par département et type de bien
Figure 2 | Transaction : erreur absolue médiane par département et type de bien
Un indice de fiabilité pertinent
Bien souvent les indices de fiabilité sont difficiles à interpréter. Notre score de fiabilité (allant de 0 à 100) se base sur l’erreur observée sur des biens similaires ainsi que sur un intervalle de confiance produit par notre moteur d’estimation. Pour évaluer la performance du score de fiabilité, nous proposons d’observer l’erreur médiane effectuée par tranche de 10 sur l'échelle du score. Un score de 0 à 10 est associé, sur notre échantillon, à une erreur médiane de 17% pour la location et de 21.4% pour la transaction. À l’opposé, un score de 90 à 100 est associé à une erreur médiane de 2.1% pour la location et de 1.5% pour la transaction. Ce graphique illustre ainsi la pertinence de notre score de fiabilité et peut servir de grille de lecture aux utilisateurs de notre moteur d’estimation.
Figure 3 | Erreur absolue médiane par groupe de score de fiabilité
📄 Pour télécharger cette note au format PDF, cliquez ici