Modèle vs mannequin

Les variables factices sont incorporées de la même manière que les variables quantitatives sont incluses (en tant que variables explicatives) dans les modèles de régression. Par exemple, si nous considérons un modèle de régression de type Mincer de la détermination salariale, dans lequel les salaires dépendent du sexe (qualitatif) et des années d`éducation (quantitative): une variable factice est une variable dichotomeuse qui a été codée pour représenter une variable avec un niveau de mesure plus élevé. Les variables factices sont souvent utilisées dans la régression linéaire multiple (MLR). Décision: affiliation à un parti politique. Mannequin dépendant: affiliation = 1 si affilié à la partie, 0 si non affilié. Dans les statistiques et l`économétrie, en particulier dans l`analyse de régression, une variable factice (également appelée variable d`indicateur, variable de conception, codage à chaud, indicateur booléen, variable binaire ou variable qualitative [1] [2]) est celle qui prend la valeur 0 ou 1 d`indiquer l`absence ou la présence d`un certain effet catégorique qui pourrait être susceptible de changer le résultat. 3 [4] les variables factices sont utilisées comme dispositifs pour trier les données dans des catégories mutuellement exclusives (comme le fumeur/non-fumeur, etc.). [2] par exemple, dans l`analyse économétrique des séries chronologiques, des variables factices peuvent être utilisées pour indiquer l`occurrence de guerres ou de grèves majeures. Une variable factice peut donc être considérée comme une valeur de vérité représentée par une valeur numérique 0 ou 1 (comme c`est parfois le cas dans la programmation informatique).

En incluant la variable factice dans un modèle de régression cependant, il faut faire attention au piège variable factice. Le piège variable factice est un scénario dans lequel les variables indépendantes sont multicollinéaires-un scénario dans lequel deux ou plusieurs variables sont fortement corrélées; en termes simples, une variable peut être prédite des autres. Les variables factices peuvent être étendues à des cas plus complexes. Par exemple, les effets saisonniers peuvent être capturés en créant des variables factices pour chacune des saisons: D 1 = 1 {displaystyle d_ {1} = 1} si l`observation est pour l`été, et égale à zéro autrement; D 2 = 1 {displaystyle d_ {2} = 1} si et seulement si l`automne, sinon égal à zéro; D 3 = 1 {displaystyle d_ {3} = 1} si et seulement si hiver, sinon égal à zéro; et D 4 = 1 {displaystyle d_ {4} = 1} si et seulement si le ressort, sinon est égal à zéro. Dans les données du panneau, les mannequins d`estimateur d`effets fixes sont créés pour chacune des unités dans les données transversales (par exemple, les entreprises ou les pays) ou les périodes d`une série temporelle regroupée. Toutefois, dans de telles régressions, soit le terme constant doit être enlevé ou l`un des mannequins doit être enlevé, avec sa catégorie associée devenant la catégorie de base contre laquelle les autres sont évalués afin d`éviter le piège variable factice: décision: choix de Occupation. Mannequin dépendant: supervision = 1 si superviseur, 0 si non superviseur. Codage fictif pour une variable catégorielle avec trois catégories, en utilisant athée comme catégorie de référence l`utilisation de données catégorielles dans les modèles de régression multiple est une méthode puissante pour inclure des types de données non numériques dans un modèle de régression. Les données catégorielles font référence à des valeurs de données qui représentent des valeurs de données de catégories avec un nombre fixe et non ordonné de valeurs, par exemple sexe (mâle/femelle) ou saison (été/enrouleur/printemps/automne). Dans un modèle de régression, ces valeurs peuvent être représentées par des variables factices-variables contenant des valeurs telles que 1 ou 0 représentant la présence ou l`absence de la valeur catégorique.