FAQ SASConsultez toutes les FAQ

Nombre d'auteurs : 13, nombre de questions : 308, dernière mise à jour : 5 avril 2016  Ajouter une question

 

Cette F.A.Q., qui traite de tout type de questions portant sur l'outil SAS, a été réalisée à partir des contributions des membres des forums sas de developpez.com en vue de répondre à des questions fréquemment posées par les utilisateurs et grâce à SAS France qui a bien voulu nous donner accès à ses sources.

Si vous désirez contribuer à l'amélioration de cette F.A.Q., vous pouvez participer au billet de participation à l'enrichissement de la faq SAS , ou contacter le responsable SAS , ou contacter un des responsables de l'équipe Business Intelligence .

Nous espérons que cette F.A.Q. saura répondre à un maximum de vos questions. Nous vous souhaitons une bonne lecture.

L'équipe SAS de developpez.com remercie les contributeurs actuels : ash_rmy , bahraoui , datametric , fafabzh6 , Fleur-Anne.Blain , green_fr , oncle_pete , raf64flo , rastoix , s_a_m et steelspirit .

L'équipe SAS de developpez.com remercie aussi claudeLeloup et jacques_jean pour leurs relectures attentives de la F.A.Q. dans le but de chasser les fautes d'orthographes.


SommaireStatistiquesRégression et classification (26)
précédent sommaire suivant
 

SS1 :

  • Somme des carrés des erreurs séquentielles.
  • Chaque effet est ajouté l'un après l'autre au modèle général.

Exemple : Modèle Y fonction de A, B, C et A*B

Terminologie

  • A, B, C et A*B constituent les variables explicatrices ou effet.
  • A, B et C sont des effets simples issus donc d'un seul terme A, B et C respectivement.
  • A*B est un effet composite, c'est-à-dire issu de deux termes A et B.
  • La somme des carrés des écarts SS est définie par la formule suivante :
    SS(Y) = SS(A, B, C, A*B / constante)
  • Alors, les SS1 sont définies comme suit :
    SS1(A) = SS(A / constante)
    SS1(B) = SS(B / constante, A)
    SS1(C) = SS(C / constante, A, B)
    SS1(A*B) = SS(A / constante, A, B, C)

Caractéristiques des SS1 :

  • SS(Y) = SS1(A) + SS1(B) + SS1(C) + SS1(A*B)
  • Les SS1 sont statistiquement indépendantes les unes des autres si les erreurs sont indépendantes et normalement distribuées.
  • Les SS1 dépendent de l'ordre dans lequel les effets sont inclus dans le modèle général.
  • Les SS1 sont utiles en particulier dans le cas des modèles polynomiaux pour connaître la contribution d'un terme de degré (n+1) par rapport au modèle général de degré n.
  • Les hypothèses de significativité des SS1 testées diffèrent selon que les données sont équilibrées ou pas (valeurs manquantes ou non).


SS2 : elle est dérivée de la différence entre les sommes des carrés des écarts des sous-modèles correspondants.

L'erreur de type 2 d'un effet donné est en fait la différence d'erreur due à l'ajout de cet effet dans le modèle une fois que tous les autres effets ont été ajoutés au modèle général, excepté les effets composites.

Alors, les SS2 sont définies comme suit :

  • SS2(A) = SS(A / constante, B, C)
  • SS2(B) = SS(B / constante, A, C)
  • SS2(C) = SS(C / constante, A, B)
  • SS2(A*B) = SS(A*B / constante, A, B, C)

Caractéristiques des SS2 :

  • SS(Y) n'est pas égale à SS2(A) + SS2(B) + SS2(C) + SS2(A*B).
  • Les hypothèses de significativité des SS2 testées n'incluent pas nécessairement les paramètres des autres effets excepté pour les effets composites.
  • Les SS2 ne dépendent pas de l'ordre d'introduction des effets dans le modèle général.
  • Les hypothèses de significativité des SS2 testées diffèrent selon que les données sont équilibrées ou pas (valeurs manquantes ou non).


SS3 - 4 : somme des carrés des erreurs partielles.

Chaque effet est testé séparément par rapport au modèle général. Ce sont les sommes des carrés des écarts les plus intéressantes et les plus exploitées. En l'absence de valeurs manquantes (données équilibrées), SS3 et SS4 sont égales.

Alors, les SS3-4 sont définies comme suit :

  • SS3-4(A) = SS(A / constante, B, C, A*B)
  • SS3-4(B) = SS(B / constante, A, C, A*B)
  • SS3-4(C) = SS(C / constante, A, B, A*B)
  • SS3-4(A*B) = SS(A*B / constante, A, B, C)

Caractéristiques des SS3 - 4 :

  • SS(Y) n'est pas égale à SS3-4(A) + SS3-4(B) + SS3-4(C) + SS3-4(A*B).
  • Les hypothèses de significativité des SS3-4 testées n'incluent pas nécessairement les paramètres des autres effets excepté pour les effets composites.
  • Les SS3-4 ne dépendent pas de l'ordre d'introduction des effets dans le modèle général.
  • Les SS3 et SS4 diffèrent uniquement si les données sont déséquilibrées (valeurs manquantes présentes). Dans ces cas-là, SS3 conserve l'orthogonalité tandis que SS4 conserve l'équilibre des données, c'est à dire contrebalance le déséquilibre des données.

Le type de somme des carrés des écarts à considérer dépend de ce que l'on souhaite étudier. Dans le cas d'une régression linéaire classique, valeurs explicatives continues, SS2, SS3 et SS4 sont identiques. Dans le cas d'une analyse de variance, valeurs explicatives nominales, SS1, SS2, SS3 et SS4 peuvent être utiles toutes les quatre.

Mis à jour le 11 décembre 2009 sas

Il est possible de générer les variables indicatrices relatives à une variable catégorielle grâce à une étape data, ou encore grâce à la proc TRANSREG.

Un exemple des deux méthodes est présenté ci-dessous dans le cas d'une variable catégorielle, notée 'Trait', à trois modalités 'A', 'B' et 'P'.

1- Avec une étape data, il est dans les habitudes d'utiliser le code synthétique suivant :

Code sas : Sélectionner tout
1
2
3
4
5
6
title 'Création de variables indicatrices'; 
data Maladie ; 
set Maladie ; 
TraitA = (Trait='A') ; 
TraitB = (Trait='B') ; 
Run ;
2- Avec la proc TRANSREG, il faut utiliser l'option DESIGN et l'instruction MODEL CLASS en précisant la variable catégorielle :

Code sas : Sélectionner tout
1
2
3
4
5
6
title 'Création de variables indicatrices'; 
proc transreg data=Maladie design; 
model class(Trait); 
id Age Duree Gueri; 
output; 
run;
Dans ce cas, les variables indicatrices sont générées dans une table Datan.

Mis à jour le 15 novembre 2011 sas

Proposer une nouvelle réponse sur la FAQ

Ce n'est pas l'endroit pour poser des questions, allez plutôt sur le forum de la rubrique pour ça


Réponse à la question

Liens sous la question
précédent sommaire suivant
 

Les sources présentées sur cette page sont libres de droits et vous pouvez les utiliser à votre convenance. Par contre, la page de présentation constitue une œuvre intellectuelle protégée par les droits d'auteur. Copyright © 2020 Developpez Developpez LLC. Tous droits réservés Developpez LLC. Aucune reproduction, même partielle, ne peut être faite de ce site et de l'ensemble de son contenu : textes, documents et images sans l'autorisation expresse de Developpez LLC. Sinon vous encourez selon la loi jusqu'à trois ans de prison et jusqu'à 300 000 € de dommages et intérêts.