Avertissement : --------------- Les macros SAS de ce répertoire sont des exemples pédagogiques à modifier ou adapter selon les besoins. Les commentaires sont à adresser à mailto:besse@math.ups-tlse.fr. Les documents pédagogiques associés ainsi que des exemples d'utilisation (TP) sont disponibles à partir de l'URL http://lsp.ups-tlse.fr/Besse/Enseignement.html. Les programmes de toutes les macros sont regroupées en un seul fichier macros.sas à exécuter en début de session SAS. Contenu : --------- 1. Techniques factorielles La plupart des macros sont structurées autour d'une méthode. Une première macro exécute l'ensemble des calculs tandis que d'autres sont destinées aux représentations graphiques usuelles mais non diponibles dans SAS. Les paramètres sont documentés dans chaque fichier. 1.1 Analyse en composante principale %acp puis %gacpsx (eboulis des valeurs propres), %gacpbx (boites a moustaches // des composantes), %gacpvx (graphique des variables) %gacpix (graphique des individus). 1.2 Analyse factorielle discriminante %afd puis %gafdvx (graphique des variables) %gafdix (graphique des individus). 1.3 Analyse factorielle des correspondances La procédure corresp est complete et ne demande donc pas de calculs complémentaires. Seuls les graphiques ont été développés avec la convention suivante : les codes des modalités d'une même variables doivent commencer par la même lettre. Cela autorise des graphiques plus lisibles car associant une couleur aux modalités d'une variable. %gafcx : pour les correspondances simples. %gafcix : pour les correspondances multiples avec couleurs et représentation des individus si l'AFCM est calculées par AFC du tableau disjonctif complet (cf. TP data mining). 2. Classification de grands tableaux %choixnc : Enchaînement d'un algorithme de nuées dynamiques avec un très grand nombre de classes suivi d'une classification ascendante hiérarchique de ces classes pour aider au choix "optimal" de leur nombre. %critere Calculs et graphiques des criteres de choix du nombre de classes. %nudnc (nuees dynamiques) %cah (classification ascendante hierarchique), Lorsqu'une ACP (%acp) est exécutée à la suite d'une classification, %gacpixm fournit une réprésentation des individus par leur numéro de classes. 3. Rééchantillonnage Validation croisée en analyse discriminante (%vc1disc, %vc2disc) et en régression logistique (%vc1logit, %vc2logit). Soit classique par suppression d'une observation, soit par itérations de tirages aléatoires d'un échantillon de validation (taux de 20% par défaut). Construction,à partir d'une table SAS, d'une nouvelle table contenant un échantillon par tirage aléatoire simple (%aleasimp) ou un échantillon bootstrap (%bootstrp). 4. Divers %tprow : Calcul de la matrice des coefficients de Tchuprow entre plusieurs variables qualitatives et de leurs distances déduites (%dtprow). %epsf : ouverture d'un fichier à utiliser avant des commandes graphiques. Ce fichier recevra les commandes postscript générées. %vlambda : reconstruction d'une matrice après décomposition en valeurs singulières.