Publier

STAT-H-400 Analyse de données multivariées

< Retour

Analyse de données multivariées : Janvier 2017 - 20 Jan 2018

Question 1 : Vous avez des données numériques classées en deux groupes par un expert, expliquez comment créer un modèle à partir de ces données qui permettrait de classer de nouvelles données. Donnez un exemple d'un tel modèle et détaillez-le.

Fallait en gros parler de toute l'intro du Chapitre 5, de la méthodologie de création d'un modèle à la classification supervisée, et donner un exemple de classficiation supervisée (analyse discriminante, regression logistique, plus proches voisins) à détailler. Elle pose des questions assez précises, faut bien comprendre le cours pour y répondre, et elle creuse assez loin.

Question 2 : Elle parcourt le rapport, pose des questions pour que l'on justifie ce qui n'est pas clair et pose plein de questions de cours. Pour moi c'était : definition p-value, coefficients de corrélation et tests de corrélation, détail du test de KS pour les distributions, résumé ACP, différences ACM et ACP, expliquer ACM en partant d'un tableau de contingence.

STAT-H-400 - 19 Jan 2016

1) Expliquez l'utilité de l'ACP et ses principes fondamentaux.
Elle laisse plein de temps pour préparer sur des tableaux, seul, puis quand elle vient elle pose plein de petites questions pour voir jusqu'où on a été dans la matière.

2) Elle passe le rapport en revue et pose des questions.
J'ai eu: que signifie la p-value, comment fonctionne le test khi carré d'indépendance, quelles sont les méthodes de clustering, comment fonctionne la méthode de Ward.

Elle est sympa.

STAT-H-400 - 22 Jan 2010

Rien de très neuf : Parler des avantages/inconvénients des différentes méthodes de clustering et developer l'une d'elle : vous avez largement le temps pour préparer la question,essayer donc déjà d'anticiper ses questions ( Definition et décomposition de l'inertie , définition d'un centroide, etc ) .
Pour les questions : Interpréter l'inertie et dire pourquoi la méthode converge bel et bien .
Seconde partie,vous parcourez le rapport avec elle à vos cotés . Evidemment,certaines choses sont floues,si elle vous les explique,montrez que vous comprenez bien de quoi elle parle en prenant le relais. Pour les tests d'hypothèses,elle demande simplement de savoir quand appliquer tel test,nul besoin de redifinir la statistique associé ( à confirmer cepedant...)
Cet examen et ce cours n'est pas très difficile en soi,mais veillez bien à ne pas le sous estimer.
A bientot 😉

STAT-H-400 - 19 Jan 2010

Première question : à partir de données quantitatives sur une série de tissus, des experts les classent en sains ou malades. Comment faire pour avoir un système de décision basé là-dessus, avec construction et validation du modèle? Décrire un modèle le permettant -> parler du camembert pour la construction/validation, puis choisir un modèle de la partie 2 du cours et développer (plus proches voisins par exemple)
Deuxième question : se ballade dans le rapport et pose des questions du genre "comment calcule-t-on les fréquences attendues pour le test d'indépendance?"

STAT-H-400 - 15 Jan 2010

Première question : modèle pour prédire à partir de données quantitatives si un individu est malade ou pas -> analyse discriminante, Bayes, Fischer, validation, plus proches voisins, etc.
Deuxième question : elle s'est un peu baladé dans tout le rapport, avec des questions sur les p-values, les hypothèses des différents tests, fonctionnement des ACPs... elle passe un peu en revue tout ce qui est pas clair et/ou complètement foireux dans le rapport pour voir si tu sais de quoi tu parles ou pas du tout (indice : généralement c'est pas du tout :p)
Elle est sympa, mais elle lâche pas le morceau quand t'essaye de "discrètement" détourner les questions, ou de rester dans des généralités : elle veut des définitions précises.

STAT-H-400 - 15 Jan 2010

Comme les autres années. Moi j'ai eu:
1. une question test d'hypothèse
2. une question sur acp, acm, cluster dans mes rapports. Elle demande d'expliquer les incohérences ou les manques d'explication

STAT-H-400 - 28 Jun 2008

1) clustering
2) test student

STAT-H-400 - 12 Aug 2007

Question : on a une série de tissus qui sont soit sains soit malins et on a une série de mesures de protéines ou je c plus quoi et on veut, sur base de nouvelles mesures être en mesure de déterminer si le tissu est sain ou malade => très clairement la deuxième partie du cours avec les modèles => expliquer comment on fait un modèle puis l'analyse discriminante factorielle puis l'analyse discriminante décisionnelle et pour finir un petit tour sur les classificateurs bayésiens. Puis une pluie de petites questions avec entre-autre les trucs qu'on a d'office passé comme le diagramme en camenbert pour utiliser un même échantillon pour l'apprentissage et le test du modèle (puisque les données sont chères). On a un peu parlé aussi des plus proches voisins et tout enfin c'est une machine à questions.
Pour la partie sur les labos, ya des postits plein le rapport et c'est parti, elle passe de post-it en post-it (seulement sur la partie du cours non vue avant donc ici la première) et elle cuisine sur les tests avec les hypothèses, la procédure de Dunn, les coefficients de Spearman et Pearson (à savoir qu'en général quand on travaille sur les données on est en paramétrique et sur les rangs en non paramétrique)

STAT-H-400 - 18 Jan 2008

Hey moi j'ai eu une petite mise en situation ou elle me disait que j'avais un tableau de données dont les individus étaient des tissus malades et les variables aléatoires des trucs genre des taux d'expression de protéines. La question était "on voudrait mettre en évidence des groupes parmis les tissus malades"
En gros il fallait tout raconter sur le clustering (chaque technique, comment les embriquer) et moi je lui ai aussi proposé de faire une acp avant ca et elle a trouvé que c'était une bonne idée.
Il faut vraiment tout dire, justifier chaque mot que vous dites expliquer chaque point de chaque graphe que vous dessinez et elle sera ravie.
Pour les tp's elle m'a fait chier avec les différences entre tous les coéficients de corrélation (spearman, pearson, kendal,....)
En bref elle est plutot sympa et elle laisee beaucoup de temps pour préparer.

STAT-H-400 - 12 Jan 2008

Tout connaitre, de la partie sur les tests d'hypothèses à la dernière ligne du cours sur la régression linéaire multiple. Une question sur une des deux parties du cours, et puis questions dans votre rapport sur l'autre partie. Elle creuse dans tout ce que vous dites( hypothèses qu'on fait, ce que signifie chaque terme que vous employez, les coefficients utilisés,etc)
exemples:
Régression linéaire multiple (savoir ce qu’est R)
ACM et détaillez les principes de base de son fonctionnement.
théorème de Bayes (différence entre P (Wk | x) et P (x | Wk) elle s'est également attardée sur la régression logistique et la méthode les plus proche voisins.
clustering, analyse discrimante, etc..


Il n'y a pas de publications plus anciennes.