|
Auteur | Sujet : [Topic Unique] Statistiques descriptives, inférentielles & dataviz |
---|
Rasthor | Reprise du message précédent : |
Publicité | Posté le 16-09-2016 à 16:17:03 |
Rasthor | Oui, je pourrais aussi mettre un Khi2. Je l'ai d'ailleurs teste, les resultats sont vraiment tres proches.
|
lefilpourpre Michel | Drap ici le nouveau Dioscur. --------------- Miraisin |
Profil supprimé | Posté le 19-09-2016 à 09:51:21
|
lefilpourpre Michel | #compétition entre différents modèles Alors ... j'ai une question assez pointue (je m'adresse en particulier à Magic Panda, Heisenberg et CobbDouglas) à propos des instruments de mesure de la performance d'un modèle prédictif. DONC : Je souhaite faire une compétition entre les trois modèles uni-variés (VAR, ARIMA, MCE) destinés à prédire la grandeur exogène "Valeur ajoutée brute du secteur de la construction en France" ... à partir de ses valeurs passées. Pour ce faire. Je souhaite prendre comme critère la précision (la somme des erreurs la plus réduite ndlr) des trois fits que j'ai effectués avec ces modèles axés sur le passé. Je souhaite m'inspirer de la méthodologie de Box et Jenkins (qui sont les auteurs les plus célèbres du champ d'analyse des séries temporelles avec leur méthode des années 70 si populaire qui sert à fitter un ARIMA sur une courbe auto-corrélée saisonalisée et non-stationnaire). https://en.wikipedia.org/wiki/Box%E [...] g_approach Nota : Pourquoi ne pas prendre un ARCH ? Les modèles ARCH sont spécialisés dans le fit de séries hétéroskedastiques ... c'est à dire (techniquement) des séries dont les variabilités changent drastiquement au cours du temps ... c'est à dire que dans la réalité ils ont été conçus pr des séries financières. Précisions : ces dernières sont volatiles pour des raisons à la fois irrationnelles (micro-paniques généralisées type Brexit) et rationnelles (les résultats des grands groupes boursiers sont transmis annuellement par les DAF de ces grosses entités ce qui fait que leurs cours boursiers sont régulièrement victimes de brusques variations). /Nota. Or moi j'utilise des VAR, MCE et ARIMA car ce sont des grandeurs économiques. C'est à dire qu'elles sont ancrées dans la réalité d'une société qui change, certes, mais de façon lente. Maintenant. J'ai une question très précise. La méthode de Box et Jenkins est associée à la sélection des paramètres (p,d,q) d'une seul instrument ARIMA (séries non-stationaires) avec le AIC et le BIC. https://fr.wikipedia.org/wiki/Crit% [...] d%27Akaike Je souhaite reprendre ce fonctionnement en mesurant la performance avec des formules (dans l'idée c'est proche d'un R² ou de AICs ou BICs) dites : - RMSE (le plus populaire et fréquemment utilisé) http://faculty.weatherhead.case.ed [...] asures.pdf Mais sur mes trois instruments différents (MCE, VAR, ARIMA). Mais d'après ma lecture de ce post ... http://forums.cirad.fr/logiciel-R/ [...] f=11&t=221 (post 11 sept 2006 15:25) ... Et des sources sur le forum francophone du CIRAD : *ils* utilisent tous ces critères AIC pour la comparaison de modèles non-nichés de régressions. https://perso.univ-rennes1.fr/berna [...] %A9s%22%22 Dans leur langage ... "les instruments type AIC et BIC sont limités à l'analyse d'une même distribution". Par extension je pense que c'est le cas pour mes trois formules (RMSE, PdRAE, MdAPE) ... mais dans les articles que j'ai lus les textes répètent cette phrase ("exclusivement efficace pour une même distribution" ) sans que je ne puisse en percer le sens exact : => Quand je lis que ces outils (RMSE, MdRAE, MdAPE) ne servent que de comparaison pour l'analyse "d'une même distribution " ... ils désignent un type de distribution ?! (Gauss, Khi² ...) ou alors ils désignent exactement la série analysée ?! (ici la grandeur "valeur ajoutée de la construction en France " ) ou alors ils parlent de la distribution probabiliste utilisée par l'instrument (VAR, ARIMA, MCE) pour calculer les paramètres ?! Indice : vu que ce sont des formules extrêmement intelligentes assises sur l'idée de la somme des erreurs entre la grandeur et les points de la courbe construite par l'instrument ... je pense que ça ne change rien à rien qu'on change d'instrument vu que c'est bien l'équation de la courbe qui est visée et que par conséquent je peux comparer les résultats ... mais au vu de la gravité potentielle de cette erreur de raisonnement je souhaite vérifier. (avant que les grands décideurs de l'hexagone ne réalisent que je suis une sorte de tanche en stats ) Message cité 1 fois Message édité par lefilpourpre le 21-09-2016 à 19:35:02 |
lefilpourpre Michel |
1) je pense qu'il existe forcément une procédure documentée pour un machin aussi peu complexe Message cité 1 fois Message édité par lefilpourpre le 22-09-2016 à 15:05:20 |
Kaffeine Noisette | Pour le mec avec la table de contingence : https://www.researchgate.net/post/A [...] _2_groups2
|
HeisenberG75 www.savewalterwhite.com |
Tu connais un moyen graphique de comparer de modèles ? (Que ce soit chacun sur son graph ou les 3 modèles sur le même graph) Car la je vais sortir pour chacun de mes modèles le rmse, mape, mae.. et prendre le celui qui est le plus performant mais un graphique peut-être sympa aussi Ps : souvent utilisé aussi il y a le coefficient de theil pour mesurer la qualité de prédiction |
Publicité | Posté le 22-09-2016 à 15:23:07 |
lefilpourpre Michel | Merci pr les infos Message édité par lefilpourpre le 22-09-2016 à 15:46:39 |
Rasthor |
Tu penses bien que j'ai fait des recherches, mais rien de trouve de concret pour le moment. Peut-etre que je n'utilise pas les bons mot-cles. C'est pour ca que j'ai ecrit ici, dans l'espoir que quelqu'un aurait deja rencontre ce genre de problème.
Merci. Mais j'ai l'impression que les tests qu'ils proposent ne donne qu'une unique p-value pour l'ensemble du tableau. Or je voudrais une p-value par cellule.
|
lefilpourpre Michel | R²et RMSE Message cité 1 fois Message édité par lefilpourpre le 23-09-2016 à 12:39:25 |
Profil supprimé | Posté le 26-09-2016 à 18:54:44 drapal |
Profil supprimé | Posté le 05-11-2016 à 22:53:25 Existe-t-il des MOO francophones concernant une remise à niveau en maths, stats proba niveau terminale ou L2 en sciences eco svp? |
radioactif Mighty mighty man |
--------------- "La physique, c'est les mathématiques du branleur curieux"© | "Les gens ont tellement peur d'avoir un futur pourri qu'ils se font facilement a l'idee d'avoir un present de merde, en somme"© |
Profil supprimé | Posté le 08-11-2016 à 17:52:16
|
Rasthor | Bonjour, J'ai une petite question: J'ai une matrice de 500 observations (lignes) et 40 features (colonnes). Je n'ai aucune idée si mes observations peuvent se grouper ou pas. J'ai fait un clustering, d'abord en estimant le nombre de clusters avec la methode Affinity Propagation: J'obtiens 20 clusters, que je passe ensuite dans K-means. (J'ai aussi manuellement réduit a 3, 5 ou 10, ca a l'air de bien marcher).
Message édité par Rasthor le 06-12-2016 à 20:23:49 |
Darmstadtium Pipoteur grotesque | PCA est justement un algorithme de réduction de dimension non supervisé, donc que tu n'aies pas de groupe n'est pas un problème (ça le serait pour LDA par contre).
--------------- Vous pourriez comprendre ainsi pourquoi l'isotropie peut être détournée de son enclave de finalité dès le postulat de base choisie. surunitairedream - 09/06/2013 -- Contrepets |
rd350 |
rd350 |
Rasthor |
|
Bébé Yoda |
|
Rasthor |
|
Bébé Yoda | Oui ça me semble plus logique. Je suis sur secteur Grenoblois, le seul soucis c'est que ça manque d'offres en ce moment, mais je ne suis pas pressé pendant ce temps je continue à me former tranquille |
Rasthor |
Message édité par Rasthor le 01-05-2017 à 11:28:08 |
Bébé Yoda | Salut les statisticiens,
|
Rasthor |
Message édité par Rasthor le 01-05-2017 à 16:02:23 |
cassiopella | Pourquoi il n'y plus de lien vers les masters?
|
Bébé Yoda |
|
Rasthor |
|
cassiopella |
Message cité 1 fois Message édité par cassiopella le 01-05-2017 à 21:08:52 |
Bébé Yoda |
Message édité par Bébé Yoda le 01-05-2017 à 23:16:44 |
Bébé Yoda |
|
Bébé Yoda | Bon, j'ai fait mon petit exercice, j'ai collecté les notes sur tripadvisor qui me donne la distribution suivante :
|
Rasthor | Il faut utiliser le two-sided test en premier, qui est le Wilcoxon rank-sum (ranksums):
|
Oceanborn |
|
Bébé Yoda |
|
Rasthor |
C'est une facon de voir les choses. Mais il y aussi beaucoup de gens très satisfait! Est-ce un bien un biais?
Des notes assez proches je dirais, et l'ecart-type entre notes pas assez different entre les deux restaurants. Message édité par Rasthor le 02-05-2017 à 12:36:29 |
Publicité | Posté le |
Sujets relatifs | |
---|---|
[Topic Unique] Licence LEA (Langues Etrangères Appliquées) | [ Topic unique ] Stage à l'étranger |
[Topic unique] Bac 2k13 - 2k14 === | [Topic Unique] Concours A/A+ (Rejoignez la clownance !) |
Master économétrie et statistiques appliquées | [Topic Unique] Magistère Banque Finance - Université Panthéon-Assas |
[Topic Unique] Master Économétrie et Statistiques Appliquées - Orléans | [Topic Unique]Bloquer son année universitaire |
[Topic Unique] ROUEN BUSINESS SCHOOL MASTERE Spécialisé FINANCE | |
Plus de sujets relatifs à : [Topic Unique] Statistiques descriptives, inférentielles & dataviz |