geopas Posté(e) 7 février 2024 Signaler Posté(e) 7 février 2024 Bonjour, Juste une question : comment sont créés les points ammonites sur ta représentation UMAP ? A l'aide d'un logiciel propriétaire ? Et peux-tu nous en dire un peu plus sur UMAP ? J'ai l'impression que c'est principalement utilisé comme technique d'analyse lorsqu'on dispose de nombreuses données par échantillon (je précise que je ne connais rien de ce domaine). Citer
alkimik Posté(e) 7 février 2024 Signaler Posté(e) 7 février 2024 le logiciel est cité sur sa page pour umap jai feuilleté ici (pas mon truc non plus, mais faut bien apprendre) https://en.wikipedia.org/wiki/Nonlinear_dimensionality_reduction#Uniform_manifold_approximation_and_projection Citer
Elra Fossile Posté(e) 7 février 2024 Auteur Signaler Posté(e) 7 février 2024 il y a une heure, geopas a dit : Bonjour, Juste une question : comment sont créés les points ammonites sur ta représentation UMAP ? A l'aide d'un logiciel propriétaire ? Et peux-tu nous en dire un peu plus sur UMAP ? J'ai l'impression que c'est principalement utilisé comme technique d'analyse lorsqu'on dispose de nombreuses données par échantillon (je précise que je ne connais rien de ce domaine). Pour toute mon analyse de données, j'ai utilisé un logiciel, R, qui est libre de droit, mais qui s'utilise en lignes de commande (il faut donc connaître le langage R). Sauf pour mesurer, j'ai pris le logiciel imageJ qui est aussi libre de droit. En fait, avant de faire une UMAP, j'ai fait une ACP (Analyse en composantes principales). Et l'ACP, c'est vraiment ce qui est important dans mon analyse. La UMAP, c'est *juste* une façon de visualiser les données (et classiquement, oui, elle est utilisée pour de très gros jeux de données, mais je trouve que ça fonctionne bien aussi avec des petits jeux). L'ACP m'a servi de base pour calculer les distances (donc le niveau de différence) entre individus et pour créer des groupes de ressemblance. La UMAP sert juste à voir de manière lisible les groupes. L'ACP, c'est une façon de simplifier les données qui se base sur les corrélations entre variables. Par exemple, dans mon jeu, il y a une très forte corrélation entre UWI, WER et WHI (qui représent tous plus ou moins l'involution). Mon ACP va "résumer" cette corrélation en créant une nouvelle dimension qui "résumera" ces trois variables. Dans mon jeu, UWI/WER/WHI explique le plus la variabilité des données : mes ammonites se différencient pas mal en fonction de l'involution. Ca va être l'axe 1, la direction dans l'espace des données où la variation est la plus importante. Et ensuite, elle varient pas mal en fonction de la taille et de l'épaisseur : ça va être l'axe 2, car en plus, y'a une corrélation négative modérée entre la taille et l'épaisseur. Moi j'ai pris les trois axes de l'ACP, qui en gros représentent l'involution, la taille et l'épaisseur. Pour représenter de manière plus "sympa" mes trois axes de l'ACP, j'ai utilisé la UMAP. La UMAP va résumer en 2D les dimensions en 3D. Voilà la représentation sur les deux premiers axes de l'ACP : Bon, ça va, c'est pas trop moche, mais je trouve la UMAP plus lisible. Et surtout, moi j'ai choisi de tenir compte du 3ème axe, et difficile de représenter des données 3D en 2D ^^. il y a 52 minutes, alkimik a dit : le logiciel est cité sur sa page pour umap jai feuilleté ici (pas mon truc non plus, mais faut bien apprendre) https://en.wikipedia.org/wiki/Nonlinear_dimensionality_reduction#Uniform_manifold_approximation_and_projection Oui, pas évident ! Pour résumer, la UMAP est un algo qui va essayer de représenter le plus fidèlement possible en 2D des distances qui sont, elles en 3D, 4D.... 50D, 70D. Citer
geopas Posté(e) 7 février 2024 Signaler Posté(e) 7 février 2024 Merci pour ces explications. Belle synthèse d'un sujet complexe. Tout ça est beaucoup plus clair maintenant. Et, au passage, je découvre R (et un langage de programmation de plus !). Citer
Elra Fossile Posté(e) 7 février 2024 Auteur Signaler Posté(e) 7 février 2024 De rien 🙂 J'espère que mes explications sont claires, je trouve que ce n'est jamais facile de vulgariser ce genre de chose. R est très utilisé dans tout ce qui est statistiques, science des données, etc. Citer
Squalicorax Posté(e) 8 février 2024 Signaler Posté(e) 8 février 2024 Bonjour, il y a une problématique à évaluer, c'est la notion de transport/accumulation, on peu avoir une accumulation de coquilles d'ammonites mâles (microconques) suivant la force des courants marins par exemple, les macroconques pouvant s'accumuler sur une zone à plus forte action de courant, une coquille macroconque peu aussi servir d'accumuleur(dépression liée au volume de la coquille avec accumulation derrière cette m^me coquille), c'est là que cela deviens passionnant de pouvoir échantillonner les fossiles et le sédiment qui va avec. La question serait: avons nous les m^mes dimensions de coquilles de tel espèce dans tel sédiment? calcaire pur, ou zone de calcaire avec un apport sableux, calcaire franchement argileux, argiles sableuse etc... Pour exemple de comparaison, dans le Vercors j'ai étudié le béton phosphaté Albien, avec une forte accumulation de microconques dans les niveaux argileux sableux et des macroconques dans les niveaux sableux (ce qui semble logique plus on a d'argile moins on a de courant, moins de possibilité de transport d'éléments volumineux). Mais pour vérifier cela il faut pouvoir observer des couches de sédiments, dans la surface des champs c'est plus compliqué. Une autre problématique, c'est de bien connaitre les espèces et distinguer les mâles des femmelles, définir si l'ammonite est entière, es-que la loge d'habitation est encore visible ?( c'est pas toujours évident). Bref connaitre sa stratie sur le bout des doigts avec les faunes qui vont avec, ça c'est souvent le travail de recherches sur des années, m^me en consultant les publies et travaillant sur le terrain. Mais cela reste un beau projet. Bon courage dans les mesures. Citer
Messages recommandés
Rejoindre le sujet et participer
Pour poster un message, il faut créer un compte membre. Si vous avez un compte membre, connectez-vous maintenant pour publier dans ce sujet.