Suite

Utiliser les outils ArcGIS Getis Ord Gi* et IDW avec des « points chauds » où les zones non mesurées sont des « points froids » ?


J'ai deux ensembles de données que j'aimerais analyser ensemble. Le premier ensemble de données a des emplacements de nids d'oiseaux dans les quartiers (nid). Le deuxième ensemble de données a des emplacements de mangeoires d'oiseaux dans les quartiers (nourriture). A chaque emplacement X,Y de nourriture, j'ai également des informations sur la quantité de nourriture (l'étendue de la ressource). Chacun d'entre eux sont des fichiers de formes de points dans ArcGIS.

Je voudrais créer une surface lissée (raster alimentaire) de nourriture afin que je puisse extraire une valeur d'indice alimentaire pour l'emplacement de chaque nid dans mon ensemble de données. L'indice de nourriture devrait dépendre de la proximité d'une mangeoire à oiseaux à ce nid et de l'étendue de la nourriture à cette mangeoire à oiseaux.

J'ai utilisé Getis Ord Gi* pour générer des zscores pour chacun de mes emplacements de nourriture (en pondérant chaque emplacement en fonction de l'étendue de la ressource), puis j'ai utilisé ces valeurs dans l'analyse IDW. Cependant, les scores z de Getis Ord Gi* sont à la fois positifs et négatifs car ils comparent la valeur alimentaire à chaque endroit à la valeur alimentaire moyenne à tous les mangeoires du quartier. Le résultat est que certains de mes feeders s'avèrent être des "points froids" dans le raster IDW résultant.

Ce que j'aimerais, c'est un raster de nourriture où tous les emplacements de nourriture sont "chauds" (à des degrés divers selon l'étendue) et les emplacements non mesurés sont par définition "plus froids" que ceux-ci (parce que je sais qu'il n'y a pas de mangeoires là-bas).

Est-ce que quelqu'un connaît un moyen de le faire (par exemple, contraindre les Zscores afin qu'ils soient tous positifs ou spécifier autrement que les points mesurés sont tous "chauds") ?

Ou dois-je utiliser complètement une autre analyse ?

J'ai également testé KDE sur ces données, mais je préférerais si possible IDW car plusieurs champs de KDE sont choisis au " caprice " du chercheur. Je pense que j'ai peut-être du mal à défendre des choix de bande passante, etc. avec mes jeux de données.


Comme commenté par @JeffreyEvans :

vous rencontrerez les mêmes problèmes de biais d'échantillon avec les statistiques de motif de points qu'avec la densité de noyau, peut-être encore plus. Vous pouvez envisager une approche de krigeage, ou même un glm spatial.


vous rencontrerez les mêmes problèmes de biais d'échantillon avec les statistiques de motif de points qu'avec la densité de noyau, peut-être encore plus. Gardez à l'esprit qu'une hypothèse de PPA est que vous représentez la population et non un échantillon.

La paramétrisation de la fonction noyau peut avoir des effets profonds sur l'estimation de densité résultante. Les résultats peuvent être influencés par le type de noyau (par exemple, gaussien, uniforme) ainsi que par la bande passante. Il serait assez difficile de démêler le signal fourni par le KDE du processus spatial sous-jacent et nécessiterait une modélisation supplémentaire considérable, telle qu'un Monte Carlo sur plusieurs bandes passantes et spécifications de noyau, pour prendre en charge toute inférence.

Ceux-ci sont également modélisés comme des processus spatiaux indépendants et ne sont pas directement comparables. Pour les rendre comparables, vous avez besoin d'une sorte de modèle de régression spatiale formalisé ou d'une analyse de type corrélation croisée. C'est pourquoi les fonctions "croisées" (par exemple, Cross-K, LISA bivariée) ont été créées en premier lieu. Cependant, en raison de violations de la PPA, une approche de régression spatiale semble de mise.