Более

Сравниваете два растра плотности ядра для интересующих областей?

Сравниваете два растра плотности ядра для интересующих областей?


В основе моего вопроса лежит то, что у меня есть единичные продажи продукта А, агрегированные по городам. У меня также есть единичные продажи для категории А с разбивкой по городам.

Цель состоит в том, чтобы сравнить области, в которых продукт А работает лучше, чем ожидалось, учитывая эффективность Категории A. Причина для сравнения заключается в том, что подсчет единиц, как правило, соответствует общему распределению населения (т.е. по номинальной стоимости оба набора данных показывают, что крупные города являются основными рынками ).

Я взял каждый набор данных и нормализовал его по z-баллу. Затем я вычислил два растра плотности ядра, по одному для каждого набора. Теперь мой вопрос: есть ли лучший способ сравнить эти два с учетом моей цели?

Могу ли я просто использовать растровые вычисления [Продукт A] - [Категория A], чтобы создать растр, чтобы показать области, в которых продукт превосходит категорию? Это правильный подход или есть лучший способ?

Также я заметил, что диапазон значений min / max, вычисленный для каждой плотности ядра, отличается для двух наборов данных. Имеет ли это значение для сравнения?

  • Продукт A: от -0,0055 до +0,0253
  • Категория A: от -0,0087 до +0,0683

Обновлять Чем больше я играю с этим, я не получаю нужных мне результатов. Я не могу использовать операторы деления в расчете растра, потому что демонстраторы, близкие к нулю, астрономически раздувают числа. Я считаю, что сначала мне пришлось бы повторно нормализовать каждую из двух плотностей ядра?


Понимание динамики представляющих интерес городских территорий с помощью добровольной географической информации

Получение представления о динамике городской структуры имеет решающее значение для создания контекста в умном городе. В этой статье основное внимание уделяется городским территориям, представляющим интерес (UAOI), концепции, которая дает функциональные определения пространственной структуры города. Традиционные источники социальных данных редко могут охватить эти аспекты в масштабе, в то время как пространственная информация о городе сама по себе не отражает того, как население по-разному оценивает различные части города. Следовательно, мы используем добровольно предоставляемую географическую информацию (VGI), чтобы преодолеть некоторые ограничения традиционных источников в предоставлении структурных и функциональных представлений о городской структуре. Мы используем специальный тип VGI - метаданные из изображений Flickr с геотегами - для идентификации UAOI и использования их временных и пространственных атрибутов. Для этого мы предлагаем методологическую стратегию, которая сочетает в себе иерархическую пространственную кластеризацию на основе плотности для приложений с шумом и алгоритм «α-формы» для количественной оценки динамики UAOI во Внутреннем Лондоне за период 2013–2015 годов и разработки инновационной визуализации Профили UAOI, по которым можно изучить динамику UAOI. Наши результаты расширяют и улучшают предыдущую литературу по этой теме и представляют собой полезный справочник для городских практиков, которые могут пожелать включить более своевременную информацию при принятии решений.


Методы

Анализ основан на данных на уровне отдельных лиц и территорий, собранных в рамках исследования «Образ жизни и окружающей среды в викторианском стиле» (VicLANES) у 2349 человек в 50 небольших районах мегаполиса Мельбурн. Дополнительная информация о районах была также получена из ряда различных наборов административных геопространственных данных. Дизайн проекта VicLANES был одобрен Комитетом по этике человека Университета Ла Троб (№ 02–130), и все участники получили свободное и осознанное согласие.

Обстановка и дизайн исследования

VicLANES - это большое многоуровневое исследование, проведенное в 2003–2004 гг. В 21 внутреннем административном районе Мельбурна, Австралия. О методах VicLANES сообщалось ранее.18, 19 Вкратце, CCD (также известные как районы сбора данных переписи во время исследования, это были наименьшие географические единицы измерения, используемые Австралийским бюро статистики) были ранжированы в соответствии с показателем домохозяйства. с низким доходом (<$ A400 в неделю), затем расслоены на септилы. Затем было случайным образом выбрано пятьдесят ПЗС из верхнего (17), среднего (16) и нижнего (17) сегментов. Почтовые анкеты были разосланы 4005 жителям старше 18 лет, которые были случайно выбраны из списков избирателей (голосование является обязательным для всех австралийцев старше 18 лет, и, по оценкам, 97,7% лиц, имеющих право голоса, зарегистрированы. сделайте это) .20 Для максимального увеличения количества ответов был принят метод индивидуального дизайна для почтовых опросов21. Был достигнут 58,7% действительный процент завершения, при этом 2349 участников ответили на действительный опрос о своем поведении в области физической активности. Возраст респондентов 18–75 лет.

Результат измерения

Переменная результата, ИМТ, была основана на самооценке роста и веса и моделировалась как непрерывный результат.

Переменная воздействия: направления

Информация о пунктах назначения поступала из двух основных источников: (1) экологический аудит VicLANES 22, 23 и (2) общедоступные наборы пространственных данных. Мы выбрали направления, которые, как мы думали, люди могут использовать для активного путешествия в своем районе. В анализ были включены следующие пункты назначения: образовательные учреждения (школы, детские сады, университеты), кафе / магазины на вынос, остановки и станции транспорта, супермаркеты, спортивные сооружения, общественные ресурсы (например, библиотеки, центры здоровья матери и ребенка, места отправления культа, сообщества). центры), небольшие продуктовые магазины (например, круглосуточные магазины, пекарни, мясные лавки, бакалейные лавки). Дополнительная онлайн-таблица S1 предоставляет подробную информацию о типах адресатов и источниках этих данных назначения.

KDE: построение переменной экспозиции в ArcGIS

В ArcGIS 10.1,24 все пункты назначения были объединены и объединены в один слой. Поверхность плотности ядра точек назначения была оценена и извлечена с помощью команды «извлечь значения в точки» в наборе инструментов Spatial Analyst в ArcGIS.24

Процесс KDE начинается с непрерывной поверхности карты, разделенной на сетку с заданными размерами ячеек. На этой карте KDE размещает серию конусов или ядер, центрированных по каждой точечной характеристике, представляющей интерес (в данном случае, пункту назначения), создавая непрерывную карту плотности или интенсивности элементов.25 Радиус каждого конуса / ядра установлен на расстояние, которое оценивается, чтобы отразить область обслуживания / область действия этой конкретной функции или ресурса. Каждой ячейке на поверхности карты назначается оценка плотности ядра, так что ячейки в центре конуса получают более высокие оценки, а ячейки на периферии конуса получают меньшие оценки.25 По сути, оценки плотности ядра обратно пропорциональны расстоянию от объект, на котором конус центрирован (центр конуса) .25 KDE взвешивает влияние объектов таким образом, что объект, расположенный ближе всего к точке / местоположению, получает больший вес, в то время как объект, расположенный на некотором расстоянии, получает пренебрежимо малое значение. взвешивание.14 Конусы различных функций / пунктов назначения часто существенно перекрываются. Функция сглаживания (двумерное распределение Гаусса) добавляет оценки перекрывающихся ядер для каждой ячейки.12, 25 Пример результирующего изображения KDE распределения пунктов назначения с использованием 1200-метровых ядер представлен на рисунке 1.

Растровое представление оценок плотности ядра распределения назначения с использованием ядер размером 1200 м.

Значения ядерной плотности были извлечены таким образом, чтобы местонахождению домохозяйства каждого участника было присвоено значение ядерной плотности выходной ячейки, в которой они проживали. В то время как оценки плотности ядра рассчитываются на основе того, насколько близки пункты назначения друг к другу, значения, извлеченные в каждом местоположении участника, обеспечивают указание близости и плотности пунктов назначения по отношению к местоположению участника. Оценки высокой плотности ядра указывают на высокую интенсивность или кластеризацию пунктов назначения, оценки низкой плотности ядра указывают на незначительные, сильно рассредоточенные пункты назначения. Умеренные оценки плотности ядра могут указывать на рассредоточенные пункты назначения или они могут быть результатом, когда участник находится на большем расстоянии от набора пунктов назначения с высокой кластеризацией.

В этом анализе оценки плотности ядра были рассчитаны с использованием ядер размером 400, 800 и 1200 мкм. Нас интересовало, в какой степени физическая активность может опосредовать любые наблюдаемые связи между пунктами назначения и ИМТ. Утверждается, что 400 м - это расстояние, которое люди могут выбрать пешком, а не на автомобиле 26, и это примерно соответствует 5-минутной прогулке. Были также выбраны расстояния 800 и 1200 м, так как они представляют собой расстояние, которое средний человек может пройти за 10 и 15 минут соответственно.

Построение переменной подверженности для статистического анализа

Оценки плотности ядра были разделены на квинтили (квинтиль 1, представляющий области наименее распределенных пунктов назначения, и квинтиль 5, представляющий области наиболее интенсивно распределенных пунктов назначения). Существуют прецеденты использования квинтилей для моделирования распределения направлений, включая исследования в США13 и наши собственные исследования16.

Смущающие

На основании литературных данных несколько ковариат были включены в анализ как потенциальные искажающие факторы.13, 27 Это были: возраст (сгруппированы по шести категориям: 18–24 25–34 35–44 45–54 55–64 64 года и старше), пол, страна рождения (родился в Австралии, родился в стране, отличной от Австралии), образование (степень бакалавра или диплом о высшем профессиональном образовании, без последипломного образования), тип домохозяйства (одинокий взрослый - нет детей одинокий взрослый с двумя или более взрослыми детьми- нет детей, двое или более взрослых с детьми), преобладающее домашнее занятие (профессиональный служащий, служащий синего воротничка, не входящий в состав рабочей силы - включая пенсионеров, студентов, безработных, тех, кто не ищет или не может работать), а также инвалидность / травма что мешает упражнениям (да, нет). Неблагоприятная территория также была включена в качестве потенциальной помехи. Три септила, использованные для определения основы выборки (см. «Параметры исследования и план» выше), использовались в качестве индикатора неблагоприятного положения в районе и были определены как наименее обездоленные, средне обездоленные и наиболее обездоленные.

Достаточность физической активности

Используя элементы опроса Active Australia, участников попросили указать частоту и продолжительность их участия в ходьбе, высокой физической активности, умеренной физической активности, активной садовой или дворовой работе. Затем эти элементы использовались для измерения общей достаточности физической активности. Исследование Active Australia Survey использовалось в национальных опросах и демонстрирует очень хорошую надежность и валидность28.

Австралийские и международные руководящие принципы рекомендуют, чтобы человек занимался физическими упражнениями средней или высокой интенсивности не менее 30 минут в течение большей части недели, в общей сложности не менее 150 минут в неделю. 28–30 Согласно опросу Active Australia Survey Согласно рекомендациям, достаточность физической активности для здоровья может быть измерена двумя способами28: (1) измеряется как общее время физической активности (не менее 150 минут для достаточности) (2) измеряется как общее время в общем количестве занятий (не менее 150 минут). не менее пяти сеансов). Для этого анализа был выбран комбинированный показатель времени и количества тренировок (минимум 150 минут активности как минимум умеренной интенсивности в течение как минимум пяти сессионных недель) 31, 32, поскольку он наиболее точно соответствует рекомендациям по достаточности физической активности.29

В соответствии с рекомендациями по администрированию и внедрению Active Australia Survey, ответы VicLANES были преобразованы в общее количество времени (минут), затраченного на каждое действие, и суммированы, при этом активная активность была взвешена с коэффициентом 2,28. Затем 33 участника были отнесены к одной из категорий. две группы: те, кто сообщал о менее чем 150 минут как минимум умеренной активности в течение пяти сеансов в неделю, были классифицированы как недостаточно активные, те, у которых было как минимум 150 минут как минимум умеренной активности в течение пяти или более сессий, были классифицированы как достаточно активные.

Статистический анализ

Беременные женщины (n = 22) были исключены, поскольку их ИМТ мог быть изменен статусом беременности. Один CCD за пределами центрального делового района Мельбурна был исключен из окончательного анализа (n = 14), поскольку зона охвата этой CCD охватывала почти весь центральный деловой район, а количество объектов и направлений, содержащихся в этой зоне охвата, было нерегулярно большим. . Мы также исключили 150 участников, для которых отсутствовали данные ИМТ, в результате чего была получена аналитическая выборка из 2163 участников и 49 CCD. Отсутствовали отсутствующие данные по полу, возрастной группе или степени неблагополучия местности. Отсутствующие данные для других переменных варьировались от 0,1% до 2,1%, за исключением элемента инвалидности и элемента физической активности, для которых отсутствующие данные составили 5,6% и 14,2%, соответственно.

Все анализы проводились в Stata IC 10.0. Референтной категорией для воздействия был квинтиль 1 (Q1, самая низкая кластеризация назначения). Описательный анализ включал перекрестные таблицы между ИМТ и как отдельными ковариатами, так и оценками плотности ядра. Была проведена многоуровневая линейная регрессия (с CCD на уровне 2 и индивидуумами на уровне 1) для изучения связи между ИМТ и тремя измерениями плотности ядра (400, 800 и 1200 мкм). В частности, мы использовали многоуровневые модели смешанных эффектов с надежными SE. Все модели были скорректированы с учетом мешающих факторов. Наконец, в модели была включена физическая активность, чтобы проверить, ослабляет ли она связь между оценками плотности ядра и ИМТ. Для всех оценок указаны OR и 95% доверительные интервалы.


Литературный обзор

Горячие точки, которые определяются как районы с относительно высоким уровнем риска, обычно определяются на основе некоторых конкретных критериев отбора. Было разработано множество различных методологий и критериев для повышения точности процесса идентификации горячих точек и, следовательно, экономической эффективности программы повышения безопасности [6]. Один из наиболее часто используемых критериев выбора определяется ожидаемой частотой столкновений на интересующих участках. Этот конкретный критерий подчеркивает максимизацию общесистемных преимуществ вмешательства в области безопасности, нацеленного на горячие точки, в то время как другой обычно реализуемый критерий рассматривает ожидаемую частоту столкновений (т. Е. Ожидаемую частоту столкновений, нормализованную воздействием движения), который подчеркивает перспективу равенства отдельных участников дорожного движения [ 7].

Ожидаемая частота столкновений на площадке обычно оценивается с использованием подхода, основанного на модели столкновений, при котором частота столкновений моделируется статистически как функция некоторых важных характеристик, таких как характеристики дороги, интенсивность движения и погодные факторы [1–5]. Дороги обычно делятся на однородные участки равной длины и пересечения в качестве единиц пространственного анализа. Для оценки ожидаемого числа ДТП по дорожной сети в исследуемой области используются различные модели подсчета, из которых наиболее популярна отрицательная биномиальная оценка (NB), и впоследствии оценки сравниваются с заранее заданным пороговым значением для определения наличия сайт принадлежит точке доступа. Обратите внимание, что модели NB обычно используются в эмпирической байесовской (EB) структуре для лучшего отражения местного опыта уровней безопасности [1, 6]. Одной из наиболее важных частей этого подхода к моделированию является предположение о распределении вероятностей для количества аварий и функциональная спецификация параметров модели. Если эти компоненты указаны неправильно, применение таких моделей подсчета может привести к неправильным точкам доступа. Кроме того, этот подход требует большого объема данных и требует значительных усилий по сбору и обработке связанных данных и калибровке соответствующих моделей [8].

Ожидаемую частоту ДТП можно также оценить с помощью геостатистического метода, учитывая влияние неизмеряемых смешивающих переменных с помощью концепции пространственной автокорреляции между ДТП в географическом пространстве [9–13]. KDE - это пример, который использовался в области безопасности дорожного движения для изучения пространственной картины ДТП и выявления горячих точек [8–12]. Точно так же существуют другие геостатические методы, такие как методы кластеризации, которые оценивают относительный риск на основе степени их связи с окружающей средой. Примерами этих методов, используемых в исследованиях безопасности дорожного движения, являются кластеризация по K-среднему [14, 15], иерархическая кластеризация по ближайшему соседству (NNH) [16–18], индекс Морана I и статистика Getis-Ord Gi [19–21].

Андерсон и др. [11] применили метод KDE в городе Афьонкарахисар, Турция. В этом исследовании авторы смогли выявить участки с высокой степенью риска ДТП, которые были сконцентрированы на перекрестках дорог. Аналогичным образом Keskin et al. [13], Бласкес и Селис [12] использовали метод индекса KDE и Морана для наблюдения за изменением во времени горячих точек в дорожной сети. Хан и др. [21] использовали статистику Getis-Ord Gi для изучения пространственной картины аварий, связанных с погодой, в частности аварий, связанных с дождем, туманом и снегом. Для каждой категории погодных условий была выявлена ​​особая закономерность, что дополнительно указывало на необходимость определения приоритетов обработок в зависимости от различных погодных условий и мест. Pulgurtha et al. [9], Пулугурта и Ванапалли [22], а также Ха и Тилль [23] использовали метод KDE для исследования пространственных вариаций дорожно-транспортных происшествий с участием пешеходов и опасных автобусных остановок. Эти исследования показали возможность эффективного и экономичного решения проблем безопасности пешеходов и пассажиров. Другое исследование, проведенное Левином [17], Кундакчи и Тайдес-Яманом [18], использовало метод кластеризации NNH для обнаружения горячих точек ДТП через дорожную сеть.

Заметная разница в вышеупомянутых геостатистических методах заключается в том, как учитываются пространственные корреляции. Например, в методе KDE симметричная функция ядра, которая является функцией пропускной способности, помещается в каждую точку столкновения, создавая гладкую поверхность интенсивности. Затем для данной точки интереса интенсивность столкновения является суммой всей перекрывающейся поверхности из-за столкновений. Напротив, в методе кластеризации, таком как NNH, предварительно указывается пороговое значение, которое определяет степень кластеризации в окрестности. Если расстояние между парами точек данных о сбоях меньше порогового значения, то эти сбои группируются в один кластер. Также можно указать дополнительные критерии, такие как минимальное количество точек в кластере. Это различие в присвоении разного веса сбоям, происходящим в непосредственной близости (например, метод KDE) или простой группировке сбоев в определенные кластеры, ясно указывает на то, что эти методы, вероятно, будут иметь разные результаты с точки зрения размера, формы и расположения горячих точек. Одна из привлекательных частей метода KDE по сравнению с другими вариантами методов кластеризации заключается в том, что он учитывает пространственную автокорреляцию сбоев (см. Раздел 4.1 для более подробных объяснений). Более того, этот метод прост и удобен в реализации. Это может быть одной из причин того, что метод KDE широко используется в сфере безопасности дорожного движения.

В прошлых попытках разработки методов, основанных на геостатистике, другой популярный метод, называемый кригингом, редко использовался при анализе безопасности дорожного движения. Как один из самых передовых методов интерполяции, кригинг широко используется во многих различных областях исследований при необходимости пространственного прогнозирования. При небольшом количестве априорной информации этот метод может обеспечить лучшую линейную несмещенную оценку (СИНИЙ) для переменных, которые имеют тенденцию изменяться в пространстве [24, 25].


Исследование использования и моделирования географической информационной системы для борьбы с преступлениями в лесной сфере: оценка преступлений в лесах Восточного Средиземноморья

В данном исследовании основное внимание уделяется геостатистической оценке моделей пространственной оценки лесных преступлений. Географическая информационная система (ГИС), широко используемая при оценке преступности и зависимых от нее переменных, помогает выявлять преступления в отношении лесов в сельских регионах. В этом исследовании преступления в отношении леса (посягательство на леса, незаконное использование, незаконные лесозаготовки и т. Д.) Оцениваются комплексно, а моделирование проводилось с использованием десяти различных независимых переменных в среде ГИС. Области исследования - три руководителя лесных хозяйств (Басконус, Чинарпинар и Хартлап), связанные с региональным управлением лесного хозяйства Кахраманмарас в Кахраманмарасе. Модель оценки была разработана с использованием обычных методов наименьших квадратов (OLS) и географически взвешенной регрессии (GWR), которые часто используются для пространственной ассоциации. Для повышения точности модели оценки были предложены три разные модели. Использование переменных со значением коэффициента инфляции дисперсии (VIF) ниже 7,5 в Модели I и ниже 4 в Модели II и зависимых переменных со значительными устойчивыми значениями вероятности в Модели III связано с лесными преступлениями. После этого модель с наименьшим исправленным информационным критерием Акаике (AICc), а высшая р В качестве критерия сравнения было выбрано значение 2. Следовательно, Model III оказалась более точной по сравнению с другими моделями. Для модели III, в то время как AICc было 328 491 и р 2 было 0,634 для модели OLS-3, AICc было 318 489 и р 2 было 0,741 для модели GWR-3. В этом отношении использование ГИС для борьбы с преступлениями в лесной сфере предоставляет различные сценарии и реальную информацию, которая поможет принять политические и стратегические меры.

Это предварительный просмотр содержимого подписки, доступ через ваше учреждение.


Хранение растров

Среды хранения растров позволяют управлять определенными свойствами выходных растров. Есть также некоторые зависимости формата, поэтому проверьте страницу справки любого конкретного инструмента, который вы используете, для получения более подробной информации.

Как правило, существует разница между поддерживаемыми средами хранения растров, когда на выходе получается сетка Esri, и другими поддерживаемыми растровыми форматами, такими как файловая база геоданных или растры TIFF.

Целочисленный вывод или с плавающей запятой может определить, поддерживается ли конкретная среда хранения растров.

У некоторых инструментов есть параметр, который может определять тип выходного растра.

Для некоторых инструментов тип вывода определяется типами всех входов. Например, если инструмент принимает несколько входных растров, и все они целочисленные, за исключением одного с плавающей запятой, выходной растр будет с плавающей запятой. Когда вывод является плавающей точкой, может поддерживаться меньшее количество сред хранения растров.

В каждой справке по инструменту есть раздел «Среды» в нижней части страницы. Здесь будут перечислены все среды, которые могут поддерживаться этим инструментом. Обратите внимание, что этот список включает все выходные данные инструмента, включая дополнительные. Например, рассмотрим инструмент «Стоимостное расстояние», основным выходом которого является растр с плавающей запятой. Хотя растры с плавающей запятой не поддерживают настройку среды сжатия, существует дополнительный выходной растр обратной ссылки, который является целым числом. Поскольку целочисленные растры для определенных форматов могут поддерживать сжатие, эта среда будет присутствовать в списке поддерживаемых сред. Это важная деталь, которую нужно понимать при оценке этих сред.

В следующих разделах представлены более подробные сведения о каждой из сред хранения растров.

Сжатие

Параметр среды Тип сжатия обычно применяется для выходных целочисленных растров. Если вывод - это плавающая точка, настройка игнорируется, и выходной растр всегда несжатый.

Целочисленные растры в формате Esri Grid всегда используют сжатие с кодировкой длин серий (RLE), поэтому установка для среды значения None не повлияет на выходную сетку.

Хотя некоторые форматы в противном случае могут допускать сжатие с потерями, поддерживается только параметр Тип сжатия. Параметр качества сжатия не поддерживается и по существу равен 100, независимо от того, установлено ли для него какое-либо другое значение.

Пирамиды

Параметр среды пирамиды не применяется для выходных растров. Пирамиды не создаются для вывода растров из любого инструмента Spatial Analyst.

Растровая статистика

С помощью параметра «Вычислить статистику» настройки среды «Статистика растра» вы можете отказаться от создания статистики для выходного целочисленного растра. Проверьте конкретную документацию для этого инструмента на предмет исключений.

Статистика всегда создается для выходных растров с плавающей запятой, независимо от настройки этой среды.

Размер плитки

Параметр среды Размер листа обычно поддерживается инструментами Spatial Analyst для следующих форматов вывода: TIFF, файловая база геоданных или база геоданных SDE.

Размер плитки по умолчанию - 128 x 128 ячеек.


Вероятные причины проблем с Topo to Raster

Если вы столкнетесь с какими-либо проблемами при запуске Topo to Raster, проверьте следующие пункты, чтобы получить объяснения и решения наиболее часто встречающихся проблем.

  • Недостаточно доступных системных ресурсов. Алгоритмы, используемые в Topo to Raster, хранят в памяти как можно больше информации во время обработки. Это обеспечивает одновременный доступ к данным о точках, контурах, стоках, ручьях и озерах. Чтобы облегчить обработку больших наборов данных, рекомендуется закрыть ненужные приложения перед запуском инструмента, чтобы освободить физическую оперативную память. Также важно, чтобы на диске было достаточно места для системной подкачки.
  • Входной контур или точка может быть слишком плотным для указанного размера выходной ячейки. Если одна выходная ячейка покрывает несколько входных контуров или точек, алгоритм может быть не в состоянии определить значение для этой ячейки. Чтобы решить эту проблему, попробуйте одно из следующих действий:
    • Уменьшите размер ячейки, затем выполните повторную выборку до большего размера ячейки после Топо в растр.
    • Растеризуйте меньшие части входных данных, используя выходной экстент и поля в ячейках. Соберите полученные растры компонентов с помощью инструмента Мозаика.
    • Вырезайте входные данные в перекрывающиеся разделы и запустите Topo to Raster отдельно для каждого раздела. Соберите полученные растры компонентов с помощью инструмента Мозаика.

    Защита дикой природы приобретает все большее значение в эпоху Шестого вымирания и антропоцена. Нанесение на карту экологических показателей наряду с непрерывным изменением человека дает ключевую информацию для защиты дикой природы. Однако может возникнуть неопределенность при определении территорий дикой природы путем реклассификации карт континуума дикой природы. В этом исследовании для определения отдельных участков дикой природы и оценки их относительного качества дикой природы используется подход, объединяющий как логическое наложение, так и взвешенную линейную комбинацию (WLC). Этот подход применяется к Китаю с разрешением 1 км 2. Участки дикой природы сначала идентифицируются с помощью логического наложения с дискретными пороговыми значениями для землепользования, удаленности от населенных пунктов и дорог. Затем создается индекс качества дикой природы с использованием модели WLC путем взвешивания и объединения шести показателей качества дикой природы, включая биофизическую естественность, плотность населения, удаленность от поселений, удаленность от автомобильных / железных дорог, плотность поселений и плотность автомобильных / железных дорог. Затем создается интегрированная карта дикой природы путем объединения результатов логической модели и модели WLC. Выяснилось, что Китай является очень дикой страной в некоторых частях, насчитывающей более 86 000 участков дикой природы с различным относительным качеством дикой природы, которые покрывают приблизительно 42% территории Китая. Около 77% существующих участков дикой природы не покрыты заповедниками, что указывает на очевидные пробелы в сохранении дикой природы Китая. Представленные здесь карты дикой природы могут потенциально поддержать создание новых охраняемых территорий дикой природы, сохранение связи и программы мониторинга. Этот комплексный подход к картированию дикой природы потенциально полезен для других стран при проведении собственных инвентаризаций дикой природы и разработке политики сохранения дикой природы.

    Цао Юэ доктор философии. кандидат кафедры ландшафтной архитектуры Университета Цинхуа. Его исследования сосредоточены на планировании охраняемых территорий, управлении национальными парками, картировании и сохранении дикой природы.

    Стив Карвер географ, старший преподаватель и директор Исследовательского института дикой природы Университета Лидса. Он имеет более чем 30-летний опыт работы в области ГИС и многокритериальной оценки с особыми интересами к дикой природе, дикой земле, восстановлению дикой природы, оценке ландшафта и участию общественности. Он много работал над разработкой методологий картирования и оценки дикой местности, тестировал и применял их в различных местах и ​​пространственных масштабах, включая Шотландию, Англию, Великобританию, Европу, Северную Америку и Азию.

    Ян Руи является председателем и профессором кафедры ландшафтной архитектуры и президентом Института национальных парков Университета Цинхуа. У него более 30 лет опыта в ландшафтном планировании и управлении национальными парками и объектами всемирного наследия в Китае. Он работал над многими национально важными проектами ландшафтного планирования в качестве руководителя группы, включая планирование национального парка «Три источника реки», горы Уи, горы Тай, Желтой горы, долины Цзючжайгоу, горы Утай, снежной горы Мейли и т. Д.


    Глава 6 Использование R в качестве ГИС: работа с растровыми и векторными данными

    Распространенная задача ГИС в археологии - это связать растровые и векторные данные, например, связать местоположения участков с такими переменными окружающей среды, как высота, уклон и аспект. Обычно это делается путем вычисления значений для местоположений точек в шейп-файле сайтов, и часто представляет интерес сравнить переменные среды по некоторым аспектам изменчивости сайта - функции, временному периоду, размеру и т. Д. Здесь мы возьмем немного больше надежный подход, который рассматривает области вокруг сайтов, а не их точное местоположение, вычисляет буфер вокруг каждого местоположения сайта и затем усредняет значения нескольких переменных среды в этих буферах. Для простоты мы будем использовать матрицу высот и растры уклона и аспекта, которые мы можем извлечь из нее, но также можно использовать любые другие растровые данные. Используя вымышленный набор данных для небольшой области в Провансе, мы рассмотрим некоторые инструменты для исследования пространственных данных и покажем, что области, заселенные в раннем железном веке и галло-римском периоде, значительно различались по некоторым параметрам. , но похожи в других.

    Мы могли бы предположить, например, что римская колонизация области была основана на выращивании зерновых культур на экспорт, и что в результате поселения галло-римского периода должны были отдавать приоритет относительно невысоким, равнинным землям, подходящим для такой деятельности. Мы могли бы проверить эту гипотезу, сравнив площади, занятые в эти два периода, по высоте и уклону.

    6.0.1.1 Первые шаги: импорт и форматирование данных

    Начнем с загрузки нескольких пакетов…

    … А затем импорт и изучение данных.

    6.0.1.2 Работа с матрицей высот

    Мы можем использовать матрицу высот для вычисления производных матрицы высот.

    Эти сводки полезны, но давайте также построим нашу растровую матрицу высот: это не обязательно, но обнадеживает, что данные значимы. Мы не будем пытаться сделать график слишком красивым, указанных параметров достаточно, чтобы отобразить его как понятную ЦМР местности.

    6.0.1.3 Растровое и точечное построение

    We can check that our data occupy the same space, and visually assess our hypothesis, by plotting the raster with the sites overlain as points, varying color and shape by period. Since this is just for exploratory purposes, we won’t worry about making it too pretty.

    Satisfied that our data make sense, and perhaps already having developed some ideas about site distribution just by staring at the map, we can move on to explore the site locations analytically. We’ll begin by building a raster stack that consists of the rasters of the three variables we’ll examine: elevation, slope, and aspect.

    6.0.1.4 Raster Stacks

    6.0.1.5 Using extract() to selectively summarize raster data

    We can then take that raster stack and use extract() to summarize values of DEM, slope, and aspect within a buffer around each point.

    The results can be examined in any number of ways here we’ll make boxplots for each of the variables of interest. We’ll plot each variable by period, so each result will comprise two box-and-whisker plots, one for the Early Iron Age and one for the Gallo-Roman Period

    6.0.1.6 Boxplotting for exploratory data analysis

    As with the exploratory raster-and-point plotting we did above, we won’t worry too much about making these plots pretty we’ll just do enough to make them easily visually intelligible. I’m using the lattice package for the plotting, but there are several other ways to do this as well. Something that we won’t get into here because it adds a layer of complication is to also characterize the environmental background - i.e., to assess the question of whether settlement locations comprise a random sample of the the available landscape or instead focus on certain kinds of locations.

    We can already assess our hypothesis by looking at those plots individually, but since we’ve written them to objects we can also easily juxtapose them in a single plot and consider the results.

    We can now quantitatively assess whatever visual assessments we made: it’s clear (the notches give a rough 95% confidence interval for the medians) that parts of the landscape of differing slope and elvation were preferred in the two periods (and, in contrast, that aspect was considered similarly or perhaps remained unimportant).

    6.0.1.7 Summary

    What does all this mean for the archaeological question?Our hypothesis looks pretty compelling, at first glance. There is a marked change between the Early Iron Age and the Gallo-Roman Period in the parts of the landscape preferred, and the pattern is robust. That said, this should be seen as exploratory analysis, and common GIS caveats apply:

    • the variables we’re looking at hardly comprise an exhaustive list,
    • there’s perhaps some danger of ecological fallacy with categories so broad,
    • there’s always some risk that some other variable that is related to - or at least covaries with - those we’ve examined is фактически the causal one,
    • issues like data quality and landscape taphonomy ought to be considered,
    • we are privileging environmental variables because that data is easily available,
    • и т.п.

    However, those are problems of argument construction more than of method, and I find this a powerful set of tools with which to explore data and think about which arguments to test in more detail. Such issues might be addressed by further exploring the data (e.g., exploring other site variables, varying the buffer size, varying the summary statistics use to describe the landscape within the buffer), adding other data (e.g., rasters of distance-from-streams, soil type and depth, etc.), and thinking about what it would take to build a more robust argument.

    Finally, by way of considering what we might gain by using R as a GIS in this way (rather than QGIS, ArcGIS, etc) I want to highlight four of the steps we’ve gone through:

    1. subsetting data
    2. adding environmental (or any spatial) variables as raster data and summarizing them with respect to site locations
    3. specifying analytical parameters (e.g., buffer size, summary statistics)
    4. visualising the distributions of environmental variables for the sites

    All of these provide flexibility in the particulars of the analysis, and the entire process is easily repeatable in varying permutations or with different data.


    In traffic safety studies, the few scholars who have focused on analyzing disaggregated data obtained results that have been either difficult to explain or demonstrate because they did not provide clear visual maps or utilize statistical tests to quantify the spatial relationships. In order to increase the use of such disaggregated spatial methods for use in traffic safety studies, the current study documents the application of a new RGB (red, green, blue) model which combines the color additive theorem and the kernel density map (KDE) to define crash colocation patterns and the coincidence spaces of related variables.

    This study contributes to the literature in three major ways: (1) a new RGB model was established and applied in the field of traffic safety (2) the variable dimensions were expanded from two to three and, (3) the dimension of uncertainty was also included. When the new RGB model was utilized with data collected in College Station, Texas, the results indicated that the new colocation map is able to clearly and accurately define colocation hotspots of crashes, crimes, and alcohol retailers. As expected, these hotspots are located in areas with many bars, the largest strip malls and busiest intersections. The intensity maps have provided results consistent with the above colocation maps. However, the uncertainty map does not show a relatively higher level of certainty regarding the location of hotspots as we expected because the input of each variable was not related to the highest kernel value. Therefore, future scholars should focus on the colocation and intensity maps while using the uncertainty map as a reference for individual event risk evaluation only.