Подсчет ящиков — это метод сбора данных для анализа сложных моделей путем разбиения набора данных , объекта, изображения и т. д. на все более мелкие части, обычно в форме «ящика», и анализа частей в каждом меньшем масштабе. Суть процесса сравнивают с увеличением или уменьшением масштаба с использованием оптических или компьютерных методов для изучения того, как наблюдения деталей изменяются с масштабом. Однако при подсчете ящиков вместо изменения увеличения или разрешения линзы исследователь изменяет размер элемента, используемого для осмотра объекта или модели (см. рисунок 1). Компьютерные алгоритмы подсчета ящиков применяются к моделям в 1-, 2- и 3-мерных пространствах. [1] [2] Этот метод обычно реализуется в программном обеспечении для использования с моделями, извлеченными из цифровых носителей , хотя фундаментальный метод может использоваться для физического исследования некоторых моделей. Этот метод возник из фрактального анализа и используется в нем . Он также применяется в смежных областях, таких как анализ лакунарности и мультифрактальный анализ. [3] [4]
Теоретически, цель подсчета ящиков — количественно оценить фрактальное масштабирование, но с практической точки зрения это потребовало бы, чтобы масштабирование было известно заранее. Это можно увидеть на рисунке 1, где выбор ящиков правильных относительных размеров легко показывает, как шаблон повторяется в меньших масштабах. Однако во фрактальном анализе коэффициент масштабирования не всегда известен заранее, поэтому алгоритмы подсчета ящиков пытаются найти оптимизированный способ разрезания шаблона, который выявит коэффициент масштабирования. Основной метод для этого начинается с набора измерительных элементов — ящиков — состоящих из произвольного числа, называемого здесь для удобства, размеров или калибров, которые мы будем называть набором s. Затем эти ящики размером s применяются к шаблону и подсчитываются. Для этого для каждого в , измерительный элемент, который обычно представляет собой 2-мерный квадрат или 3-мерный ящик с длиной стороны, соответствующей , используется для сканирования шаблона или набора данных (например, изображения или объекта) в соответствии с заранее определенным планом сканирования, чтобы охватить соответствующую часть набора данных, записывая, т. е. подсчитывая , для каждого шага сканирования соответствующие характеристики, захваченные в измерительном элементе. [3] [4]
Соответствующие признаки, собранные во время подсчета ящиков, зависят от исследуемого объекта и типа проводимого анализа. Например, два хорошо изученных объекта подсчета ящиков — это бинарные (имеющие только два цвета, обычно черный и белый) [2] и полутоновые [5] цифровые изображения (т. е. jpeg, tiff и т. д.). Подсчет ящиков обычно выполняется на основе шаблонов, извлеченных из таких неподвижных изображений, и в этом случае записанная исходная информация обычно основана на признаках пикселей, таких как предопределенное значение цвета или диапазон цветов или интенсивностей. Когда подсчет ящиков выполняется для определения фрактального измерения, известного как измерение подсчета ящиков , записанная информация обычно является либо «да», либо «нет» относительно того, содержал ли ящик какие-либо пиксели предопределенного цвета или диапазона (т. е. подсчитывается количество ящиков, содержащих соответствующие пиксели в каждом ). Для других типов анализа искомыми данными могут быть количество пикселей, попадающих в измерительную ячейку, [4] диапазон или средние значения цветов или интенсивности, пространственное расположение пикселей в каждой ячейке или такие свойства, как средняя скорость (например, от потока частиц). [5] [6] [7] [8]
Каждый алгоритм подсчета ящиков имеет план сканирования, который описывает, как будут собираться данные, по сути, как ящик будет перемещаться по пространству, содержащему шаблон. В алгоритмах подсчета ящиков использовались различные стратегии сканирования, где несколько базовых подходов были изменены для решения таких проблем, как выборка, методы анализа и т. д.
Традиционный подход заключается в сканировании в неперекрывающейся регулярной сетке или решетчатом шаблоне. [3] [4] Для иллюстрации на рисунке 2а показан типичный шаблон, используемый в программном обеспечении, которое вычисляет измерения подсчета ящиков из шаблонов, извлеченных в двоичные цифровые изображения контуров, таких как фрактальный контур, показанный на рисунке 1, или классический пример береговой линии Британии, часто используемый для объяснения метода нахождения измерения подсчета ящиков . Стратегия имитирует многократное наложение квадратного ящика, как если бы он был частью сетки, наложенной на изображение, так что ящик для каждого никогда не перекрывается там, где он был ранее (см. рисунок 4). Это делается до тех пор, пока вся интересующая область не будет отсканирована с использованием каждого и соответствующая информация не будет записана. [9] [10] При использовании для нахождения измерения подсчета ящиков метод модифицируется для нахождения оптимального покрытия.
Другой подход, который использовался, — это алгоритм скользящего ящика, в котором каждый ящик скользит по изображению, перекрывая предыдущее размещение. Рисунок 2b иллюстрирует базовую схему сканирования с использованием скользящего ящика. Подход с фиксированной сеткой можно рассматривать как алгоритм скользящего ящика с приращениями по горизонтали и вертикали, равными . Алгоритмы скользящего ящика часто используются для анализа текстур в анализе лакунарности и также применяются в мультифрактальном анализе . [2] [8] [11] [12] [13]
Подсчет ящиков также может использоваться для определения локальной вариации в отличие от глобальных мер, описывающих весь шаблон. Локальную вариацию можно оценить после того, как данные будут собраны и проанализированы (например, некоторые программные цветовые коды областей в соответствии с фрактальной размерностью для каждой подвыборки), но третий подход к подсчету ящиков заключается в перемещении ящика в соответствии с некоторой особенностью, связанной с интересующими пикселями. Например, в алгоритмах подсчета ящиков локального связанного измерения ящик для каждого центрируется на каждом интересующем пикселе, как показано на рисунке 2c. [7]
Реализация любого алгоритма подсчета ячеек должна указывать определенные детали, такие как способ определения фактических значений в , включая минимальный и максимальный размеры для использования и метод увеличения между размерами. Многие из таких деталей отражают практические вопросы, такие как размер цифрового изображения, но также и технические вопросы, связанные с конкретным анализом, который будет выполняться на данных.Другой вопрос, которому уделяется значительное внимание, заключается в том, как приблизиться к так называемому «оптимальному покрытию» для определения размеров подсчета ящиков и оценки мультифрактального масштабирования . [5] [14] [15] [16]
Одной из известных проблем в этом отношении является определение того, что составляет границу полезной информации в цифровом изображении, поскольку ограничения, используемые в стратегии подсчета ячеек, могут влиять на собираемые данные.
Алгоритм должен указывать тип приращения, который будет использоваться между размерами ячеек (например, линейный или экспоненциальный), что может оказать существенное влияние на результаты сканирования.
Как показано на рисунке 4, общее расположение ящиков также влияет на результаты подсчета ящиков. Один из подходов в этом отношении — сканирование с нескольких ориентаций и использование усредненных или оптимизированных данных. [17] [18]
Для решения различных методологических вопросов некоторые программы написаны таким образом, чтобы пользователи могли указывать множество таких деталей, а некоторые включают такие методы, как сглаживание данных после факта, чтобы они были более пригодными для типа проводимого анализа. [19]