Тестирование суррогатных данных

Тестирование суррогатных данных ^[1] (или метод суррогатных данных ) — это метод статистического доказательства от противного, аналогичный тестам перестановки ^[2] и параметрическому бутстраппингу . Он используется для обнаружения нелинейности во временном ряду . ^[3] Метод включает в себя указание нулевой гипотезы, описывающей линейный процесс , а затем генерацию нескольких наборов суррогатных данных в соответствии с использованием методов Монте-Карло . Затем для исходного временного ряда и всего суррогатного набора вычисляется дискриминирующая статистика. Если значение статистики для исходного ряда существенно отличается от значения для суррогатного набора, нулевая гипотеза отклоняется и предполагается нелинейность. ^[3] $H_{0}$ $H_{0}$

Конкретный метод проверки суррогатных данных, который будет использоваться, напрямую связан с нулевой гипотезой. Обычно это похоже на следующее: данные являются реализацией стационарной линейной системы, выход которой, возможно, был измерен монотонно возрастающей, возможно, нелинейной (но статической) функцией . ^[1] Здесь линейный означает, что каждое значение линейно зависит от прошлых значений или от настоящих и прошлых значений некоторого независимого идентично распределенного (iid) процесса, обычно также гауссовского. Это эквивалентно утверждению, что процесс имеет тип ARMA . В случае потоков (непрерывных отображений) линейность системы означает, что она может быть выражена линейным дифференциальным уравнением. В этой гипотезе статическая функция измерения — это функция, которая зависит только от настоящего значения своего аргумента, а не от прошлых.

Методы

Было предложено много алгоритмов для генерации суррогатных данных. Обычно их классифицируют на две группы: ^[4]

Типичные реализации : ряды данных генерируются как выходные данные хорошо подобранной модели для исходных данных.
Ограниченные реализации : ряды данных создаются непосредственно из исходных данных, как правило, путем их подходящего преобразования.

Последние методы суррогатных данных не зависят ни от конкретной модели, ни от каких-либо параметров, поэтому они являются непараметрическими методами. Эти методы суррогатных данных обычно основаны на сохранении линейной структуры исходного ряда (например, путем сохранения функции автокорреляции или, что эквивалентно, периодограммы , оценки спектра выборки). ^[5] Среди методов ограниченных реализаций наиболее широко используются (и поэтому их можно назвать классическими методами ):

Алгоритм 0, или RS ( Random Shuffle ): ^[1]^[6] Новые данные создаются просто случайными перестановками исходного ряда. Эта концепция также используется в тестах перестановок . Перестановки гарантируют то же распределение амплитуд, что и исходный ряд, но разрушают любую временную корреляцию, которая могла быть в исходных данных. Этот метод связан с нулевой гипотезой о том, что данные являются некоррелированным iid-шумом (возможно, гауссовым и измеряемым статической нелинейной функцией).
Алгоритм 1, или RP ( случайные фазы ; также известный как FT, преобразование Фурье ): ^[1]^[7] Для сохранения линейной корреляции (периодограммы) ряда суррогатные данные создаются обратным преобразованием Фурье модулей преобразования Фурье исходных данных с новыми (равномерно случайными) фазами. Если суррогаты должны быть действительными, фазы Фурье должны быть антисимметричными относительно центрального значения данных.
Алгоритм 2, или AAFT (для Amplitude Adjusted Fourier Transform ): ^[1]^[4] Этот метод имеет примерно те же преимущества, что и два предыдущих: он пытается сохранить как линейную структуру, так и распределение амплитуды. Этот метод состоит из следующих шагов:
- Масштабирование данных до гауссовского распределения ( гауссианизация ).
- Выполнение RP-преобразования новых данных.
- Наконец, выполняем преобразование, обратное первому ( дегауссианизацию ).
Недостатком этого метода как раз и является то, что последний шаг несколько меняет линейную структуру.
Итеративный алгоритм 2, или IAAFT (для итеративного амплитудно-регулируемого преобразования Фурье ): ^[8] Этот алгоритм является итеративной версией AAFT. Шаги повторяются до тех пор, пока функция автокорреляции не станет достаточно похожей на оригинал или пока не будет никаких изменений в амплитудах.

Было предложено много других методов суррогатных данных, некоторые из которых основаны на оптимизации для достижения автокорреляции, близкой к исходной, ^[9]^[10]^[11] некоторые основаны на вейвлет-преобразовании ^[12]^[13]^[14] а некоторые способны работать с некоторыми типами нестационарных данных. ^[15]^[16]^[17]

Вышеупомянутые методы называются линейными суррогатными методами, поскольку они основаны на линейном процессе и обращаются к линейной нулевой гипотезе. ^[9] В широком смысле, эти методы полезны для данных, показывающих нерегулярные колебания (краткосрочные изменчивости), и данные с таким поведением изобилуют в реальном мире. Однако мы часто наблюдаем данные с очевидной периодичностью, например, годовые числа солнечных пятен, электрокардиограмму (ЭКГ) и т. д. Временные ряды, показывающие сильные периодичности, явно не согласуются с линейными нулевыми гипотезами. Для решения этого случая были предложены некоторые алгоритмы и нулевые гипотезы. ^[18]^[19]^[20]

Смотрите также

Ссылки

^ abcde J. Theiler; S. Eubank; A. Longtin; B. Galdrikian; J. Doyne Farmer (1992). "Тестирование нелинейности временных рядов: метод суррогатных данных" (PDF) . Physica D . 58 (1–4): 77–94. Bibcode :1992PhyD...58...77T. doi :10.1016/0167-2789(92)90102-S.
^ Мур, Джейсон Х. «Бутстраппинг, тестирование перестановок и метод суррогатных данных». Физика в медицине и биологии 44.6 (1999): L11
^ ab Андреас Галка (2000). Темы нелинейного анализа временных рядов: с выводами для анализа ЭЭГ . River Edge, NJ: World Scientific. стр. 222–223. ISBN 9789810241483.
^ ab J. Theiler; D. Prichard (1996). "Метод Монте-Карло с ограниченной реализацией для проверки гипотез". Physica D . 94 (4): 221–235. arXiv : comp-gas/9603001 . Bibcode :1996PhyD...94..221T. doi :10.1016/0167-2789(96)00050-4. S2CID 12568769.
^ А. Галка; Т. Одзаки (2001). «Тестирование нелинейности во временных рядах высокой размерности на основе непрерывной динамики». Physica D. 158 ( 1–4): 32–44. Bibcode : 2001PhyD..158...32G. CiteSeerX 10.1.1.379.7641 . doi : 10.1016/s0167-2789(01)00318-9.
^ JA Scheinkman; B. LeBaron (1989). «Нелинейная динамика и доходность акций». The Journal of Business . 62 (3): 311. doi :10.1086/296465.
^ AR Osborne; AD Kirwan Jr.; A. Provenzale; L. Bergamasco (1986). «Поиск хаотического поведения в крупномасштабных и мезомасштабных движениях в Тихом океане». Physica D. 23 ( 1–3): 75–83. Bibcode : 1986PhyD...23...75O. doi : 10.1016/0167-2789(86)90113-2.
^ T. Schreiber; A. Schmitz (1996). «Улучшенные суррогатные данные для тестов нелинейности». Phys. Rev. Lett . 77 (4): 635–638. arXiv : chao-dyn/9909041 . Bibcode :1996PhRvL..77..635S. doi :10.1103/PhysRevLett.77.635. PMID 10062864. S2CID 13193081.
^ ab T. Schreiber; A. Schmitz (2000). "Суррогатные временные ряды". Physica D. 142 ( 3–4): 346–382. arXiv : chao-dyn/9909037 . Bibcode : 2000PhyD..142..346S. doi : 10.1016/S0167-2789(00)00043-9. S2CID 13889229.
^ T. Schreiber (1998). «Ограниченная рандомизация данных временных рядов». Phys. Rev. Lett . 80 (4): 2105–2108. arXiv : chao-dyn/9909042 . Bibcode :1998PhRvL..80.2105S. doi :10.1103/PhysRevLett.80.2105. S2CID 42976448.
^ Р. Энгберт (2002). «Тестирование нелинейности: роль суррогатных данных». Хаос, солитоны и фракталы . 13 (1): 79–84. Bibcode : 2002CSF....13...79E. doi : 10.1016/S0960-0779(00)00236-8.
^ M. Breakspear; M. Brammer; PA Robinson (2003). «Построение многомерных суррогатных наборов из нелинейных данных с использованием вейвлет-преобразования». Physica D. 182 ( 1): 1–22. Bibcode : 2003PhyD..182....1B. doi : 10.1016/S0167-2789(03)00136-2.
^ CJ Keylock (2006). "Ограниченные суррогатные временные ряды с сохранением структуры среднего и дисперсии". Phys. Rev. E. 73 ( 3): 036707. Bibcode : 2006PhRvE..73c6707K. doi : 10.1103/PhysRevE.73.036707. PMID 16605698.
^ CJ Keylock (2007). «Метод на основе вейвлетов для генерации суррогатных данных». Physica D. 225 ( 2): 219–228. Bibcode : 2007PhyD..225..219K. doi : 10.1016/j.physd.2006.10.012.
^ T. Nakamura; M. Small (2005). "Small-shuffle surrogate data: Testing for dynamics in fluctuing data with trends". Phys. Rev. E. 72 ( 5): 056216. Bibcode : 2005PhRvE..72e6216N. doi : 10.1103/PhysRevE.72.056216. hdl : 10397/4826 . PMID 16383736.
^ T. Nakamura; M. Small; Y. Hirata (2006). "Тестирование нелинейности в нерегулярных колебаниях с долгосрочными тенденциями". Phys. Rev. E. 74 ( 2): 026205. Bibcode : 2006PhRvE..74b6205N. doi : 10.1103/PhysRevE.74.026205. hdl : 10397/7633 . PMID 17025523.
^ JH Lucio; R. Valdés; LR Rodríguez (2012). «Улучшения методов суррогатных данных для нестационарных временных рядов». Phys. Rev. E. 85 ( 5): 056202. Bibcode : 2012PhRvE..85e6202L. doi : 10.1103/PhysRevE.85.056202. PMID 23004838.
^ J. Theiler (1995). «О доказательствах низкоразмерного хаоса в эпилептической электроэнцефалограмме». Physics Letters A. 196 ( 5–6): 335–341. Bibcode : 1995PhLA..196..335T. doi : 10.1016/0375-9601(94)00856-K.
^ M. Small; D. Yu; RG Harrison (2001). "Суррогатный тест для псевдопериодических данных временных рядов". Phys. Rev. Lett . 87 (18): 188101. Bibcode :2001PhRvL..87r8101S. doi :10.1103/PhysRevLett.87.188101. hdl : 10397/4856 .
^ X. Luo; T. Nakamura; M. Small (2005). "Суррогатный тест для различения хаотических и псевдопериодических временных рядов". Phys. Rev. E . 71 (2): 026230. arXiv : nlin/0404054 . Bibcode :2005PhRvE..71b6230L. doi :10.1103/PhysRevE.71.026230. hdl :10397/4828. PMID 15783410. S2CID 35512941.