SETI@home («SETI дома») — проект Исследовательского центра SETI в Беркли по анализу радиосигналов с целью поиска признаков внеземного разума . До марта 2020 года он был запущен как общедоступный интернет- проект добровольных вычислений , использующий программную платформу BOINC . Он размещен в Лаборатории космических наук Калифорнийского университета в Беркли и является одним из многих мероприятий, проводимых в рамках всемирной инициативы SETI .
Программное обеспечение SETI@home было выпущено для публики 17 мая 1999 года [5] [6] [7] [8], что сделало его третьим крупномасштабным использованием добровольных вычислений через Интернет в исследовательских целях после запуска Great Internet Mersenne Prime Search (GIMPS) в 1996 году и Distributed.net в 1997 году. Наряду с MilkyWay@home и Einstein@home , это третий крупный вычислительный проект такого типа, основной целью которого является исследование явлений в межзвездном пространстве.
В марте 2020 года проект прекратил отправлять новые работы пользователям SETI@home, что привело к остановке краудсорсингового вычислительного аспекта проекта. [9] В то время команда намеревалась переключить внимание на анализ и интерпретацию накопленных за 20 лет данных. Однако команда оставила открытой возможность в конечном итоге возобновить добровольные вычисления с использованием данных с других радиотелескопов, таких как MeerKAT и FAST . [10]
По состоянию на ноябрь 2021 года научная группа проанализировала данные и удалила шумовые сигналы ( радиочастотные помехи ) с помощью разработанного ими инструмента Nebula и выберет около 100 мультиплетов с наивысшими показателями для наблюдения с помощью сферического телескопа с апертурой в пятьсот метров , на которое им было предоставлено 24 часа времени наблюдения. [11]
Две первоначальные цели SETI@home были:
Вторая из этих целей считается полностью достигнутой. Текущая среда BOINC , являющаяся развитием оригинальной SETI@home, обеспечивает поддержку многих вычислительно-интенсивных проектов в широком спектре дисциплин.
Первая из этих целей на сегодняшний день не дала никаких убедительных результатов: никаких доказательств сигналов ETI не было получено через SETI@home. Однако продолжающееся продолжение основано на предположении, что анализ наблюдений не является «некорректным». Оставшаяся часть этой статьи посвящена именно первоначальным наблюдениям/анализу SETI@home. Подавляющее большинство неба (более 98%) еще не обследовано, и каждая точка на небе должна быть обследована много раз, чтобы исключить даже подмножество возможностей.
SETI@home ищет возможные доказательства радиопередач от внеземного разума, используя данные наблюдений с радиотелескопа Аресибо и телескопа Грин-Бэнк . [14] Данные собираются «впритык» или «пассивно», пока телескоп используется для других научных программ. Данные оцифровываются, сохраняются и отправляются на объект SETI@home. Затем данные разбираются на небольшие фрагменты по частоте и времени и анализируются с помощью программного обеспечения для поиска любых сигналов, то есть изменений, которые нельзя отнести к шуму и, следовательно, содержат информацию. Используя добровольные вычисления, SETI@home отправляет миллионы фрагментов данных для анализа за пределами площадки домашними компьютерами, а затем эти компьютеры сообщают результаты. Таким образом, то, что кажется сложной проблемой в анализе данных, сводится к разумной с помощью большого интернет-сообщества заимствованных компьютерных ресурсов.
Программное обеспечение ищет пять типов сигналов, которые отличают их от шума : [15]
Существует множество вариаций того, как сигнал ETI может быть затронут межзвездной средой и относительным движением его источника по сравнению с Землей. Таким образом, потенциальный «сигнал» обрабатывается многими способами (хотя не проверяются все методы обнаружения или сценарии), чтобы обеспечить наивысшую вероятность отличия его от мерцающего шума, уже присутствующего во всех направлениях внешнего пространства. Например, другая планета, скорее всего, будет двигаться со скоростью и ускорением относительно Земли, и это сместит частоту, со временем, потенциального «сигнала». Проверка этого посредством обработки выполняется, в некоторой степени, в программном обеспечении SETI@home.
Этот процесс чем-то похож на настройку радио на разные каналы и наблюдение за измерителем уровня сигнала. Если уровень сигнала повышается, это привлекает внимание. С технической точки зрения, это включает в себя много цифровой обработки сигнала, в основном дискретные преобразования Фурье с различными скоростями и длительностями щебетания .
На сегодняшний день проект не подтвердил обнаружение каких-либо сигналов ETI . Однако он определил несколько потенциальных целей (позиций на небе), где всплеск интенсивности нелегко объяснить как шумовые пятна, [16] для дальнейшего анализа. Самый значительный потенциальный сигнал на сегодняшний день был объявлен 1 сентября 2004 года и назван Radio source SHGb02+14a .
Хотя проект не достиг заявленной основной цели — поиска внеземного разума, он доказал научному сообществу, что добровольные вычислительные проекты с использованием подключенных к Интернету компьютеров могут быть успешными в качестве жизнеспособного инструмента анализа и даже превзойти самые большие суперкомпьютеры. [17] [ проверка не удалась ] Однако не было продемонстрировано, что порядок величины превышения используемых компьютеров, многие из которых находятся вне дома (первоначальное намерение состояло в том, чтобы использовать 50 000–100 000 «домашних» компьютеров), [18] принес проекту научную пользу. (Подробнее об этом см. ниже в разделе Проблемы.)
Астроном Сет Шостак заявил в 2004 году, что он ожидает получить убедительный сигнал и доказательство контакта с инопланетянами между 2020 и 2025 годами, основываясь на уравнении Дрейка . [19] Это означает, что длительные усилия могут принести пользу SETI@home, несмотря на (текущую) двадцатилетнюю работу без успеха в обнаружении внеземного разума.
Любой, у кого был хотя бы периодически подключенный к Интернету компьютер, мог принять участие в проекте SETI@home, запустив бесплатную программу, которая загружала и анализировала данные радиотелескопа .
Данные наблюдений записывались на 2- терабайтные жесткие диски SATA , загруженные с телескопа Аресибо в Пуэрто-Рико, каждый из которых содержал около 2,5 дней наблюдений, которые затем отправлялись в Беркли . [20] В Аресибо нет широкополосного подключения к Интернету , поэтому данные должны были отправляться по почте в Беркли. [21] Оказавшись там, они делятся как во временной , так и в частотной областях на рабочие единицы по 107 секунд данных, [22] или приблизительно 0,35 мегабайта (350 килобайт или 350 000 байт ), которые перекрываются по времени, но не по частоте. [20] Затем эти рабочие единицы отправляются с сервера SETI@home через Интернет на персональные компьютеры по всему миру для анализа.
Данные были объединены в базу данных с использованием компьютеров SETI@home в Беркли. Помехи были отклонены, и различные алгоритмы обнаружения шаблонов были применены для поиска наиболее интересных сигналов.
Проект использовал CUDA для обработки на GPU , начиная с 2015 года. [23]
В 2016 году SETI@home начал обрабатывать данные проекта Breakthrough Listen . [24]
Программное обеспечение для добровольных вычислений SETI@home работало либо в качестве заставки , либо непрерывно во время работы пользователя, используя процессорное время, которое в противном случае оставалось бы неиспользованным.
Первоначальная программная платформа, теперь называемая «SETI@home Classic», работала с 17 мая 1999 года по 15 декабря 2005 года. Эта программа могла запускать только SETI@home; ее заменила Berkeley Open Infrastructure for Network Computing (BOINC), которая также позволяет пользователям вносить вклад в другие добровольные вычислительные проекты одновременно с запуском SETI@home. Платформа BOINC также позволяла тестировать больше типов сигналов.
Прекращение поддержки платформы SETI@home Classic сделало старые компьютеры Macintosh, работающие под управлением классической Mac OS (до декабря 2001 года), непригодными для участия в проекте.
SETI@home был доступен для консоли Sony PlayStation 3. [25]
3 мая 2006 года началось распространение новых рабочих единиц для новой версии SETI@home под названием "SETI@home Enhanced". Поскольку компьютеры имели мощность для более интенсивной вычислительной работы, чем в начале проекта, эта новая версия была в два раза более чувствительна к гауссовым сигналам и к некоторым видам импульсных сигналов, чем исходное программное обеспечение SETI@home (BOINC). Это новое приложение было оптимизировано до такой степени, что на некоторых рабочих единицах оно работало быстрее, чем в предыдущих версиях. Однако некоторые рабочие единицы (лучшие рабочие единицы, говоря научным языком) занимали значительно больше времени.
Кроме того, некоторые дистрибутивы приложений SETI@home были оптимизированы для определенного типа ЦП . Они назывались «оптимизированными исполняемыми файлами» и, как было обнаружено, работали быстрее на системах, предназначенных для этого ЦП. По состоянию на 2007 год [обновлять]большинство этих приложений были оптимизированы для процессоров Intel и соответствующих им наборов инструкций . [26]
Результаты обработки данных обычно автоматически передавались при следующем подключении компьютера к Интернету; его также можно было заставить подключиться к Интернету по мере необходимости.
С более чем 5,2 миллионами участников по всему миру проект стал добровольным вычислительным проектом с наибольшим количеством участников на сегодняшний день [ когда? ] . Первоначальным намерением SETI@home было задействовать 50 000–100 000 домашних компьютеров. [18] С момента запуска 17 мая 1999 года проект зарегистрировал более двух миллионов лет совокупного вычислительного времени. [ по состоянию на? ] 26 сентября 2001 года SETI@home выполнил в общей сложности 10 21 операций с плавающей запятой . Это было признано изданием Книги рекордов Гиннесса 2008 года как крупнейшее вычисление в истории. [27] С более чем 145 000 активных компьютеров в системе (всего 1,4 миллиона) в 233 странах по состоянию на 23 июня 2013 года [обновлять]SETI@home имел возможность вычислять более 668 терафлопс . [28] Для сравнения, компьютер Tianhe-2 , который по состоянию на 23 июня 2013 года был самым быстрым суперкомпьютером[обновлять] в мире , мог вычислять 33,86 петафлопс (примерно в 50 раз больше).
Планировалось получить данные из обсерватории Паркса в Австралии для анализа южного полушария. [29] Однако по состоянию на 3 июня 2018 года [обновлять]эти планы не были упомянуты на веб-сайте проекта. Другие планы включают в себя многолучевой регистратор данных, проверку ближнего времени и Astropulse (приложение, которое использует когерентную дедисперсию для поиска импульсных сигналов). [30] Astropulse будет работать совместно с оригинальной программой SETI@home для обнаружения других источников, таких как быстро вращающиеся пульсары, взрывающиеся первичные черные дыры или пока неизвестные астрофизические явления. [31] Бета-тестирование финальной публичной версии Astropulse было завершено в июле 2008 года, а распределение рабочих единиц на машины с более высокими характеристиками, способные обрабатывать более ресурсоемкие рабочие единицы, началось в середине июля 2008 года.
31 марта 2020 года Калифорнийский университет в Беркли прекратил отправку новых данных для обработки клиентами SETI@Home, на время прекратив усилия. Программа заявила, что они достигли точки «снижения отдачи» от обработки добровольцами и им необходимо перевести усилия в спящий режим, пока они обрабатывают результаты. [32]
Пользователи SETI@home быстро начали соревноваться друг с другом за обработку максимального количества рабочих единиц. Были сформированы команды для объединения усилий отдельных пользователей. Соревнование продолжалось и стало масштабнее с появлением BOINC.
Как и в любом соревновании, были предприняты попытки «обмануть» систему и заявить о кредите за работу, которая не была выполнена. Для борьбы с мошенничеством система SETI@home отправляет каждую рабочую единицу нескольким компьютерам, значение, известное как «начальная репликация» (в настоящее время 2 ). Кредит предоставляется только за каждую возвращенную рабочую единицу после того, как было возвращено минимальное количество результатов и результаты согласуются, значение, известное как «минимальный кворум» (в настоящее время 2 ). Если из-за ошибок вычислений или мошенничества путем отправки ложных данных согласуется недостаточное количество результатов, отправляется больше идентичных рабочих единиц, пока не будет достигнут минимальный кворум. Окончательный кредит, предоставленный всем машинам, которые вернули правильный результат, одинаков и является наименьшим из значений, заявленных каждой машиной.
Некоторые пользователи установили и запустили SETI@home на компьютерах на своих рабочих местах; этот акт известен как «Borging», в честь борга из «Звездного пути» , стремящегося к ассимиляции . В некоторых случаях пользователи SETI@home злоупотребляли ресурсами компании, чтобы получить результаты рабочего подразделения, и по крайней мере два человека были уволены за запуск SETI@home в производственной системе предприятия. [33] В новостной группе alt.sci.seti есть ветка под названием «Всех уволили за заставку SETI» [34] , которая началась еще 14 сентября 1999 года.
Другие пользователи собирают дома большое количество оборудования, чтобы создать «фермы SETI», которые обычно состоят из нескольких компьютеров, состоящих только из материнской платы , процессора , оперативной памяти и блока питания , которые размещаются на полках как бездисковые рабочие станции, работающие под управлением Linux или старых версий Microsoft Windows «без монитора». [35]
До 2020 года проект SETI@home получал данные из обсерватории Аресибо , которая находилась в ведении Национального центра астрономии и ионосферы и администрировалась SRI International .
Сокращение операционного бюджета обсерватории привело к дефициту средств, который не был восполнен из других источников, таких как частные доноры, НАСА , другие зарубежные научно-исследовательские институты или частные некоммерческие организации, такие как SETI@home.
Однако, по общему мнению многих участников проекта SETI, любой пригодный к использованию радиотелескоп мог бы заменить Аресибо (который полностью вышел из строя в декабре 2020 года) [36] [37] , поскольку все системы SETI являются портативными и перемещаемыми.
В одном задокументированном случае человек был уволен за явный импорт и использование программного обеспечения SETI@home на компьютерах, используемых в американском штате Огайо. [38] В другом случае директор ИТ-отдела школы подал в отставку после того, как его установка предположительно обошлась его школьному округу в 1 миллион долларов на расходы по демонтажу; однако другими причинами этого увольнения были отсутствие связи с начальством, неустановка программного обеспечения брандмауэра и предполагаемая кража компьютерного оборудования, [39] что заставило редактора ZDNet прокомментировать, что «бессмыслица с добровольными вычислениями была просто лучшим и самым очевидным оправданием, по которому округ должен был расторгнуть его контракт с обоснованием ». [40]
По состоянию на 16 октября 2005 года [обновлять]примерно треть обработки для не-BOINC-версии программного обеспечения выполнялась на рабочих или учебных компьютерах. [41] Поскольку многие из этих компьютеров предоставляют ограниченные привилегии обычным пользователям, возможно, что большая часть этого была сделана сетевыми администраторами .
В некоторой степени это может быть компенсировано лучшей связью с домашними машинами и повышением производительности домашних компьютеров, [ необходима ссылка ] особенно тех, которые оснащены графическими процессорами , [42] которые также принесли пользу другим проектам добровольных вычислений, таким как Folding@Home . [43] [44] Распространение мобильных вычислительных устройств предоставляет еще один большой ресурс для добровольных вычислений. Например, в 2012 году Петр Лущек (бывший аспирант Джека Донгарры ) представил результаты, показывающие, что iPad 2 соответствует исторической производительности Cray-2 (самого быстрого компьютера в мире в 1985 году) на встроенном бенчмарке LINPACK . [45]
В настоящее время нет государственного финансирования исследований SETI, а частное финансирование всегда ограничено. Космическая научная лаборатория Беркли нашла способы работы с небольшими бюджетами, и проект получил пожертвования, что позволило ему выйти далеко за рамки первоначально запланированной продолжительности, но ему все еще приходится конкурировать за ограниченное финансирование с другими проектами SETI и другими проектами космических наук.
В призыве о пожертвованиях от 16 декабря 2007 года SETI@home заявила о своем нынешнем скромном состоянии и призвала пожертвовать 476 000 долларов, необходимых для продолжения работы в 2008 году.
Ряд лиц и компаний внесли неофициальные изменения в распределенную часть программного обеспечения, чтобы попытаться получить более быстрые результаты, но это поставило под угрозу целостность всех результатов. [46] В результате программное обеспечение пришлось обновить, чтобы упростить обнаружение таких изменений и обнаружение ненадежных клиентов. BOINC будет работать на неофициальных клиентах; однако клиенты, которые возвращают разные и, следовательно, неверные данные, не допускаются, поэтому повреждение базы данных результатов избегается. BOINC полагается на перекрестную проверку для проверки данных [47], но ненадежные клиенты должны быть идентифицированы, чтобы избежать ситуаций, когда два из них сообщают одни и те же неверные данные и, следовательно, повреждают базу данных. Очень популярный неофициальный клиент (lunatic) позволяет пользователям использовать специальные функции, предоставляемые их процессорами, такими как SSE , SSE2 , SSE3 , SSSE3 , SSE4.1 и AVX , для обеспечения более быстрой обработки.
SETI@home — это испытательный стенд для дальнейшего развития не только BOINC, но и других технологий аппаратного и программного обеспечения (базы данных). При нагрузках обработки SETI@home эти экспериментальные технологии могут оказаться более сложными, чем ожидалось, поскольку базы данных SETI не содержат типичных бухгалтерских и бизнес-данных или реляционных структур. Нетрадиционное использование баз данных часто влечет за собой большие накладные расходы на обработку и риск повреждения базы данных и полного отказа базы данных. Сбои оборудования, программного обеспечения и баз данных могут (и вызывают) провалы в участии в проекте.
Проект пришлось закрыть несколько раз, чтобы перейти на новые базы данных, способные обрабатывать более массивные наборы данных. Отказ оборудования оказался существенным источником остановок проекта, поскольку отказ оборудования часто сопровождается повреждением базы данных.