Цифровая автоматизированная система идентификации (DAISY) — это автоматизированная система идентификации видов , оптимизированная для быстрого скрининга беспозвоночных (например, насекомых) неспециалистами (например, паратаксономистами ).
Она была разработана доктором Марком О'Нилом в середине 1990-х годов. Разработка финансировалась Darwin Initiative в 1997 году [1] и BBSRC . [2] Права на интеллектуальную собственность были приобретены компанией О'Нила, Tumbling Dice Ltd, в феврале 2000 года [3] по окончании гранта Darwin Project. Система подверглась дальнейшему развитию, в результате чего был создан экземпляр, доступный через Интернет и способный в режиме, близком к реальному времени, обрабатывать группы (например, бражники ), содержащие несколько сотен таксонов . На среднем и высоком уровне серверного оборудования ПК (например, blade-сервер ) идентификация возможна менее чем за секунду для группы из 300 таксонов. Распараллеливание критических кодов классификатора DAISY (с использованием либо заказной технологии FPGA , либо технологии программирования GPU общего назначения , такой как CUDA ) даст увеличение производительности на порядок. Это означает, что DAISY можно использовать для проведения идентификации в реальном времени в группах, содержащих тысячи таксонов (например, настоящие мухи ).
DAISY использовался в нескольких исследовательских проектах О'Нила [4] и других, а также был представлен в научно-популярных телепередачах и статьях в журналах. Проект также был предметом недавней статьи в Science . [5]
В 2011 году первая установка DAISY, способная масштабироваться до сотен таксонов, была установлена в Музее естественной истории в Лондоне. Этот сервер предлагал интерфейсы как VNC , так и веб-сервисов и мог выгружать вычислительные операции сопоставления образов на графический процессор NVIDIA , запрограммированный с использованием CUDA . Эта установка могла обеспечить идентификацию видов, учитывая набор данных из 300+ таксонов, менее чем за секунду в многопользовательской среде.
Совсем недавно, под эгидой финансирования Innovate UK , DAISY была значительно модифицирована для удовлетворения потребностей деятельности upstream в нефтегазовом секторе, в частности биостратиграфии . Результирующая система GeoDAISY представляет собой значительный технологический прогресс. Она способна к глубокому обучению , инкапсуляции знаний, интеллектуальному анализу данных на основе шаблонов и поиску контента (на основе изображений) , а также может эффективно обрабатывать обучающие наборы, состоящие из миллионов шаблонов на товарном оборудовании, используя комбинацию интеллектуального кэширования данных и OpenMP . Более подробная информация о GeoDAISY и обоснование для ее разработки доступны в виде технических документов на странице Tumbling Dice в LinkedIn.