stringtranslate.com

Список наборов данных для исследований в области машинного обучения

Эти наборы данных используются в исследованиях машинного обучения (ML) и цитируются в рецензируемых научных журналах . Наборы данных являются неотъемлемой частью области машинного обучения. Крупные достижения в этой области могут быть результатом достижений в алгоритмах обучения (таких как глубокое обучение ), компьютерного оборудования и, что менее интуитивно понятно, доступности высококачественных наборов обучающих данных. [1] Высококачественные помеченные наборы обучающих данных для контролируемых и полуконтролируемых алгоритмов машинного обучения обычно сложно и дорого создавать из-за большого количества времени, необходимого для маркировки данных. Хотя их не нужно маркировать, создание высококачественных наборов данных для обучения без учителя также может быть трудным и дорогостоящим. [2] [3] [4] [5]

Многие организации, включая правительства, публикуют и делятся своими наборами данных . Наборы данных классифицируются в зависимости от лицензий на открытые данные и неоткрытые данные .

Наборы данных различных государственных органов представлены в Списке открытых сайтов государственных данных . Наборы данных портируются на порталы открытых данных . Они доступны для поиска, размещения и доступа через такие интерфейсы, как Open API . Наборы данных доступны в различных отсортированных типах и подтипах.

Список сортировок, используемых для наборов данных

Портал данных классифицируется в зависимости от типа лицензии. Порталы данных с открытым исходным кодом, основанные на лицензии , известны как порталы открытых данных , которые используются многими правительственными организациями и академическими учреждениями .

Список порталов открытых данных

Список порталов, подходящих для нескольких типов приложений

Портал данных иногда перечисляет самые разнообразные подтипы наборов данных, относящиеся ко многим приложениям машинного обучения .

Список порталов, подходящих для конкретного подтипа приложений

Порталы данных, подходящие для определенного подтипа приложения машинного обучения, перечислены в последующих разделах.

Данные изображения

Текстовые данные

Эти наборы данных состоят в основном из текста для таких задач, как обработка естественного языка , анализ настроений , перевод и кластерный анализ .

Отзывы

Новостные статьи

Сообщения

Твиттер и твиты

Диалоги

Юридический

Другой текст

Звуковые данные

Эти наборы данных состоят из звуков и звуковых характеристик, используемых для таких задач, как распознавание и синтез речи .

Речь

Музыка

Другие звуки

Данные сигнала

Наборы данных, содержащие информацию об электрическом сигнале, требующую какой-либо обработки сигнала для дальнейшего анализа.

Электрический

Отслеживание движения

Другие сигналы

Физические данные

Наборы данных из физических систем.

Физика высоких энергий

Системы

Астрономия

Наука о планете Земля

Другие физические

Биологические данные

Наборы данных из биологических систем.

Человек

Животное

Грибы

Растение

Микроб

Открытие лекарств

Данные об аномалиях

Данные для ответов на вопросы

В этот раздел включены наборы данных, посвященные структурированным данным.

Данные диалога или инструкции

В этом разделе представлены наборы данных, которые...

Информационная безопасность

Климат и устойчивость

Данные кода

Многомерные данные

Финансовый

Погода

Перепись

Транзит

Интернет

Игры

Прочие многомерные

Кураторские репозитории наборов данных

Поскольку наборы данных имеют множество форматов и иногда их может быть сложно использовать, была проделана значительная работа по созданию и стандартизации формата наборов данных, чтобы упростить их использование для исследований в области машинного обучения.

Смотрите также

Рекомендации

  1. ^ Висснер-Гросс, А. «Наборы данных по алгоритмам». Edge.com . Проверено 8 января 2016 г.
  2. ^ Вайс, генеральный директор; Провост, Ф. (1 сентября 2003 г.). «Обучение, когда обучающие данные обходятся дорого: влияние распределения классов на индукцию дерева». Журнал исследований искусственного интеллекта . Фонд доступа к искусственному интеллекту. 19 : 315–354. дои : 10.1613/jair.1199. ISSN  1076-9757. S2CID  2344521.
  3. ^ Терни, Питер (2000). «Типы затрат в индуктивном концептуальном обучении». arXiv : cs/0212034 .
  4. Эбни, Стивен (17 сентября 2007 г.). Полуконтролируемое обучение компьютерной лингвистике. ЦРК Пресс. ISBN 978-1-4200-1080-0.
  5. ^ Жлиобайте, Индре; Бифет, Альберт; Пфарингер, Бернхард; Холмс, Джефф (2011). «Активное обучение с развивающимися потоковыми данными». Машинное обучение и обнаружение знаний в базах данных . Конспекты лекций по информатике. Том. 6913. Берлин, Гейдельберг: Springer Berlin Heidelberg. стр. 597–612. дои : 10.1007/978-3-642-23808-6_39. ISBN 978-3-642-23807-9. ISSN  0302-9743.
  6. ^ Маколи, Джулиан; Таргетт, Кристофер; Ши, Циньфэн; Антон ван ден Хенгель (2015). «Рекомендации по стилям и заменителям на основе изображений». arXiv : 1506.04757 [cs.CV].
  7. ^ «Данные обзора Amazon» . nijianmo.github.io . Проверено 8 октября 2021 г.
  8. ^ Ганесан, Кавита; Чжай, Чэнсян (2012). «Рейтинг организаций на основе мнений». Поиск информации . 15 (2): 116–150. дои : 10.1007/s10791-011-9174-8. hdl : 2142/15252 . S2CID  16258727.
  9. ^ Льв, Юаньхуа, Димитриос Лимберопулос и Цян Ву. «Исследование эвристики ранжирования в мобильном локальном поиске». Материалы 35-й международной конференции ACM SIGIR «Исследования и разработки в области информационного поиска ». АКМ, 2012.
  10. ^ Харпер, Ф. Максвелл; Констан, Джозеф А. (2015). «Наборы данных MovieLens: история и контекст». Транзакции ACM в интерактивных интеллектуальных системах . 5 (4): 19. дои : 10.1145/2827872. S2CID  16619709.
  11. ^ Кенигштейн, Ноам, Гидеон Дрор и Иегуда Корен. «Музыкальные рекомендации Yahoo!: моделирование музыкальных рейтингов с учетом временной динамики и таксономии предметов». Материалы пятой конференции ACM по рекомендательным системам . АКМ, 2011.
  12. ^ Макфи, Брайан и др. «Вызов набора данных на миллион песен». Материалы 21-й международной конференции-спутника по Всемирной паутине . АКМ, 2012.
  13. ^ Боанец, Марко и Владислав Райкович. «Получение знаний и объяснение принятия решений по нескольким атрибутам». 8-й международный семинар по экспертным системам и их приложениям . 1988.
  14. ^ Тан, Питер Дж. и Дэвид Л. Доу. «MML-вывод графов решений с многосторонними соединениями». Австралийская совместная конференция по искусственному интеллекту . 2002.
  15. ^ «Количественная оценка комедии на YouTube: почему количество букв в вашем LOL имеет значение» . Метатекстовая база данных НЛП . Проверено 26 октября 2020 г.
  16. ^ Ким, Бён Джу (2012). «Классификатор больших данных». Конвергенция и гибридные информационные технологии . Коммуникации в компьютерной и информатике. Том. 310. стр. 505–512. дои : 10.1007/978-3-642-32692-9_63. ISBN 978-3-642-32691-2.
  17. ^ Пересгонсалес, Хосе Д.; Гилби, Эндрю (2011). «Прогнозирование рейтингов аэропортов Skytrax на основе отзывов клиентов». Журнал управления аэропортами . 5 (4): 335–339.
  18. ^ Ло, Вэй-Инь и Ю-Шань Ши. «Методы раздельного выбора для деревьев классификации». Statistica sinica (1997): 815–840.
  19. ^ Лим, Тьен-Сиен; Ло, Вэй-Инь; Ши, Ю-Шань (2000). «Сравнение точности прогнозирования, сложности и времени обучения тридцати трех старых и новых алгоритмов классификации». Машинное обучение . 40 (3): 203–228. дои : 10.1023/а: 1007608224229. S2CID  17030953.
  20. ^ Киет Ван Нгуен, Ву Дук Нгуен, Фу XV Нгуен, Тхам Т.Х. Труонг, Нган Луу-Туи Нгуен. «UIT-VSFC: Корпус отзывов вьетнамских студентов для анализа настроений»
  21. ^ Хо, Вонг Ань; Нгуен, Дуонг Хуинь-Конг; Нгуен, Дань Хоанг; Фам, Линь Тхи-Ван; Нгуен, Дык-Ву; Нгуен, Киет Ван; Нгуен, Нган Луу-Туи (2020). «Распознавание эмоций в текстах вьетнамских социальных сетей». Компьютерная лингвистика . Коммуникации в компьютерной и информатике. Том. 1215. стр. 319–333. arXiv : 1911.09339 . дои : 10.1007/978-981-15-6168-9_27. ISBN 978-981-15-6167-2. S2CID  208202333.
  22. Нхунг Тхи-Хонг Нгуен, Фуонг Ха-Диеу Фан, Луан Тхань Нгуен, Киет Ван Нгуен, Нган Луу-Туи Нгуен (24 апреля 2021 г.). «Вьетнамское обнаружение жалоб на открытые домены на веб-сайтах электронной коммерции». arXiv : 2104.11969 [cs.CL].{{cite arXiv}}: CS1 maint: multiple names: authors list (link)
  23. Фу Зиа Хоанг, Кань Дык Луу, Кхань Куок Тран, Киет Ван Нгуен, Нган Луу-Туи Нгуен (26 января 2023 г.). «ViHOS: вьетнамцы выявляют разжигание ненависти». arXiv : 2301.10186 [cs.CL].{{cite arXiv}}: CS1 maint: multiple names: authors list (link)
  24. ^ Дермуш, Мохамед; Вельсин, Жюльен; Хоас, Лейла; Лаудчер, Сабина (2014). «Совместная модель эволюции тем и настроений с течением времени». Международная конференция IEEE 2014 по интеллектуальному анализу данных . IEEE. стр. 773–778. дои : 10.1109/icdm.2014.82. ISBN 978-1-4799-4302-9.
  25. ^ Роуз, Тони; Стивенсон, Марк; Уайтхед, Майлз (2002). «Корпус Reuters, том 1 - от вчерашних новостей до языковых ресурсов завтрашнего дня» (PDF) . ЛРЭК . 2 . S2CID  9239414. Архивировано из оригинала (PDF) 6 августа 2019 года.
  26. ^ Амини, Массих Р.; Усунье, Николя; Гутте, Кирилл (2009). «Обучение на основе нескольких частично наблюдаемых представлений - приложение к категоризации многоязычного текста». Достижения в области нейронных систем обработки информации . 22 : 28–36.
  27. ^ Лю, Мин; и другие. (2015). «VRCA: алгоритм кластеризации большого количества текстов». Материалы 24-й Международной конференции по искусственному интеллекту . АААИ Пресс. Архивировано из оригинала 5 ноября 2021 года . Проверено 6 августа 2019 г.
  28. ^ Аль-Харби, С; Альмухареб, А; Аль-Тубайти, А; Хоршид, М.С.; Аль-Радже, А. (2008). «Автоматическая классификация арабского текста». Материалы 9-й Международной конференции по статистическому анализу текстовых данных, Лион, Франция .
  29. ^ «Набор данных для оценки извлечения связей и сущностей: Dstl/re3d» . Гитхаб . 17 декабря 2018 г.
  30. ^ "The Examiner - Каталог SpamClickBait" .
  31. ^ "Миллион заголовков новостей" .
  32. ^ «Одна неделя глобальных новостных лент» .
  33. ^ Кулкарни, Рохит (2018), Архив Reuters News-Wire , Harvard Dataverse, doi : 10.7910/DVN/XDB74W
  34. ^ "IrishTimes - Waxy-Wany News" .
  35. ^ «Набор данных заголовков новостей для обнаружения сарказма» . kaggle.com . Проверено 27 апреля 2019 г.
  36. ^ Климт, Брайан и Имин Ян. «Представляем корпус Enron». СЕАС . 2004.
  37. ^ Косинец, Георгий; Кляйнберг, Джон; Уоттс, Дункан (2008). «Структура информационных путей в сети социальных коммуникаций». arXiv : 0806.3201 [физика.soc-ph].
  38. ^ Андрутсопулос, Ион; Куциас, Джон; Чандринос, Константинос В.; Палиурас, Джордж; Спиропулос, Константин Д. (2000). «Оценка наивной байесовской фильтрации спама». В Потамиасе, Г.; Мустакис, В.; ван Сомерен, М. (ред.). Материалы семинара по машинному обучению в эпоху новой информации . 11-я Европейская конференция по машинному обучению, Барселона, Испания. Том. 11. С. 9–17. arXiv : cs/0006013 . Бибкод : 2000cs........6013A.
  39. ^ Братко, Андрей; и другие. (2006). «Фильтрация спама с использованием статистических моделей сжатия данных» (PDF) . Журнал исследований машинного обучения . 7 : 2673–2698.
  40. ^ Алмейда, Тьяго А., Хосе Мария Г. Идальго и Акебо Ямаками. «Вклад в изучение фильтрации SMS-спама: новый сборник и результаты». Материалы 11-го симпозиума ACM по документальной инженерии . АКМ, 2011.
  41. ^ Делани; Джейн, Сара; Бакли, Марк; Грин, Дерек (2012). «Фильтрация SMS-спама: методы и данные». Экспертные системы с приложениями . 39 (10): 9899–9908. дои : 10.1016/j.eswa.2012.02.053. S2CID  15546924.
  42. ^ Иоахимс, Торстен. Вероятностный анализ алгоритма Роккио с TFIDF для категоризации текста . № КМУ-КС-96-118. Университет Карнеги-Меллона, Питтсбург, Пенсильвания, факультет компьютерных наук, 1996 год.
  43. ^ Димитракакис, Христос и Сами Бенджио. Адаптация онлайн-политики для ансамблевых алгоритмов . № EPFL-ОТЧЕТ-82788. ИДИАП, 2002.
  44. ^ Думс, С. и др. «Movietweetings: набор данных о рейтингах фильмов, собранный из Твиттера, 2013 г. Доступно по адресу https://github.com/sidooms/MovieTweetings».
  45. ^ Рой Чоудхури, Аруни; Линь, Цунг-Ю; Маджи, Субхрансу; Узнал-Миллер, Эрик (2017). «Twitter100k: реальный набор данных для кросс-медийного поиска со слабым контролем». arXiv : 1703.06618 [cs.CV].
  46. ^ "huyt16/Twitter100k". Гитхаб . Проверено 26 марта 2018 г.
  47. ^ Иди, Алек; Бхаяни, Рича; Хуан, Лэй (2009). «Классификация настроений в Твиттере с использованием дистанционного наблюдения». Отчет о проекте CS224N, Стэнфорд . 1 : 12.
  48. ^ Чикерсал, Прерна, Суджанья Пориа и Эрик Камбрия. «SeNTU: анализ настроений твитов путем сочетания классификатора на основе правил с контролируемым обучением». Материалы международного семинара по семантической оценке SemEval . 2015.
  49. ^ Зафарани, Реза и Хуан Лю . «Хранилище данных социальных вычислений в АГУ». Школа вычислительной техники, информатики и систем принятия решений, Университет штата Аризона (2009 г.).
  50. ^ Курс по науке о данных от DataTrained Education «Сертифицированный IBM курс по науке о данных [ мертвая ссылка ] ». Сертифицированный IBM онлайн-курс по науке о данных
  51. ^ Маколи, Джулиан Дж.; Лесковец, Юре. «Учимся обнаруживать социальные круги в сетях эго». НИПС . 2012 : 2012.
  52. ^ Шубель, Ловро; Фиала, Далибор; Баец, Марко (2014). «Сетевое статистическое сравнение топологии цитирования библиографических баз данных». Научные отчеты . 4 (6496): 6496. arXiv : 1502.05061 . Бибкод : 2014NatSR...4E6496S. дои : 10.1038/srep06496. ПМЦ 4178292 . ПМИД  25263231. 
  53. ^ Абдулла Н. и др. «Анализ настроений на арабском языке: на основе корпуса и лексикона». Материалы конференции IEEE по прикладной электротехнике и вычислительным технологиям (AEECT) . 2013.
  54. ^ Абурейг, Раддад и др. «Об автоматической категоризации арабских статей на основе их политической направленности». Третья международная конференция по информатике и информатике (ICIEIS2014) . 2014.
  55. ^ Кавала, Франсуа и др. «Прогнозы активности в общественной жизни на линии». 4-я конференция по моделям и анализу резолюций: математические и информатические подходы . 2013.
  56. ^ Сабхарвал, Ашиш; Самуловиц, Хорст; Тезауро, Джеральд (2015). «Выбор почти оптимальных учащихся посредством постепенного распределения данных». arXiv : 1601.00024 [cs.LG].
  57. ^ Сюй и др. «SemEval-2015 Задача 1: Перефраз и семантическое сходство в Twitter (PIT)» Материалы 9-го Международного семинара по семантической оценке . 2015.
  58. ^ Сюй и др. «Извлечение лексически расходящихся парафраз из Твиттера» Транзакции Ассоциации вычислительных технологий (TACL) . 2014.
  59. ^ Миддлтон, Стюарт Э; Миддлтон, Ли; Модаффери, Стефано (2014). «Картирование кризисов стихийных бедствий в реальном времени с использованием социальных сетей» (PDF) . Интеллектуальные системы IEEE . 29 (2): 9–17. дои :10.1109/MIS.2013.126. S2CID  15139204.
  60. ^ "Геопарсепы". 2016.Библиотека Python PyPI
  61. ^ Шмули, Боаз; Ку, Лунь-Вэй; Рэй, Сумья (2020). «Реактивный надзор: новый метод сбора данных о сарказме». Материалы конференции 2020 года по эмпирическим методам обработки естественного языка (EMNLP) . Ассоциация компьютерной лингвистики. стр. 2553–2559. doi : 10.18653/v1/2020.emnlp-main.201. S2CID  221970454.
  62. ^ Шмули, Боаз. «Набор данных сарказма SPIRS». Гитхаб .
  63. ^ Гупта, Аакаш (2020). «Голландская коллекция социальных сетей». Центр данных о COVID-19. дои : 10.5072/FK2/MTPTL7 . Проверено 11 ноября 2023 г.
  64. ^ "Стримлит". Huggingface.co . Проверено 18 декабря 2020 г.
  65. ^ "Голландская коллекция социальных сетей" . kaggle.com . Проверено 18 декабря 2020 г.
  66. ^ Шмули, Боаз; Рэй, Сумья; Лунь-Вэй (2021). «Счастливый танец, медленные хлопки: использование GIF-реакций для прогнозирования вызванного аффекта в Твиттере». Материалы 59-го ежегодного собрания Ассоциации компьютерной лингвистики и 11-й Международной совместной конференции по обработке естественного языка (Том 2: Короткие статьи). Том. Ассоциация компьютерной лингвистики. Как. стр. 395–401. doi : 10.18653/v1/2021.acl-short.50. S2CID  235125510.
  67. ^ Шмули, Вооз (5 мая 2023 г.), ReactionGIF , получено 6 октября 2023 г.
  68. ^ Форсайт Э., Лин Дж. и Мартелл К. (25 июня 2008 г.). Корпус чата NPS. Получено с http://faculty.nps.edu/cmartell/NPSChat.htm.
  69. ^ Сордони, Алессандро; Галлей, Мишель; Аули, Майкл; Брокетт, Крис; Цзи, Янфэн; Митчелл, Маргарет; Не, Цзянь-Юнь; Гао, Цзяньфэн; Долан, Билл (2015). «Нейросетевой подход к контекстно-зависимой генерации диалоговых ответов». arXiv : 1506.06714 [cs.CL].
  70. ^ Шауль, К. и Вестбери К. (2013) Корпус USENET с уменьшенной избыточностью (2005–2011) Эдмонтон, AB: Университет Альберты (загружено с http://www.psych.ualberta.ca/~westburylab/downloads/usenetcorpus .download.html)
  71. ^ КАН, М. (2011, январь). Корпус службы коротких сообщений (SMS) NUS. Получено с http://www.comp.nus.edu.sg/entrepreneurship/innovation/osr/corpus/. Архивировано 29 июня 2018 г. на Wayback Machine.
  72. ^ Застрял_В_Матрице. (2015, 3 июля). У меня есть все общедоступные комментарии Reddit для изучения. ~ 1,7 миллиарда комментариев при сжатии 250 ГБ. Есть ли в этом интерес? [Исходное сообщение]. Сообщение опубликовано на https://www.reddit.com/r/datasets/comments/3bxlg7/i_have_every_publicly_available_reddit_comment/.
  73. ^ Лоу, Райан; Пау, Ниссан; Сербан, Юлиан; Пино, Джоэль (2015). «Корпус диалогов Ubuntu: большой набор данных для исследования неструктурированных многоповоротных диалоговых систем». arXiv : 1506.08909 [cs.CL].
  74. ^ Джейсон Уильямс Антуан Ро Мэтью Хендерсон, «[1]», Диалог и дискурс | Апрель 2016 года.
  75. Хоппе, Трэвис (16 декабря 2021 г.), The-Pile-FreeLaw , получено 11 января 2023 г.
  76. ^ Чжэн, Люсия; Гуха, Нил; Андерсон, Брэндон Р.; Хендерсон, Питер; Хо, Дэниел Э. (21 июня 2021 г.). «Когда предтренировочная подготовка помогает?». Материалы восемнадцатой международной конференции по искусственному интеллекту и праву . Нью-Йорк, штат Нью-Йорк, США: ACM. стр. 159–168. дои : 10.1145/3462757.3466088. ISBN 9781450385268. S2CID  233296302.
  77. ^ "куча закона/куча закона · Наборы данных в Hugging Face" . Huggingface.co . 4 июля 2022 г. Проверено 11 января 2023 г.
  78. ^ «О проекте | Проект доступа к судебным делам» . прецедентное право . Проверено 11 января 2023 г.
  79. ^ К. Ковсари, Д. Е. Браун, М. Хейдарисафа, К. Джафари Мейманди, М. С. Гербер и Л. Е. Барнс, «HDLTex: иерархическое глубокое обучение для классификации текста», 16-я Международная конференция IEEE по машинному обучению и приложениям (ICMLA), 2017 г., стр. 364–371. doi:10.1109/ICMLA.2017.0-134
  80. ^ К. Ковсари, Д. Е. Браун, М. Хейдарисафа, К. Джафари Мейманди, М. С. Гербер и Л. Е. Барнс, «Набор данных Web of Science», doi : 10.17632/9rw3vkcfy4.6
  81. ^ Гальгани, Филиппо, Пол Комптон и Ахим Хоффманн. «Сочетание различных методов реферирования юридического текста». Материалы семинара по инновационным гибридным подходам к обработке текстовых данных . Ассоциация компьютерной лингвистики, 2012.
  82. ^ Нагвани, Северная Каролина (2015). «Обобщение большой коллекции текста с использованием тематического моделирования и кластеризации на основе платформы MapReduce». Журнал больших данных . 2 (1): 1–18. дои : 10.1186/s40537-015-0020-5 .
  83. ^ Шлер, Джонатан; и другие. (2006). «Влияние возраста и пола на ведение блога» (PDF) . Весенний симпозиум AAAI: Вычислительные подходы к анализу блогов . 6 . Архивировано из оригинала (PDF) 14 ноября 2020 года . Проверено 6 августа 2019 г.
  84. ^ Ананд, Пранав и др. «Поверьте мне, мы можем это сделать! Аннотации убедительных действий в тексте блога». Вычислительные модели естественного аргумента . 2011.
  85. ^ Трауд, Аманда Л., Питер Дж. Муха и Мейсон А. Портер. «Социальная структура сетей Facebook». Физика А: Статистическая механика и ее приложения 391.16 (2012): 4165–4180.
  86. ^ Ричард, Эмиль; Саваль, Пьер-Андре; Ваятис, Николас (2012). «Оценка одновременно разреженных и низкоранговых матриц». arXiv : 1206.6474 [cs.DS].
  87. ^ Ричардсон, Мэтью; Берджес, Кристофер Дж.К.; Реншоу, Эрин (2013). «MCTest: набор данных для машинного понимания текста в открытой области». ЕМНЛП . 1 .
  88. ^ Уэстон, Джейсон; Борд, Антуан; Чопра, Сумит; Раш, Александр М.; Барт ван Мерриенбур; Жулен, Арман; Миколов, Томас (2015). «На пути к полному ответу на вопросы с помощью искусственного интеллекта: набор обязательных игрушечных задач». arXiv : 1502.05698 [cs.AI].
  89. ^ Маркус, Митчелл П.; Энн Марцинкевич, Мэри; Санторини, Беатрис (1993). «Создание большого аннотированного корпуса английского языка: The Penn Treebank». Компьютерная лингвистика . 19 (2): 313–330.
  90. ^ Коллинз, Майкл (2003). «Головоуправляемые статистические модели для анализа естественного языка». Компьютерная лингвистика . 29 (4): 589–637. дои : 10.1162/089120103322753356 .
  91. ^ Гийон, Изабель и др., ред. Извлечение функций: основы и приложения . Том. 207. Спрингер, 2008.
  92. ^ Лин, Юрий и др. «Синтаксические аннотации для корпуса ngram книг Google». Материалы демонстраций системы ACL 2012 . Ассоциация компьютерной лингвистики, 2012.
  93. ^ Кришнамурти, Ниведа; и другие. (2013). «Создание описаний видео на естественном языке с использованием текстовых знаний». АААИ . 1 . Архивировано из оригинала 6 августа 2019 года . Проверено 6 августа 2019 г.
  94. ^ Люйкс, Ким и Уолтер Далеманс. «Персоны: корпус предсказаний автора и личности на основе текста [ мертвая ссылка ] ». ЛРЭК . 2008.
  95. ^ Солорио, Тамар, Рагиб Хасан и Майнул Мизан. «Пример обнаружения кукол в Википедии». Семинар по языковому анализу в социальных сетях (LASM) в NAACL HLT . 2013.
  96. ^ "Файлы Pushshift" . файлы.pushshift.io . Архивировано из оригинала 12 января 2023 года . Проверено 12 января 2023 г.
  97. ^ Баумгартнер, Джейсон; Занетту, Саввас; Киган, Брайан; Сквайр, Меган; Блэкберн, Джереми (23 января 2020 г.). «Набор данных Pushshift Reddit». arXiv : 2001.08435 [cs.SI].
  98. ^ Сиарелли, Патрик Маркес и Элиас Оливейра. «Агломерация и устранение условий понижения размерности». Проектирование и применение интеллектуальных систем, 2009. ISDA'09. Девятая международная конференция по . ИИЭР, 2009.
  99. ^ Чжоу, Минъюань, Оскар Эрнан Мадрид Падилья и Джеймс Г. Скотт. «Априорные данные для матриц случайного счета, полученных из семейства отрицательных биномиальных процессов». Только что принятый журнал Американской статистической ассоциации (2015 г.): 00–00.
  100. ^ Коциас, Димитриос и др. «От группы к индивидуальным ярлыкам с использованием глубоких функций». Материалы 21-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных. АКМ, 2015.
  101. ^ Нин, Юэ; Мутия, Сатхаппан; Рангвала, Хузефа; Рамакришнан, Нарен (2016). «Моделирование предшественников для прогнозирования событий посредством вложенного многоэкземплярного обучения». arXiv : 1602.08033 [cs.SI].
  102. ^ Буза, Кристиан. «Прогноз обратной связи для блогов». Анализ данных, машинное обучение и обнаружение знаний . Springer International Publishing, 2014. 145–152.
  103. ^ Сойсал, Омер М (2015). «Анализ правил ассоциации с преимущественно связанными последовательными шаблонами». Экспертные системы с приложениями . 42 (5): 2582–2592. дои : 10.1016/j.eswa.2014.10.049.
  104. ^ Чжу, Юкун и др. «Совмещение книг и фильмов: к визуальным объяснениям, похожим на истории, путем просмотра фильмов и чтения книг». Материалы международной конференции IEEE по компьютерному зрению . 2015.
  105. ^ Боуман, Сэмюэл Р.; Анджели, Габор; Поттс, Кристофер; Мэннинг, Кристофер Д. (2015). «Большой аннотированный корпус для изучения вывода на естественном языке». arXiv : 1508.05326 [cs.CL].
  106. ^ "Коллекция корпуса DSL" . ttg.uni-saarland.de . Проверено 22 сентября 2017 г.
  107. ^ «Городской словарь слов и определений» .
  108. ^ Х. Эльсахар, П. Вугиуклис, А. Ремачи, К. Гравье, Дж. Хэйр, Ф. Лафорест, Э. Симперл, «T-REx: крупномасштабное согласование естественного языка с тройками базы знаний», Труды Одиннадцатая Международная конференция по языковым ресурсам и оценке (LREC-2018).
  109. ^ Ван, Алекс; Сингх, Аманприт; Майкл, Джулиан; Хилл, Феликс; Леви, Омер; Боуман, Сэмюэл Р. (2018). «GLUE: многозадачная платформа для тестирования и анализа понимания естественного языка». arXiv : 1804.07461 [cs.CL].
  110. ^ «Компьютеры учатся читать, но они все еще не такие умные» . Проводной . Проверено 29 декабря 2019 г.
  111. ^ "Эталон КЛЕЯ" . www.glubenchmark.com . Проверено 25 февраля 2019 г.
  112. ^ Цюань, Хоанг Лам; Куанг, Дуй Ле; Ван Киет, Нгуен; Нган, Луу-Туй Нгуен. «UIT-ViIC: Набор данных для первой оценки титров к изображениям на вьетнамском языке».
  113. ^ То, Куок Хай; Нгуен, Ван Киет; Нгуен, Луу Туй Нган; Нгуен, Гиа Туан Ань (2020). «Прогнозирование пола на основе вьетнамских имен с использованием методов машинного обучения». Материалы 4-й Международной конференции по обработке естественного языка и поиску информации . стр. 55–60. arXiv : 2010.10852 . дои : 10.1145/3443279.3443309. ISBN 9781450377607. S2CID  224814110.
  114. ^ Нгуен, Луан Тхань; Ван Нгуен, Киет; Нгуен, Нган Луу-Туи (18 марта 2021 г.). «Обнаружение конструктивной и токсичной речи для комментариев в социальных сетях в открытом доступе на вьетнамском языке». Достижения и тенденции в области искусственного интеллекта. Практика искусственного интеллекта . Конспекты лекций по информатике. Том. 12798. стр. 572–583. arXiv : 2103.10069 . дои : 10.1007/978-3-030-79457-6_49. ISBN 978-3-030-79456-9. S2CID  232269671.
  115. ^ Сакстон, Дэвид и др. «Анализ способностей нейронных моделей к математическому мышлению». Международная конференция по обучению представлений . 2018.
  116. ^ М. Верстег, Р. Тиольер, Т. Шац, X.-N. Цао, К. Ангера, А. Янсен и Э. Дюпу (2015). «The Zero Resource Speech Challenge 2015», в рамках INTERSPEECH-2015.
  117. ^ М. Верстег, X. Ангера, А. Янсен и Э. Дюпу (2016). «Проблема речи с нулевыми ресурсами 2015: предлагаемые подходы и результаты», SLTU-2016.
  118. ^ Сакар, Бетул Эрдогду; и другие. (2013). «Сбор и анализ набора речевых данных Паркинсона с несколькими типами звукозаписей». Журнал IEEE по биомедицинской и медицинской информатике . 17 (4): 828–834. дои : 10.1109/jbhi.2013.2245674. PMID  25055311. S2CID  15491516.
  119. ^ Чжао, Шунан и др. «Автоматическое обнаружение выраженных эмоций при болезни Паркинсона». Акустика, речь и обработка сигналов (ICASSP), Международная конференция IEEE 2014 г., посвященная . ИИЭР, 2014.
  120. ^ Используется в: Хаммами, Насереддине и Моулди Бедде. «Улучшенная древовидная модель распознавания арабской речи». Компьютерные науки и информационные технологии (ICCSIT), 2010 г. 3-я Международная конференция IEEE по . Том. 5. ИИЭР, 2010.
  121. ^ Маатен, Лоуренс. «Изучение дискриминационных ядер Фишера». Материалы 28-й Международной конференции по машинному обучению (ICML-11) . 2011.
  122. ^ Коул, Рональд и Марк Фэнти. «Распознавание устной буквы». Учеб. Третий семинар DARPA по речи и естественному языку . 1990.
  123. ^ Шапель, Оливье; Синдхвани, Викас; Кирти, Сатья С. (2008). «Методы оптимизации для полуконтролируемых машин опорных векторов» (PDF) . Журнал исследований машинного обучения . 9 : 203–233.
  124. ^ Кудо, Минеичи; Тояма, Джун; Симбо, Масару (1999). «Классификация многомерных кривых с использованием областей прохождения». Буквы для распознавания образов . 20 (11): 1103–1111. Бибкод : 1999PaReL..20.1103K. CiteSeerX 10.1.1.46.2515 . дои : 10.1016/s0167-8655(99)00077-x. 
  125. ^ Джагер, Герберт; и другие. (2007). «Оптимизация и применение сетей эхо-состояний с нейронами вытекающего интегратора». Нейронные сети . 20 (3): 335–352. doi :10.1016/j.neunet.2007.04.016. ПМИД  17517495.
  126. ^ Цанас, Афанасий; и другие. (2010). «Точный телемониторинг прогрессирования болезни Паркинсона с помощью неинвазивных речевых тестов». Транзакции IEEE по биомедицинской инженерии (представленная рукопись). 57 (4): 884–893. дои : 10.1109/tbme.2009.2036000. PMID  19932995. S2CID  7382779.
  127. ^ Клиффорд, Гари Д.; Клифтон, Дэвид (2012). «Беспроводные технологии в лечении заболеваний и медицине». Ежегодный обзор медицины . 63 : 479–492. doi : 10.1146/annurev-med-051210-114650. ПМИД  22053737.
  128. ^ Зуэ, Виктор; Сенефф, Стефани; Гласс, Джеймс (1990). «Разработка речевых баз данных в Массачусетском технологическом институте: TIMIT и за его пределами». Речевое общение . 9 (4): 351–356. дои : 10.1016/0167-6393(90)90010-7.
  129. ^ Кападиа, Садик, Валчо Валчев и С. Дж. Янг. «Тренинг MMI для непрерывного распознавания фонем в базе данных TIMIT». Акустика, речь и обработка сигналов, 1993. ICASSP-93., 1993 Международная конференция IEEE по . Том. 2. ИИЭР, 1993.
  130. ^ Халаби, Навар (2016). Современная стандартная арабская фонетика для синтеза речи (PDF) (кандидатская диссертация). Университет Саутгемптона , Школа электроники и информатики.
  131. ^ Ардила, Розана; Брэнсон, Меган; Дэвис, Келли; Хенретти, Майкл; Колер, Майкл; Мейер, Джош; Мораис, Рубен; Сондерс, Линдси; Тайерс, Фрэнсис М.; Вебер, Грегор (13 декабря 2019 г.). «Общий голос: массово-многоязычный речевой корпус». arXiv : 1912.06670v2 [cs.CL].
  132. ^ "Набор речевых данных LJ" . keithito.com . Проверено 13 апреля 2022 г.
  133. ^ Гандура, Абдулкадер; Хьябо, Фарук; Аль-Даккак, Умайма (июнь 2021 г.). «Создание и сравнение набора данных арабских речевых команд для обнаружения небольших ключевых слов». Инженерные применения искусственного интеллекта . 102 : 104267. doi : 10.1016/j.engappai.2021.104267. ISSN  0952-1976. S2CID  235637809.
  134. ^ Чжоу, Фанг, К. Клэр и Росс Д. Кинг. «Предсказание географического происхождения музыки». Data Mining (ICDM), Международная конференция IEEE 2014 г., посвященная . ИИЭР, 2014.
  135. ^ Сакченти, Эдоардо; Камачо, Хосе (2015). «Об использовании k-кратной операции наблюдения в перекрестной проверке PCA». Журнал хемометрики . 29 (8): 467–478. дои : 10.1002/cem.2726. hdl : 10481/55302 . S2CID  62248957.
  136. ^ Бертен-Маье, Тьерри и др. «Набор данных о миллионе песен». ISMIR 2011: Материалы 12-й конференции Международного общества по поиску музыкальной информации, 24–28 октября 2011 г., Майами, Флорида . Университет Майами, 2011.
  137. ^ Хенафф, Микаэль; и другие. (2011). «Неконтролируемое изучение редких функций для масштабируемой классификации аудио» (PDF) . ИСМИР . 11 .
  138. ^ Рафий, Зафар (2017). "Музыка". MUSDB18 — корпус музыкального разделения . дои : 10.5281/zenodo.1117372.
  139. ^ Дефферрард, Майкл; Бензи, Кирелл; Вандергейнст, Пьер; Брессон, Ксавье (6 декабря 2016 г.). «FMA: набор данных для музыкального анализа». arXiv : 1612.01840 [cs.SD].
  140. ^ Эспозито, Роберто; Радичони, Даниэле П. (2009). «Carpediem: Оптимизация алгоритма Витерби и приложений для контролируемого последовательного обучения» (PDF) . Журнал исследований машинного обучения . 10 : 1851–1880.
  141. ^ Сурати, Джамшид; и другие. (2016). «Классификация активного обучения на основе взаимной информации». Энтропия . 18 (2): 51. Бибкод : 2016Entrp..18...51S. дои : 10.3390/e18020051 .
  142. ^ Саламон, Джастин; Джейкоби, Кристофер; Белло, Хуан Пабло. «Набор данных и таксономия для исследования городского звука». Материалы Международной конференции ACM по мультимедиа . АКМ, 2014.
  143. ^ Лагранж, Матье; Лафай, Грегуар; Россиньоль, Матиас; Бенетос, Эммануил; Робель, Аксель (2015). «Среда оценки для обнаружения событий с использованием морфологической модели акустических сцен». arXiv : 1502.00141 [stat.ML].
  144. ^ Геммеке, Йорт Ф. и др. «Набор аудио: онтология и набор данных, помеченных человеком, для аудиособытий». Международная конференция IEEE по акустике, речи и обработке сигналов (ICASSP). 2017.
  145. ^ «Осторожно, птицеловы: искусственный интеллект научился определять птиц по их песням» . Наука | АААС . 18 июля 2018 года . Проверено 22 июля 2018 г.
  146. ^ "Задача по обнаружению звука птиц" . Лаборатория машинного прослушивания в Университете Королевы Марии . 3 мая 2016 года . Проверено 22 июля 2018 г.
  147. ^ Вичерн, Гордон; Антоньини, Джо; Флинн, Майкл; Личэн Ричард Чжу; Маккуинн, Эммет; Ворона, Дуайт; Манилоу, Итан; Джонатан Ле Ру (2019). «БУХ!: Расширение разделения речи на шумную среду». arXiv : 1907.01160 [cs.SD].
  148. ^ Дроссос К., Липпинг С. и Виртанен Т. «Клото: набор данных для аудиотитров» Международная конференция IEEE по акустике, речи и обработке сигналов (ICASSP). 2020.
  149. ^ Дроссос К., Липпинг С. и Виртанен Т. (2019). Набор данных Clotho (Версия 1.0) [Набор данных]. Зенодо . http://doi.org/10.5281/zenodo.3490684
  150. ^ Набор данных CAIDA UCSD по Witty Worm - 19–24 марта 2004 г., http://www.caida.org/data/passive/witty_worm_dataset.xml
  151. ^ Чен, Зешэн и Чуаньи Цзи. «Оптимальный метод сканирования червей с использованием дистрибутивов уязвимых хостов». Международный журнал безопасности и сетей 2.1–2 (2007): 71–80.
  152. ^ Качуи, Мохамад и др. «Высокоточная оценка артериального давления без использования манжеты и без калибровки с использованием времени прохождения импульса [ постоянная мертвая связь ] ». Схемы и системы (ISCAS), Международный симпозиум IEEE 2015 г., посвященный . ИИЭР, 2015.
  153. ^ PhysioBank, PhysioToolkit. «PhysioNet: компоненты нового исследовательского ресурса для сложных физиологических сигналов». Тираж. v101 и23. е215-е220 .
  154. ^ Вергара, Александр; и другие. (2012). «Компенсация дрейфа датчика химического газа с использованием ансамблей классификаторов». Датчики и исполнительные механизмы B: Химические вещества . 166 : 320–329. дои :10.1016/j.snb.2012.01.074.
  155. ^ Коротценков, Г.; Чо, БК (2014). «Инженерные подходы к улучшению параметров кондуктометрических датчиков газа. Часть 2. Снижение рассеиваемой (потребляемой) мощности и повышение стабильности и надежности». Датчики и исполнительные механизмы B: Химические вещества . 198 : 316–341. дои :10.1016/j.snb.2014.03.069.
  156. ^ Куинлан, Джон Р. (1992). «Обучение с помощью непрерывных занятий» (PDF) . 5-я Австралийская совместная конференция по искусственному интеллекту . 92 .
  157. ^ Мерц, Кристофер Дж.; Паццани, Майкл Дж. (1999). «Подход на основе главных компонентов к объединению оценок регрессии». Машинное обучение . 36 (1–2): 9–32. дои : 10.1023/а:1007507221352 .
  158. ^ Торрес-Соспедра, Хоакин и др. «UJIIndoorLoc-Mag: новая база данных для задач локализации по магнитному полю». Внутреннее позиционирование и внутренняя навигация (IPIN), Международная конференция 2015 г. по . ИИЭР, 2015.
  159. ^ Берквенс, Рафаэль, Маартен Вейн и Герберт Переманс. «Средняя взаимная информация вероятностной локализации Wi-Fi». Внутреннее позиционирование и внутренняя навигация (IPIN), Международная конференция 2015 г. Банф, Канада: IPIN . 2015.
  160. ^ Пашке, Фабиан и др. «Sensorlose Zustandsüberwachung an Synchronmotoren». Слушания. 23. Семинар «Вычислительный интеллект», Дортмунд, 5.-6. Декабрь 2013 года . КИТ Научное Издательство, 2013.
  161. ^ Лессмайер, Кристиан и др. «Сбор данных и анализ сигналов на основе измеренных токов двигателя для обнаружения дефектов в электромеханических приводных системах».
  162. ^ Угулино, Уоллес и др. «Носимые компьютеры: классификация поз и движений тела по данным акселерометров. Архивировано 25 сентября 2020 года в Wayback Machine ». Достижения в области искусственного интеллекта – SBIA 2012 . Springer Berlin Heidelberg, 2012. 52–61.
  163. ^ Шнайдер, Ян; и другие. (2015). «Усиление чувств: обзор поддержки обучения на основе датчиков». Датчики . 15 (2): 4097–4133. Бибкод : 2015Senso..15.4097S. дои : 10.3390/s150204097 . ПМК 4367401 . ПМИД  25679313. 
  164. ^ Мадео, Рената CB, Клодоальдо А.М. Лима и Сараджейн М. Перес. «Сегментация единиц жестов с использованием машин опорных векторов: сегментация жестов из исходных положений». Материалы 28-го ежегодного симпозиума ACM по прикладным вычислениям . АКМ, 2013.
  165. ^ Лун, Роанна; Чжао, Вэньбин (2015). «Обзор приложений и распознавания движений человека с помощью Microsoft Kinect». Международный журнал распознавания образов и искусственного интеллекта . 29 (5): 1555008. doi :10.1142/s0218001415550083.
  166. ^ Теодоридис, Теодорос и Хуошэн Ху. «Классификация действий трехмерных моделей человека с использованием динамических ИНС для наблюдения за мобильными роботами. Архивировано 6 августа 2019 года в Wayback Machine ». Робототехника и биомиметика, 2007. РОБИО 2007. Международная конференция IEEE по . ИИЭР, 2007.
  167. ^ Этемад, Сейед Али и Али Арья. «3D-распознавание действий человека и трансформация стиля с использованием устойчивых нейронных сетей обратного распространения ошибки». Интеллектуальные вычисления и интеллектуальные системы, 2009. ICIS 2009. Международная конференция IEEE. Том. 4. ИИЭР, 2009.
  168. ^ Алтун, Керем; Баршан, Биллур; Тунчель, Оркун (2010). «Сравнительное исследование классификации деятельности человека с помощью миниатюрных инерционных и магнитных датчиков». Распознавание образов . 43 (10): 3605–3620. Бибкод : 2010PatRe..43.3605A. дои : 10.1016/j.patcog.2010.04.019. hdl : 11693/11947 .
  169. ^ Натан, Ран ; и другие. (2012). «Использование данных трехосного ускорения для определения поведенческих режимов животных, находящихся на свободном выгуле: общие концепции и инструменты, проиллюстрированные для белоголовых сипов». Журнал экспериментальной биологии . 215 (6): 986–996. дои : 10.1242/jeb.058602. ПМЦ 3284320 . ПМИД  22357592. 
  170. ^ Ангита, Давиде и др. «Распознавание активности человека на смартфонах с использованием многоклассовой аппаратно-совместимой машины опорных векторов». Окружающая среда, сопровождаемая проживанием и уходом на дому . Springer Berlin Heidelberg, 2012. 216–223.
  171. ^ Су, Син; Тонг, Ханхан; Цзи, Пин (2014). «Распознавание активности с помощью датчиков смартфона». Цинхуа Наука и Технология . 19 (3): 235–249. дои : 10.1109/tst.2014.6838194. S2CID  62751498.
  172. ^ Кадус, Мохаммед Валид. Временная классификация: распространение парадигмы классификации на многомерные временные ряды . Дисс. Университет Нового Южного Уэльса, 2002 г.
  173. ^ Грейвс, Алекс и др. «Временная классификация коннекционистов: маркировка данных несегментированных последовательностей с помощью рекуррентных нейронных сетей». Материалы 23-й международной конференции по машинному обучению . АКМ, 2006.
  174. ^ Веллосо, Эдуардо и др. «Качественное распознавание активности упражнений по поднятию тяжестей». Материалы 4-й Международной конференции по дополненному человеку . АКМ, 2013.
  175. ^ Мортазави, Бобак Джек и др. «Определение единой наилучшей оси для распознавания повторений упражнений и расчет умных часов. Архивировано 4 ноября 2021 года в Wayback Machine ». Сети носимых и имплантируемых датчиков тела (BSN), 2014 11-я Международная конференция по . ИИЭР, 2014.
  176. ^ Сапсанис, Христос и др. «Улучшение классификации основных движений рук на основе ЭМГ с использованием ЭМД». Общество инженерии в медицине и биологии (EMBC), 2013 г., 35-я ежегодная международная конференция IEEE . ИИЭР, 2013.
  177. ^ аб Андрианезис, Константинос; Цзес, Энтони (2015). «Разработка и контроль многофункционального протеза руки с приводами из сплава с памятью формы». Журнал интеллектуальных и робототехнических систем . 78 (2): 257–289. дои : 10.1007/s10846-014-0061-6. S2CID  207174078.
  178. ^ Банос, Орести; и другие. (2014). «Работа с эффектами смещения датчика при распознавании активности носимых устройств». Датчики . 14 (6): 9995–10023. Бибкод : 2014Senso..14.9995B. дои : 10.3390/s140609995 . ПМЦ 4118358 . ПМИД  24915181. 
  179. ^ Стисен, Аллан и др. «Умные устройства разные: оценка и смягчение неоднородностей мобильных датчиков для распознавания активности». Материалы 13-й конференции ACM по встраиваемым сетевым сенсорным системам . АКМ, 2015.
  180. ^ Бхаттачарья, Сурав и Николас Д. Лейн. «От умного к глубокому: надежное распознавание активности на умных часах с использованием глубокого обучения».
  181. ^ Баччу, Давиде; и другие. (2014). «Экспериментальная характеристика резервуарных вычислений в приложениях для престарелых». Нейронные вычисления и их приложения . 24 (6): 1451–1464. дои : 10.1007/s00521-013-1364-4. hdl : 11568/237959 . S2CID  14124013.
  182. ^ Палумбо, Филиппо; Барсокки, Паоло; Галличкио, Клаудио; Чесса, Стефано; Микели, Алессио (2013). «Мультисенсорное объединение данных для распознавания активности на основе вычислений резервуаров». Оценка систем AAL посредством сравнительного анализа конкурентов . Коммуникации в компьютерной и информатике. Том. 386. стр. 24–35. дои : 10.1007/978-3-642-41043-7_3. ISBN 978-3-642-41042-0.
  183. ^ Рейсс, Аттила и Дидье Стрикер. «Представляем новый набор эталонных данных для мониторинга активности». Носимые компьютеры (ISWC), 2012 г. 16-й международный симпозиум по . ИИЭР, 2012.
  184. ^ Рогген, Дэниел и др. «ВОЗМОЖНОСТИ: К оппортунистической деятельности и системам распознавания контекста». Мир беспроводных, мобильных и мультимедийных сетей и семинаров, 2009. WoWMoM 2009. Международный симпозиум IEEE по . ИИЭР, 2009.
  185. ^ Курц, Марк и др. «Динамическая количественная оценка возможностей распознавания активности в оппортунистических системах». Конференция по автомобильным технологиям (весна VTC), 73-я конференция IEEE 2011 г. ИИЭР, 2011.
  186. ^ Штайлер, Тимо и Хайнер Штукеншмидт. «Локализация носимых устройств на теле: исследование распознавания активности с учетом положения». Повсеместные вычисления и коммуникации (PerCom), Международная конференция IEEE 2016 г., посвященная . ИИЭР, 2016.
  187. ^ Чжи, Ин Сюань; Лукасик, Мишель; Ли, Майкл Х.; Долатабади, Эльхам; Ван, Розали Х.; Таати, Бабак (2018). «Автоматическое обнаружение компенсации во время роботизированной реабилитационной терапии инсульта». Журнал IEEE трансляционной инженерии в здравоохранении и медицине . 6 : 2100107. doi : 10.1109/JTEHM.2017.2780836. ISSN  2168-2372. ПМК 5788403 . ПМИД  29404226. 
  188. ^ Долатабади, Эльхам; Чжи, Ин Сюань; Да, Бинг; Коаран, Мардж; Лупиначчи, Джорджия; Михайлидис, Алекс; Ван, Розали; Таати, Бабак (23 мая 2017 г.). «Набор данных позы реабилитации после инсульта в Торонто для выявления компенсации во время реабилитационной терапии после инсульта». Материалы 11-й Международной конференции EAI по всеобъемлющим вычислительным технологиям в здравоохранении . АКМ. стр. 375–381. дои : 10.1145/3154862.3154925. ISBN 9781450363631. S2CID  24581930.
  189. ^ "Набор данных позы инсульта для реабилитации в Торонто" .
  190. ^ Юнг, Мерел М.; Поэль, Маннес; Поппе, Рональд; Хейлен, Дирк К.Дж. (1 марта 2017 г.). «Автоматическое распознавание сенсорных жестов в корпусе социальных прикосновений». Журнал о мультимодальных пользовательских интерфейсах . 11 (1): 81–96. дои : 10.1007/s12193-016-0232-9. ISSN  1783-8738. S2CID  1802116.
  191. Юнг, ММ (Мерель) (1 июня 2016 г.). «Корпус социальных контактов (CoST)». Университет Твенте. doi : 10.4121/uuid: 5ef62345-3b3e-479c-8e1d-c922748c9b29. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  192. ^ Эберхард, С., Д. Куманс и О. Де Вел. «Сравнение классификаторов в условиях большой размерности». Кафедра математики. Статистик, Университет Джеймса Кука, Северный Квинсленд, Австралия, Tech. Реп 92-02 (1992).
  193. ^ Басу, Сугато. «Полуконтролируемая кластеризация с ограниченными базовыми знаниями». АААИ . 2004.
  194. ^ Тюфекчи, Пинар (2014). «Прогнозирование выходной электрической мощности при полной нагрузке электростанции комбинированного цикла с базовой нагрузкой с использованием методов машинного обучения». Международный журнал электроэнергетики и энергетических систем . 60 : 126–140. дои : 10.1016/j.ijepes.2014.02.027.
  195. ^ Кая, Хейсем, Пинар Тюфекчи и Фикрет С. Гюрген. «Локальные и глобальные методы обучения для прогнозирования мощности комбинированной газовой и паровой турбины». Международная конференция по новым тенденциям в компьютерной и электронной технике (ICETCEE'2012), Дубай . 2012.
  196. ^ Бальди, Пьер; Садовский, Питер; Уайтсон, Дэниел (2014). «Поиск экзотических частиц в физике высоких энергий с глубоким обучением». Природные коммуникации . 5 : 2014. arXiv : 1402.4735 . Бибкод : 2014NatCo...5.4308B. дои : 10.1038/ncomms5308. PMID  24986233. S2CID  195953.
  197. ^ аб Бальди, Пьер; Садовский, Питер; Уайтсон, Дэниел (2015). «Усовершенствованный поиск бозона Хиггса до τ+ τ− с помощью глубокого обучения». Письма о физических отзывах . 114 (11): 111801. arXiv : 1410.3469 . Бибкод : 2015PhRvL.114k1801B. doi : 10.1103/physrevlett.114.111801. PMID  25839260. S2CID  2339142.
  198. ^ аб Адам-Бурдариос, К.; Коуэн, Г.; Жермен-Рено, К.; Гийон, И.; Кегль, Б.; Руссо, Д. (2015). «Задача машинного обучения Хиггса». Физический журнал: серия конференций . 664 (7): 072015. Бибкод : 2015JPhCS.664g2015A. дои : 10.1088/1742-6596/664/7/072015 .
  199. ^ Бальди, Пьер; Кранмер, Кайл; Фосетт, Тейлор; Садовский, Питер; Уайтсон, Дэниел (2016). «Параметризованные нейронные сети для физики высоких энергий». Европейский физический журнал C . 76 (5): 235. arXiv : 1601.07913 . Бибкод : 2016EPJC...76..235B. doi : 10.1140/epjc/s10052-016-4099-4. S2CID  254108545.
  200. ^ Ортигоса, И.; Лопес, Р.; Гарсия, Дж. «Подход нейронных сетей к прогнозированию остаточного сопротивления парусных яхт». Материалы Международной конференции по морской технике MARINE . 2007 .
  201. ^ Герритсма, Дж., Р. Оннинк и А. Верслуис. Геометрия, устойчивость и устойчивость серии корпусов яхт Delft System . Делфтский технологический университет, 1981 г.
  202. ^ Лю, Хуан и Хироши Мотода. Извлечение, построение и выбор признаков: перспектива интеллектуального анализа данных . Springer Science & Business Media, 1998.
  203. ^ Райх, Йорам. Переход к знаниям идеального дизайна путем обучения . [Университет Карнеги-Меллона], Исследовательский центр инженерного дизайна, 1989.
  204. ^ Тодоровский, Люпчо; Джероски, Сашо (1999). «Эксперименты по метауровенному обучению с помощью ILP». Принципы интеллектуального анализа данных и обнаружения знаний . Конспекты лекций по информатике. Том. 1704. стр. 98–106. дои : 10.1007/978-3-540-48247-5_11. ISBN 978-3-540-66490-1. S2CID  39382993.
  205. ^ Ван, Юн. Новый подход к подгонке линейных моделей в пространствах большой размерности . Дисс. Университет Вайкато, 2000 г.
  206. ^ Киблер, Деннис; Ага, Дэвид В.; Альберт, Марк К. (1989). «Прогнозирование действительных атрибутов на основе экземпляров». Вычислительный интеллект . 5 (2): 51–57. doi :10.1111/j.1467-8640.1989.tb00315.x. S2CID  40800413.
  207. ^ Палмер, Кристофер Р. и Христос Фалуцос. «Внешнее сходство категориальных признаков, основанное на электричестве». Достижения в области обнаружения знаний и интеллектуального анализа данных . Springer Berlin Heidelberg, 2003. 486–500.
  208. ^ Цанас, Афанасий; Хифара, Анжелики (2012). «Точная количественная оценка энергоэффективности жилых зданий с использованием статистических инструментов машинного обучения». Энергия и здания . 49 : 560–567. doi :10.1016/j.enbuild.2012.03.003.
  209. ^ Де Уайльд, Питер (2014). «Разрыв между прогнозируемыми и измеренными энергетическими характеристиками зданий: основа для исследования». Автоматизация в строительстве . 41 : 40–49. doi :10.1016/j.autcon.2014.02.009.
  210. ^ Брукс, Томас Ф., Д. Стюарт Поуп и Майкл А. Марколини. Самошум профиля и прогнозирование . Том. 1218. Национальное управление по аэронавтике и исследованию космического пространства, Управление управления, Отдел научной и технической информации, 1989.
  211. ^ Дрейпер, Дэвид. «Оценка и распространение неопределенности модели». Журнал Королевского статистического общества, серия B (методологический) (1995): 45–97.
  212. ^ Лавин, Майкл (1991). «Проблемы экстраполяции, проиллюстрированные данными об уплотнительных кольцах космического корабля». Журнал Американской статистической ассоциации . 86 (416): 919–921. дои : 10.1080/01621459.1991.10475132.
  213. ^ Ван, Цзюнь, Бэй Ю и Лес Гассер. «Визуализация кластеризации на основе дерева концепций с заштрихованными матрицами сходства». Data Mining, 2002. ICDM 2003. Труды. Международная конференция IEEE 2002 г. по . ИИЭР, 2002.
  214. ^ Петтенгилл, Гордон Х.; Форд, Питер Г.; Джонсон, Уильям Т.К.; Рэйни, Р. Кейт; Содерблом, Лоуренс А. (1991). «Магеллан: характеристики радаров и продукты для обработки данных». Наука . 252 (5003): 260–265. Бибкод : 1991Sci...252..260P. дои : 10.1126/science.252.5003.260. PMID  17769272. S2CID  43398343.
  215. ^ Аб Агаронян, Ф.; и другие. (2008). «Энергетический спектр электронов космических лучей при энергиях ТэВ». Письма о физических отзывах . 101 (26): 261104. arXiv : 0811.3894 . Бибкод : 2008PhRvL.101z1104A. doi :10.1103/PhysRevLett.101.261104. HDL : 2440/51450. PMID  19437632. S2CID  41850528.
  216. ^ Бок, РК; и другие. (2004). «Методы многомерной классификации событий: пример использования изображений черенковского гамма-телескопа». Ядерные приборы и методы в физических исследованиях. Раздел А: Ускорители, спектрометры, детекторы и сопутствующее оборудование . 516 (2): 511–528. Бибкод : 2004NIMPA.516..511B. дои :10.1016/j.nima.2003.08.157.
  217. ^ Ли, Цзинььян; и другие. (2004). «Deeps: новая система ленивого обнаружения и классификации на основе экземпляров». Машинное обучение . 54 (2): 99–124. doi : 10.1023/b:mach.0000011804.08528.7d .
  218. ^ Вильяескуза-Наварро, Франциско; др. и др. (2022). «Многополевой набор данных CAMELS: изучение фундаментальных параметров Вселенной с помощью искусственного интеллекта». Серия дополнений к астрофизическому журналу . 259 (2): 61. arXiv : 2109.10915 . Бибкод : 2022ApJS..259...61В. дои : 10.3847/1538-4365/ac5ab0 . S2CID  237604997.
  219. ^ Зиберт, Ли и Том Симкин. «Вулканы мира: иллюстрированный каталог голоценовых вулканов и их извержений». (2014).
  220. ^ Сикора, Марек; Врубель, Лукаш (2010). «Применение алгоритмов индукции правил для анализа данных, собираемых системами мониторинга сейсмической опасности на угольных шахтах». Архив горных наук . 55 (1): 91–114.
  221. ^ Сикора, Марек и Беата Сикора. «Грубый мониторинг природных опасностей». Грубые наборы: избранные методы и приложения в менеджменте и технике . Springer London, 2012. 163–179.
  222. ^ Аддор, Нанс; Ньюман, Эндрю Дж.; Мизуками, Наоки; Кларк, Мартин П. (20 октября 2017 г.). «Набор данных CAMELS: характеристики водосбора и метеорология для исследований на больших выборках». Гидрология и науки о системе Земли . 21 (10): 5293–5313. Бибкод : 2017HESS...21.5293A. doi : 10.5194/hess-21-5293-2017 . ISSN  1607-7938.
  223. ^ Ньюман, AJ; Кларк, член парламента; Сэмпсон, К.; Вуд, А.; Хэй, Ле; Бок, А.; Вигер, Р.Дж.; Блоджетт, Д.; Брекке, Л.; Арнольд-младший; Хопсон, Т. (14 января 2015 г.). «Разработка большого набора гидрометеорологических данных в масштабе водораздела для прилегающих территорий США: характеристики набора данных и оценка региональной изменчивости характеристик гидрологической модели». Гидрология и науки о системе Земли . 19 (1): 209–223. Бибкод : 2015HESS...19..209N. дои : 10.5194/hess-19-209-2015 . ISSN  1607-7938.
  224. ^ Альварес-Гарретон, Камила; Мендоса, Пабло А.; Буазье, Хуан Пабло; Аддор, Нанс; Гальегильос, Маурисио; Самбрано-Биджарини, Маурисио; Лара, Антонио; Пуэльма, Кристобаль; Кортес, Гонсало; Гарро, Рене; Макфи, Джеймс (13 ноября 2018 г.). «Набор данных CAMELS-CL: атрибуты водосбора и метеорология для крупных выборочных исследований - набор данных Чили». Гидрология и науки о системе Земли . 22 (11): 5817–5846. Бибкод : 2018HESS...22.5817A. дои : 10.5194/hess-22-5817-2018 . ISSN  1607-7938. S2CID  133955609.
  225. ^ Чагас, Винисиус Б.П.; Чаффе, Педро Л.Б.; Аддор, Нанс; Фан, Фернандо М.; Флейшманн, Аян С.; Пайва, Родриго CD; Сикейра, Винисиус А. (8 сентября 2020 г.). «CAMELS-BR: гидрометеорологические временные ряды и атрибуты ландшафта для 897 водосборных бассейнов Бразилии». Данные науки о системе Земли . 12 (3): 2075–2096. Бибкод : 2020ESSD...12.2075C. doi : 10.5194/essd-12-2075-2020 . ISSN  1866-3516. S2CID  234737197.
  226. ^ Коксон, Джемма; Аддор, Нанс; Блумфилд, Джон П.; Фрир, Джим; Фрай, Мэтт; Ханнафорд, Джейми; Хауден, Николас Дж. К.; Лейн, Розанна; Льюис, Мелинда; Робинсон, Эмма Л.; Вагенер, Торстен (12 октября 2020 г.). «CAMELS-GB: гидрометеорологические временные ряды и атрибуты ландшафта для 671 водосборного бассейна Великобритании». Данные науки о системе Земли . 12 (4): 2459–2483. Бибкод : 2020ESSD...12.2459C. doi : 10.5194/essd-12-2459-2020 . ISSN  1866-3516. S2CID  226192657.
  227. ^ Фаулер, Кейрнан Дж.А.; Ачарья, Суваш Чандра; Аддор, Нанс; Чжоу, Чичжун; Пил, Мюррей К. (6 августа 2021 г.). «CAMELS-AUS: гидрометеорологические временные ряды и характеристики ландшафта для 222 водосборов Австралии». Данные науки о системе Земли . 13 (8): 3847–3867. Бибкод : 2021ESSD...13.3847F. doi : 10.5194/essd-13-3847-2021 . ISSN  1866-3516. S2CID  238796784.
  228. ^ Клинглер, Кристоф; Шульц, Карстен; Хернеггер, Мэтью (16 сентября 2021 г.). «LamaH-CE: БОЛЬШАЯ выборка данных для гидрологии и наук об окружающей среде для Центральной Европы». Данные науки о системе Земли . 13 (9): 4529–4565. Бибкод : 2021ESSD...13.4529K. дои : 10.5194/essd-13-4529-2021 . ISSN  1866-3516. S2CID  240533508.
  229. ^ Да, I – C (1998). «Моделирование прочности высокопрочного бетона с использованием искусственных нейронных сетей». Исследования цемента и бетона . 28 (12): 1797–1808. дои : 10.1016/s0008-8846(98)00165-3.
  230. ^ Заранди, М. Х. Фазель; и другие. (2008). «Нечеткие полиномиальные нейронные сети для аппроксимации прочности бетона на сжатие». Прикладные мягкие вычисления . 8 (1): 488–498. Бибкод : 2008ApSoC...8...79S. doi :10.1016/j.asoc.2007.02.010.
  231. ^ Да, И. «Моделирование осадки бетона с помощью летучей золы и суперпластификатора». Компьютеры и бетон 5.6 (2008): 559–572.
  232. ^ Генсель, Осман; и другие. (2011). «Сравнение искусственных нейронных сетей и общих линейных моделей для анализа абразивного износа бетона». Строительство и строительные материалы . 25 (8): 3486–3494. doi :10.1016/j.conbuildmat.2011.03.040.
  233. ^ Дитерих, Томас Г. и др. «Сравнение динамического положения покоя и касательного расстояния для прогнозирования активности наркотиков. Архивировано 7 декабря 2019 года в Wayback Machine ». Достижения в области нейронных систем обработки информации (1994): 216–216.
  234. ^ Бушема, Массимо, Уильям Дж. Тастл и Стефано Терци. «Метасеть: новое семейство метаклассификаторов». Приложения интеллектуального анализа данных с использованием искусственных адаптивных систем . Springer New York, 2013. 141–182.
  235. ^ Амораднежад, Исса; Аморанежад, Рахимберди; и другие. (2022). «Набор данных о возрасте: структурированный набор данных общего назначения о жизни, работе и смерти 1,22 миллиона выдающихся людей». Материалы семинара 16-й Международной конференции AAAI по Интернету и социальным сетям (ICWSM) . МКУВСМ. 3 : 1–4. дои : 10.36190/2022.82. S2CID  249668669.
  236. ^ «Набор данных о возрасте». Гитхаб . 7 июня 2022 г.
  237. ^ «Синтетический набор данных глазного дна». Архивировано из оригинала 29 ноября 2021 года . Проверено 22 февраля 2023 г.
  238. ^ Ло Кастро, Дарио; и другие. (2020). «Визуальная основа для создания фотореалистичных сосудов сетчатки для целей диагностики». Журнал биомедицинской информатики . 108 : 103490. дои : 10.1016/j.jbi.2020.103490. PMID  32640292. S2CID  220429697.
  239. ^ Ингбер, Лестер (1997). «Статистическая механика неокортикальных взаимодействий: канонические показатели импульсов электроэнцефалографии». Физический обзор E . 55 (4): 4578–4593. arXiv : физика/0001052 . Бибкод : 1997PhRvE..55.4578I. doi : 10.1103/PhysRevE.55.4578. S2CID  6390999.
  240. ^ Хоффманн, Ульрих; Весен, Жан-Марк; Эбрахими, Турадж; Дизеренс, Карин (2008). «Эффективный интерфейс мозг-компьютер на базе P300 для людей с ограниченными возможностями». Журнал методов нейробиологии . 167 (1): 115–125. CiteSeerX 10.1.1.352.4630 . doi :10.1016/j.jneumeth.2007.03.005. PMID  17445904. S2CID  9648828. 
  241. ^ Дончин, Эмануэль; Спенсер, Кевин М.; Виджесингхе, Ранджит (2000). «Ментальный протез: оценка скорости интерфейса мозг-компьютер на базе P300». Транзакции IEEE по реабилитационной технике . 8 (2): 174–179. дои : 10.1109/86.847808. PMID  10896179. S2CID  84043.
  242. ^ Детрано, Роберт; и другие. (1989). «Международное применение нового вероятностного алгоритма диагностики ишемической болезни сердца». Американский журнал кардиологии . 64 (5): 304–310. дои : 10.1016/0002-9149(89)90524-9. ПМИД  2756873.
  243. ^ Брэдли, Эндрю П. (1997). «Использование площади под кривой ROC при оценке алгоритмов машинного обучения» (PDF) . Распознавание образов . 30 (7): 1145–1159. Бибкод : 1997PatRe..30.1145B. дои : 10.1016/s0031-3203(96)00142-2. S2CID  13806304.
  244. ^ Улица, Западная Северная Каролина; Вольберг, Вашингтон; Мангасарян, OL (1993). «Извлечение ядерных признаков для диагностики опухоли молочной железы». В Ачарье Радж С.; Гольдгоф, Дмитрий Б. (ред.). Биомедицинская обработка изображений и биомедицинская визуализация. Том. 1905. стр. 861–870. дои : 10.1117/12.148698. S2CID  14922543.
  245. ^ Демир, Чигдем и Бюлент Йенер. «Автоматическая диагностика рака на основе гистопатологических изображений: систематическое исследование». Политехнический институт Ренсселера, техн. Реп (2005).
  246. ^ Злоупотребление, вещество. «Администрация служб психического здоровья, результаты национального исследования по употреблению наркотиков и здоровью 2010 года: краткое изложение национальных результатов, серия NSDUH H-41, публикация HHS № (SMA) 11-4658». Роквилл, Мэриленд: Управление служб по борьбе со злоупотреблением психоактивными веществами и психическим здоровьем 201 (2011).
  247. ^ Хун, Цзы-Цюань; Ян, Цзин-Ю (1991). «Оптимальная дискриминантная плоскость для малого числа выборок и метод построения классификатора на плоскости». Распознавание образов . 24 (4): 317–324. Бибкод : 1991PatRe..24..317H. дои : 10.1016/0031-3203(91)90074-ф.
  248. ^ Аб Ли, Джиньян и Лимсун Вонг. «Использование правил для анализа биомедицинских данных: сравнение C4.5 и PCL». Достижения в области управления информацией в эпоху Интернета . Springer Berlin Heidelberg, 2003. 254–265.
  249. ^ Гювенир, Х. Алтай и др. «Алгоритм контролируемого машинного обучения для анализа аритмии». Компьютеры в кардиологии 1997 . ИИЭР, 1997.
  250. ^ Лагус, Криста и др. «Независимый групповой анализ переменных при изучении компактных представлений данных». Материалы Международной междисциплинарной конференции по адаптивному представлению знаний и рассуждению (AKRR'05), Т. Хонкела, В. Конёнен, М. Пёлля и О. Симула, ред., Эспоо, Финляндия . 2005.
  251. ^ Страк, Беата и др. «Влияние измерения HbA1c на уровень повторной госпитализации: анализ 70 000 записей пациентов из клинической базы данных». BioMed Research International 2014; 2014 год
  252. ^ Рубин, Дэниел Дж (2015). «Госпитальная повторная госпитализация больных сахарным диабетом». Текущие отчеты о диабете . 15 (4): 1–9. дои : 10.1007/s11892-015-0584-7. PMID  25712258. S2CID  3908599.
  253. ^ Антал, Балинт; Хайду, Андраш (2014). «Ансамблевая система автоматического скрининга диабетической ретинопатии». Системы, основанные на знаниях . 60 (2014): 20–27. arXiv : 1410.8576 . Бибкод : 2014arXiv1410.8576A. doi :10.1016/j.knosys.2013.12.023. S2CID  13984326.
  254. ^ Халой, Мринал (2015). «Улучшенное обнаружение микроаневризмы с использованием глубоких нейронных сетей». arXiv : 1505.04424 [cs.CV].
  255. ^ ЭЛИ, Гийом ПАТРИ, Жерве ГОТЬЕ, Бруно ЛЭЙ, Жюльен РОЖЕР, Дэмиен. «ADCIS Загрузка третьей стороны: база данных Messidor». adcis.net . Проверено 25 февраля 2018 г. .{{cite web}}: CS1 maint: multiple names: authors list (link)
  256. ^ Десенсьер, Этьен; Чжан, Сивэй; Казугель, Гай; Лэй, Бруно; Коченер, Беатрис; Трон, Кэролайн; Гейн, Филипп; Ордонес, Ричард; Массин, Паскаль (26 августа 2014 г.). «Отзывы об общедоступной базе данных изображений: база данных Мессидор». Анализ изображений и стереология . 33 (3): 231–234. дои : 10.5566/ias.1155 . ISSN  1854-5165.
  257. ^ Багиров, А.М.; и другие. (2003). «Неконтролируемая и контролируемая классификация данных посредством негладкой и глобальной оптимизации». Вершина . 11 (1): 1–75. CiteSeerX 10.1.1.1.6429 . дои : 10.1007/bf02578945. S2CID  14165678. 
  258. ^ Фунг, Гленн и др. «Быстрый итерационный алгоритм для дискриминанта Фишера с использованием гетерогенных ядер». Материалы двадцать первой международной конференции по машинному обучению . АКМ, 2004.
  259. ^ Куинлан, Джон Росс и др. «Индуктивное приобретение знаний: практический пример». Материалы Второй австралийской конференции по применению экспертных систем . Аддисон-Уэсли Лонгман Паблишинг Ко., Инк., 1987.
  260. ^ Аб Чжоу, Чжи-Хуа; Цзян, Юань (2004). «NeC4.5: нейронный ансамбль на основе C4.5». Транзакции IEEE по знаниям и инженерии данных . 16 (6): 770–773. CiteSeerX 10.1.1.1.8430 . дои : 10.1109/tkde.2004.11. S2CID  1024861. 
  261. ^ Э-э, Орхан; и другие. (2012). «Подход, основанный на вероятностной нейронной сети, для диагностики заболевания мезотелиомой». Компьютеры и электротехника . 38 (1): 75–81. doi : 10.1016/j.compeleceng.2011.09.001.
  262. ^ Эр, Орхан, А. Четин Танрикулу и Абдуррахман Абакай. «Использование методов искусственного интеллекта для диагностики злокачественной мезотелиомы плевры». Диджле Тип Дергиси 42.1 (2015).
  263. ^ Ли, Майкл Х.; Местре, Тьяго А.; Фокс, Сьюзен Х.; Таати, Бабак (25 июля 2017 г.). «Оценка паркинсонизма и дискинезии, вызванной леводопой, на основе зрения с оценкой позы глубокого обучения». Журнал нейроинженерии и реабилитации . 15 (1): 97. arXiv : 1707.09416 . Бибкод : 2017arXiv170709416L. дои : 10.1186/s12984-018-0446-z . ПМК 6219082 . ПМИД  30400914. 
  264. ^ Ли, Майкл Х.; Местре, Тьяго А.; Фокс, Сьюзен Х.; Таати, Бабак (май 2018 г.). «Автоматическая оценка дискинезии, вызванной леводопой: оценка реакции видеофункций». Паркинсонизм и связанные с ним расстройства . 53 : 42–45. doi :10.1016/j.parkreldis.2018.04.036. ISSN  1353-8020. PMID  29748112. S2CID  13666294.
  265. ^ "Набор данных для оценки позы Паркинсона на основе зрения | Kaggle" . kaggle.com . Проверено 22 августа 2018 г.
  266. ^ Шеннон, Пол; и другие. (2003). «Cytoscape: программная среда для интегрированных моделей сетей биомолекулярного взаимодействия». Геномные исследования . 13 (11): 2498–2504. дои : 10.1101/гр.1239303. ПМК 403769 . ПМИД  14597658. 
  267. ^ Джавади, Соруш; Миррошандель, Сейед Аболгасем (2019). «Новый метод глубокого обучения для автоматической оценки изображений спермы человека». Компьютеры в биологии и медицине . 109 : 182–194. doi : 10.1016/j.compbiomed.2019.04.030. ISSN  0010-4825. PMID  31059902. S2CID  146809768.
  268. ^ «soroushj/mhsma-dataset: MHSMA: модифицированный набор данных анализа морфологии спермы человека» . github.com . Проверено 3 мая 2019 г.
  269. ^ Кларк, Дэвид, Золтан Шретер и Энтони Адамс. «Количественное сравнение дистального и обратного распространения ошибки». Материалы австралийской конференции по нейронным сетям 1996 года . 1996.
  270. ^ Цзян, Юань и Чжи-Хуа Чжоу. «Редактирование обучающих данных для классификаторов kNN с ансамблем нейронных сетей». Достижения в области нейронных сетей – ISNN 2004 . Springer Berlin Heidelberg, 2004. 356–361.
  271. ^ Онтаньон, Сантьяго и Энрик Плаза. «О мерах подобия на основе уточняющей решетки». Исследования и разработки рассуждений на основе прецедентов . Springer Berlin Heidelberg, 2009. 240–255.
  272. ^ «Инвентаризация данных PLF» . Гитхаб . 5 ноября 2021 г.
  273. ^ Игера, Клара; Гардинер, Кэтлин Дж.; Чиос, Кшиштоф Дж. (2015). «Самоорганизующиеся карты признаков идентифицируют белки, имеющие решающее значение для обучения в мышиной модели синдрома Дауна». ПЛОС ОДИН . 10 (6): e0129126. Бибкод : 2015PLoSO..1029126H. дои : 10.1371/journal.pone.0129126 . ПМК 4482027 . ПМИД  26111164. 
  274. ^ Ахмед, доктор Махиуддин; и другие. (2015). «Динамика белка, связанная с неудачным и спасенным обучением в мышиной модели синдрома Дауна Ts65Dn». ПЛОС ОДИН . 10 (3): e0119491. Бибкод : 2015PLoSO..1019491A. дои : 10.1371/journal.pone.0119491 . ПМЦ 4368539 . ПМИД  25793384. 
  275. ^ Лэнгли, ПАТ (2014). «Компромисс между простотой и охватом при поэтапном концептуальном обучении» (PDF) . Труды по машинному обучению . 1988 : 73. Архивировано из оригинала (PDF) 6 августа 2019 года . Проверено 6 августа 2019 г.
  276. ^ «Набор данных о грибах 2020» . гриб.mathematik.uni-marburg.de . Проверено 6 апреля 2021 г.
  277. ^ Вагнер, Деннис; Хайдер, Доминик; Хаттаб, Жорж (14 апреля 2021 г.). «Создание, обработка и моделирование грибных данных для поддержки задач классификации». Научные отчеты . 11 (1): 8134. Бибкод : 2021NatSR..11.8134W. дои : 10.1038/s41598-021-87602-3. ISSN  2045-2322. ПМК 8046754 . ПМИД  33854157. 
  278. ^ Кортес, Пауло и Анибал де Хесус Раймундо Мораис. «Подход к интеллектуальному анализу данных для прогнозирования лесных пожаров с использованием метеорологических данных». (2007).
  279. ^ Фаркуад, Массачусетс; Рави, В.; Раджу, С. Бапи (2010). «Поддержка методов извлечения гибридных правил на основе векторной регрессии для прогнозирования». Экспертные системы с приложениями . 37 (8): 5577–5589. дои : 10.1016/j.eswa.2010.02.055.
  280. ^ Фишер, Рональд А. (1936). «Использование множественных измерений в таксономических задачах». Анналы евгеники . 7 (2): 179–188. doi :10.1111/j.1469-1809.1936.tb02137.x. hdl : 2440/15227 .
  281. ^ Гахрамани, Зубин и Майкл И. Джордан. «Обучение под контролем на основе неполных данных с помощью ЭМ-подхода. Архивировано 22 апреля 2017 г. в Wayback Machine ». Достижения в области нейронных систем обработки информации 6 . 1994.
  282. ^ Маллах, Чарльз; Коуп, Джеймс; Оруэлл, Джеймс (2013). «Классификация листьев растений с использованием вероятностной интеграции формы, текстуры и особенностей краев». Обработка сигналов, распознавание образов и приложения . 5 : 1.
  283. ^ Яхиауи, Итери, Ольфа Мзуги и Ножа Буджемаа. «Дескриптор формы листа для идентификации видов деревьев. Архивировано 6 августа 2019 года в Wayback Machine ». Мультимедиа и выставка (ICME), Международная конференция IEEE 2012 г., посвященная . ИИЭР, 2012.
  284. ^ Тан, Минг и Ларри Эшельман. «Использование взвешенных сетей для представления знаний о классификации в зашумленных областях». Материалы Пятой международной конференции по машинному обучению . 2014.
  285. ^ Чаританович, Малгожата и др. «Полный алгоритм кластеризации градиентов для анализа особенностей рентгеновских изображений». Информационные технологии в биомедицине . Springer Berlin Heidelberg, 2010. 15–24.
  286. ^ Санчес, Маурисио А.; и другие. (2014). «Алгоритм нечеткой гранулярной гравитационной кластеризации для многомерных данных». Информационные науки . 279 : 498–511. doi :10.1016/j.ins.2014.04.005.
  287. ^ Блэкард, Джок А.; Дин, Денис Дж. (1999). «Сравнительная точность искусственных нейронных сетей и дискриминантного анализа при прогнозировании типов лесного покрова на основе картографических переменных». Компьютеры и электроника в сельском хозяйстве . 24 (3): 131–151. Бибкод : 1999CEAgr..24..131B. CiteSeerX 10.1.1.128.2475 . дои : 10.1016/s0168-1699(99)00046-0. S2CID  13985407. 
  288. ^ Фюрнкранц, Йоханнес. «Изучение правил по круговому принципу». Материалы 18-й Международной конференции по машинному обучению (ICML-01): 146–153 . 2001.
  289. ^ Ли, Сун; Ассманн, Сара М.; Альберт, Река (2006). «Прогнозирование основных компонентов сетей передачи сигналов: динамическая модель передачи сигналов абсцизовой кислоты замыкающих клеток». ПЛОС Биол . 4 (10): е312. arXiv : q-bio/0610012 . Бибкод : 2006q.bio....10012L. doi : 10.1371/journal.pbio.0040312 . ПМК 1564158 . ПМИД  16968132. 
  290. ^ Мунисами, Тришен; и другие. (2015). «Распознавание листьев растений с использованием особенностей формы и цветовой гистограммы с классификаторами K-ближайших соседей». Procedia Информатика . 58 : 740–747. дои : 10.1016/j.procs.2015.08.095 .
  291. ^ Ли, Бай (2016). «Сопоставление атомных потенциалов: эволюционный подход к распознаванию целей, основанный на краевых характеристиках». Оптик . 127 (5): 3162–3168. Бибкод : 2016Оптик.127.3162Л. дои : 10.1016/j.ijleo.2015.11.186.
  292. ^ Разавиан, Али и др. «Готовые материалы CNN: потрясающая основа для признания». Материалы конференции IEEE по компьютерному зрению и распознаванию образов . 2014.
  293. ^ Нильсбак, Мария-Елена и Эндрю Зиссерман. «Визуальный словарь классификации цветов». Компьютерное зрение и распознавание образов, конференция IEEE Computer Society 2006 г., посвященная . Том. 2. ИИЭР, 2006.
  294. ^ Гизельссон, Томас М.; и другие. (2017). «Общедоступная база данных изображений для эталонных алгоритмов классификации саженцев растений». arXiv : 1711.05458 [cs.CV].
  295. ^ Муресан, Хорея; Олтян, Михай (2018). «Распознавание фруктов по изображениям с использованием глубокого обучения». Акта Univ. Сапиентии, Информатика . 10 (1): 26–42. дои : 10.2478/ausi-2018-0002 .
  296. ^ Олтеан, Михай; Муресан, Хория (2017). «Набор данных с изображениями фруктов на Kaggle».
  297. ^ Накаи, Кента; Канехиса, Минору (1991). «Экспертная система прогнозирования мест локализации белков у грамотрицательных бактерий». Белки: структура, функции и биоинформатика . 11 (2): 95–110. дои : 10.1002/прот.340110203. PMID  1946347. S2CID  27606447.
  298. ^ Линг, Чарльз X. и др. «Деревья решений с минимальными затратами». Материалы двадцать первой международной конференции по машинному обучению . АКМ, 2004.
  299. ^ Маэ, Пьер и др. «Автоматическая идентификация отпечатков пальцев смешанных видов бактерий в масс-спектре MALDI-TOF». Биоинформатика (2014): btu022.
  300. ^ Барбано, Дуэйн; и другие. (2015). «Быстрая характеристика микроводорослей и смесей микроводорослей с использованием времяпролетной масс-спектрометрии с матричной лазерной десорбцией и ионизацией (MALDI-TOF MS)». ПЛОС ОДИН . 10 (8): e0135337. Бибкод : 2015PLoSO..1035337B. дои : 10.1371/journal.pone.0135337 . ПМЦ 4536233 . ПМИД  26271045. 
  301. ^ Хортон, Пол; Накаи, Кента (1996). «Вероятностная система классификации для прогнозирования мест клеточной локализации белков» (PDF) . Протокол ISMB-96 . 4 : 109–15. PMID  8877510. Архивировано из оригинала (PDF) 4 ноября 2021 года . Проверено 6 августа 2019 г.
  302. ^ Оллвейн, Эрин Л.; Шапире, Роберт Э.; Певец Йорам (2001). «Превращение мультикласса в двоичный: объединяющий подход для классификаторов полей» (PDF) . Журнал исследований машинного обучения . 1 : 113–141.
  303. ^ Майр, Андреас; Кламбауэр, Гюнтер; Унтертинер, Томас; Хохрайтер, Зепп (2016). «DeepTox: прогнозирование токсичности с использованием глубокого обучения». Границы в науке об окружающей среде . 3 : 80. дои : 10.3389/fenvs.2015.00080 .
  304. ^ Лавин, Александр; Ахмад, Субутай (12 октября 2015 г.). «Оценка алгоритмов обнаружения аномалий в реальном времени — эталонный тест Numenta Anomaly». 2015 г., 14-я Международная конференция IEEE по машинному обучению и приложениям (ICMLA) . стр. 38–44. arXiv : 1510.03336 . дои : 10.1109/ICMLA.2015.141. ISBN 978-1-5090-0287-0. S2CID  6842305.
  305. ^ Юрий Д. Кацер; Козицын Вячеслав Олегович. «Репозиторий SKAB GitHub». Гитхаб . Проверено 12 января 2021 г.
  306. ^ Юрий Д. Кацер; Козицын Вячеслав Олегович (2020). «Бенчмарк аномалий Сколтеха (СКАБ)». Кэггл. дои : 10.34740/KAGGLE/DSV/1693952 . Проверено 12 января 2021 г. {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  307. ^ Кампос, Гильерме О.; Зимек, Артур ; Сандер, Йорг; Кампелло, Рикардо Дж.Г.Б.; Миценкова, Барбора; Шуберт, Эрих; Согласен, Ира; Хоул, Майкл Э. (2016). «Об оценке неконтролируемого обнаружения выбросов: меры, наборы данных и эмпирическое исследование». Интеллектуальный анализ данных и обнаружение знаний . 30 (4): 891. doi : 10.1007/s10618-015-0444-8. ISSN  1384-5810. S2CID  1952214.
  308. ^ Анн-Катрин Хартманн, Томмазо Сору, Эдгард Маркс. Создание большого набора данных для нейронных ответов на вопросы в базе знаний DBpedia. 2018.
  309. ^ Томмазо Сору, Эдгард Маркс. Диего Муссаллем, Андре Вальдестильяс, Диего Эстевес, Чиро Барон. SPARQL как иностранный язык. 2018.
  310. ^ Киет Ван Нгуен, Дык-Ву Нгуен, Ань Гиа-Туан Нгуен, Нган Луу-Туй Нгуен. Вьетнамский набор данных для оценки понимания машинного чтения. КОЛИНГ 2020.
  311. ^ Киет Ван Нгуен, Кхием Винь Тран, Сон Т. Луу, Ань Гиа-Туан Нгуен, Нган Луу-Туй Нгуен. Расширение лексического подхода с помощью внешних знаний для понимания машинного чтения на вьетнамском языке с множественным выбором. Доступ IEEE. 2020.
  312. ^ Ананта, Равитея; Вакуленко Светлана; Ту, Чжучэн; Лонгпре, Шейн; Пулман, Стивен; Чаппиди, Шринивас (2020). «Ответы на вопросы в открытой области становятся диалоговыми благодаря переписыванию вопросов». arXiv : 2010.04898 [cs.IR].
  313. ^ Хашаби, Дэниел; Мин, Севон; Хот, Тушар; Сабхарвал, Ашиш; Тафьорд, Ойвинд; Кларк, Питер; Хаджиширзи, Ханнане (ноябрь 2020 г.). «UNIFIEDQA: пересекая границы форматов с помощью единой системы контроля качества». Выводы Ассоциации компьютерной лингвистики: EMNLP 2020 . Онлайн: Ассоциация компьютерной лингвистики: 1896–1907. arXiv : 2005.00700 . doi : 10.18653/v1/2020.findings-emnlp.171. S2CID  218487109.
  314. ^ Надсмотрщик, Наборы исследовательских данных Google, 17 декабря 2022 г. , получено 7 января 2023 г.
  315. ^ Бирн, Билл; Кришнамурти, Картик; Санкар, Чиннадхурай; Нилакантан, Арвинд; Дакворт, Дэниел; Явуз, Семих; Гудрич, Бен; Дубей, Амит; Цедильник, Энди; Ким, Кю Ён (1 сентября 2019 г.). «Наставник задач-1: к реалистичному и разнообразному набору данных диалога». arXiv : 1909.05358 [cs.CL].
  316. ^ Ясунага, Мичихиро; Лян, Перси (21 ноября 2020 г.). «Восстановление программы с самоконтролем на основе графиков на основе диагностической обратной связи». Международная конференция по машинному обучению . ПМЛР: 10799–10808. arXiv : 2005.10636 .
  317. ^ Ван, Ичжун; Мишра, Сваруп; Алипурмолабаши, Пега; Корди, Йегане; Мирзаи, Амирреза; Арункумар, Анджана; Ашок, Арджун; Дханасекаран, Арут Сельван; Наик, Атхарва; Стап, Дэвид; Патхак, Эшаан; Караманолакис, Яннис; Лай, Хайжи Гэри; Пурохит, Ишан; Мондал, Ишани (24 октября 2022 г.). «Сверхестественные инструкции: обобщение с помощью декларативных инструкций для более чем 1600 задач НЛП». arXiv : 2204.07705 [cs.CL].
  318. ^ Паперно, Денис; Крушевский, Герман; Лазариду, Анжелики; Фам, Куан Нгок; Бернарди, Рафаэлла; Пеццелле, Сандро; Барони, Марко; Боледа, Джемма; Фернандес, Ракель (7 августа 2016 г.), Набор данных LAMBADA, doi : 10.5281/zenodo.2630551 , получено 7 января 2023 г.
  319. ^ Паперно, Денис; Крушевский, Герман; Лазариду, Анжелики; Фам, Нгок Куан; Бернарди, Рафаэлла; Пеццелле, Сандро; Барони, Марко; Боледа, Джемма; Фернандес, Ракель (август 2016 г.). «Набор данных LAMBADA: предсказание слов, требующее широкого дискурсивного контекста». Материалы 54-го ежегодного собрания Ассоциации компьютерной лингвистики (Том 1: Длинные статьи) . Берлин, Германия: Ассоциация компьютерной лингвистики: 1525–1534 гг. дои : 10.18653/v1/P16-1144. hdl : 10230/32702. S2CID  2381275.
  320. ^ Вэй, Джейсон; Босма, Мартен; Чжао, Винсент; Гуу, Кельвин; Ю, Адамс Вэй; Лестер, Брайан; Ду, Нэн; Дай, Эндрю М.; Ле, Куок В. (10 февраля 2022 г.). «Точно настроенные языковые модели — это ученики с нулевым шансом». arXiv : 2109.01652 . {{cite journal}}: Требуется цитировать журнал |journal=( помощь )
  321. ^ «Работа с ATT&CK | MITRE ATT&CK®» . Attack.mitre.org . Проверено 14 января 2023 г.
  322. ^ «CAPEC - Перечисление и классификация общих шаблонов атак (CAPEC™)» . capec.mitre.org . Проверено 14 января 2023 г.
  323. ^ "CVE - Дом" . cve.mitre.org . Проверено 14 января 2023 г.
  324. ^ «CWE - Перечень общих слабостей» . cwe.mitre.org . Проверено 14 января 2023 г.
  325. ^ Лим, Сви Киат; Муис, Алдриан Обаха; Лу, Вэй; Онг, Чэнь Хуэй (июль 2017 г.). «MalwareTextDB: база данных для аннотированных статей о вредоносном ПО». Материалы 55-го ежегодного собрания Ассоциации компьютерной лингвистики (Том 1: Длинные статьи) . Ванкувер, Канада: Ассоциация компьютерной лингвистики: 1557–1567. дои : 10.18653/v1/P17-1143. S2CID  7816596.
  326. ^ "ЮСЕНИКС". УСЕНИКС . Проверено 19 января 2023 г.
  327. ^ «APTnotes | Прочтите документацию» . readthedocs.org . Проверено 19 января 2023 г.
  328. ^ «Недавние публикации авторов/названий в области криптографии и безопасности» . arxiv.org . Проверено 19 января 2023 г.
  329. ^ «Целостная информационная безопасность для веб-разработчиков - выпуск 0» . f0.holisticinfosecforwebdevelopers.com . Проверено 20 января 2023 г.
  330. ^ «Целостная информационная безопасность для веб-разработчиков - выпуск 1» . f1.holisticinfosecforwebdevelopers.com . Проверено 20 января 2023 г.
  331. ^ Винсент, Адам. «Взлом и усиление защиты веб-сервисов» (PDF) . owasp.org .
  332. ^ Маккрей, Джо. «Расширенное внедрение SQL» (PDF) . defcon.org .
  333. ^ Шах, Шрирадж. «Техника обнаружения и использования слепого внедрения SQL» (PDF) . blueinfy.com .
  334. ^ Палцер, CC «Этический хакерство» (PDF) . текстовые файлы .
  335. ^ «Раскрытые секреты взлома — информационное и учебное руководство» (PDF) .
  336. ^ Парк, Алексис. «Взломать любой сайт» (PDF) .
  337. ^ Серрудо, Сезар; Мартинес Файо, Эстебан. «Взлом баз данных для владения вашими данными» (PDF) . черная шляпа .
  338. ^ О'Коннор, Тиджей. «Violent Python — кулинарная книга для хакеров, судебных аналитиков, тестеров на проникновение и инженеров по безопасности» (PDF) . Гитхаб .
  339. ^ Гранд, Джо. «Реверс-инжиниринг оборудования: доступ, анализ и поражение» (PDF) . черная шляпа .
  340. ^ Чанг, Джейсон В. «Компьютерный взлом: обоснование требований к национальной отчетности» (PDF) . cyber.harvard.edu .
  341. ^ «Национальный репозиторий стратегий кибербезопасности». МСЭ . Проверено 20 января 2023 г.
  342. Чен, Яньлинь (31 августа 2022 г.), Cyber ​​Security Natural Language Processing , получено 20 января 2023 г.
  343. ^ Зампиери, Маркос; Мальмаси, Шервин; Наков, Преслав; Розенталь, Сара; Фарра, Нура; Кумар, Ритеш (16 апреля 2019 г.). «Прогнозирование типа и цели оскорбительных публикаций в социальных сетях». arXiv : 1902.09666 [cs.CL].
  344. ^ «Отчеты об угрозах». www.ncsc.gov.uk. _ Проверено 20 января 2023 г.
  345. ^ «Категория: Отчеты APT | Securelist» . Securelist.com . Проверено 23 января 2023 г.
  346. ^ «Ваша связь с новостями о кибербезопасности - Киберновости | CyberWire» . КиберВайр . Проверено 23 января 2023 г.
  347. ^ "Новости". 21 августа 2016 года . Проверено 23 января 2023 г.
  348. ^ "Киберньюс". Киберньюс .
  349. ^ "БлипингКомпьютер". Мигающий компьютер . Проверено 23 января 2023 г.
  350. ^ «Домашняя страница». Запись из Recorded Future News . Проверено 23 января 2023 г.
  351. ^ «HackRead | Последние киберпреступления - InfoSec-Tech - Новости взлома» . 8 января 2022 г. Проверено 23 января 2023 г.
  352. ^ «Securelist | Исследования и отчеты Касперского об угрозах» . Securelist.com . Проверено 31 января 2023 г.
  353. ^ Харшоу, Кристофер Р.; Бриджес, Роберт А.; Яннаконе, Майкл Д.; Рид, Джоэл В.; Гудолл, Джон Р. (5 апреля 2016 г.). «Графпринты». Материалы 11-й ежегодной конференции по исследованию кибербезопасности и информационной безопасности . ЦИРЦ '16. Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники. стр. 1–4. дои : 10.1145/2897795.2897806. ISBN 978-1-4503-3752-6.
  354. ^ «Farsight Security, решения для кибербезопасности» . Безопасность Фарсайта . Проверено 13 февраля 2023 г.
  355. ^ "Шнайер по безопасности". www.schneier.com . Проверено 13 февраля 2023 г.
  356. ^ «№1 в области облачной безопасности и кибербезопасности конечных точек» . Тренд Микро . Проверено 13 февраля 2023 г.
  357. ^ «Новости хакеров | Надежный сайт новостей о кибербезопасности №1» . Хакерские новости . Проверено 13 февраля 2023 г.
  358. ^ «Кребс о безопасности – подробные новости и расследования безопасности» . Проверено 25 февраля 2023 г.
  359. ^ "График знаний MITRE D3FEND" . d3fend.mitre.org . Проверено 31 марта 2023 г.
  360. ^ "МИТР | АТЛАС™" . atlas.mitre.org . Проверено 31 марта 2023 г.
  361. ^ «MITRE Engage™ | Система взаимодействия с противниками от MITRE» . Проверено 1 апреля 2023 г.
  362. ^ «Учебники по хакерству - лучшие пошаговые руководства по хакерству» . Учебники по взлому . Проверено 1 апреля 2023 г.
  363. ^ "Центр знаний TCFD" . Центр знаний TCFD . Проверено 3 февраля 2023 г. .
  364. ^ "ResponsibilityReports.com" . www.responsibilityreports.com . Проверено 3 февраля 2023 г. .
  365. ^ «О проекте — МГЭИК» . Проверено 20 февраля 2023 г.
  366. ^ «Альянс исследований корпоративной устойчивости | ARCS служит средством продвижения тщательных академических исследований по вопросам корпоративной устойчивости» . Corporate-sustainability.org . Проверено 2 марта 2023 г.
  367. ^ Мехра, Шришти; Лука, Роберт; Чжан, Исюнь (26 марта 2022 г.). «ESGBERT: языковая модель для помощи в задачах классификации, связанных с экологической, социальной и управленческой практикой компаний». Встроенные системы и приложения : 183–190. arXiv : 2203.16788 . doi : 10.5121/csit.2022.120616. ISBN 9781925953657. S2CID  247825524.
  368. ^  В эту статью включен текст, доступный по лицензии CC BY 4.0.
  369. ^ Диггельманн, Томас; Бойд-Грабер, Иордания; Булиан, Яннис; Чиарамита, Массимилиано; Лейппольд, Маркус (2 января 2021 г.). «КЛИМАТНАЯ ЛИХОРАДКА: набор данных для проверки реальных климатических заявлений». arXiv : 2012.00614 [cs.CL].
  370. ^ "Климатические новости-БД" . www.climate-news-db.com . Проверено 3 февраля 2023 г.
  371. ^ "Климатекст". www.sustainablefinance.uzh.ch . Проверено 19 февраля 2023 г.
  372. ^ "Гринбиз". www.greenbiz.com . Проверено 2 марта 2023 г.
  373. ^ «Изучите горячий список @Reuters из 1000 ведущих ученых-климатологов» . Рейтер . Проверено 22 марта 2023 г.
  374. ^ «Блоги | Альянс исследований корпоративной устойчивости» . Corporate-sustainability.org . Проверено 27 марта 2023 г.
  375. ^ "Гринбиз". www.greenbiz.com . Проверено 29 марта 2023 г.
  376. ^ "Новости КСО". www.csrwire.com . Проверено 29 марта 2023 г.
  377. ^ "Домашняя страница CDP" . www.cdp.net . Проверено 29 марта 2023 г.
  378. ^ де Врис, Вред (2022). «Стек: 3 ТБ исходного кода с разрешительной лицензией». arXiv : 2211.15533 [cs.CL].
  379. ^ "Дедуляция стека" . Обнимающее лицо . Проверено 29 августа 2023 г.
  380. ^ «Блог о гибридном облаке» . content.cloud.redhat.com . Проверено 9 апреля 2023 г.
  381. ^ "Оркестровка контейнеров производственного уровня" . Кубернетес . Проверено 9 апреля 2023 г.
  382. ^ «Главная | Официальная документация Red Hat OpenShift» . docs.openshift.com . Проверено 9 апреля 2023 г.
  383. ^ "Фонд облачных вычислений" . Фонд облачных вычислений . Проверено 9 апреля 2023 г.
  384. ^ Презентации сообщества CNCF, Cloud Native Computing Foundation (CNCF), 11 апреля 2023 г. , получено 11 апреля 2023 г.
  385. ^ «Red Hat - Мы создаем технологии с открытым исходным кодом для предприятий» . www.redhat.com . Проверено 1 мая 2023 г.
  386. ^ Браун, Майкл Скотт, Майкл Дж. Пелоси и Генри Дирска. «Генетический алгоритм с динамическим радиусом, сохраняющий виды, для финансового прогнозирования акций индекса Доу-Джонса [ мертвая ссылка ] ». Машинное обучение и интеллектуальный анализ данных в распознавании образов . Springer Berlin Heidelberg, 2013. 27–41.
  387. ^ Шен, Као-И; Цзенг, Гво-Сюн (2015). «Модель VC-DRSA с нечетким выводом для технического анализа: помощь в принятии инвестиционных решений». Международный журнал нечетких систем . 17 (3): 375–389. дои : 10.1007/s40815-015-0058-8. S2CID  68241024.
  388. ^ Куинлан, Дж. Росс (1987). «Упрощение деревьев решений». Международный журнал человеко-машинных исследований . 27 (3): 221–234. CiteSeerX 10.1.1.18.4267 . дои : 10.1016/s0020-7373(87)80053-6. 
  389. ^ Хамерс, Барт; Суйкенс, Йохан АК; Де Мур, Барт (2003). «Связанное трансдуктивное ансамблевое обучение моделей ядра» (PDF) . Журнал исследований машинного обучения . 1 :1–48.
  390. ^ Шмуэли, Галит , Ральф П. Руссо и Вольфганг Янк. «БАРИСТА: модель поступления ставок на онлайн-аукционах». Анналы прикладной статистики (2007): 412–441.
  391. ^ Пэн, Цзе и Ханс-Георг Мюллер. «Дистанционная кластеризация редко наблюдаемых случайных процессов с применением на онлайн-аукционах». Анналы прикладной статистики (2008): 1056–1077.
  392. ^ Эггермонт, Йерун, Йост Н. Кок и Уолтер А. Костерс. «Генетическое программирование для классификации данных: разделение пространства поиска». Материалы симпозиума ACM 2004 года по прикладным вычислениям . АКМ, 2004.
  393. ^ Моро, Серхио; Кортес, Пауло; Рита, Пауло (2014). «Подход, основанный на данных, для прогнозирования успеха банковского телемаркетинга». Системы поддержки принятия решений . 62 : 22–31. дои : 10.1016/j.dss.2014.03.001. hdl : 10071/9499 . S2CID  14181100.
  394. ^ Пейн, Ричард Д.; Маллик, Бани К. (2014). «Байесовская классификация больших данных: обзор с дополнениями». arXiv : 1411.5653 [stat.ME].
  395. ^ Акбилгыч, Огуз; Боздоган, Хампарсум; Балабан, М. Эрдал (2014). «Новая модель гибридных нейронных сетей RBF в качестве прогнозиста». Статистика и вычисления . 24 (3): 365–375. doi : 10.1007/s11222-013-9375-7. S2CID  17764829.
  396. ^ Джабин, Сурайя. «Прогнозирование фондового рынка с использованием искусственной нейронной сети прямого распространения». Межд. Дж. Компьютер. Прил. (IJCA) 99,9 (2014 г.).
  397. ^ Да, И-Ченг; Че-хуэй, Лянь (2009). «Сравнение методов интеллектуального анализа данных для точности прогнозирования вероятности дефолта клиентов по кредитным картам». Экспертные системы с приложениями . 36 (2): 2473–2480. дои : 10.1016/j.eswa.2007.12.020. S2CID  15696161.
  398. ^ Линь, Шу Лин (2009). «Новый двухэтапный гибридный подход к кредитному риску в банковской сфере». Экспертные системы с приложениями . 36 (4): 8333–8341. дои : 10.1016/j.eswa.2008.10.015.
  399. ^ Юмо Сюй и Шей Б. Коэн. 2018. Прогноз движения акций на основе твитов и исторических цен. В материалах 56-го ежегодного собрания Ассоциации компьютерной лингвистики (Том 1: Длинные статьи) , страницы 1970–1979, Мельбурн, Австралия. Ассоциация компьютерной лингвистики.
  400. ^ Пелкманс, Кристиан; и другие. (2005). «Дифференциограмма: непараметрическая оценка дисперсии шума и ее использование для выбора модели». Нейрокомпьютинг . 69 (1): 100–122. doi : 10.1016/j.neucom.2005.02.015.
  401. ^ Бэй, Стивен Д.; и другие. (2000). «Архив больших наборов данных UCI KDD для исследований и экспериментов по интеллектуальному анализу данных». Информационный бюллетень ACM SIGKDD об исследованиях . 2 (2): 81–85. CiteSeerX 10.1.1.15.9776 . дои : 10.1145/380995.381030. S2CID  534881. 
  402. ^ Лукас, Д.Д.; и другие. (2015). «Разработка оптимальных сетей наблюдения за парниковыми газами с учетом производительности и стоимости». Геонаучные приборы, методы и системы данных . 4 (1): 121. Бибкод : 2015GI......4..121L. дои : 10.5194/gi-4-121-2015 .
  403. ^ Пейлс, Джек С.; Килинг, Чарльз Д. (1965). «Концентрация углекислого газа в атмосфере на Гавайях». Журнал геофизических исследований . 70 (24): 6053–6076. Бибкод : 1965JGR....70.6053P. дои : 10.1029/jz070i024p06053.
  404. ^ Сиджиллито, Винсент Г. и др. «Классификация радиолокационных сигналов из ионосферы с использованием нейронных сетей». Технический дайджест Johns Hopkins APL 10.3 (1989): 262–266.
  405. ^ Чжан, Кун и Вэй Фань. «Прогнозирование искаженных стохастических озоновых дней: анализ, решения и не только». Знания и информационные системы 14.3 (2008): 299–326.
  406. ^ Райх, Брайан Дж., Монтсеррат Фуэнтес и Дэвид Б. Дансон. «Байесовская пространственная квантильная регрессия». Журнал Американской статистической ассоциации (2012).
  407. ^ Кохави, Рон (1996). «Повышение точности классификаторов Найва-Байеса: гибрид дерева решений». КДД . 96 .
  408. ^ Оза, Никундж К. и Стюарт Рассел. «Экспериментальное сравнение онлайн- и пакетной версий упаковки и повышения». Материалы седьмой международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . АКМ, 2001.
  409. ^ Бэй, Стивен Д. (2001). «Многомерная дискретизация для интеллектуального анализа множеств». Знания и информационные системы . 3 (4): 491–512. CiteSeerX 10.1.1.217.921 . дои : 10.1007/pl00011680. S2CID  10945544. 
  410. ^ Рагглс, Стивен (1995). «Схемы выборки и ошибки выборки». Исторические методы . 28 (1): 40–46. дои : 10.1080/01615440.1995.9955312.
  411. ^ Мик, Кристофер, Бо Тиссон и Дэвид Хекерман. «Метод кривой обучения применительно к кластеризации». АЙСТАТС . 2001.
  412. ^ Фанаи-Т, Хади; Гама, Жоао (2013). «Маркировка событий, сочетающая ансамблевые детекторы и базовые знания». Прогресс в области искусственного интеллекта . 2 (2–3): 113–127. дои : 10.1007/s13748-013-0040-3. S2CID  3345087.
  413. ^ Жио, Ромен и Рафаэль Шерье. «Прогнозирование использования системы велопроката на день вперед». Вычислительный интеллект в транспортных средствах и транспортных системах (CIVTS), симпозиум IEEE 2014 г., Россия . ИИЭР, 2014.
  414. ^ Чжан, Сяньюань; и другие. (2013). «Оценка времени в пути по городскому маршруту с использованием крупномасштабных данных такси с частичной информацией». Транспортные исследования, часть C: Новые технологии . 33 : 37–49. дои : 10.1016/j.trc.2013.04.001.
  415. ^ Морейра-Матиас, Луис; и другие. (2013). «Прогнозирование спроса пассажиров на такси с использованием потоковых данных». Транзакции IEEE в интеллектуальных транспортных системах . 14 (3): 1393–1402. дои : 10.1109/tits.2013.2262376. S2CID  14764358.
  416. ^ Хван, Рен-Хунг; Сюэ, Ю-Линг; Чен, Ю-Тин (2015). «Эффективная система рекомендаций такси, основанная на модели пространственно-временного факторного анализа». Информационные науки . 314 : 28–40. doi :10.1016/j.ins.2015.03.068.
  417. ^ Х. В. Джагадиш, Йоханнес Герке, Александрос Лабринидис, Яннис Папаконстантину, Джинеш М. Патель, Рагху Рамакришнан и Сайрус Шахаби. Большие данные и их технические проблемы. Коммун. ACM, 57(7):86–94, июль 2014 г.
  418. ^ Кальтранс ПеМС
  419. ^ Мейзель, Роберт и др. «Структура графов в сети — анализ на разных уровнях агрегации». Журнал веб-науки 1.1 (2015).
  420. ^ Кушмерик, Николас. «Учимся удалять интернет-рекламу». Материалы третьей ежегодной конференции по автономным агентам . АКМ, 1999.
  421. ^ Фрадкин, Дмитрий и Дэвид Мэдиган. «Эксперименты со случайными прогнозами для машинного обучения». Материалы девятой международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . АКМ, 2003.
  422. ^ Эти данные использовались в разделах статистической графики и вычислений Американской статистической ассоциации за 1999 год.
  423. ^ Ма, Джастин и др. «Выявление подозрительных URL-адресов: применение масштабного онлайн-обучения». Материалы 26-й ежегодной международной конференции по машинному обучению . АКМ, 2009.
  424. ^ Левченко, Кирилл и др. «Траектории кликов: сквозной анализ цепочки создания стоимости спама». Безопасность и конфиденциальность (SP), симпозиум IEEE 2011 г., посвященный . ИИЭР, 2011.
  425. ^ Мохаммад, Рами М., Фади Табта и Ли Маккласки. «Оценка особенностей фишинговых веб-сайтов с использованием автоматизированного метода». Интернет-технологии и защищенные транзакции, Международная конференция 2012 г. для . ИИЭР, 2012.
  426. ^ Сингх, Ашишкумар и др. «Эксперименты по кластеризации больших данных о транзакциях для сегментации рынка». Материалы Международной конференции по науке о больших данных и вычислительной технике 2014 года . АКМ, 2014.
  427. ^ Боллакер, Курт и др. «Freebase: совместно созданная графовая база данных для структурирования человеческих знаний». Материалы международной конференции ACM SIGMOD 2008 г. по управлению данными . АКМ, 2008.
  428. ^ Минц, Майк и др. «Дистанционный контроль для извлечения отношений без маркированных данных». Материалы совместной конференции 47-го ежегодного собрания ACL и 4-й международной совместной конференции по обработке естественного языка AFNLP: Том 2-Том 2 . Ассоциация компьютерной лингвистики, 2009.
  429. ^ Местерхарм, Крис и Майкл Дж. Паццани. «Активное обучение с использованием онлайн-алгоритмов. Архивировано 22 сентября 2017 г. в Wayback Machine ». Материалы 17-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . АКМ, 2011.
  430. ^ Ван, Шусен; Чжан, Чжихуа (2013). «Улучшение разложения матрицы CUR и аппроксимации Нистрема с помощью адаптивной выборки» (PDF) . Журнал исследований машинного обучения . 14 (1): 2729–2769. arXiv : 1303.4207 . Бибкод : 2013arXiv1303.4207W.
  431. ^ ab "Куча". Pile.eleuther.ai . Проверено 14 апреля 2022 г.
  432. ^ "Линии JSON". jsonlines.org . Проверено 14 апреля 2022 г.
  433. ^ Гао, Лео; Бидерман, Стелла; Блэк, Сид; Голдинг, Лоуренс; Хоппе, Трэвис; Фостер, Чарльз; Пханг, Джейсон; Он, Гораций; Тите, Аниш; Набешима, Ноа; Прессер, Шон (31 декабря 2020 г.). «Куча: набор данных разнообразного текста объемом 800 ГБ для языкового моделирования». arXiv : 2101.00027 [cs.CL].
  434. ^ "ОСКАР". oscar-project.org . Проверено 12 августа 2023 г.
  435. ^ Ортис Суарес, Педро и др. «[2]». Асинхронный конвейер для обработки огромных корпораций в инфраструктурах со средними и низкими ресурсами . ЦМЛК-7, 2019.
  436. ^ Абаджи, Жюльен и др. «[3]». На пути к более чистому многоязычному сканируемому корпусу, ориентированному на документы . ЛРЭЦ, 2022.
  437. ^ Коэн, Ваня. «ОпенВебТекстКорпус». OpenWebTextКорпус . Проверено 9 января 2023 г.
  438. ^ «openwebtext · Наборы данных в обнимающем лице» . Huggingface.co . 16 ноября 2022 г. Проверено 9 января 2023 г.
  439. ^ Солнье, Люсиль (2023). «Корпус BigScience ROOTS: составной многоязычный набор данных объемом 1,6 ТБ». arXiv : 2303.03915 [cs.CL].
  440. ^ «Данные BigScience · Наборы данных в обнимающем лице» . Huggingface.co . 29 августа 2023 г. Проверено 29 августа 2023 г.
  441. ^ Каттрал, Роберт; Оппачер, Франц; Деуго, Дуайт (2002). «Эволюционный анализ данных с автоматическим обобщением правил» (PDF) . Последние достижения в области компьютеров, вычислений и коммуникаций : 296–300. S2CID  18625415. Архивировано из оригинала (PDF) 6 августа 2019 года.
  442. ^ Бертон, Ариэль Н.; Келли, Пол Х.Дж. (2006). «Прогнозирование производительности рабочих нагрузок подкачки с использованием облегченной трассировки». Компьютерные системы будущего поколения . Эльзевир Б.В. 22 (7): 784–793. doi :10.1016/j.future.2006.02.003. ISSN  0167-739X.
  443. ^ Бейн, Майкл; Магглтон, Стивен (1994). «Изучение оптимальных шахматных стратегий». Машинный интеллект . Oxford University Press, Inc. 13 : 291–309. дои : 10.1093/oso/9780198538509.003.0012. ISBN 978-0-19-853850-9.
  444. ^ Килан, младший (1983). «Изучение эффективных процедур классификации и их применение к шахматным эндшпилям». Машинное обучение – эффективные процедуры классификации обучения и их применение в шахматных эндшпильах . Том. 1. С. 463–482. дои : 10.1007/978-3-662-12405-5_15. ISBN 978-3-662-12407-9. {{cite book}}: |journal=игнорируется ( помощь )
  445. ^ Шапиро, Ален Д. (1987). Структурированная индукция в экспертных системах . Аддисон-Уэсли Лонгман Паблишинг Ко., Инк.
  446. ^ Матеус, Кристофер Дж.; Ренделл, Ларри А. (1989). «Конструктивная индукция по деревьям решений» (PDF) . ИДЖКАИ . 89 .[ мертвая ссылка ]
  447. ^ Белсли, Дэвид А., Эдвин Ку и Рой Э. Уэлш. Регрессионная диагностика: выявление влиятельных данных и источников коллинеарности . Том. 571. Джон Уайли и сыновья, 2005.
  448. ^ Руотсало, Туукка; Аройо, Лора; Шрайбер, Гус (2009). «Лингвистическая аннотация цифровых коллекций культурного наследия, основанная на знаниях» (PDF) . Интеллектуальные системы IEEE . 24 (2): 64–75. дои : 10.1109/MIS.2009.32. hdl : 1871.1/9f6091aa-9596-46a9-9251-f11edeeb28b7. S2CID  6667472. Архивировано из оригинала (PDF) 16 августа 2017 года . Проверено 6 декабря 2018 г.
  449. ^ Ли, Лихун; Чу, Вэй; Лэнгфорд, Джон; Ван, Сюаньхуэй (2011). «Непредвзятая офлайн-оценка алгоритмов рекомендации новостных статей на основе контекстных бандитов». Материалы четвертой международной конференции ACM по веб-поиску и интеллектуальному анализу данных . стр. 297–306. arXiv : 1003.5956 . дои : 10.1145/1935826.1935878. ISBN 9781450304931. S2CID  744200.
  450. ^ Юнг, Кам Фунг и Яньян Ян. «Проактивная персонализированная система рекомендаций для мобильных новостей». Разработки в области разработки электронных систем (DESE), 2010 г. ИИЭР, 2010.
  451. ^ Гасс, Сьюзен Э.; Робертс, Дж. Мюррей (2006). «Распространение холодноводного коралла Lophelia pertusa (Scleractinia) на нефтегазовых платформах в Северном море: рост колоний, пополнение и экологический контроль над распространением». Бюллетень о загрязнении морской среды . 52 (5): 549–559. Бибкод : 2006MarPB..52..549G. doi :10.1016/j.marpolbul.2005.10.002. ПМИД  16300800.
  452. ^ Гионис, Аристид; Маннила, Хейкки; Цапарас, Панайотис (2007). «Кластерная агрегация». Транзакции ACM по извлечению знаний из данных . 1 (1): 4. CiteSeerX 10.1.1.709.528 . дои : 10.1145/1217299.1217303. S2CID  433708. 
  453. ^ Обрадович, Зоран и Слободан Вучетич. Проблемы интеллектуального анализа научных данных: гетерогенные, смещенные и большие выборки . Технический отчет, Центр информационных наук и технологий Университета Темпл, 2004 г.
  454. ^ Ван дер Путтен, Питер; ван Сомерен, Маартен (2000). «Вызов CoIL 2000: Дело страховой компании». Опубликовано Sentient Machine Research, Амстердам. Также технический отчет Лейденского института передовых компьютерных наук . 9 : 1–43.
  455. ^ Мао, Казахстан (2002). «Выбор центра нейронной сети RBF на основе меры разделимости класса отношения Фишера». Транзакции IEEE в нейронных сетях . 13 (5): 1211–1217. дои : 10.1109/tnn.2002.1031953. ПМИД  18244518.
  456. ^ Олав, Мануэль; Райкович, Владислав; Боханец, Марко (1989). «Заявление о приеме в государственные школы» (PDF) . Экспертные системы в государственном управлении . 1 : 145–160.
  457. ^ Лизотт, Дэниел Дж.; Мадани, Омид; Грейнер, Рассел (2012). «Бюджетное обучение классификаторов Найва-Байеса». arXiv : 1212.2472 [cs.LG].
  458. ^ Лебовиц, Майкл (1986). «Концептуальное обучение в богатой входной области: память, основанная на обобщениях». Машинное обучение: подход искусственного интеллекта . 2 : 193–214. ISBN 9780934613002.
  459. ^ Да, И-Ченг; Ян, Кинг-Янг; Тин, Тао-Мин (2009). «Открытие знаний о модели RFM с использованием последовательности Бернулли». Экспертные системы с приложениями . 36 (3): 5866–5871. дои : 10.1016/j.eswa.2008.07.018.
  460. ^ Ли, Вэнь-Чен; Ченг, Бор-Вэнь (2011). «Интеллектуальная система для повышения эффективности донорства крови». Журнал качества Vol . 18 (2): 173.
  461. ^ Шмидтманн, Ирен и др. «Оценка связи записей Krebsregisters NRW Schwerpunkt. Архивировано 6 декабря 2018 года в Wayback Machine ». Abschlußbericht, том 11 (2009).
  462. ^ Сарияр, Мурат; Борг, Андреас; Поммеренинг, Клаус (2011). «Контроль ложных совпадений при связывании записей с использованием теории экстремальных значений». Журнал биомедицинской информатики . 44 (4): 648–654. дои : 10.1016/j.jbi.2011.02.008. ПМИД  21352952.
  463. ^ Кандильер, Лоран и Винсент Лемэр. «Разработка и анализ задачи Nomao по активному обучению в реальном мире». Труды ALRA: Активное обучение в реальных приложениях, семинар ECML-PKDD . 2012.
  464. ^ Маркес, Иван Гарридо. «Метод адаптации предметной области для классификации текста на основе подхода саморегулируемого обучения». (2013).
  465. ^ Нагеш, Харша С., Санджай Гойл и Алок Н. Чоудхари. «Адаптивные сетки для кластеризации больших наборов данных». СДМ. 2001.
  466. ^ Кузилек, Якуб и др. «OU Analyse: анализ студентов из группы риска в Открытом университете». Обзор аналитики обучения (2015): 1–16.
  467. ^ Сименс, Джордж и др. Open Learning Analytics: интегрированная и модульная платформа [ постоянная мертвая ссылка ] . Дисс. Издательство Открытого университета, 2011.
  468. ^ Барлакки, Джанни; Де Надаи, Марко; Ларчер, Роберто; Казелла, Антонио; Читик, Кристиана; Торриси, Джованни; Антонелли, Фабрицио; Веспиньяни, Алессандро; Пентланд, Алекс; Лепри, Бруно (2015). «Набор данных о городской жизни города Милана и провинции Трентино из нескольких источников». Научные данные . 2 : 150055. Бибкод : 2015NatSD...250055B. дои : 10.1038/sdata.2015.55. ISSN  2052-4463. ПМЦ 4622222 . ПМИД  26528394. 
  469. ^ Ваншорен Дж., Ван Рейн Дж.Н., Бишл Б., Торго Л. (2013). «OpenML: сетевая наука в машинном обучении». Исследования SIGKDD . 15 (2): 49–60. arXiv : 1407.7722 . дои : 10.1145/2641190.2641198. S2CID  4977460.
  470. ^ Олсон Р.С., Ла Кава В., Ожеховский П., Урбанович Р.Дж., Мур Дж.Х. (2017). «PMLB: большой набор тестов для оценки и сравнения машинного обучения». Добыча биоданных . 10 (1): 36. arXiv : 1703.00512 . Бибкод : 2017arXiv170300512O. дои : 10.1186/s13040-017-0154-4 . ПМЦ 5725843 . ПМИД  29238404. 
  471. ^ "Готовые наборы данных" . appen.com . Приложение . Проверено 30 декабря 2020 г.
  472. ^ «Наборы данных с открытым исходным кодом». appen.com . Приложение . Проверено 30 декабря 2020 г.