Библиотека Python для машинного обучения
scikit-learn (ранее scikits.learn , а также известная как sklearn ) — это бесплатная библиотека машинного обучения с открытым исходным кодом для языка программирования Python . [3]
Она включает в себя различные алгоритмы классификации , регрессии и кластеризации , включая машины опорных векторов , случайные леса , градиентный бустинг , k -средние и DBSCAN , и разработана для взаимодействия с числовыми и научными библиотеками Python NumPy и SciPy . Scikit-learn — это проект, спонсируемый NumFOCUS из финансовых средств. [4]
Обзор
Проект scikit-learn начинался как scikits.learn, проект Google Summer of Code французского специалиста по данным Дэвида Курнапо . Название проекта происходит от понятия, что это «SciKit» (SciPy Toolkit), отдельно разработанное и распространяемое стороннее расширение для SciPy . [5]
Оригинальная кодовая база была позже переписана другими разработчиками . В 2010 году участники Фабиан Педрегоса, Гаэль Вароко, Александр Грамфор и Венсан Мишель из Французского института исследований в области компьютерных наук и автоматизации в Сакле , Франция , взяли на себя руководство проектом и выпустили первую публичную версию библиотеки 1 февраля 2010 года. [6] В ноябре 2012 года scikit-learn и scikit-image были описаны как две из «хорошо поддерживаемых и популярных» библиотек scikits [обновлять]. [7] В 2019 году было отмечено, что scikit-learn является одной из самых популярных библиотек машинного обучения на GitHub . [8]
Выполнение
scikit-learn в основном написан на Python и широко использует NumPy для высокопроизводительной линейной алгебры и операций с массивами. Кроме того, некоторые основные алгоритмы написаны на Cython для повышения производительности. Машины опорных векторов реализованы оболочкой Cython вокруг LIBSVM ; логистическая регрессия и линейные машины опорных векторов реализованы аналогичной оболочкой вокруг LIBLINEAR . В таких случаях расширение этих методов с помощью Python может оказаться невозможным.
scikit-learn хорошо интегрируется со многими другими библиотеками Python, такими как Matplotlib и plotly для построения графиков, NumPy для векторизации массивов, Pandas dataframes, SciPy и многими другими.
История версий
scikit-learn изначально был разработан Дэвидом Курнапо как проект Google Summer of Code в 2007 году. Позже в том же году к проекту присоединился Матье Брушер и начал использовать его как часть своей диссертационной работы. В 2010 году к проекту присоединился INRIA , Французский институт исследований в области компьютерных наук и автоматизации , и первый публичный релиз (v0.1 beta) был опубликован в конце января 2010 года.
- Август 2013. scikit-learn 0.14 [9]
- Июль 2014. scikit-learn 0.15.0 [9]
- Март 2015. scikit-learn 0.16.0 [9]
- Ноябрь 2015 г. scikit-learn 0.17.0 [9]
- Сентябрь 2016. scikit-learn 0.18.0
- Июль 2017. scikit-learn 0.19.0
- Сентябрь 2018. scikit-learn 0.20.0 [10]
- Май 2019. scikit-learn 0.21.0 [11]
- Декабрь 2019. scikit-learn 0.22 [12]
- Май 2020 г. scikit-learn 0.23.0 [13]
- Янв 2021. scikit-learn 0.24 [14]
- Сентябрь 2021 г. scikit-learn 1.0.0 [15]
- Октябрь 2021 г. scikit-learn 1.0.1 [16]
- Декабрь 2021 г. scikit-learn 1.0.2 [17]
- Май 2022 г. scikit-learn 1.1.0 [18]
- Май 2022. scikit-learn 1.1.1 [19]
- Август 2022 г. scikit-learn 1.1.2 [20]
- Октябрь 2022 г. scikit-learn 1.1.3 [21]
- Декабрь 2022 г. scikit-learn 1.2.0 [22]
- Январь 2023 г. scikit-learn 1.2.1 [23]
- Март 2023 г. scikit-learn 1.2.2 [24]
альтернативы scikit-learn
Ссылки
- ^ "Release 1.5.2". 11 сентября 2024 г. Получено 26 сентября 2024 г.
- ^ "Проект с открытым исходным кодом scikit-learn на Open Hub: страница языков". Open Hub . Получено 14 июля 2018 г. .
- ^ Фабиан Педрегоса; Гаэль Варокво; Александр Грамфор; Винсент Мишель; Бертран Тирион; Оливье Гризель; Матье Блондель; Питер Преттенхофер; Рон Вайс; Винсент Дюбур; Джейк Вандерплас; Александр Пассос; Дэвид Курнапо; Матье Перро; Эдуард Дюшенэ (2011). «scikit-learn: машинное обучение на Python». Журнал исследований машинного обучения . 12 : 28:25–28:30.
- ^ "Проекты, спонсируемые NumFOCUS". NumFOCUS . Получено 2021-10-25 .
- ^ Дрейер, Янто. «научное обучение».
- ^ "О нас — документация scikit-learn 0.20.1". scikit-learn.org .
- ^ Эли Брессерт (2012). SciPy и NumPy: обзор для разработчиков. O'Reilly. стр. 43.
- ^ "Состояние Октоверса: машинное обучение". Блог GitHub . GitHub . 2019-01-24 . Получено 2019-10-17 .
- ^ abcd "История выпусков — документация scikit-learn 0.19.dev0". scikit-learn.org . Получено 27.02.2017 .
- ^ "История выпусков - документация 0.20.0". scikit-learn . Получено 6 ноября 2018 г. .
- ^ "История выпусков - документация 0.21.0". scikit-learn . Получено 5 мая 2019 г. .
- ^ "История выпусков - документация 0.22". scikit-learn . Получено 7 июня 2020 г. .
- ^ "История выпусков - документация 0.23.0". scikit-learn . Получено 7 июня 2020 г. .
- ^ "История выпусков - документация 0.24", scikit-learn , получено 2021-02-08
- ^ "История выпусков - документация 1.0.0". scikit-learn .
- ^ "История выпусков - документация 1.0.1". scikit-learn .
- ^ "История выпусков - документация 1.0.2". scikit-learn .
- ^ "История выпусков - документация 1.1.0". scikit-learn .
- ^ "История выпусков - документация 1.1.1". scikit-learn .
- ^ "История выпусков - документация 1.1.2". scikit-learn .
- ^ "История выпусков - документация 1.1.3". scikit-learn .
- ^ "История выпусков - документация 1.2.0". scikit-learn .
- ^ "История выпусков - документация 1.2.1". scikit-learn .
- ^ "История выпусков - документация 1.2.2". scikit-learn .
Внешние ссылки
- Официальный сайт
- scikit-learn на GitHub