Майкл Ральф Стоунбрейкер (родился 11 октября 1943 [6] ) — учёный-компьютерщик , специализирующийся на системах баз данных . Благодаря серии академических прототипов и коммерческих стартапов исследования и продукты Стоунбрейкера занимают центральное место во многих реляционных базах данных . Он также является основателем многих компаний, занимающихся базами данных, включая Ingres Corporation , Illustra , Paradigm4, StreamBase Systems , Tamr, Vertica и VoltDB , а также занимал должность технического директора Informix . За свой вклад в исследования баз данных Стоунбрейкер получил в 2014 году Премию Тьюринга , которую часто называют «Нобелевской премией в области вычислений». [7]
Карьеру Стоунбрейкера можно условно разделить на два этапа: его время в Калифорнийском университете в Беркли, когда он сосредоточился на системах управления реляционными базами данных, таких как Ingres и Postgres , и, начиная с 2001 года, в Массачусетском технологическом институте (MIT), где он разработал более новые методы управления данными, такие как C-Store , H-Store , SciDB и DBOS . [8] Стоунбрейкер в настоящее время является почетным профессором Калифорнийского университета в Беркли и адъюнкт-профессором Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института. [9] [10] Он также известен как редактор книги «Чтения в системах баз данных ».
Стоунбрейкер вырос в Милтоне, Нью-Гэмпшир . [11] Он получил степень бакалавра электротехники в Принстонском университете в 1965 году, а также степень магистра и доктора философии. из Мичиганского университета в 1967 и 1971 годах [12] соответственно. Среди его наград — медаль Джона фон Неймана IEEE и первая награда SIGMOD Edgar F. Codd Innovations Award. В 1994 году он был назначен членом Ассоциации вычислительной техники . [13] В 1997 году он был избран членом Национальной инженерной академии по разработке и коммерциализации реляционных и объектно-реляционных систем баз данных. В марте 2015 года было объявлено, что он выиграл Премию Тьюринга ACM 2014 года . [7] В сентябре 2015 года он выиграл Премию Содружества 2015 года, выбранную членами совета MassTLC. [14]
Стоунбрейкер поступил на работу в Калифорнийский университет в Беркли в качестве доцента в 1971 году и преподавал на факультете информатики в течение двадцати девяти лет. Именно там он провел свою первую новаторскую работу над реляционными базами данных.
В 1973 году Стоунбрейкер и его коллега Юджин Вонг начали исследовать системы реляционных баз данных после прочтения серии основополагающих статей, опубликованных Эдгаром Ф. Коддом по реляционной модели данных . [15]
Их проект, известный как Ingres (Интерактивная графическая и поисковая система) [16] , был одной из первых систем (наряду с System R от IBM ), продемонстрировавших возможность создания практической и эффективной реализации реляционной модели. Ряд ключевых идей INGRES до сих пор широко используются в реляционных системах, включая использование B-деревьев , репликацию первичной копии, подход перезаписи запросов к представлениям и ограничениям целостности , а также идею правил/триггеров для проверки целостности в реляционных системах. СУБД. Кроме того, была проделана большая экспериментальная работа, которая позволила понять, как построить систему блокировки, которая могла бы обеспечить удовлетворительную производительность транзакций. [17]
К середине 1970-х годов команда Стоунбрейкера, используя сменяющуюся команду студентов-программистов, создала удобную систему реляционных баз данных. В то время Ingres считался «низким уровнем» по сравнению с IBM System R, поскольку он работал на машинах Digital Equipment Corporation на базе Unix , а не на « больших железных » мэйнфреймах IBM . [ нужна цитата ]
Однако к началу 1980-х годов производительность и возможности этих недорогих машин стали серьезно угрожать рынку мэйнфреймов IBM, и вместе с этой угрозой появилась способность Ingres стать жизнеспособным, «настоящим» продуктом для большого количества приложений. Ingres использовал вариант лицензии BSD за символическую плату, и вскоре ряд компаний воспользовались этим для создания коммерческих версий Ingres. [ нужна цитата ]
В их число входил Стоунбрейкер, который вместе с другими профессорами Беркли Ларри Роу и Юджином Вонгом помог основать Relational Technology, Inc. , позже названную Ingres Corporation. Впоследствии, проданная Computer Associates , Ingres была восстановлена как независимая компания в 2005 году, а позже переименована в Actian . Другие стартапы, основанные на Ingres, включают Sybase , основанную Робертом Эпштейном, студентом этого проекта, и Britton Lee, Inc. Код Sybase позже был использован в качестве основы для Microsoft SQL Server . [18]
После основания реляционной технологии Стоунбрейкер и Роу начали «пост-Ингровскую» работу по устранению ограничений реляционной модели. Новый проект получил название POSTGRES (POST inGRES) [19] и был разработан для добавления поддержки сложных типов данных в системы баз данных и улучшения сквозной производительности приложений с интенсивным использованием данных. Postgres предоставил модель объектно-реляционного программирования, в которой поля могли быть сложными типами данных и где пользователи могли регистрировать новые типы, а также скалярные и агрегатные функции над этими типами. Postgres имел ряд других возможностей расширения, что позволяло программистам легко изменять или добавлять к оптимизатору, языку запросов, среде выполнения и платформам индексирования. Эти функции улучшили как программируемость базы данных, так и производительность, а также позволили помещать в базу данных большие части ряда приложений, включая географические информационные системы и обработку временных рядов . Это привело к существенному расширению рынка коммерческих баз данных. [ нужна цитата ]
Postgres также предлагался с использованием BSD-подобной лицензии, и этот код лег в основу бесплатного программного обеспечения PostgreSQL . Стоунбрейкер также возглавил усилия по коммерциализации кода, создав Illustra , которую приобрела Informix . PostgreSQL использовался в качестве основы для ряда других стартап-компаний, включая Aster Data Systems , EnterpriseDB и Greenplum . [ нужна цитата ]
Informix приобрела Illustra в 1996 году, и Стоунбрейкер стал техническим директором Informix и занимал эту должность до сентября 2000 года. Informix интегрировала O–R-сопоставление Illustra и DataBlades в продукт 7.x OnLine, в результате чего появился Informix Universal Server (IUS), или, в более общем смысле, Informix Universal Server (IUS), или, в более общем плане, Версия 9. [ нужна ссылка ]
После проекта Postgres Стоунбрейкер инициировал проект Mariposa [20] , который стал основой Cohera Corporation. Марипоса создала объединенную базу данных на основе экономической модели торговли ресурсами, в которой данные, распределенные по нескольким организациям, можно было интегрировать и запрашивать из единого реляционного интерфейса, регулируемого политиками для конкретных сайтов, взимающими плату за обработку и хранение данных. Эта экономическая политика позволила реализовать традиционные идеи оптимизации запросов на конкурирующих сайтах, а также послужила основой для хранения, репликации и перемещения данных внутри федерации.
Первоначальной миссией Cohera была коммерциализация Mariposa, но в конечном итоге она сосредоточилась на приложении для управления каталогами между предприятиями на базе ядра интегрированной интеграции данных. Интеллектуальная собственность Cohera была приобретена PeopleSoft в 2001 году и использована в качестве основы для управления корпоративными каталогами PeopleSoft. PeopleSoft, в свою очередь, была куплена корпорацией Oracle в 2004 году .
Стоунбрейкер стал адъюнкт-профессором Массачусетского технологического института в 2001 году, где начал еще одну серию исследовательских проектов и основал ряд компаний.
В проекте «Аврора» Стоунбрейкер вместе с коллегами из Университета Брандейса , Университета Брауна и Массачусетского технологического института сосредоточился на управлении данными для потоковой передачи данных, используя новую модель данных и язык запросов. В отличие от реляционных систем, которые «извлекают» данные и обрабатывают их по одной записи, в Aurora данные «передаются», поступающие асинхронно из внешних источников данных (таких как биржевые котировки, ленты новостей или датчики). поток результатов (например, оконные средние значения), которые отправляются пользователям. [21]
Стоунбрейкер стал соучредителем StreamBase Systems в 2003 году для коммерциализации технологии, лежащей в основе Aurora.
В рамках проекта C-Store , начатого в 2005 году, Стоунбрейкер вместе с коллегами из Брандейса, Брауна, Массачусетского технологического института и Массачусетского университета в Бостоне разработал параллельную столбцово-ориентированную СУБД без совместного использования для хранения данных. Разделяя и сохраняя данные в столбцах, C-Store может выполнять меньше операций ввода-вывода и получать более высокие коэффициенты сжатия, чем традиционные системы баз данных, которые хранят данные в строках. [22]
Стоунбрейкер объяснил, что это происходит потому, что похожие элементы данных расположены рядом: Имя, Имя, Имя, Имя и Имя, Адрес, Почтовый индекс, Телефон#. В 2005 году Стоунбрейкер стал соучредителем Vertica для коммерциализации технологии C-Store. [23]
В 2006 году Стоунбрейкер вместе с исследователями из Университета Флориды начал проект «Морфеус». Morpheus — это система интеграции данных , которая опирается на набор «преобразований» для взаимодействия между источниками данных. Каждое преобразование предоставляет запрашиваемый интерфейс для конкретного веб-сайта или сервиса, а Morpheus позволяет искать и составлять несколько преобразований для предоставления нового сервиса или единого представления нескольких сервисов.
В 2009 году Стоунбрейкер стал соучредителем Goby, [24] местной поисковой компании, основанной на идеях Морфеуса и предназначенной для людей, которые могут заняться чем-то новым в свободное время.
В 2007 году Стоунбрейкер совместно с исследователями из Университета Брауна , Массачусетского технологического института и Йельского университета запустил проект H-Store . H-Store — это распределенная система онлайн-обработки транзакций (OLTP) в основной памяти, предназначенная для обеспечения очень высокой пропускной способности при рабочих нагрузках по обработке транзакций.
В 2009 году Стоунбрейкер стал соучредителем, а затем выступил консультантом коммерческого стартапа VoltDB , основанного на идеях проекта H-Store.
В 2008 году вместе с Дэвидом ДеВиттом и исследователями из Брауна, Массачусетского технологического института, Портлендского государственного университета , SLAC , Вашингтонского университета и Университета Висконсин-Мэдисон Стоунбрейкер запустил SciDB [25] [26] — СУБД с открытым исходным кодом, специально разработанную для приложения научных исследований. [27]
Он основал Paradigm4 вместе с Мэрилин Матц, которая стала генеральным директором. Компания Paradigm4 разработала SciDB, используемую в основном в науках о жизни и на финансовых рынках. Novartis , Foundation Medicine и Национальные институты здравоохранения являются одними из клиентов компании. [14] [28]
В 2010 и 2011 годах Стоунбрейкер раскритиковал движение NoSQL . [29] [30] [31]
Стоунбрейкер обучил более 30 студентов, [2] в том числе:
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )