Google Books (ранее известный как Google Book Search , Google Print и под кодовым названием Project Ocean ) [1] — это сервис от Google , который выполняет поиск по полному тексту книг и журналов, которые Google отсканировал, преобразовал в текст с помощью оптического распознавания символов (OCR) и сохранил в своей цифровой базе данных. [2] Книги предоставляются либо издателями и авторами через Партнерскую программу Google Books, либо библиотеками-партнерами Google через Библиотечный проект. [3] Кроме того, Google сотрудничает с рядом издателей журналов для оцифровки их архивов. [4] [5]
Программа Publisher Program впервые получила название Google Print, когда была представлена на Франкфуртской книжной ярмарке в октябре 2004 года. Библиотечный проект Google Books, который сканирует произведения из коллекций библиотек-партнеров и добавляет их в цифровой инвентарь, был анонсирован в декабре 2004 года.
Инициатива Google Books получила высокую оценку за ее потенциал в плане предоставления беспрецедентного доступа к тому, что может стать крупнейшим онлайн-сводом человеческих знаний [6] [7], а также за содействие демократизации знаний . [8] Однако ее также критиковали за возможные нарушения авторских прав [8] [9] и отсутствие редактирования для исправления многочисленных ошибок, вносимых в отсканированные тексты процессом OCR.
По состоянию на октябрь 2019 года [обновлять]Google отметил 15-летие Google Books и предоставил количество отсканированных книг, составившее более 40 миллионов наименований. [10] В 2010 году Google подсчитал, что в мире существует около 130 миллионов различных наименований, [11] и заявил, что намерен отсканировать их все. [11] Однако процесс сканирования в американских академических библиотеках замедлился с 2000-х годов. [12] [13] Усилия Google Book по сканированию стали предметом судебных разбирательств, включая дело Authors Guild против Google , коллективный иск в Соединенных Штатах, решенный в пользу Google (см. ниже). Это было крупное дело, которое едва не изменило практику авторского права для произведений-сирот в Соединенных Штатах. [14] Исследование, проведенное в 2023 году учеными из Калифорнийского университета, Беркли и бизнес-школ Северо-Восточного университета, показало, что оцифровка книг Google Books привела к увеличению продаж физических версий книг. [15]
Результаты поиска из Google Книги отображаются как в универсальном поиске Google , так и на специализированном сайте поиска Google Книги ( books.google.com ).
В ответ на поисковые запросы Google Книги позволяет пользователям просматривать полные страницы из книг, в которых встречаются поисковые термины, если книга не защищена авторским правом или если владелец авторских прав дал разрешение. Если Google считает, что книга все еще защищена авторским правом, пользователь видит «фрагменты» текста вокруг запрошенных поисковых терминов. Все вхождения поисковых терминов в тексте книги отображаются с желтым выделением.
В Google Книгах используются четыре уровня доступа: [16]
В ответ на критику со стороны таких групп, как Американская ассоциация издателей и Гильдия авторов , Google объявила о политике отказа в августе 2005 года, посредством которой владельцы авторских прав могли предоставить список названий, которые они не хотят сканировать, и запрос был бы соблюден. Компания также заявила, что не будет сканировать никакие книги, защищенные авторским правом, в период с августа по 1 ноября 2005 года, чтобы предоставить владельцам возможность решить, какие книги исключить из проекта. Таким образом, у владельцев авторских прав есть три варианта в отношении любой работы: [18]
Большинство отсканированных работ больше не издаются и не продаются. [19]
Помимо закупки книг в библиотеках, Google также получает книги от своих партнеров-издателей через «Партнерскую программу», призванную помочь издателям и авторам продвигать свои книги. Издатели и авторы отправляют в Google либо цифровую копию своей книги в формате EPUB или PDF , либо печатную копию, которая становится доступной для предварительного просмотра в Google Books. Издатель может контролировать процент книги, доступной для предварительного просмотра, при этом минимальный размер составляет 20%. Они также могут сделать книгу полностью доступной для просмотра и даже разрешить пользователям загружать копию в формате PDF. Книги также могут быть доступны для продажи в Google Play. [3] В отличие от проекта Library Project, это не вызывает никаких проблем с авторскими правами, поскольку осуществляется в соответствии с соглашением с издателем. Издатель может в любое время отказаться от соглашения. [18]
Для многих книг Google Books отображает оригинальные номера страниц. Однако Тим Паркс , писавший в The New York Review of Books в 2014 году, отметил, что Google прекратил предоставлять номера страниц для многих недавних публикаций (вероятно, тех, которые были приобретены через Партнерскую программу) «предположительно в союзе с издателями, чтобы заставить тех из нас, кому нужно готовить сноски, покупать бумажные издания». [20]
Проект начался в 2002 году под кодовым названием Project Ocean. Соучредитель Google Ларри Пейдж всегда интересовался оцифровкой книг. Когда он и Марисса Майер начали экспериментировать со сканированием книг в 2002 году, им потребовалось 40 минут, чтобы оцифровать 300-страничную книгу. Но вскоре технология была развита до такой степени, что операторы сканирования могли сканировать до 6000 страниц в час. [14]
Google создала специальные центры сканирования, куда книги доставлялись на грузовиках. Станции могли оцифровывать со скоростью 1000 страниц в час. Книги помещались в специально изготовленную механическую колыбель, которая регулировала корешок книги на месте, в то время как ряд ламп и оптических приборов сканировал две открытые страницы. На каждую страницу были направлены две камеры, которые снимали изображение, в то время как дальномер LIDAR накладывал трехмерную лазерную сетку на поверхность книги, чтобы захватить кривизну бумаги. Человек-оператор переворачивал страницы вручную, используя ножную педаль для фотографирования. Поскольку не нужно было выравнивать страницы или идеально их выравнивать, система Google не только достигала замечательной эффективности и скорости, но и помогала защищать хрупкие коллекции от чрезмерного обращения. После этого грубые изображения проходили три уровня обработки: во-первых, алгоритмы устранения искривлений использовали данные LIDAR для исправления кривизны страниц. Затем программное обеспечение оптического распознавания символов (OCR) преобразовало необработанные изображения в текст, и, наконец, еще один раунд алгоритмов извлек номера страниц, сноски, иллюстрации и диаграммы. [14]
Многие книги сканируются с помощью специализированной камеры Elphel 323 [21] [22] со скоростью 1000 страниц в час. [23] Патент , выданный Google в 2009 году, показал, что Google придумала инновационную систему для сканирования книг, которая использует две камеры и инфракрасный свет для автоматической коррекции кривизны страниц в книге. Создавая 3D-модель каждой страницы и затем «распрямляя» ее, Google может представлять страницы, выглядящие плоскими, без необходимости делать страницы плоскими, что требует использования деструктивных методов, таких как расплетание или стеклянные пластины для индивидуального выравнивания каждой страницы, что неэффективно для крупномасштабного сканирования. [24] [25]
Google решила исключить цветовую информацию в пользу лучшего пространственного разрешения, поскольку большинство книг, не защищенных авторским правом, в то время не содержали цветов. Каждое изображение страницы проходило через алгоритмы, которые различали текстовые и иллюстрационные области. Затем текстовые области обрабатывались с помощью OCR для обеспечения полнотекстового поиска. Google потратила значительные ресурсы на разработку оптимальных методов сжатия, стремясь к высокому качеству изображения, сохраняя при этом минимальный размер файла, чтобы обеспечить доступ для интернет-пользователей с низкой пропускной способностью. [26]
Для каждого произведения Google Books автоматически создает страницу обзора. На этой странице отображается информация, извлеченная из книги — сведения о ее издании, карта часто встречающихся слов, оглавление, а также вторичные материалы, такие как резюме, обзоры читателей (не читаемые в мобильной версии сайта) и ссылки на другие соответствующие тексты. Посетитель страницы, например, может увидеть список книг, которые разделяют схожий жанр и тему, или он может увидеть список текущих научных работ по книге. Этот контент, кроме того, предлагает интерактивные возможности для пользователей, вошедших в свою учетную запись Google . Они могут экспортировать библиографические данные и цитаты в стандартных форматах , писать собственные обзоры, добавлять их в свою библиотеку для маркировки, организации и распространения с другими людьми. [27] [28] Таким образом, Google Books собирает эти более интерпретативные элементы из различных источников, включая пользователей, сторонние сайты, такие как Goodreads , и часто автора и издателя книги. [29]
На самом деле, чтобы побудить авторов загружать собственные книги, Google добавил несколько функций на сайт. Авторы могут разрешить посетителям бесплатно загружать свои электронные книги или устанавливать собственную цену покупки. Они могут менять цену туда и обратно, предлагая скидки, когда им это удобно. Кроме того, если автор книги решит добавить номер записи ISBN , LCCN или OCLC , сервис обновит URL книги, включив его. Затем автор может установить определенную страницу в качестве якоря ссылки. Эта опция делает их книгу более легко обнаруживаемой.
Ngram Viewer — это сервис, подключенный к Google Books, который отображает частоту использования слов в их коллекции книг. Сервис важен для историков и лингвистов, поскольку он может предоставить взгляд изнутри на человеческую культуру через использование слов в течение различных периодов времени. [30] Эта программа подверглась критике из-за ошибок в метаданных, используемых в программе. [31]
Проект подвергся критике за то, что его заявленная цель сохранения бесхозных и вышедших из печати произведений находится под угрозой из-за ошибок в отсканированных данных, а такие проблемы не решаются. [32] [33]
Процесс сканирования подвержен ошибкам. Например, некоторые страницы могут быть нечитаемыми, перевернутыми или в неправильном порядке. Ученые даже сообщали о мятых страницах, закрывающих большие пальцы и пальцы, и размазанных или размытых изображениях. [34] По этому вопросу в заявлении Google в конце отсканированных книг говорится:
Оцифровка на самом базовом уровне основана на изображениях страниц физических книг. Чтобы сделать эту книгу доступной в виде файла в формате ePub, мы взяли эти изображения страниц и извлекли текст с помощью технологии оптического распознавания символов (или сокращенно OCR). Извлечение текста из изображений страниц является сложной инженерной задачей. Пятна на страницах физических книг, причудливые шрифты, старые шрифты, порванные страницы и т. д. могут привести к ошибкам в извлеченном тексте. Несовершенное OCR — это только первая проблема на пути к конечной цели перехода от коллекций изображений страниц к книгам на основе извлеченного текста. Наши компьютерные алгоритмы также должны автоматически определять структуру книги (каковы верхние и нижние колонтитулы, где размещены изображения, является ли текст стихом или прозой и т. д.). Правильное выполнение этого позволяет нам отображать книгу таким образом, чтобы она соответствовала формату оригинальной книги. Несмотря на все наши усилия, вы можете увидеть орфографические ошибки, ненужные символы, посторонние изображения или отсутствующие страницы в этой книге. По нашим оценкам, эти ошибки не должны помешать вам наслаждаться содержанием книги. Технические проблемы автоматического создания идеальной книги пугают, но мы продолжаем совершенствовать наши технологии OCR и извлечения структуры книги. [35]
В 2009 году Google заявили, что начнут использовать reCAPTCHA для исправления ошибок, обнаруженных в сканах Google Book. Этот метод улучшит только отсканированные слова, которые трудно распознать из-за процесса сканирования, и не сможет исправить такие ошибки, как перевернутые страницы или заблокированные слова. [36]
Ошибки сканирования вдохновили на создание произведений искусства, таких как опубликованные коллекции аномальных страниц и блог Tumblr . [37]
Ученые часто сообщали о вопиющих ошибках в метаданных Google Books, включая неправильно приписанных авторов и ошибочные даты публикации. Джеффри Нанберг , лингвист, исследующий изменения в словоупотреблении с течением времени, заметил, что поиск книг, опубликованных до 1950 года и содержащих слово «интернет», выдал маловероятные 527 результатов. Вуди Аллен упоминается в 325 книгах, якобы опубликованных до его рождения. Google ответил Нанбергу, обвинив в большинстве ошибок внешних подрядчиков. [31]
Другие обнаруженные ошибки метаданных включают даты публикации до рождения автора (например, 182 произведения Чарльза Диккенса до его рождения в 1812 году); неверные классификации предметов (издание «Моби Дика» находится в разделе «компьютеры», биография Мэй Уэст классифицирована в разделе «религия»), противоречивые классификации (10 изданий « Листьев травы» Уитмена классифицированы как «художественная» и «документальная» литература), неправильно написанные названия, авторы и издатели ( Моби Дик: или Белая «стена» ), а также метаданные для одной книги, неправильно добавленные к совершенно другой книге (метаданные для математической работы 1818 года ведут к любовному роману 1963 года). [38] [39]
Был проведен обзор элементов метаданных автора, названия, издателя и года публикации для 400 случайно выбранных записей Google Books. Результаты показывают, что 36% выбранных книг в проекте оцифровки содержали ошибки метаданных. Этот уровень ошибок выше, чем можно было бы ожидать в типичном онлайн-каталоге библиотеки. [40]
Общий уровень ошибок в 36,75%, обнаруженный в этом исследовании, говорит о том, что метаданные Google Books имеют высокий уровень ошибок. Хотя «крупные» и «мелкие» ошибки являются субъективным различием, основанным на несколько неопределенной концепции «находимости», ошибки, обнаруженные в четырех элементах метаданных, рассмотренных в этом исследовании, следует считать крупными. [40]
Ошибки метаданных, основанные на некорректных отсканированных датах, затрудняют исследования с использованием базы данных проекта Google Books. Google проявил лишь ограниченный интерес к устранению этих ошибок. [41]
Некоторые европейские политики и интеллектуалы критиковали усилия Google по мотивам лингвистического империализма . Они утверждают, что, поскольку подавляющее большинство книг, предлагаемых для сканирования, написаны на английском языке, это приведет к непропорциональному представлению естественных языков в цифровом мире. Немецкий, русский, французский и испанский, например, являются популярными языками в науке. Однако непропорциональный акцент на английском языке в Интернете может повлиять на доступ к исторической науке и, в конечном счете, на рост и направление будущей науки. Среди этих критиков — Жан-Ноэль Жаннени , бывший президент Национальной библиотеки Франции . [42] [43]
Хотя Google Books оцифровал большое количество старых выпусков журналов, его сканы не включают метаданные, необходимые для идентификации конкретных статей в конкретных выпусках. Это привело к тому, что создатели Google Scholar начали собственную программу по оцифровке и размещению старых журнальных статей (по соглашению с издателями). [44]
Проект библиотеки Google Books направлен на сканирование и создание поисковых коллекций нескольких крупных исследовательских библиотек . [45] Наряду с библиографической информацией часто доступны для просмотра фрагменты текста из книги. Если книга не защищена авторским правом и находится в общественном достоянии, она полностью доступна для чтения или скачивания . [16]
Книги, защищенные авторским правом и отсканированные через Library Project, доступны в Google Books для просмотра фрагментов. Что касается качества сканов, Google признает, что они «не всегда достаточно высокого качества», чтобы предлагаться для продажи в Google Play. Кроме того, из-за предполагаемых технических ограничений Google не заменяет сканы версиями более высокого качества, которые могут быть предоставлены издателями. [46]
Проект является предметом иска Гильдии авторов против Google , поданного в 2005 году и вынесенного в пользу Google в 2013 году, а затем повторно рассмотренного в апелляционном порядке в 2015 году.
Владельцы авторских прав могут заявить права на отсканированную книгу и сделать ее доступной для предварительного просмотра или полного просмотра («передав» ее в свою учетную запись Партнерской программы) или попросить Google запретить поиск текста книги. [46]
Число учреждений, участвующих в Библиотечном проекте, возросло с момента его создания. [47]
С момента первого объявления о партнерстве к проекту присоединились и другие институциональные партнеры: [54]
2002 : Группа членов команды Google официально запускает «секретный проект „книги“». [73] Основатели Google Сергей Брин и Ларри Пейдж придумали идею, которая позже стала Google Books, будучи еще аспирантами Стэнфорда в 1996 году. На странице истории на веб-сайте Google Books описывается их первоначальное видение этого проекта: «в будущем мире, в котором оцифрованы огромные коллекции книг, люди будут использовать „ веб-краулер “ для индексации содержимого книг и анализа связей между ними, определяя релевантность и полезность любой данной книги, отслеживая количество и качество цитат из других книг». [73] Эта команда посетила сайты некоторых из самых крупных усилий по оцифровке того времени, включая Американский проект памяти Библиотеки Конгресса , Проект Гутенберг и Универсальную библиотеку, чтобы узнать, как они работают, а также Мичиганский университет, альма-матер Пейджа, и базу для таких проектов оцифровки, как JSTOR и Making of America. В разговоре с тогдашним президентом университета Мэри Сью Коулман , когда Пейдж узнал, что, по текущим оценкам университета, сканирование всех томов библиотеки займет 1000 лет, Пейдж, как сообщается, сказал Коулману, что он «верит, что Google может помочь сделать это за шесть лет». [73]
2003 : Команда работает над разработкой высокоскоростного процесса сканирования, а также программного обеспечения для решения проблем, связанных с нестандартными размерами шрифтов, необычными шрифтами и «другими неожиданными особенностями». [73]
Декабрь 2004 : Google объявил о расширении своей инициативы Google Print, известной как Google Print Library Project. [47] Google объявила о партнерстве с несколькими известными университетскими и публичными библиотеками, включая Мичиганский университет , Гарвард ( Библиотека Гарвардского университета ), Стэнфорд ( Зеленая библиотека ), Оксфорд ( Бодлеанская библиотека ) и Нью-Йоркскую публичную библиотеку . Согласно пресс-релизам и библиотекарям университетов, Google планировала оцифровать и сделать доступными через свой сервис Google Books около 15 миллионов томов в течение десятилетия. Это объявление вскоре вызвало споры, поскольку ассоциации издателей и авторов оспорили планы Google по оцифровке не только книг, находящихся в общественном достоянии, но и названий, все еще находящихся под авторским правом.
Сентябрь–октябрь 2005 г .: Два иска против Google, обвиняющие компанию в несоблюдении авторских прав и невыплате должной компенсации авторам и издателям. Один из них — коллективный иск от имени авторов (Authors Guild против Google, 20 сентября 2005 г.), а другой — гражданский иск, поданный пятью крупными издателями и Ассоциацией американских издателей (McGraw Hill против Google, 19 октября 2005 г.) [9] [74] [75] [76] [77] [78]
Ноябрь 2005 г .: Google изменил название этой службы с Google Print на Google Book Search. [79] Программа, позволяющая издателям и авторам включать свои книги в службу, была переименована в Google Books Partner Program, [80] а партнерство с библиотеками стало называться Google Books Library Project.
2006 : Google добавил кнопку «скачать pdf» ко всем своим книгам, не защищенным авторским правом и находящимся в общественном достоянии. Он также добавил новый интерфейс просмотра вместе с новыми страницами «Об этой книге». [73]
Август 2006 : Система Калифорнийского университета объявила, что присоединится к проекту оцифровки книг. Это включает часть из 34 миллионов томов в приблизительно 100 библиотеках, управляемых Системой. [81]
Сентябрь 2006 г .: Мадридский университет Комплутенсе стал первой испаноязычной библиотекой, присоединившейся к проекту библиотеки Google Books. [82]
Октябрь 2006 г .: Университет Висконсин-Мэдисон объявил, что присоединится к проекту оцифровки Book Search вместе с библиотекой Wisconsin Historical Society . В совокупности библиотеки имеют 7,2 миллиона фондов. [83]
Ноябрь 2006 г .: к проекту присоединился Университет Вирджинии . Его библиотеки содержат более пяти миллионов томов и более 17 миллионов рукописей, редких книг и архивов. [84]
Январь 2007 г .: Техасский университет в Остине объявил, что присоединится к проекту оцифровки Book Search. По крайней мере один миллион томов будет оцифрован из 13 библиотек университета.
Март 2007 г .: Баварская государственная библиотека объявила о партнерстве с Google с целью сканирования более миллиона общедоступных и неизданных произведений на немецком, а также английском, французском, итальянском, латинском и испанском языках. [85]
Май 2007 г .: Google и Кантональная и университетская библиотека Лозанны объявили о партнерстве в проекте по оцифровке книг . [86]
Май 2007 г .: Библиотека Бёкенторен Гентского университета объявила, что будет сотрудничать с Google в оцифровке и создании оцифрованных версий книг XIX века на французском и голландском языках, доступных в Интернете. [87]
Май 2007 г.: Университет Майсура объявляет, что Google оцифрует более 800 000 книг и рукописей, включая около 100 000 рукописей, написанных на санскрите или каннада как на бумаге, так и на пальмовых листьях. [68]
Июнь 2007 г .: Комитет по институциональному сотрудничеству (переименованный в Big Ten Academic Alliance в 2016 г.) объявил, что его двенадцать библиотек-членов примут участие в сканировании 10 миллионов книг в течение следующих шести лет. [58]
Июль 2007 г .: Университет Кэйо стал первым библиотечным партнером Google в Японии, объявив, что они оцифруют не менее 120 000 книг, являющихся общественным достоянием. [88]
Август 2007 : Google объявила, что оцифрует до 500 000 как защищенных авторским правом, так и находящихся в общественном достоянии элементов из библиотеки Корнеллского университета . Google также предоставит цифровую копию всех отсканированных работ для включения в собственную библиотечную систему университета. [89]
Сентябрь 2007 : Google добавил функцию, которая позволяет пользователям делиться фрагментами книг, которые находятся в общественном достоянии. Фрагменты могут отображаться точно так же, как в скане книги, или как простой текст. [90]
Сентябрь 2007 г .: Google представила новую функцию под названием «Моя библиотека», которая позволяет пользователям создавать персональные библиотеки, подборки книг, которые они могут помечать, рецензировать, оценивать или выполнять полнотекстовый поиск. [91]
Декабрь 2007 г .: Колумбийский университет был добавлен в качестве партнера по оцифровке произведений, являющихся общественным достоянием. [92]
Май 2008 г .: Microsoft свернула и запланировала завершить свой проект сканирования , который достиг 750 000 книг и 80 миллионов журнальных статей. [93]
Октябрь 2008 : После двух лет переговоров между издательской индустрией и Google было достигнуто соглашение . Google согласилась выплатить компенсацию авторам и издателям в обмен на право сделать миллионы книг доступными для общественности. [9] [94]
Октябрь 2008 г .: «Общий цифровой репозиторий» HathiTrust (позже известный как Цифровая библиотека HathiTrust) был запущен совместно Комитетом по институциональному сотрудничеству и 11 университетскими библиотеками в системе Калифорнийского университета , все из которых были библиотеками-партнерами Google, с целью архивирования и предоставления академического доступа к книгам из их коллекций, отсканированным Google и другими организациями. [95]
Ноябрь 2008 : Google достиг отметки в 7 миллионов книг для элементов, отсканированных Google и их издательскими партнерами. 1 миллион были в режиме полного предварительного просмотра и 1 миллион были полностью просматриваемыми и загружаемыми общественными работами. Около пяти миллионов были распроданы . [19] [96] [97]
Декабрь 2008 : Google объявила о включении журналов в Google Books. Среди названий — New York Magazine , Ebony и Popular Mechanics [98] [99]
Февраль 2009 : Google запустил мобильную версию Google Book Search, позволяющую пользователям iPhone и телефонов Android читать более 1,5 миллионов произведений, находящихся в общественном достоянии, в США (и более 500 000 за пределами США) с помощью мобильного браузера. Вместо изображений страниц отображается простой текст книги. [100]
Май 2009 г .: На ежегодной выставке BookExpo в Нью-Йорке компания Google заявила о своем намерении представить программу, которая позволит издателям продавать цифровые версии своих новейших книг напрямую потребителям через Google. [101]
Декабрь 2009 : Французский суд прекратил сканирование книг, защищенных авторским правом, опубликованных во Франции, заявив, что это нарушает законы об авторском праве. Это был первый крупный юридический убыток для проекта сканирования. [102]
Апрель 2010 г .: Художники не были включены в предыдущий иск и урегулирование, являются группами истцов в другом иске и заявляют, что намерены привлечь внимание не только к Google Books. «Новый групповой иск», — говорится в заявлении, — «выходит за рамки проекта Google Library и включает другие систематические и всеобъемлющие нарушения Google прав фотографов, иллюстраторов и других художников». [103]
Май 2010 : Сообщалось, что Google запустит цифровой книжный магазин под названием Google Editions . [104] Он будет конкурировать с Amazon, Barnes & Noble, Apple и другими розничными продавцами электронных книг с помощью собственного магазина электронных книг. В отличие от других, Google Editions будет полностью онлайн и не будет требовать определенного устройства (например, Kindle, Nook или iPad).
Июнь 2010 г .: Google преодолел отметку в 12 миллионов отсканированных книг. [11]
Август 2010 г .: Было объявлено, что Google намерена в течение десятилетия отсканировать все известные существующие 129 864 880 книг, что в общей сложности составит более 4 миллиардов цифровых страниц и 2 триллиона слов. [11]
Декабрь 2010 г .: Google eBooks (Google Editions) был запущен в США. [105]
Декабрь 2010 г .: Google запустил Ngram Viewer, который собирает и отображает в виде графика данные об использовании слов в своей коллекции книг. [30]
Март 2011 г .: Федеральный судья отклонил соглашение , достигнутое между издательской индустрией и Google. [106]
Март 2012 : Google преодолел отметку в 20 миллионов отсканированных книг. [107] [108]
Март 2012 : Google достиг соглашения с издателями. [109]
Январь 2013 г .: Документальный фильм «Google и мировой мозг» был показан на кинофестивале «Сандэнс» . [110]
Ноябрь 2013 г .: Окружной судья США Денни Чин в решении по делу «Гильдия авторов против Google» встал на сторону Google, сославшись на добросовестное использование. [111] Авторы заявили, что подадут апелляцию. [112]
Октябрь 2015 г .: Апелляционный суд встал на сторону Google, заявив, что Google не нарушал закон об авторских правах. [113] По данным New York Times, Google отсканировал более 25 миллионов книг. [12]
Апрель 2016 г .: Верховный суд США отклонил апелляцию Гильдии авторов, что означает, что решение суда низшей инстанции остается в силе, и Google будет разрешено сканировать библиотечные книги и отображать фрагменты в результатах поиска, не нарушая закон. [114]
Google был довольно скрытен относительно своих планов относительно будущего проекта Google Books. Сканирование замедлялось по крайней мере с 2012 года, что подтвердили библиотекари нескольких учреждений-партнеров Google. В Университете Висконсина скорость снизилась до менее чем половины от того, что было в 2006 году. Однако библиотекари заявили, что снижение темпов может быть естественным результатом созревания проекта — изначально стопки книг были полностью заняты для сканирования, тогда как теперь нужно было учитывать только те названия, которые еще не были отсканированы. [50] На собственной странице временной шкалы Google Books компании не упоминалось ничего после 2007 года даже в 2017 году, а блог Google Books был объединен с блогом Google Search в 2012 году. [115]
Несмотря на победу в десятилетнем судебном разбирательстве в 2017 году, The Atlantic заявил, что Google «практически закрыла свою операцию по сканированию». [14] В апреле 2017 года Wired сообщил, что над проектом работало всего несколько сотрудников Google, и новые книги все еще сканировались, но значительно медленнее. В нем говорилось, что десятилетняя юридическая тяжба привела к тому, что Google утратила свои амбиции. [115]
В рамках проекта библиотечные книги оцифровывались довольно беспорядочно, независимо от статуса авторских прав, что привело к ряду судебных исков против Google. К концу 2008 года Google, как сообщается, оцифровала более семи миллионов книг, из которых только около миллиона были произведениями в общественном достоянии. Из остальных один миллион были защищены авторским правом и находились в печати, а пять миллионов были защищены авторским правом, но не были изданы. В 2005 году группа авторов и издателей подала крупный коллективный иск против Google за нарушение авторских прав на произведения. Google утверждала, что она сохраняет «сиротские произведения» — книги, все еще находящиеся под авторским правом, но чьи владельцы авторских прав не могут быть найдены. [116]
Гильдия авторов и Ассоциация американских издателей подали в суд на Google в 2005 году за его книжный проект, ссылаясь на «массовое нарушение авторских прав ». [117] Google возразил, что его проект представляет собой добросовестное использование и является эквивалентом карточного каталога цифровой эпохи , в котором каждое слово в публикации индексируется. [9] Иски были объединены, и в конечном итоге было предложено урегулирование . Урегулирование получило значительную критику по самым разным основаниям, включая антимонопольное законодательство, конфиденциальность и неадекватность предложенных классов авторов и издателей. В конечном итоге урегулирование было отклонено, [118] и издатели вскоре после этого заключили мировое соглашение с Google. Гильдия авторов продолжила свое дело, и в 2011 году их предложенный класс был сертифицирован . Google подала апелляцию на это решение, при этом ряд друзей утверждали о неадекватности класса, и Второй округ отклонил сертификацию класса в июле 2013 года, вернув дело в Окружной суд для рассмотрения защиты добросовестного использования Google . [119]
В 2015 году Гильдия авторов подала еще одну апелляцию против Google, которая должна была быть рассмотрена Апелляционным судом второго округа США в Нью-Йорке. Google единогласно выиграла дело на основании аргумента о том, что они не показывали людям полные тексты, а только фрагменты, и они не позволяли людям незаконно читать книгу. [120] В отчете суды заявили, что они не нарушали законы об авторском праве, поскольку они были защищены положением о добросовестном использовании. [121]
Гильдия авторов снова попыталась в 2016 году обжаловать решение и на этот раз передала свое дело на рассмотрение в Верховный суд. Дело было отклонено, оставив решение Второго округа по делу без изменений, что означает, что Google не нарушала законы об авторском праве. [122] Это дело также создало прецедент для других подобных дел в отношении законов о добросовестном использовании, поскольку оно еще больше разъяснило закон и расширило его. Такое разъяснение затрагивает другие проекты сканирования, похожие на Google. [120]
Другие иски последовали примеру Гильдии авторов. В 2006 году немецкий иск, поданный ранее, был отозван. [123] В июне 2006 года Hervé de la Martinière, [124] французский издатель, известный как La Martinière и Éditions du Seuil , [125] объявил о своем намерении подать в суд на Google France. [126] В 2009 году Парижский гражданский суд присудил 300 000 евро (примерно 430 000 долларов США ) в качестве возмещения ущерба и процентов и обязал Google выплачивать 10 000 евро в день, пока он не удалит книги издателя из своей базы данных. [125] [127] Суд написал: «Google нарушил законы об авторских правах, полностью воспроизведя и сделав доступными» книги, которыми владеет Seuil, без его разрешения [125] и что Google «совершил действия, нарушающие авторские права, которые наносят вред издателям». [124] Google заявил, что подаст апелляцию. [125] Syndicat National de l'Edition, присоединившийся к иску, заявил, что Google отсканировал около 100 000 французских произведений, защищенных авторским правом. [125]
В декабре 2009 года китайская писательница Миан Миан подала гражданский иск на 8900 долларов против Google за сканирование ее романа « Acid Lovers» . Это первый подобный иск, поданный против Google в Китае. [128] Кроме того, в ноябре того же года Китайское общество по авторскому праву на письменные произведения (CWWCS) обвинило Google в сканировании 18 000 книг 570 китайских писателей без разрешения. 20 ноября Google согласилась предоставить список отсканированных ею китайских книг, но компания отказалась признать, что «нарушила» законы об авторском праве. [129] [ ненадежный источник? ]
В марте 2007 года Томас Рубин, заместитель генерального юрисконсульта по авторским правам, товарным знакам и коммерческим секретам в Microsoft, обвинил Google в нарушении закона об авторских правах с помощью их службы поиска книг. Рубин особенно раскритиковал политику Google по свободному копированию любой работы до тех пор, пока владелец авторских прав не уведомит его об этом. [130]
Лицензирование Google работ, являющихся общественным достоянием, также является предметом беспокойства из-за использования цифровых методов водяных знаков в книгах. Некоторые опубликованные работы, находящиеся в общественном достоянии, такие как все работы, созданные федеральным правительством США , по-прежнему рассматриваются как другие работы, защищенные авторским правом, и поэтому заблокированы после 1922 года. [131]
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite book}}
: CS1 maint: неподходящий URL ( ссылка )Google, один из пионеров в этой области, с другой стороны, утверждает, что имеет семь миллионов книг, доступных для его проекта "Google Book Search", который увидел свет в конце 2004 года.
{{cite web}}
: CS1 maint: неподходящий URL ( ссылка )