Google Книги (ранее известный как Google Book Search , Google Print и под кодовым названием Project Ocean ) [1] — это сервис от Google , который выполняет поиск по полному тексту книг и журналов, отсканированных Google, преобразованных в текст с использованием оптических символов. распознавания (OCR) и хранится в его цифровой базе данных. [2] Книги предоставляются либо издателями и авторами в рамках Партнерской программы Google Книги, либо библиотечными партнерами Google в рамках Библиотечного проекта. [3] Кроме того, Google заключила партнерские отношения с рядом издателей журналов с целью оцифровки их архивов. [4] [5]
Программа для издателей впервые была известна как Google Print, когда она была представлена на Франкфуртской книжной ярмарке в октябре 2004 года. В декабре 2004 года было объявлено о проекте библиотеки Google Книги, который сканирует произведения из коллекций библиотек-партнеров и добавляет их в цифровой каталог. .
Инициатива Google Книги получила высокую оценку за ее потенциал предложить беспрецедентный доступ к тому, что может стать крупнейшим онлайновым массивом человеческих знаний [6] [7] и способствовать демократизации знаний . [8] Однако его также критиковали за возможные нарушения авторских прав, [8] [9] и отсутствие редактирования для исправления многих ошибок, внесенных в отсканированные тексты в процессе оптического распознавания символов.
По состоянию на октябрь 2019 года [обновлять]Google отпраздновал 15-летие Google Books и предоставил количество отсканированных книг более 40 миллионов наименований. [10] В 2010 году компания Google подсчитала, что в мире насчитывается около 130 миллионов различных наименований, [11] и заявила, что намерена сканировать их все. [11] Однако с 2000-х годов процесс сканирования в американских академических библиотеках замедлился. [12] [13] Усилия по сканированию Книги Google были предметом судебных разбирательств, в том числе Гильдии авторов против Google , коллективного иска в США, решение которого было принято в пользу Google (см. ниже). Это был крупный случай, который вплотную приблизился к изменению практики авторского права на произведения неизвестных авторов в Соединенных Штатах. [14] Исследование, проведенное в 2023 году учеными из бизнес-школ Калифорнийского университета, Беркли и Северо-Восточного университета , показало, что оцифровка книг Google Books привела к увеличению продаж физических версий книг. [15]
Результаты Google Книг отображаются как в универсальном поиске Google , так и на специальном поисковом веб-сайте Google Книг ( books.google.com ).
В ответ на поисковые запросы Google Книги позволяют пользователям просматривать полные страницы книг, на которых встречаются условия поиска, если книга не защищена авторскими правами или если владелец авторских прав дал на это разрешение. Если Google считает, что книга все еще защищена авторскими правами, пользователь видит «фрагменты» текста вокруг запрашиваемых поисковых запросов. Все поисковые запросы в тексте книги выделяются желтым цветом.
В Google Книгах используются четыре уровня доступа: [16]
В ответ на критику со стороны таких групп, как Американская ассоциация издателей и Гильдия авторов , в августе 2005 года Google объявила о политике отказа , согласно которой владельцы авторских прав могут предоставить список названий, которые они не хотят сканировать, и запрос будет быть уважаемым. Компания также заявила, что не будет сканировать книги, защищенные авторскими правами, в период с августа по 1 ноября 2005 г., чтобы предоставить владельцам возможность решить, какие книги исключить из проекта. Таким образом, у владельцев авторских прав есть три варианта выбора в отношении любого произведения: [18]
Большинство отсканированных работ больше не издаются и не коммерчески доступны. [19]
Помимо приобретения книг в библиотеках, Google также получает книги от своих партнеров-издателей в рамках «Партнерской программы», призванной помочь издателям и авторам продвигать свои книги. Издатели и авторы отправляют в Google либо цифровую копию своей книги в формате EPUB или PDF , либо печатную копию, которая доступна в Google Книгах для предварительного просмотра. Издатель может контролировать процент книги, доступной для предварительного просмотра, но не менее 20 %. Они также могут сделать книгу полностью доступной для просмотра и даже разрешить пользователям загружать копию в формате PDF. Книги также можно продавать в Google Play. [3] В отличие от Библиотечного проекта, этот проект не вызывает каких-либо проблем с авторскими правами, поскольку осуществляется в соответствии с соглашением с издателем. Издатель может отказаться от соглашения в любое время. [18]
Для многих книг Google Книги отображают исходные номера страниц. Однако Тим Паркс в статье The New York Review of Books в 2014 году отметил, что Google прекратил предоставлять номера страниц для многих недавних публикаций (вероятно, тех, которые были приобретены в рамках партнерской программы) «предположительно в союзе с издателями, чтобы заставить те из нас, кому нужно готовить сноски для покупки бумажных изданий». [20]
Проект начался в 2002 году под кодовым названием Project Ocean. Соучредитель Google Ларри Пейдж всегда интересовался оцифровкой книг. Когда он и Марисса Майер начали экспериментировать со сканированием книг в 2002 году, им потребовалось 40 минут, чтобы оцифровать 300-страничную книгу. Но вскоре технология была развита до такой степени, что операторы сканирования могли сканировать до 6000 страниц в час. [14]
Google создал специальные центры сканирования, в которые книги доставлялись грузовиками. Станции могли оцифровывать со скоростью 1000 страниц в час. Книги были помещены в специально изготовленную механическую подставку, которая регулировала корешок книги на месте, в то время как множество источников света и оптических инструментов сканировали две открытые страницы. На каждую страницу будут направлены две камеры, фиксирующие изображение, а дальномер LIDAR будет накладывать на поверхность книги трехмерную лазерную сетку, чтобы фиксировать кривизну бумаги. Человек-оператор перелистывал страницы вручную, используя ножную педаль для фотографирования. Благодаря отсутствию необходимости сглаживать страницы или идеально их выравнивать, система Google не только достигла поразительной эффективности и скорости, но и помогла защитить хрупкие коллекции от чрезмерного обращения. После этого необработанные изображения прошли три уровня обработки: сначала алгоритмы устранения искажений использовали данные LIDAR, фиксирующие кривизну страниц. Затем программное обеспечение оптического распознавания символов (OCR) преобразовало необработанные изображения в текст, и, наконец, еще один раунд алгоритмов извлекал номера страниц, сноски, иллюстрации и диаграммы. [14]
Многие книги сканируются с помощью специальной камеры Elphel 323 [21] [22] со скоростью 1000 страниц в час. [23] Патент , выданный Google в 2009 году, показал, что Google разработала инновационную систему для сканирования книг, которая использует две камеры и инфракрасный свет для автоматической коррекции кривизны страниц в книге. Построив 3D-модель каждой страницы, а затем «устранив ее деформацию», Google может представить страницы плоскими, не делая их по-настоящему плоскими, что требует использования деструктивных методов, таких как развязывание или стеклянные пластины для индивидуального разделения. выравнивать каждую страницу, что неэффективно при сканировании больших объемов. [24] [25]
Google решил отказаться от информации о цвете в пользу лучшего пространственного разрешения, поскольку большинство книг, защищенных авторскими правами, в то время не содержали цветов. Каждое изображение страницы проходило через алгоритмы, которые различали текстовые и иллюстративные области. Затем текстовые области обрабатывались с помощью OCR, чтобы обеспечить полнотекстовый поиск. Google потратил значительные ресурсы на разработку оптимальных методов сжатия, стремясь к высокому качеству изображения при сохранении минимального размера файлов, чтобы обеспечить доступ к ним пользователям Интернета с низкой пропускной способностью. [26]
Для каждой работы Google Книги автоматически создают обзорную страницу. На этой странице отображается информация, извлеченная из книги — сведения о ее публикации, карта часто встречающихся слов, оглавление — а также второстепенные материалы, такие как резюме, отзывы читателей (не читабельные в мобильной версии веб-сайта) и ссылки. к другим соответствующим текстам. Например, посетитель страницы может увидеть список книг, имеющих схожий жанр и тему, или список текущих научных исследований по этой книге. Более того, этот контент предлагает интерактивные возможности для пользователей, вошедших в свою учетную запись Google . Они могут экспортировать библиографические данные и цитаты в стандартные форматы , писать свои собственные обзоры, добавлять их в свою библиотеку, чтобы их можно было пометить, систематизировать и поделиться ими с другими людьми. [27] [28] Таким образом, Google Книги собирают эти более интерпретирующие элементы из ряда источников, включая пользователей, сторонние сайты, такие как Goodreads , а часто и автора и издателя книги. [29]
Фактически, чтобы побудить авторов загружать свои книги, Google добавил на сайт несколько функций. Авторы могут разрешить посетителям загружать их электронные книги бесплатно или установить собственную цену покупки. Они могут менять цену взад и вперед, предлагая скидки, когда им это удобно. Кроме того, если автор книги решит добавить номер записи ISBN , LCCN или OCLC , служба обновит URL-адрес книги, включив его. Затем автор может установить конкретную страницу в качестве привязки ссылки. Эта опция облегчает поиск книги.
Ngram Viewer — это служба, подключенная к Google Книгам, которая отображает частоту использования слов в их книжной коллекции. Эта услуга важна для историков и лингвистов, поскольку она может дать возможность взглянуть изнутри на человеческую культуру через использование слов на протяжении разных периодов времени. [30] Эта программа подверглась критике из-за ошибок в метаданных, используемых в программе. [31]
Проект подвергся критике за то, что его заявленная цель по сохранению потерянных и вышедших из печати произведений находится под угрозой из-за того, что отсканированные данные содержат ошибки и такие проблемы не решаются. [32] [33]
В процессе сканирования возможны ошибки. Например, некоторые страницы могут быть нечитаемыми, перевернутыми или расположены в неправильном порядке. Ученые даже сообщали о смятых страницах, скрывающих большие и указательные пальцы, а также о смазанных или размытых изображениях. [34] По этому поводу в заявлении Google в конце отсканированных книг говорится:
Оцифровка на самом базовом уровне основана на изображениях страниц физических книг. Чтобы сделать эту книгу доступной в виде файла в формате ePub, мы взяли изображения страниц и извлекли текст с помощью технологии оптического распознавания символов (или для краткости OCR). Извлечение текста из изображений страниц — сложная инженерная задача. Пятна на страницах физических книг, необычные шрифты, старые шрифты, порванные страницы и т. д. могут привести к ошибкам в извлеченном тексте. Несовершенное распознавание текста — это лишь первая задача на пути к конечной цели перехода от коллекций изображений страниц к книгам на основе извлеченного текста. Наши компьютерные алгоритмы также должны автоматически определять структуру книги (какие верхние и нижние колонтитулы, где размещаются изображения, является ли текст стихами или прозой и так далее). Если сделать это правильно, мы сможем визуализировать книгу так, чтобы она соответствовала формату исходной книги. Несмотря на все наши усилия, в этой книге вы можете увидеть орфографические ошибки, мусорные символы, посторонние изображения или пропущенные страницы. По нашим оценкам, эти ошибки не должны помешать вам насладиться содержанием книги. Технические проблемы автоматического создания идеальной книги огромны, но мы продолжаем совершенствовать наши технологии оптического распознавания символов и извлечения структуры книги. [35]
В 2009 году Google заявила, что начнет использовать reCAPTCHA, чтобы исправить ошибки, обнаруженные при сканировании книг Google. Этот метод улучшит только отсканированные слова, которые трудно распознать из-за процесса сканирования и которые не могут устранить такие ошибки, как перевернутые страницы или заблокированные слова. [36]
Ошибки сканирования вдохновили на создание произведений искусства, таких как опубликованные коллекции аномальных страниц и блог Tumblr . [37]
Ученые часто сообщают о серьезных ошибках в метаданных в Google Книгах, в том числе об ошибочных указаниях авторов и ошибочных датах публикации. Джеффри Нанберг , лингвист, исследующий изменения в использовании слов с течением времени, заметил, что поиск книг, опубликованных до 1950 года и содержащих слово «интернет», дал маловероятные 527 результатов. Вуди Аллен упоминается в 325 книгах, якобы изданных до его рождения. В ответ Нанбергу Google возложила вину за большую часть ошибок на сторонних подрядчиков. [31]
Другие зарегистрированные ошибки в метаданных включают даты публикации до рождения автора (например, 182 произведения Чарльза Диккенса до его рождения в 1812 году); неправильные тематические классификации (издание «Моби Дика» найдено в разделе «компьютеры», биография Мэй Уэст отнесено к разделу «религия»), противоречивые классификации (10 изданий « Листьев травы » Уитмена классифицированы как «художественная литература» и «документальная литература»), неправильно написанные названия, авторы и издатели (« Моби Дик: или Белая «Стена» )», а метаданные для одной книги неправильно добавлены к совершенно другой книге (метаданные математической работы 1818 года приводят к любовному роману 1963 года). [38] [39]
Был проведен анализ элементов метаданных об авторе, названии, издателе и году публикации для 400 случайно выбранных записей Google Книг. Результаты показывают, что 36% выбранных книг в проекте оцифровки содержали ошибки в метаданных. Этот уровень ошибок выше, чем можно было бы ожидать в обычном онлайн-каталоге библиотеки. [40]
Общий уровень ошибок в 36,75%, обнаруженный в этом исследовании, предполагает, что метаданные Google Книг имеют высокий уровень ошибок. Хотя «серьезные» и «незначительные» ошибки представляют собой субъективное различие, основанное на несколько неопределенной концепции «обнаружимости», все ошибки, обнаруженные в четырех элементах метаданных, рассмотренных в этом исследовании, следует считать серьезными. [40]
Ошибки метаданных, вызванные неправильными отсканированными датами, затрудняют исследование с использованием базы данных проекта Google Книги. Google проявил лишь ограниченный интерес к устранению этих ошибок. [41]
Некоторые европейские политики и интеллектуалы раскритиковали усилия Google по причинам лингвистического империализма . Они утверждают, что, поскольку подавляющее большинство книг, предлагаемых к сканированию, написаны на английском языке, это приведет к непропорциональному представлению естественных языков в цифровом мире. Например, немецкий, русский, французский и испанский языки являются популярными языками в науке. Однако непропорциональный онлайн-акцент на английском языке может повлиять на доступ к исторической науке и, в конечном счете, на рост и направление будущих исследований. Среди этих критиков — Жан-Ноэль Жаннини , бывший президент Национальной библиотеки Франции . [42] [43]
Хотя Google Книги оцифровали большое количество старых выпусков журналов, его сканы не включают метаданные, необходимые для идентификации конкретных статей в конкретных выпусках. Это побудило создателей Google Scholar запустить собственную программу по оцифровке и размещению старых журнальных статей (по согласованию со своими издателями). [44]
Проект библиотеки Google Книг направлен на сканирование и обеспечение возможности поиска по коллекциям нескольких крупных исследовательских библиотек . [45] Наряду с библиографической информацией часто доступны для просмотра фрагменты текста из книги. Если книга не защищена авторскими правами и находится в общественном достоянии, она полностью доступна для чтения или загрузки . [16]
Книги, защищенные авторскими правами, отсканированные в рамках Библиотечного проекта, доступны в Google Книгах для просмотра фрагментов. Что касается качества сканов, Google признает, что они «не всегда достаточно высокого качества», чтобы предлагать их для продажи в Google Play. Кроме того, из-за предполагаемых технических ограничений Google не заменяет сканы версиями более высокого качества, которые могут быть предоставлены издателями. [46]
Проект является предметом иска Гильдии авторов против Google , поданного в 2005 году и вынесенного в пользу Google в 2013 году, а затем по апелляции в 2015 году.
Владельцы авторских прав могут заявить права на отсканированную книгу и сделать ее доступной для предварительного или полного просмотра (путем «переноса» ее в свою учетную запись партнерской программы) или попросить Google запретить поиск по тексту книги. [46]
Число учреждений, участвующих в Библиотечном проекте, выросло с момента его создания. [47]
Другие институциональные партнеры присоединились к проекту с момента первого объявления о партнерстве: [54]
2002 : Группа членов команды Google официально запускает «проект секретных книг». [73] Основатели Google Сергей Брин и Ларри Пейдж придумали идею, которая позже стала Google Книги, еще будучи аспирантами Стэнфорда в 1996 году. Страница истории на веб-сайте Google Книги описывает их первоначальное видение этого проекта: «В мире будущего». когда огромные коллекции книг оцифрованы, люди будут использовать « веб-сканер » для индексации содержания книг и анализа связей между ними, определяя актуальность и полезность той или иной книги, отслеживая количество и качество цитирований из других книг». [73] Эта группа посетила сайты некоторых из наиболее крупных усилий по оцифровке того времени, включая проект «Американская память» Библиотеки Конгресса , проект «Гутенберг» и Универсальную библиотеку, чтобы узнать, как они работают, а также Мичиганский университет, проект Пейджа. альма-матер и является основой для таких проектов оцифровки, как JSTOR и Making of America. В разговоре с тогдашним президентом университета Мэри Сью Коулман , когда Пейдж узнал, что текущая оценка университета для сканирования всех томов библиотеки составляет 1000 лет, Пейдж, как сообщается, сказал Коулману, что он «верит, что Google может помочь сделать это за шесть лет». " [73]
2003 : Команда работает над разработкой высокоскоростного процесса сканирования, а также программного обеспечения для решения проблем, связанных с нестандартными размерами шрифтов, необычными шрифтами и «другими неожиданными особенностями». [73]
Декабрь 2004 г .: Google объявила о расширении своей инициативы Google Print, известной как Проект библиотеки Google Print. [47] Google объявила о партнерстве с несколькими известными университетскими и публичными библиотеками, включая Мичиганский университет , Гарвард ( Библиотека Гарвардского университета ), Стэнфорд ( Зеленая библиотека ), Оксфорд ( Бодлианская библиотека ) и Публичную библиотеку Нью-Йорка . По сообщениям пресс-релизов и университетских библиотекарей, Google планировала оцифровать и сделать доступными через свой сервис Google Books примерно 15 миллионов томов в течение десятилетия. Это объявление вскоре вызвало споры, поскольку ассоциации издателей и авторов бросили вызов планам Google по оцифровке не только книг, находящихся в общественном достоянии, но и произведений, все еще находящихся под защитой авторских прав.
Сентябрь – октябрь 2005 г .: два иска против Google обвиняют компанию в несоблюдении авторских прав и не выплате надлежащей компенсации авторам и издателям. Один из них — групповой иск от имени авторов («Гильдия авторов против Google», 20 сентября 2005 г.), а другой — гражданский иск, поданный пятью крупными издателями и Ассоциацией американских издателей . (Макгроу Хилл против Google, 19 октября 2005 г.) [9] [74] [75] [76] [77] [78]
Ноябрь 2005 г .: Google изменил название этой службы с Google Print на Google Book Search. [79] Ее программа, позволяющая издателям и авторам включать свои книги в сервис, была переименована в Партнерскую программу Google Книги, [80] а партнерство с библиотеками стало Библиотечным проектом Google Книги.
2006 : Google добавил кнопку «загрузить PDF-файл» ко всем своим книгам, находящимся в общественном достоянии, не защищенным авторскими правами. Также добавлен новый интерфейс просмотра и новые страницы «Об этой книге». [73]
Август 2006 г .: Система Калифорнийского университета объявила о своем присоединении к проекту оцифровки книг. Сюда входит часть из 34 миллионов томов примерно 100 библиотек, управляемых Системой. [81]
Сентябрь 2006 г .: Мадридский университет Комплутенсе стал первой испаноязычной библиотекой, присоединившейся к библиотечному проекту Google Books. [82]
Октябрь 2006 г .: Университет Висконсина-Мэдисона объявил, что присоединится к проекту оцифровки поиска книг вместе с библиотекой Исторического общества Висконсина . В совокупности библиотеки насчитывают 7,2 миллиона фондов. [83]
Ноябрь 2006 г .: К проекту присоединился Университет Вирджинии . Его библиотеки содержат более пяти миллионов томов и более 17 миллионов рукописей, редких книг и архивов. [84]
Январь 2007 г .: Техасский университет в Остине объявил о своем присоединении к проекту оцифровки Book Search. По меньшей мере один миллион томов будет оцифрован из 13 университетских библиотек.
Март 2007 г .: Баварская государственная библиотека объявила о партнерстве с Google для сканирования более миллиона общедоступных и вышедших из печати произведений на немецком, а также английском, французском, итальянском, латинском и испанском языках. [85]
Май 2007 : Google и Кантональная и университетская библиотека Лозанны объявили о партнерстве в проекте по оцифровке книг . [86]
Май 2007 г .: Библиотека Букенторен Гентского университета объявила, что вместе с Google будет участвовать в оцифровке и создании оцифрованных версий книг XIX века на французском и голландском языках, доступных в Интернете. [87]
Май 2007 г.: Университет Майсура объявляет, что Google оцифрует более 800 000 книг и рукописей, в том числе около 100 000 рукописей, написанных на санскрите или каннада как на бумаге, так и на пальмовых листьях. [68]
Июнь 2007 г .: Комитет по институциональному сотрудничеству (переименованный в Академический альянс большой десятки в 2016 г.) объявил, что двенадцать его библиотек-членов примут участие в сканировании 10 миллионов книг в течение следующих шести лет. [58]
Июль 2007 г .: Университет Кейо стал первым библиотечным партнером Google в Японии , объявив, что они оцифруют не менее 120 000 книг, являющихся общественным достоянием. [88]
Август 2007 : Google объявил, что оцифрует до 500 000 объектов, охраняемых авторским правом и являющихся общественным достоянием, из библиотеки Корнеллского университета . Google также предоставит цифровые копии всех отсканированных произведений для включения в собственную библиотечную систему университета. [89]
Сентябрь 2007 г .: Google добавил функцию, позволяющую пользователям делиться фрагментами книг, находящихся в свободном доступе. Фрагменты могут выглядеть точно так же, как на скане книги, или в виде обычного текста. [90]
Сентябрь 2007 г .: Google представил новую функцию под названием «Моя библиотека», которая позволяет пользователям создавать персональные библиотеки, подборки книг, которые они могут помечать, просматривать, оценивать или осуществлять полнотекстовый поиск. [91]
Декабрь 2007 г .: Колумбийский университет стал партнером по оцифровке произведений, являющихся общественным достоянием. [92]
Май 2008 г .: Microsoft свернула работу и планировала завершить проект сканирования , объем которого достиг 750 000 книг и 80 миллионов журнальных статей. [93]
Октябрь 2008 г .: после двух лет переговоров между издательской индустрией и Google было достигнуто соглашение . Google согласился выплатить компенсацию авторам и издателям в обмен на право сделать миллионы книг доступными для общественности. [9] [94]
Октябрь 2008 г .: «Общий цифровой репозиторий HathiTrust » (позже известный как Цифровая библиотека HathiTrust) запущен совместно Комитетом по институциональному сотрудничеству и 11 университетскими библиотеками в системе Калифорнийского университета , все из которых были библиотеками-партнерами Google, чтобы архивировать и предоставлять академический доступ к книгам из своих коллекций, отсканированным Google и другими. [95]
Ноябрь 2008 г .: Google достигла отметки в 7 миллионов закладок для элементов, отсканированных Google и их партнерами-издателями. 1 миллион находился в режиме полного предварительного просмотра, а 1 миллион представлял собой полностью доступные для просмотра и загрузки произведения, являющиеся общественным достоянием. Около пяти миллионов экземпляров были распроданы . [19] [96] [97]
Декабрь 2008 г .: Google объявила о включении журналов в Google Книги. Названия включают New York Magazine , Ebony и Popular Mechanics [98] [99]
Февраль 2009 г .: Google запустил мобильную версию Поиска книг Google, позволяющую пользователям телефонов iPhone и Android читать более 1,5 миллионов произведений, являющихся общественным достоянием, в США (и более 500 000 за пределами США) с помощью мобильного браузера. Вместо изображений страниц отображается простой текст книги. [100]
Май 2009 г .: На ежегодной конференции BookExpo в Нью-Йорке компания Google заявила о своем намерении представить программу, которая позволит издателям продавать цифровые версии своих новейших книг напрямую потребителям через Google. [101]
Декабрь 2009 г .: Французский суд запретил сканирование книг, защищенных авторским правом, изданных во Франции, заявив, что это нарушает законы об авторском праве. Это была первая крупная юридическая потеря для проекта сканирования. [102]
Апрель 2010 г .: Художники-художники не участвовали в предыдущем иске и урегулировании, являются группами истцов в другом иске и заявляют, что намерены подвергнуть проверке не только Google Книги. «Новый коллективный иск, — говорится в заявлении, — выходит за рамки библиотечного проекта Google и включает в себя другие систематические и повсеместные нарушения Google прав фотографов, иллюстраторов и других художников». [103]
Май 2010 : Сообщалось, что Google запустит магазин цифровых книг под названием Google Editions . [104] Имея собственный магазин электронных книг, он будет конкурировать с Amazon, Barnes & Noble, Apple и другими продавцами электронных книг. В отличие от других, Google Editions будет полностью онлайн и не потребует специального устройства (например, Kindle, Nook или iPad).
Июнь 2010 г .: Google просканировал 12 миллионов книг. [11]
Август 2010 г .: было объявлено, что Google намерен в течение десятилетия отсканировать все известные существующие 129 864 880 книг, что в общей сложности составляет более 4 миллиардов цифровых страниц и 2 триллионов слов. [11]
Декабрь 2010 г .: в США запущены электронные книги Google (Google Editions). [105]
Декабрь 2010 г .: Google запустил Ngram Viewer, который собирает и отображает в виде графиков данные об использовании слов в своей коллекции книг. [30]
Март 2011 г .: Федеральный судья отклонил соглашение , достигнутое между издательской индустрией и Google. [106]
Март 2012 г .: Google просканировал 20 миллионов книг. [107] [108]
Март 2012 г .: Google достигла соглашения с издателями. [109]
Январь 2013 г .: Документальный фильм «Google и мировой мозг» был показан на кинофестивале «Сандэнс» . [110]
Ноябрь 2013 г .: В решении по делу Гильдия авторов против Google окружной судья США Денни Чин встал на сторону Google, ссылаясь на добросовестное использование. [111] Авторы заявили, что подадут апелляцию. [112]
Октябрь 2015 г .: Апелляционный суд встал на сторону Google, заявив, что Google не нарушила закон об авторском праве. [113] По данным New York Times, Google просканировал более 25 миллионов книг. [12]
Апрель 2016 г .: Верховный суд США отказался рассматривать апелляцию Гильдии авторов. Это означает, что решение суда низшей инстанции осталось в силе, и Google будет разрешено сканировать библиотечные книги и отображать их фрагменты в результатах поиска, не нарушая закон. [114]
Google хранит весьма скрытную информацию о своих планах относительно будущего проекта Google Books. Операции сканирования замедлялись, по крайней мере, с 2012 года, что подтвердили библиотекари нескольких учреждений-партнеров Google. В Университете Висконсина скорость снизилась более чем вдвое по сравнению с 2006 годом. Однако библиотекари заявили, что снижение скорости могло быть естественным результатом созревания проекта – первоначально стопки книг были полностью заняты сканирования, тогда как теперь необходимо учитывать только те заголовки, которые еще не были отсканированы. [50] На собственной странице хроники Google Книги ничего не упоминалось после 2007 года даже в 2017 году, а блог Google Книги был объединен с блогом Google Search в 2012 году. [115]
Несмотря на победу в десятилетнем судебном процессе в 2017 году, The Atlantic заявила, что Google «почти прекратила свою операцию по сканированию». [14] В апреле 2017 года издание Wired сообщило, что над проектом работало всего несколько сотрудников Google, а новые книги все еще сканировались, но значительно меньшими темпами. В нем отметили, что десятилетняя судебная тяжба привела к тому, что Google потеряла свои амбиции. [115]
В рамках проекта библиотечные книги оцифровывались без разбора, независимо от статуса авторских прав, что привело к ряду судебных исков против Google. По сообщениям, к концу 2008 года Google оцифровала более семи миллионов книг, из которых только около миллиона были произведениями, находящимися в свободном доступе. Из остальных один миллион находился под защитой авторских прав и находился в печати, а пять миллионов находились под защитой авторских прав, но не издавались. В 2005 году группа авторов и издателей подала крупный коллективный иск против Google за нарушение авторских прав на произведения, защищенные авторским правом. Google утверждала, что сохраняет «бесхозные произведения» — книги, все еще защищенные авторским правом, но правообладателей которых установить не удалось. [116]
Гильдия авторов и Ассоциация американских издателей отдельно подали в суд на Google в 2005 году за ее книжный проект, сославшись на «массовое нарушение авторских прав ». [117] Google возразила, что ее проект представляет собой добросовестное использование и является эквивалентом цифровой эпохи карточного каталога , в котором проиндексировано каждое слово в публикации. [9] Иски были объединены, и в конечном итоге было предложено мировое соглашение . Мировое соглашение подверглось серьезной критике по самым разным причинам, включая антимонопольное законодательство, конфиденциальность и неадекватность предложенных классов авторов и издателей. Мировое соглашение в конечном итоге было отклонено, [118] и вскоре после этого издатели заключили соглашение с Google. Гильдия авторов продолжила свое дело, и в 2011 году предложенный ими класс был сертифицирован . Google обжаловала это решение, при этом ряд экспертов заявили о несоответствии класса, а Второй окружной суд отклонил сертификацию класса в июле 2013 года, вернув дело в окружной суд для рассмотрения защиты Google по добросовестному использованию . [119]
В 2015 году Гильдия авторов подала еще одну апелляцию против Google, которая будет рассмотрена 2-м окружным апелляционным судом США в Нью-Йорке. Google выиграла дело единогласно на том основании, что они показывали людям не полные тексты, а фрагменты, и не позволяли людям незаконно читать книгу. [120] В отчете суды заявили, что они не нарушили законы об авторском праве, поскольку они защищены положением о добросовестном использовании. [121]
В 2016 году Гильдия авторов еще раз попыталась обжаловать это решение и на этот раз подала дело на рассмотрение Верховного суда. Дело было отклонено, оставив решение Второго округа по делу нетронутым, а это означает, что Google не нарушила законы об авторском праве. [122] Это дело также создало прецедент для других подобных дел в отношении законов о добросовестном использовании, поскольку оно дополнительно разъяснило закон и расширило его. Такое разъяснение касается и других проектов сканирования, подобных Google. [120]
Другие иски последовали примеру Гильдии авторов. В 2006 году ранее поданный немецкий иск был отозван. [123] В июне 2006 года Эрве де ла Мартиньер, [124] французский издатель, известный как La Martinière и Éditions du Seuil , [125] объявил о своем намерении подать в суд на Google France. [126] В 2009 году Гражданский суд Парижа присудил 300 000 евро (приблизительно 430 000 долларов США ) в качестве компенсации за ущерб и проценты и обязал Google платить 10 000 евро в день до тех пор, пока он не удалит книги издателя из своей базы данных. [125] [127] Суд постановил, что «Google нарушила законы об авторских правах, полностью воспроизведя и сделав доступными» книги, которыми владеет Сеуил, без ее разрешения [125] и что Google «совершила действия, нарушающие авторские права, которые наносят вред издатели». [124] Google заявила, что подаст апелляцию. [125] Syndicat National de l'Edition, присоединившийся к иску, сообщил, что Google отсканировал около 100 000 французских произведений, защищенных авторским правом. [125]
В декабре 2009 года китайская писательница Миан Миан подала гражданский иск на 8900 долларов против Google за сканирование ее романа « Любители кислоты» . Это первый подобный иск, поданный против Google в Китае. [128] Кроме того, в ноябре того же года Китайское общество авторских прав на письменные произведения (CWWCS) обвинило Google в сканировании 18 000 книг 570 китайских писателей без разрешения. 20 ноября компания Google согласилась предоставить список отсканированных ею китайских книг, но компания отказалась признать, что «нарушила» законы об авторском праве. [129] [ ненадежный источник? ]
В марте 2007 года Томас Рубин, помощник главного юрисконсульта Microsoft по авторскому праву, товарным знакам и коммерческой тайне, обвинил Google в нарушении закона об авторском праве с помощью своей службы поиска книг. Рубин особо раскритиковал политику Google по свободному копированию любых произведений до тех пор, пока правообладатель не уведомит об этом. [130]
Лицензирование Google произведений, являющихся общественным достоянием, также вызывает обеспокоенность из-за использования в книгах методов нанесения цифровых водяных знаков . Некоторые опубликованные произведения, находящиеся в общественном достоянии, например, все произведения, созданные федеральным правительством США , по-прежнему рассматриваются как другие произведения, находящиеся под авторским правом, и поэтому заблокированы после 1922 года. [131]
{{cite book}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite web}}
: CS1 maint: несколько имен: список авторов ( ссылка ){{cite book}}
: CS1 maint: неподходящий URL ( ссылка )С другой стороны, Google, один из пионеров в этой области, утверждает, что имеет семь миллионов книг для своего проекта «Поиск книг Google», который увидел свет в конце 2004 года.
{{cite web}}
: CS1 maint: неподходящий URL ( ссылка )