Проект « Миллион книг» (или «Универсальная библиотека ») — проект оцифровки книг, возглавляемый Школой компьютерных наук и университетскими библиотеками Университета Карнеги-Меллона [1] с 2007 по 2008 год. Работа с правительством и исследовательскими партнёрами в Индии ( Цифровая библиотека Индии ) и В Китае в рамках проекта сканировались книги на многих языках, используя OCR для обеспечения полнотекстового поиска и предоставления бесплатного доступа к книгам в Интернете. По состоянию на 2007 год [update]они завершили сканирование 1 миллиона книг и сделали весь каталог доступным в Интернете.
Проект «Миллион книг» был благотворительной организацией 501(c)(3) с различными центрами сканирования по всему миру.
К декабрю 2007 года было отсканировано более 1,5 миллиона книг на 20 языках: 970 000 на китайском; 360 000 на английском языке; 50 000 на телугу ; и 40 000 на арабском языке. [2] Большинство книг находятся в общественном достоянии , но было получено разрешение на включение более 60 000 книг, защищенных авторским правом (примерно 53 000 на английском языке и 7 000 на индийских языках). Книги частично зеркально отображены на сайтах Индии, Китая, Карнеги-Меллон, Интернет-архиве , Александринской библиотеке . Книги, которые были отсканированы на сегодняшний день, еще не все доступны в Интернете, и ни на одном сайте нет копий всех книг, доступных в Интернете.
Проект «Миллион книг» был «доказательством концепции», и его в значительной степени заменили HathiTrust , Google Book Search и проекты сканирования книг Интернет-архива.
В Интернет-архиве могут быть книги, которых нет в Google (например: «Стихи Роберта Фроста» , опубликованные после конца 1922 года). [3] [4] [5]
Национальный научный фонд ( NSF) выделил Карнеги-Меллону 3,63 миллиона долларов в течение четырех лет на оборудование и административные поездки для проекта «Миллион книг». Индия ежегодно выделяла 25 миллионов долларов на поддержку исследовательских проектов в области языкового перевода. Министерство образования Китая выделило 8,46 миллиона долларов на три года. Интернет-архив предоставил оборудование, персонал и деньги. Библиотека Мерседа Калифорнийского университета профинансировала работу по получению разрешения на авторские права от издателей США.
Программа завершилась в 2008 году. [6]
В число учреждений Китая, участвующих в этом проекте, входят: [1]
В число учреждений Индии, участвующих в этом проекте, входят: [1]
Учреждения в США, которые являются участниками, включают: [1]
Учреждения ЕС, являющиеся участниками, включают: [1]