В этой статье сравнивается размер Википедии с другими энциклопедиями и информационными коллекциями.
Исходный материал, из которого взята статистика Википедии для этой статьи, доступен; [1] в сноске к разделу WikiStatistics в конце этой страницы представлено техническое обсуждение этой статьи.
В настоящее время только английская Википедия содержит более 6 909 606 статей любой длины, а объединенные Википедии на всех других языках значительно превосходят английскую Википедию по размеру, составляя более 29 миллиардов слов в 55 миллионах статей на 309 языках . [2] Только английская Википедия содержит более 4,3 миллиарда слов , [3] и содержит в 95 раз больше слов, чем 120-томная англоязычная Encyclopædia Britannica (онлайн), и больше слов, чем огромная 119-томная испаноязычная Enciclopedia universal ilustrada europeo-americana .
В 2005 году объем англоязычной Википедии увеличился более чем вдвое, а многие небольшие Википедии выросли в несколько раз.
В июне 2011 года во всех разделах Википедии было опубликовано более 11 миллионов статей, а в английской версии — 3,6 миллиона . [2] [3]
Wikipedia все еще нуждается в значительном расширении и улучшении . Многие статьи низкого качества, а некоторые основные темы энциклопедии не освещены должным образом. Кроме того, средняя длина статьи составляет всего лишь немного больше половины размера статьи в Encyclopædia Britannica , хотя многие основные статьи значительно длиннее. [ требуется ссылка ] Со временем ожидается, что баланс редакционных усилий будет медленно смещаться в сторону большего акцента на повышении качества, объема, классификации и взаимосвязи существующих статей. Однако новые статьи, вероятно, всегда будут создаваться в больших количествах, поскольку соглашения Wikipedia о приемлемых темах статей включают огромное количество потенциальных новых статей каждый год (недавно известные люди, текущие события, медиа-продукты, физические продукты и т. д.). В середине 2006 года скорость создания новых статей все еще росла, но только медленно. По состоянию на январь 2007 года [обновлять]казалось, что скорость создания статей могла достичь пика в середине 2006 года, хотя последующий анализ может показать обратное. Дополнительную информацию о темпах роста Википедии и ожидаемом будущем размере см. в статье Wikipedia:Моделирование роста Википедии .
Существует множество других онлайн-баз данных, которые объединяют несколько энциклопедий и энциклопедических словарей и позволяют пользователям искать во всех работах одновременно. Одним из примеров является Oxford Reference Online — база данных из 221 энциклопедии и энциклопедического словаря, предлагающая около 1,4 миллиона статей по состоянию на 2011 год [обновлять], с запланированными расширениями в будущем. [4] Другим примером является Xrefplus, которая предлагает доступ к 262 энциклопедиям, словарям и другим справочникам. [5] Все это в сумме составило около 2,9 миллиона записей, когда в базе данных было 225 названий. [6] Также есть HighBeam Research и GaleNet . GaleNet , которая, вероятно, является крупнейшей из названных на сегодняшний день, предлагает пользователям возможность поиска в нескольких базах данных энциклопедий, включая Biography Resource Center (1 335 000 человек), Gale Virtual Reference Library (594 справочника) [7] и Science Resource Center (51 название) [8] среди прочих.
Самая большая бумажная энциклопедия, когда-либо созданная, возможно, является Yongle Encyclopedia , завершенная в 1407 году в 11 095 книгах, 370 миллионах китайских иероглифов и заказанная императором Юнлэ . [9] Отдельные книги, которые составляли энциклопедию, были небольшими по современным стандартам; работа была в двенадцать раз больше размера 20-миллионной французской Encyclopédie , [10] давая 240 миллионов слов, или 21 600 слов на книгу, хотя неясно, отличается ли она от Encyclopédie по размеру. Также неясно, в двенадцать раз ли она больше, чем оригинальная 28-томная версия Encyclopédie, завершенная в 1772 году, или 35-томная версия, завершенная в 1780 году. Yung-lo ta-tien была сборником отрывков и целых существующих работ, а не оригинальной работой. Было изготовлено всего две копии, и все, что сохранилось, — это небольшая часть одной из них.
Цифры относительно общего количества символов основаны на предполагаемой средней длине слова, составляющей пять символов плюс пробел, или шесть символов на слово.
*Классический китайский язык очень компактный. Результат — очень короткие статьи для того же содержания.
† Говорят, что энциклопедия «Юнлэ» больше, чем Полная библиотека четырех сокровищниц, но неизвестно, как их сравнивали.
‡ Кеннет Ф. Кистер , Лучшие энциклопедии Кистера: сравнительное руководство по общим и специализированным энциклопедиям, (1994) стр. 450. [Количество статей указано для 82-томного издания, а не для 119-томного.]
§ Альфьери, Дж. Треккани Дельи. "Итальянская энциклопедия" Diccionario Literario (2001 HORA, SA)
** Количество энциклопедических статей. Nationalencyklopedin насчитывает 356 000 записей.
†† Кистер, соч. цит., с. 365.
**Включает 10 000 исторических архивов.
‡‡ Рекламировалось как содержащее «более 63 000 статей... с более чем 36 000 картами местоположений и более 29 000 одобренных редактором ссылок на веб-сайты». На Premium CD-ROM 2006 года было 68 000 статей. [16]
⁑ Рекламируется как содержащий 41 500 статей, написанных 6 803 авторами, 60 миллионов слов, 350 миллионов символов, 360 000 ссылок, 122 000 определений в прилагаемом словаре, 130 000 библиографических ссылок. [17]
Обратите внимание, что Википедия не является ни словарем , ни веб-индексом ; эти цифры приведены только для сравнения порядка величин.
Проект Print Wikipedia опубликовал весь текст английской Википедии, без фотографий, по состоянию на 2015 год в 7473 томах по 700 страниц каждый (всего 5,2 миллиона страниц). Lulu готова продать каждый том за 80 долларов США, а весь комплект за 500 000 долларов США. [22]
По состоянию на июль 2015 года [обновлять]было около 23 миллиардов символов. Если предположить, что на странице 5000 символов, то получится 4,6 миллиона страниц. Если затем добавить 25% на дополнительное место для фотографий, таблиц и диаграмм, то получится 5,75 миллиона страниц. Это даст 14 375 томов по 400 страниц каждый. Например, если разрешить 0,05 долл. США за страницу, то стоимость без переплета составит 287 500 долл. США.
Подробную статистику практически по всем аспектам Википедии можно найти по адресу https://stats.wikimedia.org/EN/Sitemap.htm.
Статистика для этой страницы взята из таблицы «Количество статей» (альтернативная) и из таблицы «Слов» .
За исключением страниц перенаправления, примерно (по данным на 1 сентября 2006 г.):
Если взять разницу этих двух цифр, то получится примерно:
Существует также неучтенное количество статей, не имеющих ссылок. Текущая статистика не дает никаких указаний на размер этой последней категории. 609 миллионов слов фактически охватывают 1,3 миллиона добросовестных статей, оставшиеся 100 000 связанных статей и неизвестное количество статей без ссылок. Грубая оценка количества слов в последних двух категориях составляет десять миллионов слов. Разделив оставшиеся 600 миллионов слов на 1,3 миллиона, получаем среднюю длину статьи около 460 слов.
Кроме того, из статей в английской Википедии, возможно, 36 000 являются записями в географических справочниках "data dumped" о городах в Соединенных Штатах. Спорным является вопрос о том, следует ли записывать записи в географических справочниках в число "реальных" статей энциклопедии; однако их статистическая значимость сейчас намного меньше, чем в октябре 2002 года, когда они были добавлены. Очень многие из них были колонизированы википедистами, которые преобразовали их в разной степени, в некоторых случаях до безупречно энциклопедического статуса.