Научные языки — это языки-носители, используемые одним или несколькими научными сообществами для международного общения. По словам историка науки Майкла Гордина , они представляют собой «либо особые формы данного языка, которые используются для проведения науки, либо набор отдельных языков, на которых ведется наука». [1]
До 19 века классические языки , такие как латынь , классический арабский , санскрит и классический китайский , широко использовались в Афроевразии в целях международного научного общения. Сочетание структурных факторов, возникновение национальных государств в Европе, промышленная революция и расширение колонизации повлекли за собой глобальное использование трех европейских национальных языков: французского , немецкого и английского . Тем не менее, к концу 19 века начали появляться новые языки науки, такие как русский или итальянский, до такой степени, что международные научные организации начали продвигать использование искусственных языков, таких как эсперанто, в качестве ненационального мирового стандарта.
После Первой мировой войны английский язык постепенно опередил французский и немецкий и стал ведущим языком науки, но не единственным международным стандартом. Исследования в Советском Союзе быстро расширялись в годы после Второй мировой войны , и доступ к русским журналам стал важным политическим вопросом в Соединенных Штатах , что побудило к раннему развитию машинного перевода . В последние десятилетия 20-го века все большее число научных публикаций использовало в основном английский язык, отчасти из-за преобладания англоязычных научных инфраструктур, индексов и метрик, таких как Индекс научного цитирования . Местные языки по-прежнему остаются в значительной степени значимыми в научном отношении в крупных странах и регионах мира, таких как Китай, Латинская Америка и Индонезия. Дисциплины и области исследований со значительной степенью общественного участия, такие как социальные науки, исследования окружающей среды и медицина, также сохраняют актуальность местных языков.
Развитие открытой науки возродило дебаты о языковом разнообразии в науке, поскольку социальное и локальное воздействие стало важной целью инфраструктур и платформ открытой науки. В 2019 году 120 международных исследовательских организаций подписали Хельсинкскую инициативу по многоязычию в научной коммуникации и призвали к поддержке многоязычия и развитию «инфраструктуры научной коммуникации на национальных языках». [2] Рекомендация ЮНЕСКО по открытой науке 2021 года включает «языковое разнообразие» в качестве одной из основных характеристик открытой науки, поскольку она направлена на то, чтобы «сделать многоязычные научные знания общедоступными, доступными и пригодными для повторного использования для всех». [3] В 2022 году Совет Европейского союза официально поддержал «инициативы по содействию многоязычию» в науке, такие как Хельсинкская декларация. [4]
До XIX века классические языки играли важную роль в распространении языков в Европе , Азии и Северной Африке .
В Европе, начиная с XII века, латынь была основным языком религии, права и администрации вплоть до раннего Нового времени. Она стала языком науки «благодаря встрече с арабским»; в эпоху Возрождения XII века большой корпус арабских научных текстов был переведен на латынь, чтобы быть доступным в формирующейся сети европейских университетов и центров знаний. [5] В этом процессе латинский язык изменился и приобрел специфические черты схоластической латыни посредством многочисленных лексических и даже синтаксических заимствований из греческого и арабского языков. Использование научной латыни сохранялось еще долгое время после замены латыни на местные языки в большинстве европейских администраций: «Статус латыни как языка науки основывался на контрасте, который она создавала с использованием местных языков в других контекстах» и создал «европейское сообщество обучения», полностью отличное от местных сообществ, где жили ученые. [6] Латынь никогда не была единственным языком науки и образования. Помимо местных публикаций, местные языки очень рано обрели статус международных научных языков, которые, как можно было ожидать, будут поняты и переведены по всей Европе. В середине XVI века значительная часть печатной продукции во Франции была на итальянском языке.
В индийском и южноазиатском регионах санскрит был ведущим языком-носителем науки. Санскрит был переделан даже более радикально, чем латынь, в целях научной коммуникации, поскольку он сместился «в сторону все более сложных форм существительных, чтобы охватить виды абстракций, требуемых научным и математическим мышлением». [7] Классический китайский язык занимал столь же престижное положение в Восточной Азии, будучи в значительной степени принят научными и буддийскими сообществами за пределами Китайской империи, в частности в Японии и Корее. [8]
Классические языки пришли в упадок по всей Евразии во 2-м тысячелетии. Санскрит все больше маргинализировался после 13-го века. [9] До конца 17-го века не было четкой тенденции вытеснения латыни в Европе народными языками: в то время как в 16-м веке медицинские книги начали использовать также французский; эта тенденция была обращена вспять после 1597 года, и большая часть медицинской литературы во Франции оставалась доступной только на латыни до 1680-х годов. [10] В 1670 году на латыни было напечатано столько же книг, сколько и на немецком языке в германских государствах; в 1787 году их составляло не более 10%. [11] В этот момент упадок стал необратимым: поскольку все меньше и меньше европейских ученых были знакомы с латынью, публикации сокращались, и было меньше стимулов поддерживать языковую подготовку на латыни.
Появление научных журналов было одновременно симптомом и причиной снижения использования классического языка. Первые два современных научных журнала были опубликованы одновременно в 1665 году: Journal des Sçavans во Франции и Philosophical Transactions of the Royal Society в Англии. Они оба использовали местный диалект, что «имело совершенный исторический смысл», поскольку и Королевство Франция , и Королевство Англия были вовлечены в активную политику лингвистического продвижения языкового стандарта. [12]
Постепенное прекращение использования латыни открыло нелегкий переходный период, поскольку все больше и больше работ были доступны только на местных языках. Многие национальные европейские языки имели потенциал стать языком науки в определенной области исследований: некоторые ученые «принимали меры для изучения шведского языка, чтобы иметь возможность следить за работой [шведского химика] Бергмана и его соотечественников». [13]
Языковые предпочтения и использование в научных сообществах постепенно консолидировались в триумвират или триаду доминирующих языков науки: французский, английский и немецкий. Хотя каждый язык, как ожидалось, должен был быть понятным для целей международного научного общения, они также следовали «различным функциональным распределениям, очевидным в различных научных областях». [14] Французский язык был почти признан международным стандартом европейской науки в конце 18 века и оставался «основным» на протяжении всего 19 века. [15] Немецкий стал основным научным языком в 19 веке, поскольку он «охватывал части физических наук, в частности физику и химию, а также математику и медицину». [15] Английский язык в основном использовался исследователями и инженерами из-за основополагающего вклада английской технологии в промышленную революцию . [15]
В годы, предшествовавшие Первой мировой войне , языковое разнообразие научных публикаций значительно возросло. Появление современных национальностей и ранние движения за деколонизацию создали новые стимулы для публикации научных знаний на национальном языке. [16] Русский язык был одним из самых успешных разработок нового языка науки. В 1860-х и 1870-х годах российские исследователи в области химии и других физических наук прекратили публиковаться на немецком языке в пользу местных периодических изданий после большой работы по адаптации и созданию названий для научных концепций или элементов (таких как химические соединения). [17] Спор о значении периодической таблицы Дмитрия Менделеева способствовал признанию оригинальных публикаций на русском языке в глобальных научных дебатах: оригинальная версия была признана более авторитетной, чем ее первый «несовершенный» перевод на немецкий язык. [18]
Языковое разнообразие стало рассматриваться как структурная проблема, которая в конечном итоге ограничила распространение научных знаний. В 1924 году лингвист Роланд Грабб Кент подчеркнул, что научная коммуникация может быть существенно нарушена в ближайшем будущем из-за использования "двадцати" языков науки:
Сегодня, с возрождением некоторых второстепенных языковых единиц и усилением националистического духа некоторых более крупных, мы сталкиваемся со временем, когда ценные научные публикации могут появиться, возможно, на двадцати языках, [и] сталкиваемся с эпохой, когда важные публикации будут появляться на финском, литовском, венгерском, сербском, ирландском, турецком, иврите, арабском, хиндустани, японском и китайском языках. [19]
Определение вспомогательного языка для науки стало основным вопросом, обсуждаемым в новых международных научных учреждениях. 17 января 1901 года недавно созданная Международная ассоциация академий создала Делегацию по принятию международного вспомогательного языка «при поддержке 310 организаций-членов». [20] Делегации было поручено найти вспомогательный язык, который мог бы использоваться для «научных и философских обменов» и не мог быть никаким «национальным языком». [21] В контексте возросшей националистической напряженности любой из доминирующих языков науки казался бы не нейтральным выбором. [22] Следовательно, у Делегации был ограниченный набор вариантов, которые включали маловероятное возрождение классического языка, такого как латынь [23] или новый сконструированный язык, такой как волапюк , идиомно-нейтральный или эсперанто .
На протяжении первой половины 20-го века эсперанто серьезно рассматривался как потенциальный международный язык науки. Еще в 1954 году ЮНЕСКО приняла рекомендацию о содействии использованию эсперанто для научной коммуникации. [24] В отличие от Idiom Neutral, или упрощенной версии латыни, Interlingua , эсперанто изначально не задумывался как научный язык. Тем не менее, к началу 1900-х годов он был, безусловно, самым успешным сконструированным языком с большим международным сообществом, а также многочисленными специализированными публикациями. Начиная с 1904 года, Internacia Science Revuo стремился адаптировать эсперанто к конкретным потребностям научной коммуникации. [25] Разработка специализированного технического словаря была сложной задачей, поскольку обширная система вывода эсперанто усложняла прямой импорт слов, обычно используемых в немецких, французских или английских научных публикациях. [26] В 1907 году Делегация по принятию международного вспомогательного языка, казалось, была близка к сохранению эсперанто в качестве своего предпочтительного языка. Тем не менее, значительная критика все еще была направлена на несколько оставшихся сложностей языка, а также на отсутствие у него научной цели и технического словаря. Неожиданно Делегация поддержала новый вариант эсперанто, Ido , который был представлен очень поздно в процессе неизвестным участником. Хотя он был оформлен как компромисс между эсперантистской и антиэсперантистской фракциями, это решение в конечном итоге разочаровало всех сторонников международного средства для научной коммуникации и надолго навредило принятию искусственных языков в академических кругах. [27]
Две мировые войны оказали длительное влияние на научные языки. Сочетание политических, экономических и социальных факторов надолго ослабило триумвират трех основных языков науки в 19 веке и проложило путь к доминированию английского языка во второй половине 20 века. До сих пор продолжаются дебаты о том, ускорили ли мировые войны структурную тенденцию к преобладанию английского языка или просто создали для этого условия. По мнению Ульриха Аммона, «даже без мировых войн англоязычное сообщество получило бы экономическое и, следовательно, научное превосходство и, таким образом, предпочтение своего языка для международного научного общения». [28] Напротив, Майкл Гордин подчеркивает, что до 1960-х годов привилегированный статус английского языка был далек от устоявшегося.
Первая мировая война оказала немедленное влияние на глобальное использование немецкого языка в академических кругах. [15] В течение почти десятилетия после Первой мировой войны немецкие исследователи подвергались бойкоту на международных научных мероприятиях. Немецкие научные сообщества были скомпрометированы националистической пропагандой в пользу немецкой науки во время войны, а также эксплуатацией научных исследований для военных преступлений. Немецкий язык больше не признавался в качестве мирового научного языка. Хотя бойкот не продлился долго, его последствия были долгосрочными. В 1919 году был создан Международный исследовательский совет, чтобы заменить Международную ассоциацию академий , и в качестве рабочих языков использовались только французский и английский языки . [29] В 1932 году почти все (98,5%) международные научные конференции допускали доклады на французском языке, 83,5% на английском и только 60% на немецком. [30] Параллельно с этим фокус немецких периодических изданий и конференций становился все более локальным и все реже включал исследования из негерманских стран. [30] Немецкий язык так и не восстановил свой привилегированный статус ведущего языка науки в Соединенных Штатах, и из-за отсутствия альтернатив, помимо французского, американское образование стало «все более моноглотским» и изоляционистским. [31] Не затронутое международным бойкотом, использование французского языка достигло «плато между 1920-ми и 1940-ми годами»: хотя оно и не снижалось, оно также не выигрывало от маргинализации немецкого языка, а вместо этого уменьшалось по сравнению с экспансией английского. [15]
Рост тоталитаризма в 1930-х годах укрепил статус английского языка как ведущего научного языка. В абсолютном выражении немецкие публикации сохранили некоторую актуальность, но немецкие научные исследования были структурно ослаблены антисемитскими и политическими чистками, отказом от международного сотрудничества и эмиграцией. [32] Немецкий язык больше не бойкотировался на международных научных конференциях после Второй мировой войны, поскольку его использование быстро стало маргинальным, даже в самой Германии: даже после окончания оккупированной зоны английский на Западе и русский на Востоке стали основными языками общения для высшего образования. [33]
В течение двух десятилетий после Второй мировой войны английский язык стал ведущим языком науки. Однако большая часть глобальных исследований продолжала публиковаться на других языках, и языковое разнообразие даже, казалось, увеличивалось до 1960-х годов. Русские публикации во многих областях, особенно химии и астрономии, быстро росли после войны: «в 1948 году более 33% всех технических данных, опубликованных на иностранном языке, теперь появлялись на русском языке». [34] В 1962 году Кристофер Уортон Хансон все еще высказывал сомнения относительно будущего английского языка как ведущего языка в науке, поскольку русский и японский языки становились основными языками науки, а новые деколонизированные государства, по-видимому, были настроены отдать предпочтение местным языкам:
Кажется разумным предположить, что в долгосрочной перспективе количество значительных вкладов в научные знания разных стран будет примерно пропорционально численности их населения, и что за исключением случаев, когда население очень мало, вклады, как правило, будут публиковаться на родных языках. [35]
Расширение российских научных публикаций стало источником повторяющейся напряженности в Соединенных Штатах в течение десятилетия холодной войны. Очень немногие американские исследователи могли читать по-русски, что контрастировало с все еще широко распространенным знанием двух старейших языков науки, французского и немецкого: «В опросе 1958 года 49% американских научных и технических кадров утверждали, что могут читать по крайней мере на одном иностранном языке, но только 1,2% могли общаться на русском языке». [24] У администраторов и спонсоров науки были повторяющиеся опасения, что они не смогут эффективно отслеживать прогресс академических исследований в СССР. Эта постоянная тревога переросла в открытый кризис после успешного запуска спутника в 1958 году, поскольку децентрализованная американская исследовательская система, казалось, на какое-то время отставала от эффективности советского планирования.
Хотя кризис со спутником длился недолго, он имел далеко идущие последствия для лингвистических практик в науке: в частности, для развития машинного перевода . Исследования в этой области появились очень рано [ необходимо разъяснение ] : автоматизированный перевод появился как естественное продолжение первоначальной цели первых компьютеров: взлома кодов. [36] Несмотря на первоначальное нежелание ведущих деятелей в области вычислительной техники, таких как Норберт Винер, несколько хорошо связанных научных администраторов в США, таких как Уоррен Уивер и Леон Достерт , организовали серию крупных конференций и экспериментов в зарождающейся области, исходя из опасений, что «перевод был жизненно важен для национальной безопасности». [36] 7 января 1954 года Достерт координировал эксперимент Джорджтауна и IBM , целью которого было продемонстрировать, что метод был достаточно зрелым, несмотря на существенные недостатки вычислительной инфраструктуры того времени: некоторые предложения из русских научных статей были автоматически переведены с использованием словаря из 250 слов и шести основных правил синтаксиса. [37] В то время не было ясно, что предложения были намеренно выбраны для их пригодности для автоматизированного перевода. В лучшем случае Достерт утверждал, что «научный русский» было легче переводить, поскольку он был более шаблонным и менее грамматически разнообразным, чем повседневный русский.
Машинный перевод стал основным приоритетом в федеральном финансировании исследований в 1956 году из-за начинающейся гонки вооружений с советскими исследователями. Хотя эксперимент Джорджтауна и IBM поначалу не имел большого влияния в Соединенных Штатах, он был немедленно замечен в СССР. Первые статьи в этой области появились в 1955 году; и всего год спустя была проведена крупная конференция, привлекшая 340 представителей. [38] В 1956 году Леон Достерт получил большое финансирование при поддержке ЦРУ и имел достаточно ресурсов, чтобы преодолеть технические ограничения существующей вычислительной инфраструктуры: в 1957 году автоматизированный перевод с русского на английский мог работать на значительно расширенном словаре из 24 000 слов и полагаться на сотни предопределенных правил синтаксиса. [39] В этом масштабе автоматизированный перевод оставался дорогостоящим, поскольку он полагался на многочисленных операторов компьютеров, использующих тысячи перфокарт. [39] Однако качество вывода существенно не улучшилось: в 1964 году автоматизированный перевод нескольких предложений, представленных в ходе эксперимента Джорджтауна и IBM, дал гораздо менее читаемый вывод, поскольку больше не было возможности настраивать правила в предопределенном корпусе. [40]
В 1960-х и 1970-х годах английский язык уже не был языком большинства в науке, а был научным lingua franca . Трансформация имела более масштабные последствия, чем замена двух или трех основных языков науки одним языком: она ознаменовала «переход от триумвирата, который ценил, по крайней мере, в ограниченной степени, выражение идентичности в науке, к подавляющему акценту на коммуникации и, таким образом, к единому языку-носителю». [40] Ульрих Аммон характеризует английский как «асимметричный lingua franca», поскольку он является «родным языком и национальным языком наиболее влиятельной части мирового научного сообщества, но иностранным языком для остального мира». [41] Эту парадигму обычно связывают с глобализацией американской и англоязычной культуры во второй половине 20-го века. [41]
Никакое конкретное событие не объясняет весь этот сдвиг, хотя многочисленные преобразования подчеркивают ускоренный переход к английской науке во второй половине 1960-х годов. 11 июня 1965 года президент Линдон Б. Джонсон постановил, что английский язык стал lingua franca , который открыл «двери к научным и техническим знаниям» и чье продвижение должно быть «главной политикой» Соединенных Штатов. [42] В 1969 году исчезла самая престижная коллекция рефератов по химии начала 20-го века, немецкий Chemisches Zentralblatt : эта полиглотная компиляция на 36 языках больше не могла конкурировать с англоязычным Chemical abstract , поскольку более 65% публикаций в этой области были на английском языке. [43] К 1982 году Compte-rendu Академии наук признал, что «английский язык в настоящее время является международным стандартным языком науки и может стать практически ее уникальным языком» и уже является основным «средством общения» в европейских странах с давней традицией публикации на местном языке, таких как Германия и Италия. [44] В Европейском союзе Болонская декларация 1999 года «обязала университеты по всей Европе и за ее пределами привести свои системы в соответствие с системами Соединенного Королевства» и создала сильные стимулы для публикации академических результатов на английском языке. [45] С 1999 по 2014 год количество англоязычных курсов в европейских университетах увеличилось в десять раз. [46]
Машинный перевод, который процветал с 1954 года благодаря советско-американской конкуренции, был немедленно затронут новой парадигмой. В 1964 году Национальный научный фонд подчеркнул, что «в области перевода нет чрезвычайной ситуации» и что переводчики легко справляются с задачей сделать иностранные исследования доступными. [40] Финансирование прекратилось одновременно в Соединенных Штатах и Советском Союзе, и машинный перевод не оправился от этой исследовательской «зимы» до 1980-х годов, и к тому времени перевод научных публикаций уже не был основным стимулом. Исследования в этой области все еще продолжались в нескольких странах, где двуязычие было важным политическим и культурным вопросом: в Канаде была успешно создана система METEO для «перевода прогнозов погоды с английского на французский». [47]
Английский контент постепенно стал преобладать в изначально неанглоязычных журналах, сначала как дополнительный язык, а затем как язык по умолчанию. В 1998 году семь ведущих европейских журналов, издававшихся на своих местных языках ( Acta Physica Hungarica , Anales de Física , Il Nuovo Cimento , Journal de Physique , Portugaliae Physica и Zeitschrift für Physik ), объединились и стали European Physical Journal — международным журналом, принимающим только англоязычные статьи. Тот же процесс неоднократно происходил в менее престижных изданиях:
Эта модель стала настолько обыденной, что стала почти клише: сначала периодическое издание публикуется только на определенном этническом языке (французском, немецком, итальянском); затем оно разрешает публикацию на этом языке, а также на иностранном языке, всегда включая английский, но иногда и другие; наконец, журнал исключает все другие языки, кроме английского, и становится чисто англоязычным. [48]
Ранние научные инфраструктуры были ведущим фактором в переходе на единый транспортный язык. Критические разработки в прикладных научных вычислениях и системах поиска информации произошли в Соединенных Штатах после 1960-х годов. [49] Кризис спутника был главным стимулом, поскольку он «превратил проблему библиографического контроля библиотекарей в национальный информационный кризис». [50] и благоприятствовал амбициозным исследовательским планам, таким как SCITEL (в конечном итоге провалившееся предложение создать централизованно планируемую систему электронных публикаций в начале 1960-х годов), MEDLINE (для медицинских журналов) или NASA/RECON (для астрономии и инженерии). В отличие от упадка машинного перевода , научная инфраструктура и базы данных стали прибыльным бизнесом в 1970-х годах. Еще до появления глобальной сети, такой как World Wide Web , «в 1986 году было подсчитано, что целых 85% информации, доступной во всемирных сетях, уже были на английском языке». [51]
Преобладающее использование английского языка не ограничивалось архитектурой сетей и инфраструктур, но также влияло на содержание. Индекс научного цитирования, созданный Юджином Гарфилдом на руинах SCITEL, оказал огромное и длительное влияние на структуру глобальных научных публикаций в последние десятилетия 20-го века, поскольку его важнейшая метрика; Журнальный импакт-фактор, «в конечном итоге стал метрическим инструментом, необходимым для структурирования конкурентного рынка среди журналов». [52] Индекс научного цитирования имел лучший охват англоязычных журналов, что дало им более сильный Журнальный импакт-фактор и создало стимулы для публикации на английском языке: «Публикация на английском языке создала самые низкие барьеры для того, чтобы сделать работу «обнаружимой» для исследователей». [53] Из-за удобства работы с одноязычным корпусом Юджин Гарфилд призвал признать английский язык единственным международным языком для науки:
Поскольку Current Contents имеет международную аудиторию, можно сказать, что идеальное издание было бы многоязычным, перечисляющим все заголовки на пяти языках — один или несколько из которых читают большинство наших подписчиков, включая немецкий, французский, русский и японский, а также английский. Это, конечно, непрактично, так как это увеличило бы размер Current Contents в четыре раза (…) единственное разумное решение — опубликовать столько страниц содержания на английском языке, сколько это экономически и технически осуществимо. Для этого нам необходимо сотрудничество издателей и авторов. [54]
Почти все научные публикации, индексируемые в ведущих коммерческих академических поисковых системах, находятся на английском языке. В 2022 году это касается 95,86% из 28 142 849 ссылок, индексированных в Web of Science , и 84,35% из 20 600 733 ссылок, индексированных в Scopus . [55]
Отсутствие охвата неанглийских языков создает обратную связь , поскольку неанглийские публикации могут считаться менее ценными, поскольку они не индексируются в международных рейтингах и плохо справляются с оценочными показателями. Около 75 000 статей, названий книг и рецензий на книги из Германии были исключены из Biological abstracts с 1970 по 1996 год. [56] В 2009 году по меньшей мере 6555 журналов были опубликованы на испанском и португальском языках в мировом масштабе, и «лишь небольшая часть включена в индексы Scopus и Web of Science». [57]
Критерии включения в коммерческие базы данных не только благоприятствуют английским журналам, но и стимулируют неанглийские журналы отказываться от своих местных журналов. Они «требуют, чтобы статьи были на английском языке, имели аннотации на английском языке или, по крайней мере, имели ссылки на английском языке». [58] В 2012 году Web of Science был явно привержен англицизации (и романизации) опубликованных знаний:
Английский язык является универсальным языком науки. По этой причине Thomson Reuters фокусируется на журналах, которые публикуют полный текст на английском языке или, по крайней мере, библиографическую информацию на английском языке. В Web of Science представлено множество журналов, которые публикуют статьи с библиографической информацией на английском языке и полным текстом на другом языке. Однако в дальнейшем становится ясно, что журналы, наиболее важные для международного исследовательского сообщества, будут публиковать полный текст на английском языке. Это особенно актуально для естественных наук. Из этого правила есть заметные исключения в разделах «Искусства и гуманитарные науки» и «Социальные науки». [59]
Эта приверженность английской науке имеет значительный перформативный эффект. Коммерческие базы данных «теперь играют на международной арене значительную роль и работают в пользу английского языка», поскольку они предоставляют широкий спектр показателей качества исследований. [57] Они способствовали «масштабному неравенству, особенно между северными и южными странами». [60] Хотя ведущие научные издательства изначально «не смогли понять значение электронных публикаций», [61] они успешно перешли к «бизнесу аналитики данных» к 2010-м годам. Такие игроки, как Elsevier или Springer, все больше способны контролировать «все аспекты жизненного цикла исследования, от подачи до публикации и далее» [62] Благодаря этой вертикальной интеграции коммерческие показатели больше не ограничиваются метаданными журнальных статей, а могут включать широкий спектр индивидуальных и социальных данных, полученных среди научных сообществ.
Национальные базы данных научных публикаций показывают, что использование английского языка продолжало расширяться в 2000-х и 2010-х годах за счет местного языка. Сравнение семи национальных баз данных в Европе с 2011 по 2014 год показывает, что «во всех странах наблюдался рост доли английских публикаций». [63] Во Франции данные Open Science Barometer показывают, что доля публикаций на французском языке сократилась с 23% в 2013 году до 12-16% к 2019–2020 годам. [64]
Для Ульриха Аммона преобладание английского языка создало иерархию и «центрально-периферийное измерение» в глобальном ландшафте научных публикаций, что негативно влияет на восприятие исследований, опубликованных на языках, отличных от английского. [65] Уникальное использование английского языка оказывает дискриминационное воздействие на ученых, которые недостаточно владеют языком: в опросе, организованном в Германии в 1991 году, 30% исследователей во всех дисциплинах отказывались от публикации, когда английский был единственным вариантом. [66] В этом контексте появление новых научных сил больше не связано с появлением новой языковой науки, как это было до 1960-х годов. Китай быстро стал крупным игроком в международных исследованиях, заняв второе место после США в многочисленных рейтингах и дисциплинах. [67] Тем не менее, большая часть этих исследований является англоязычной и соответствует языковым нормам, установленным коммерческими индексами.
Доминирующее положение английского языка также укрепилось за счет «лексического дефицита», накопленного за последние десятилетия альтернативным языком науки: после 1960-х годов «новые термины создавались в английском языке гораздо быстрее, чем во французском». [68]
Несколько языков сохранили вторичный статус международного языка науки, либо из-за масштабов локального научного производства, либо из-за их постоянного использования в качестве языка-носителя в определенных контекстах. Это включает в себя, как правило, «китайский, французский, немецкий, итальянский, японский, русский и испанский». [65] Местные языки остаются распространенными в основных научных странах: «большинство научных публикаций по-прежнему публикуются на китайском языке в Китае». [69]
Эмпирические исследования использования языков в научных публикациях долгое время ограничивались структурной предвзятостью в наиболее доступных источниках: коммерческих базах данных, таких как Web of Science . [70] Беспрецедентный доступ к более крупным корпусам, не охваченным глобальным индексом, показал, что многоязычие остается существенным, хотя оно остается малоизученным: к 2022 году существует «несколько примеров масштабного анализа» многоязычия в науке. [71] В семи европейских странах с ограниченным международным охватом местного языка треть исследователей в области социальных и гуманитарных наук публикуется на двух разных языках или более: «исследования являются международными, но многоязычные публикации поддерживают локально релевантные исследования с дополнительным потенциалом для создания влияния». [72] Из-за несоответствия между реальной практикой и ее видимостью многоязычие было описано как «скрытая норма академической публикации». [73]
В целом, социальные и гуманитарные науки сохранили более разнообразные языковые практики: «в то время как естественники любого лингвистического происхождения в значительной степени перешли на английский язык в качестве языка своих публикаций, социальные ученые и ученые гуманитарных наук не сделали этого в той же степени». [74] В этих дисциплинах потребность в глобальной коммуникации уравновешивается причастностью к местной культуре: «SSH, как правило, сотрудничают с культурой и обществом, влияют на них и совершенствуют их. Чтобы достичь этого, их научные публикации частично публикуются на родных языках». [75] Тем не менее, специфика социальных и гуманитарных наук значительно сократилась после 2000 года: к 2010-м годам большая часть немецких и французских статей по искусству и гуманитарным наукам, проиндексированных в Web of Science, были на английском языке. [76] Хотя немецкий язык был оттеснен английским даже в германоязычных странах после Второй мировой войны, он также продолжал использоваться в качестве научного языка-носителя в определенных дисциплинах или областях исследований ( Nischenfächer или «узкие дисциплины»). [77] Языковое разнообразие не является специфичным для социальных наук, но эта устойчивость может быть скрыта высоким престижем, связанным с международными коммерческими базами данных: в науках о Земле «доля англоязычных документов в региональных или национальных базах данных (KCI, RSCI, SciELO) составляла приблизительно 26%, тогда как практически все документы (приблизительно 98%) в Scopus и WoS были на английском языке». [78]
Помимо общего различия между социальными и естественными науками, существует более тонкое распределение языковых практик. В 2018 году библиометрический анализ публикаций восьми европейских стран в области социальных и гуманитарных наук (SSH) выявил, что «закономерности в языке и типе публикаций SSH связаны не только с нормами, культурой и ожиданиями каждой дисциплины SSH, но и с конкретным культурным и историческим наследием каждой страны». [79] Использование английского языка было более распространено в Северной Европе, чем в Восточной Европе, а публикации на местных языках остаются особенно значимыми в Польше из-за большого «местного» рынка академической продукции». [80] Местная исследовательская политика может оказать значительное влияние, поскольку предпочтение международной коммерческой базе данных, такой как Scopus или Web of Science, может объяснить более резкое снижение публикаций на местном языке в Чешской Республике по сравнению с Польшей. [81] Дополнительные факторы включают распределение экономической модели в журналах: некоммерческие публикации имеют гораздо более сильное «языковое разнообразие», чем коммерческие публикации. [82]
С 2000-х годов расширение цифровых коллекций способствовало относительному увеличению языкового разнообразия академических индексов и поисковых систем. [70] Web of Science расширил свое региональное покрытие в период 2005-2010 годов, что привело к «увеличению количества статей на неанглоязычных языках, таких как статьи на испанском языке». [83] В португальских исследовательских сообществах в период 2007-2018 годов наблюдался резкий рост статей на португальском языке в коммерческих индексах, что свидетельствует как о сохраняющихся «пространствах устойчивости и оспаривания некоторых гегемонистских практик», так и о потенциальной новой парадигме научных публикаций, «направленной на многоязычное разнообразие». [84] Многоязычие как практика и компетенция также возросло: в 2022 году 65% начинающих исследователей в Польше опубликовали работы на двух или более языках, тогда как среди представителей старшего поколения это сделали только 54%. [85]
В 2022 году Бьянка Крамер и Кэмерон Нейлон провели масштабный анализ метаданных, доступных для 122 миллионов объектов Crossref, проиндексированных по DOI. [71] В целом, публикации на языках, отличных от английского, составляют «менее 20%», хотя их можно недооценить из-за более низкого уровня принятия DOI или использования локальных DOI (например, Китайской национальной инфраструктуры знаний). [71] Тем не менее, многоязычие, похоже, улучшилось за последние 20 лет, при значительном росте публикаций на португальском, испанском и индонезийском языках. [71]
Научная публикация стала первым крупным случаем использования машинного перевода , ранние эксперименты начались еще в 1954 году. Развитие в этой области замедлилось после 1965 года из-за растущего доминирования английского языка, ограничений вычислительной инфраструктуры и недостатков ведущего подхода — машинного перевода на основе правил. Методы на основе правил, предпочитаемые при проектировании переводов между несколькими основными языками (английский, русский, французский, немецкий...), поскольку «модуль переноса» должен был быть разработан для «каждой пары языков», что быстро приводило к комбинаторным взрывам всякий раз, когда рассматривалось больше языков. [86] После 1980-х годов область машинного перевода возродилась, поскольку она претерпела «полномасштабный сдвиг парадигмы»: явные правила были заменены статистическими и методами машинного обучения, применяемыми к большому выровненному корпусу. [87] [86] К тому времени большая часть спроса исходила уже не от научных публикаций, а от коммерческих переводов, таких как технические и инженерные руководства. [88] Второй сдвиг парадигмы произошел в 2010-х годах с развитием методов глубокого обучения , которые можно частично обучать на невыровненных корпусах («перевод с нуля»). Требуя небольшого надзора, модели глубокого обучения позволяют включать более широкое разнообразие языков, а также более широкое разнообразие лингвистических контекстов в пределах одного языка. [89] Результаты значительно точнее: после 2018 года автоматизированный перевод рефератов PubMed был признан лучше человеческого перевода для нескольких языков (например, с английского на португальский). [90] Научные публикации являются довольно подходящим вариантом использования для модели перевода на основе нейронной сети, поскольку они лучше всего работают «в ограниченных областях, для которых у них много обучающих данных». [91]
В 2021 году было «мало углубленных исследований эффективности машинного перевода в социальных и гуманитарных науках», поскольку «большинство исследований в области переводоведения сосредоточены на технических, коммерческих или юридических текстах». [92] Использование машинного перевода особенно трудно оценить и установить, поскольку такие свободно доступные инструменты, как Google Translate, стали повсеместными: «Существует возникающая, но быстро растущая потребность в грамотности машинного перевода среди членов научно-исследовательских и академических коммуникационных сообществ. Однако, несмотря на это, существует очень мало ресурсов, которые могли бы помочь членам этих сообществ приобретать и обучать этому типу грамотности». [93]
В академической среде машинный перевод охватывает множество применений. Производство письменных переводов по-прежнему ограничено отсутствием точности и, следовательно, эффективности, поскольку постредактирование несовершенного перевода должно занимать меньше времени, чем человеческий перевод. [94] Автоматизированный перевод иноязычного текста в контексте обзора литературы или «усвоения информации» более распространен, поскольку требования к качеству, как правило, ниже, а глобальное понимание текста является достаточным. [95] Влияние машинного перевода на языковое разнообразие в науке зависит от следующих применений:
Если машинный перевод в целях ассимиляции в принципе позволяет исследователям публиковать свои работы на родном языке и при этом охватывать широкую аудиторию, то машинный перевод в целях распространения может рассматриваться как нечто противоположное и поддерживающее использование общего языка для исследовательских публикаций. [96]
Более широкое использование машинного перевода создало проблемы «единообразного многоязычия». Исследования в этой области в основном были сосредоточены на английском и нескольких основных европейских языках: «Хотя мы живем в многоязычном мире, это парадоксальным образом не принимается во внимание машинным переводом». [97] Английский часто использовался в качестве «основного» языка и служил скрытым промежуточным состоянием для перевода двух неанглийских языков. [98] Вероятностные методы, как правило, отдают предпочтение наиболее ожидаемому возможному переводу из обучающего корпуса и исключают более необычные альтернативы: «Обычный аргумент против статистических методов в переводе заключается в том, что когда алгоритм предлагает наиболее вероятный перевод, он исключает альтернативные варианты и заставляет язык текста, полученного таким образом, соответствовать хорошо документированным способам выражения». [99] Хотя модели глубокого обучения способны справляться с более широким разнообразием языковых конструкций, они все еще могут быть ограничены предвзятостью сбора исходного корпуса: «на перевод слова могут влиять преобладающие теории или парадигмы в корпусе, собранном для обучения ИИ». [92]
В своей исследовательской оценке открытой науки за 2022 год Совет Европейского союза приветствовал «многообещающие разработки, которые недавно появились в области автоматического перевода» и поддержал более широкое использование «полуавтоматического перевода научных публикаций в Европе» из-за его «большого потенциала с точки зрения создания рынка» [4] .
Развитие инфраструктуры открытой науки или «инфраструктуры, контролируемой сообществом» стало основным вопросом политики движения за открытую науку. В 2010-х годах расширение коммерческой научной инфраструктуры привело к широкому признанию хрупкости открытых научных публикаций и открытых архивов. [100] Концепция инфраструктуры открытой науки появилась в 2015 году с публикацией Принципов открытых научных инфраструктур . В ноябре 2021 года Рекомендация ЮНЕСКО признала инфраструктуру открытой науки одним из четырех столпов открытой науки, наряду с открытыми научными знаниями, открытым взаимодействием общественных субъектов и открытым диалогом с другими системами знаний, и призвала к устойчивым инвестициям и финансированию: «инфраструктуры открытой науки часто являются результатом усилий по созданию сообщества, которые имеют решающее значение для их долгосрочной устойчивости, и поэтому должны быть некоммерческими и гарантировать постоянный и неограниченный доступ для всей общественности в максимально возможной степени». [3] Примерами инфраструктуры открытой науки являются индексы, издательские платформы, общие базы данных или компьютерные сети.
Открытые инфраструктуры поддерживают языковое разнообразие в науке. Ведущее бесплатное программное обеспечение для научных публикаций, Open Journal Systems , доступно на 50 языках [101] и широко распространено среди некоммерческих журналов с открытым доступом. [102] Ландшафтное исследование SPARC в 2021 году показывает, что европейские открытые научные инфраструктуры «обеспечивают доступ к целому ряду языкового контента местного и международного значения». [103] В 2019 году ведущие открытые научные инфраструктуры одобрили Хельсинкскую инициативу по многоязычию в научной коммуникации и, таким образом, взяли на себя обязательство «защищать национальные инфраструктуры для публикации локально значимых исследований». [2] Среди подписавших — DOAJ , DARIAH, LATINDEX , OpenEdition , OPERAS или SPARC Europe . [104]
В отличие от коммерческого индекса, Directory of Open Access Journals не предписывает использование английского языка. Следовательно, только половина индексируемых журналов в основном публикуются на английском языке, что резко контрастирует с большой распространенностью английского языка в коммерческих индексах, таких как Web of Science (> 95%). Шесть языков представлены более чем 500 журналами: испанский (2776 журналов, или 19,3%), португальский (1917 журналов), индонезийский (1329 журналов), французский (993 журнала), русский (733 журнала) и итальянский (529 журналов). [105] Большая часть языкового разнообразия обусловлена некоммерческими журналами (или diamond open access ): 25,7% этих изданий принимают статьи на испанском языке по сравнению с всего 2,4% журналов на основе APC. [105] В период 2020-2022 гг. «для английских статей в журналах DOAJ 21% приходится на журналы, не входящие в APC, но для статей на языках, отличных от английского, этот процент составляет огромные 86%». [71]
Неанглийские открытые инфраструктуры испытали значительный рост: в 2022 году «национальные репозитории и базы данных растут повсюду (см. базы данных, такие как Latindex в Латинской Америке, или новые репозитории в Азии, Китае, России, Индии)». [106] Это развитие открывает новые исследовательские возможности для изучения многоязычия в научном контексте: станет все более осуществимым изучение «различий между локально опубликованными исследованиями в неанглоязычных контекстах и англоязычными международными авторами». [106]
Публикация на платформах открытого доступа создала новые стимулы для публикации на местном языке. В коммерческих индексах неанглийские публикации были наказаны отсутствием международного приема и имели значительно более низкий импакт-фактор. [107] Без платного доступа местные языковые публикации могут найти свою собственную конкретную аудиторию среди большой неакадемической публики, которая может быть менее компетентной в английском языке.
В 2010-х годах количественные исследования начали подчеркивать положительное влияние местных языков на повторное использование ресурсов открытого доступа в различных национальных контекстах, таких как Финляндия , [108] Квебек , [109] Хорватия [110] или Мексика . Исследование финской платформы Journal.fi показывает, что аудитория статей на финском языке значительно более разнообразна: «в случае публикаций на национальном языке студенты (42%), несомненно, являются самой большой группой, а помимо исследователей (25%), также частные лица (12%) и другие эксперты (11%)». [108] Для сравнения, публикации на английском языке привлекают в основном профессиональных исследователей. Благодаря простоте доступа открытые научные платформы на местном языке также могут достичь более глобального охвата. Франко-канадский журнальный консорциум Érudit имеет в основном международную аудиторию, при этом менее трети читателей приезжают из Канады . [111]
Развитие мощной сети открытых научных инфраструктур в Южной Америке (например, Scielo или Redalyc ) и Пиренейском регионе привело к возрождению испанского и португальского языков в международной научной коммуникации: региональный рост «также может быть связан с бумом публикаций открытого доступа». И португальский, и испанский (а также Бразилия и Испания) играют важную роль в публикациях открытого доступа. [83]
Хотя в коммерческих базах данных многоязычие либо игнорировалось, либо даже дискриминировалось, оно ценилось как важный компонент социального воздействия открытых научных платформ и инфраструктуры. В 2015 году Хуан Пабло Альперин представил систематическую меру социального воздействия, которая подчеркнула актуальность научного контента для местных сообществ: «Я утверждаю, что, рассматривая широкий спектр показателей воздействия и охвата, выходящих далеко за рамки типичных показателей одной статьи, цитирующей другую, можно получить представление о людях, которые используют латиноамериканские исследования, тем самым открывая другим возможность увидеть, каким образом они затронули этих людей и сообщества». [112] В этом контексте новые показатели языкового разнообразия. Предложения включают индекс PLOTE [113] и индекс языкового разнообразия. [114] Тем не менее, по состоянию на 2022 год они имели «ограниченную поддержку в научной англоязычной литературе». [71] Комплексные показатели местного воздействия исследований по-прежнему в значительной степени отсутствуют: «многие аспекты исследований не могут быть измерены количественно, особенно их социокультурное воздействие». [115]
Новые научные и политические дебаты по поводу языкового разнообразия возникли после 2015 года: [116] «в последние годы политика ответственных исследований и инноваций (RRI) и открытой науки призывает к расширению доступа к исследованиям, взаимодействию между наукой и обществом и общественному пониманию науки». [117] Первоначально это вытекало из более широкого обсуждения оценки открытой науки и ограничений коммерческих показателей: в 2015 году Лейденский манифест опубликовал десять принципов для «руководства оценкой исследований», которые включали призыв «защищать совершенство в локально релевантных исследованиях». [118] Опираясь на эмпирические данные, показывающие устойчивость неанглоязычных исследовательских сообществ в Европе, Гуннар Сивертсен в 2018 году выдвинул теорию о необходимости сбалансированного многоязычия : «рассматривать все цели коммуникации во всех различных областях исследований и все языки, необходимые для достижения этих целей, целостным образом без исключений или приоритетов». [75] В 2016 году Сивертсен внес вклад в «норвежскую модель» научной оценки, предложив плоскую иерархию между несколькими крупными международными журналами и широким выбором журналов, которые не будут дискриминировать местные публикации, и призвал журналы по социальным и гуманитарным наукам отдавать предпочтение норвежским публикациям. [75]
Эти местные инициативы переросли в новое международное движение в пользу многоязычия. В 2019 году 120 исследовательских организаций и несколько сотен отдельных исследователей совместно подписали Хельсинкскую инициативу по многоязычию в научной коммуникации . Декларация включает три принципа:
Вслед за Хельсинкской инициативой многоязычие все больше ассоциируется с открытой наукой. Эта тенденция ускорилась в контексте пандемии COVID, которая «увидела широкую потребность в многоязычной научной коммуникации, не только между исследователями, но и для того, чтобы исследования могли достигать лиц, принимающих решения, профессионалов и граждан». [119] Многоязычие также вновь стало темой для дискуссий за пределами социальных наук: в 2022 году журнал Journal of Science Policy and Governance опубликовал «Призыв к диверсификации Lingua Franca академических сообществ STEM», в котором подчеркивалось, что «необходимы межкультурные решения, чтобы предотвратить пропуск важной информации англоговорящими исследователями». [120]
В ноябре 2021 года Рекомендация ЮНЕСКО по открытой науке включила многоязычие в основу своего определения открытой науки: «Для целей настоящей Рекомендации открытая наука определяется как инклюзивная конструкция, объединяющая различные движения и практики, направленные на то, чтобы сделать многоязычные научные знания общедоступными, доступными и пригодными для повторного использования для всех». [3]
В начале 2020-х годов Европейский союз начал официально поддерживать языковое разнообразие в науке как продолжение своей общей политики в пользу многоязычия. В декабре 2021 года важный доклад Европейской комиссии о будущем научной оценки в европейских странах по-прежнему упускал из виду проблему языкового разнообразия: «Многоязычие является наиболее заметным упущением». [119] В июне 2022 года Совет Европейского союза включил подробную рекомендацию о «Развитии многоязычия для европейских научных публикаций» в свою исследовательскую оценку открытой науки. Декларация признает «важную роль многоязычия в контексте научной коммуникации с обществом» и приветствует «инициативы по продвижению многоязычия, такие как Хельсинкская инициатива по многоязычию в научной коммуникации». [4] Хотя декларация не является ограничительной, она приглашает экспериментировать с многоязычием «на добровольной основе» и оценить потребности в дальнейших действиях к концу 2023 года. [121]