Корпус Ланкастер -Осло/Берген ( LOB ) — это коллекция текстов на британском английском объемом в один миллион слов , которая была составлена в 1970-х годах в сотрудничестве с Университетом Ланкастера , Университетом Осло и Норвежским вычислительным центром гуманитарных наук в Бергене , чтобы стать британским аналогом Корпуса Брауна, составленного Генри Кучерой и У. Нельсоном Фрэнсисом для американского английского в 1960-х годах. [1]
Его состав был разработан таким образом, чтобы максимально точно соответствовать оригинальному корпусу Брауна по размеру и жанрам, используя документы, опубликованные в Великобритании в 1961 году британскими авторами. [2] Оба корпуса состоят из 500 образцов, каждый из которых содержит около 2000 слов в следующих жанрах:
Главными составителями корпуса LOB были Джеффри Лич (Университет Ланкастера) и Стиг Йоханссон (Университет Осло); см. Leech & Johansson (2009) [3] .
Корпус также был размечен , т.е. каждому слову были присвоены категории частей речи . [1]