Lingua Libre — это онлайн-проект и инструмент для совместной работы ассоциации Wikimédia France , целью которого является создание совместного , многоязычного , аудиовизуального речевого корпуса под свободной лицензией . Он в основном состоит из быстрой онлайн-службы записи, которая позволяет пользователю объединять сотни записей. Участники создали контент на более чем 250 языках.
Lingua Libre позволяет записывать слова , фразы или предложения любого языка, устно ( аудиозапись ) или жестами ( видеозапись ).
Слова представляются говорящему в виде списка, созданного на месте, заранее или путем повторного использования существующей категории Wikimedia. Говорящий просто читает слово, отображаемое на экране, а программное обеспечение переходит к следующему слову, когда обнаруживает тишину после прочитанного слова. [1] Этот принцип, заимствованный из программного обеспечения с открытым исходным кодом Shtooka Wikimedia Commons .
recorder с помощью его создателя Николаса Виона, позволяет записывать несколько сотен слов в час. Затем записи автоматически загружаются из веб-клиента в медиатекуВесной 2021 года Lingua Libre был отключен из-за пожара в Страсбурге [2] , но аудиозаписи не были утеряны. [3]
Записи можно просмотреть либо на Lingua Libre, либо на Commons . Они в основном используются в других проектах Wikimedia, например, для иллюстрации записей в Викисловарях или имен собственных в статьях Wikipedia. [1]
Предусмотрено повторное использование записей в контексте обучения языку. Изучающие язык могут свободно загружать произношения и использовать их в GoldenDict, популярном программном обеспечении для словарей. [4] Таким образом, аудиозаписи могут использоваться как «словари произношений» в GoldenDict без необходимости подключения к Интернету.
Записи также повторно используются в проектах обработки естественного языка , например, для управления механизмами распознавания речи DeepSpeech от Mozilla . [5]
Lingua Libre был инициирован 23 января 2015 года [6] и имел три последовательные версии:
В рамках проекта «Языки Франции» , направленного на документирование и продвижение региональных языков Франции в Wikimedia и интернет-проектах в целом, концепция Lingua Libre началась в ноябре 2015 года, частично финансируемая DGLFLF ( Генеральная делегация по французскому языку и языкам Франции ). Первая версия проекта была запущена в августе 2016 года. Lingua Libre, подходящий только для аудиозаписи, был показан во время семинара по окситанскому языку в декабре 2016 года, [7] [8] а затем представлен онлайн-сообществу Wikimedia [9] и на международных мероприятиях в 2017 году.
Полная перестройка была начата в конце 2017 года. Новая версия Lingua Libre основана на MediaWiki , использует Wikibase и OAuth для лучшей интеграции в среду Wikimedia. Интерфейс переведен через Translatewiki.net , чтобы проект мог использоваться большим количеством сообществ. Новая версия сайта была готова в июне 2018 года [10] и открыта для публики в августе 2018 года.
В 2020 году на платформе произошли важные изменения: специально для сайта был разработан новый облик, домен .org заменил использовавшийся до этого домен .fr [11] , а также добавлена поддержка языков жестов посредством видеозаписи.
За первые два года запуска проекта было сделано около 10 000 записей. Переход на v.2 сопровождался резким увеличением вкладов. Количество записей увеличилось в 10 раз менее чем за год, превысив порог в 100 000 в мае 2019 года. Эти записи были сделаны 127 носителями на почти 50 языках. [12] К сентябрю 2020 года на платформе было более 300 000 записей на 90 языках с более чем 350 носителями. Отметка в 500 000 записей была достигнута в июне 2021 года благодаря 540 носителям 120 языков. [13]