Спецпроекты

Искусственный интеллект Abbyy помог оцифровать историю Большого театра

ИТ в госсекторе

Большой театр и компания Abbyy (при участии КАМИС) завершили масштабный волонтерский проект «Открой историю Большого». В практике российских музыкальных театров и музеев проект такого масштаба реализован впервые. Искусственный интеллект Abbyy и более 7,8 тыс. волонтеров помогли оцифровать, извлечь и систематизировать информацию из 48 тыс. афиш, 120 тыс. программок и 100 тыс. фотографий коллекции музея Большого театра. Ценные данные уже загружены в электронную базу музея Большого театра, разработанную компанией КАМИС. Сотрудникам музея предстоит проанализировать весь массив данных и опубликовать на сайте электронного архива театра, чтобы уникальная информация стала доступна каждому.

Целью проекта «Открой историю Большого» было оцифровать и упорядочить информацию из коллекции бумажных программок и фотографий для электронной базы данных театра. Сначала все исторические документы были отсканированы и распознаны программой Abbyy Finereader. Затем интеллектуальные технологии Abbyy извлекли из документов данные: названия спектаклей, имена артистов, дирижеров и пр.

Своим успехом проект обязан волонтерам. «Открой историю Большого» объединил неравнодушных людей из более 60 стран мира: США, Австралии, Бразилии, Индии, Китая, многих стран Европы и, конечно, России. Именно они тщательно проверяли и дополняли информацию на каждом этапе проекта, чтобы исключить возможные ошибки и максимально приблизить электронные версии документов к оригиналу. Также волонтерам был полностью отдан третий этап проекта – рубрикация исторических фотографий. Участники внесли в электронную базу рукописные тексты, написанные на оборотах изображений. Благодаря усилиям волонтеров люди со всего мира смогут увидеть самые яркие моменты выступлений Майи Плисецкой, Галины Улановой, Федора Шаляпина и еще более 5 тыс. артистов театра.

В заключительной части проекта специалисты Abbyy систематизировали данные в соответствии с требованиями сотрудников музея. Они настроили автоматический перевод текстов с дореволюционной орфографией на современный русский язык, заполнили пропущенные поля, исправили опечатки, привели цифры и тексты к единому формату. Вся информация из архивов театра о 54 тыс. спектаклей и 75 тыс. персон была загружена в базу данных, разработанную компанией КАМИС. По мере проверки специалистами музея Большого театра, данные публикуются на специально разработанном поисковом разделе театрального сайта.

«Проделана огромная работа, которую едва ли удалось бы осуществить в столь сжатый срок без новейших технологических разработок компании Abbyy и без человеческого фактора – без любви к Большому театру тысяч волонтеров из самых разных стран, – отметил Владимир Урин, генеральный директор Большого театра. – В эти летние дни, когда мир как будто замер, и Большой театр вынуждено не показывает спектакли уже несколько месяцев, мне особенно приятно поблагодарить наших партнеров – компанию Abbyy и наших верных зрителей, потративших три года на то, чтобы осуществить уникальный проект по оцифровке архивов Большого театра. Тысячи фотографий, афиш, ежедневных программ наших спектаклей в самое ближайшее время станут доступными не только специалистам, историкам театра, которые приходят работать в музей».

«Abbyy создает технологии искусственного интеллекта, которые помогают превращать разрозненные данные в полезную информацию. Мы особенно ценим проекты, в которых компания не только решает повседневные задачи людей, но и помогает расширять кругозор, сохранять культуру и историю страны, получать вдохновение и новые идеи для работы и жизни. Проектов, подобных "Открой историю Большого", в мире пока немного. Но я уверен, что с развитием технологий обработки естественного языка мы сможем решать все более сложные и масштабные задачи в разных странах мира», – сказал Дмитрий Шушкин, генеральный директор компании «Abbyy Россия».

«Команда Abbyy и волонтеров проделала огромную и очень важную работу. Были отсканированы несколько тысяч программ спектаклей Большого театра с 1901 г., а затем обработаны таким образом, что в настоящий момент мы можем среди тысяч образов найти нужную программку любого спектакля и концерта, проходящих на нашей сцене, посмотреть, когда и с какими партнерами выступал тот или иной артист, какие дирижеры, режиссеры, художники участвовали в постановке спектаклей. Кроме программок были обработаны и несколько тысяч афиш спектаклей, отсканированных ранее, причем временной промежуток здесь был еще больше: с 1858 г., – сказала Лидия Харина, директор музея Большого театра. – Это огромный и очень интересный архив, который теперь доступен в электронном виде. В настоящий момент им активно пользуются все сотрудники музея и Большого театра, а также исследователи, приходящие к нам работать. Мы надеемся, что вскоре он будет доступен и широкой аудитории, сотрудники музея проверяют весь массив внесенной информации, систематизируют его определенным образом, добавляют иллюстративный материал».

В ходе проекта «Открой историю Большого» волонтеры помогли собрать интересную статистику об истории главного театра страны. Так, в XIX веке на сцене около 450 раз ставили оперу «Жизнь за царя». В ХХ веке почти 60 лет одной из наиболее популярных постановок театра оставалась опера «Евгений Онегин». Майя Плисецкая исполняла роли Одетты и Одиллии в балете «Лебединое озеро» 175 раз, а знаменитый лирический тенор Леонид Собинов пел арию Ленского не менее 86 раз. Были и другие находки, связанные с жизнью театра и его зрителей. Например, участники обнаружили на страницах программок необычные постановки, такие как опера, написанная императрицей Екатериной II, водевиль, переведенный поэтом Николаем Некрасовым, экспериментальные балеты 30-х годов XX века. В программках публиковали не только информацию об артистах, но и рекламу и даже объявления о забытых вещах.