В Самаре к 80-летию Победы при участии Content AI запущен цифровой проект «Книга Памяти Самары»
В год 80-летия Победы в Великой Отечественной войне в Самаре при участии Content AI реализован цифровой проект «Книга Памяти городского округа Самара». На сайте собраны поименные списки участников войны, которые вошли в печатные «Книги памяти Самарской области», а также информация о жителях Куйбышева, сведения о которых предоставлена родственниками через опросы учащихся школ. Об этом CNews сообщили представители Content AI.
Для обработки архивных материалов была выбрана ContentCapture, универсальная IDP-платформа от компании Content AI. Решение применяет передовые OCR- и NLP-технологии в интеграции с большими языковыми моделями (LLM) для высокоточного распознавания и извлечения данных из документов разного типа, в том числе слабоструктурированных и неструктурированных.
Проект «Книга Памяти городского округа Самара» реализуется под патронажем департамента опеки и попечительства Администрации городского округа Самара, при участии ГБУ «Дворец ветеранов» и поддержке министерства цифрового развития и связи Самарской области.
«Сегодня цифровизация не только меняет облик нашей страны, но и позволяет нам сохранить память о тех, кто отдал свои жизни за нашу свободу. Современные технологии помогают сохранить ценные материалы (фотографии, документы, воспоминания ветеранов) для будущих поколений, а также сделать их доступными для всех. Благодаря «Книге памяти» каждый сможет не только узнать о подвиге своих предков и прочитать их истории, но и дополнить их новыми фактами и документами», — сказал заместитель председателя правительства – министр цифрового развития и связи Самарской области Виктор Злобич.
«На мой взгляд, очень важно, что в таком формате проект не завершится Днем Победы, а продолжит пополняться, долгие годы будет «живым» и по-настоящему народным. Сейчас собрана информация более чем о 55 тысячах бойцов, ушедших на фронт из Куйбышева и погибших в годы войны. Впереди еще много работы – предстоит опубликовать данные о тех участниках Великой Отечественной войны, которые ушли из жизни уже после Победы, тружеников тыла», – сказал глава города Самара Иван Носков.
«Content AI продолжает поддерживать инициативы, направленные на сохранение исторической памяти, демонстрируя, как современные ИТ-решения служат благородным целям, а новейшие технологии становятся мостом между прошлым и будущим. Мы убеждены, что социальная ответственность бизнеса начинается с сохранения исторической правды, а патриотизм – с уважения к подвигу предков», – сказала генеральный директор Content AI Светлана Дергачева.
В рамках проекта с помощью IDP-платформы ContentCapture оцифрованы десятки тысяч записей из архивных книг. Дополнительно собраны и оцифрованы данные, предоставленные родственниками участников ВОВ. Особое внимание было уделено верификации данных, что позволило минимизировать возможные ошибки при обработке исторических документов.
Благодаря инструментам по оцифровке текстов печатных «Книг памяти Самарской области» к сегодняшнему дню удалось перевести в цифру шесть томов и опубликовать информацию более чем о 55 тыс. воинов. Это пофамильные списки участников боевых действий, призванных на фронт через военкоматы Куйбышева и погибших в годы войны. Общий объем оцифрованных страниц составляет порядка двух тыс.
Созданный на основе извлеченных данных поисковый каталог на сайте проекта дает возможность находить информацию о военнослужащих по различным критериям: дате рождения, месту призыва, службе.