Прикладные технологии ИИ для цифровой трансформации архивов

Выступление заместителя директора НИКФИ С.Ю. Подлесного на расширенном заседании коллегии Государственного комитета Республики Татарстан по архивному делу 17 января 2020 г. в Казани.

В расширенном заседания коллегии Государственного комитета Республики Татарстан по архивному делу принял  участие Президент Республики Татарстан Рустам Минниханов. Основная тема заседания — «Формирование архивного фонда Республики Татарстан на современном этапе».

Мероприятие состоялось на площадке ГТРК «Корстон» (Казань). Здесь в холле была развернута специализированная выставка, посвященная 100-летию образования ТАССР.

Тезисы доклада

Задачи Цифровой трансформации предприятий, с использованием информационных технологий, направленных на улучшение эффективности работы и качества оказываемых услуг занимают существенное место в плане реализации Правительственной программы “Цифровая экономика Российской Федерации”.

Цифровая трансформация предусматривает внедрение новых, высокопроизводительных, гибких технологий, основанных на применении искусственного интеллекта, для управления технологическими процессами предприятия, с учетом специфики и особенностей деятельности каждой организации.

В соответствии с “Рекомендациях о функциях и полномочиях руководителей компаний по цифровой трансформации” Министерства экономического развития РФ, РЦТ наделяются обязанностями

  • управления данными при организации производственно-технологических и бизнес процессов в компании;
  • разработки и обеспечения реализации проектов по внедрению цифровых технологий во всех сферах деятельности компании;
  • разработки и обеспечения реализации документов стратегического планирования в сфере цифровой трансформации компании.

В связи с этим, представляется полезным ознакомление аудитории с основами технологии искусственного интеллекта (ИИ), применяемыми для цифровой трансформации.

Основными направлениями для осуществления цифровой трансформации государственных архивов являются:

  • повышение доступности документов, поступающих на хранение в архивы РФ за счет интеллектуального индексирования документов использования технологий классификации документов по различной номенклатуре архивной группировки.
  • повышение сохранности документов в архивах, в том числе за счет ведения распределенных реестров и внедрения технологий защиты данных от изменений.
  • повышение качества и оперативности документооборота при оказании государственных услуг для населения и предприятий, за счет интеллектуальной классификации документов и привязки их бизнес процессам обработки (с учетом структуры предприятия).

В докладе в популярной форме освещены базовые технологии искусственного интеллекта, применяемые для цифровой трансформации архивных систем.

На примере уже внедренного в Государственном Архиве Республики Татарстан модуля семантического поиска по кино-, фото-, видеодокументам, объясняется понятие семантического вектора архивного документа и его применение для группировки однородных по смыслу фрагментов данных.

Даются пояснения по способу построения семантического вектора текстовых документов и его возможности для смыслового поиска по нечетким текстовым информационным запросам на естественном языке.

Далее, на основе понятия семантического вектора, дается постановка ряда задач в области обработки текстовых документов, решение которых методами ИИ наиболее эффективно. Это задачи выделения именованных сущностей, классификация документов по темам и по эмоциональной тональности.

Классификация архивных документов по описанной номенклатуре позволит обеспечить эффективный механизм управления данными в Государственных архивах, включая вопросы разработки и реализации новых бизнес-моделей, внедрения современных цифровых технологий в процессной и продуктовой деятельности архивов, переход к управлению государственным учреждением и процессами документооборота на основе данных (data-driven decision management — DDDM).

В частности, реализация предложенных проектов открывает возможности для автоматической приоритезации при работе с обращениями граждан и аналитической работы по мониторингу социальной среды, сокращения трудозатрат при приемке документации в государственные архивы и повышения скорости, точности и эффективности документооборота на основе Государственных архивов.

Представляется важным отметить также высокую научную актуальность реализации ряда проектов нейросетевого анализа текстов на татарском языке, и необходимость привлечения специалистов из научных организаций Республики для решения этих задач.