Глава 5 Общая архитектура платформы

5.1 Архитектура системы

Программное обеспечение ЦДП выполнено на основе библиотек с открытым кодом R (Posit) и включает модули (микросервисы) высокопроизводительных расчетов на Java и C++. Для хранения эталонных данных и документов используются базы данных PostgreSQL и ClickHouse, что обеспечивает надежное и масштабируемое управление большими объемами данных. Пользовательские интерфейсы реализованы с использованием JavaScript и HTML, что обеспечивает интерактивность и доступность системы через веб-браузеры.

Микросервисная архитектура обеспечивает масштабируемость и гибкость, что позволяет динамически добавлять или отключать компоненты без влияния на работу других частей системы. Архитектура ЦДП обеспечивает сквозную интеграцию данных, моделей и интерфейсов, создавая мощный инструмент для управления предприятием.

Рисунок 20 — Архитектура платформы ЦДП

В основе архитектуры лежит иерархическая система показателей — от национальных целей и доктрин безопасности до муниципальных и пространственных показателей, — объединённая ансамблем математических моделей: демографической, системной динамики, матрицами чувствительности, межотраслевыми и межтерриториальными балансами.

Рисунок 21 — Иерархическая система показателей и ансамбль моделей ЦДП

5.2 Основные компоненты архитектуры

1. Этап получения и обработки данных (ETL)

Технология ETL (Extract, Transform, Load) отвечает за сбор данных из различных источников, их трансформацию и загрузку в центральное хранилище. Данные могут поступать как из внутренних систем предприятия, так и из внешних источников (например, Росстат, ФНС, API).

Ключевые возможности:

  • API-интеграция позволяет системе получать данные в реальном времени из различных источников, что обеспечивает актуальность расчетов и анализа;
  • система выполняет автоматическую нормализацию данных, приводя их к единому стандарту и устраняя дубли, пропуски и ошибки в форматах;
  • ClickHouse/PostgreSQL используется для хранения больших объемов аналитических данных, справочников и временных рядов, что позволяет обрабатывать данные в реальном времени с высокой производительностью.

На примере реализации для АПК архитектура модели включает два взаимосвязанных контура: модель потребления (Цифровой двойник города) на основе корреляционных и стохастических зависимостей, и модель производства (Цифровой двойник предприятия) на основе функциональных и стохастических зависимостей. Каждый контур оперирует фактами и прогнозами, включая инерционные и сценарные.

Рисунок 22 — Архитектура модели АПК и монопродуктовых балансов: модель потребления и модель производства

2. Этап расчетов и аналитики

Для проведения высокопроизводительных расчетов используются модули на Java и C++, что позволяет обрабатывать большие объемы данных с минимальными задержками.

Технологии и инструменты:

  • R (Posit) обеспечивает поддержку сложных статистических и математических моделей, необходимых для сценарного моделирования, факторного анализа и прогнозирования;
  • Targets (tar_target) используется для организации расчетных узлов и управления их зависимостями. Эта технология отслеживает актуальность данных и расчетов, поддерживает версионность расчетных моделей и обеспечивает многократные параллельные вычисления;
  • система поддерживает модели межотраслевых и межтерриториальных балансов, а также ресурсно-балансовую модель, которые используются для оценки потребностей предприятия в ресурсах и их оптимального распределения.

3. Пользовательские интерфейсы

Пользовательские интерфейсы реализованы с использованием JavaScript и HTML, что обеспечивает доступ к системе через веб-браузеры и интуитивно понятную работу с данными и аналитическими инструментами.

Возможности интерфейсов:

  • интерфейсы поддерживают интерактивные информационные панели, отчеты и визуализации на основе данных, что позволяет пользователям легко получать доступ к аналитике и принимать управленческие решения на основе актуальных данных;

Рисунок 23 — Пользовательский интерфейс ЦДП: интерактивная информационная панель МСХ

  • REST API позволяет интегрировать внешние системы с ЦДП и обеспечивать доступ к данным и функциям системы через программные интерфейсы.

Рисунок 24 — 3D-визуализация структурно-технологической схемы предприятия в интерфейсе ЦДП

5.3 Ключевые технологии

Ключевые технологии ЦДП
Технология Описание Применение в ЦДП
R (Posit) Open-source платформа для выполнения статистических и аналитических расчетов Используется для разработки сложных математических моделей и статистического анализа
Java и C++ Высокопроизводительные языки программирования для расчетов Обеспечивают быстрое выполнение вычислительно сложных операций
PostgreSQL Реляционная система управления базами данных (СУБД) для хранения структурированных данных Используется для хранения эталонных данных, справочников и документов
ClickHouse Колоночная система управления базами данных (СУБД) для высокопроизводительной аналитики на структурированных больших данных Обеспечивает хранение и обработку больших объемов аналитической информации
ETL Технология для извлечения, трансформации и загрузки данных Применяется для интеграции и нормализации данных из разных источников
Targets (tar_target) Библиотека для декларации и исполнения расчетных аналитических узлов, связанных в единый конвейер (сеть), с поддержкой трассировки изменений Обеспечивает управление расчетами, версионирование и контроль актуальности данных
JavaScript, HTML Технологии для разработки пользовательских интерфейсов Используются для создания интуитивно понятных интерфейсов и интерактивных информационных панелей

5.4 Особенности архитектуры

5.4.1 Масштабируемость и производительность

Архитектура ЦДП обеспечивает высокую производительность благодаря использованию ClickHouse для хранения больших объемов данных и Java/C++ для вычислительных модулей.

5.4.2 Интеграция с внешними системами

API-интеграция позволяет ЦДП легко взаимодействовать с различными источниками данных, включая внешние информационные системы.

5.4.3 Сценарное моделирование

Система поддерживает многократные параллельные расчеты с изменением исходных данных и параметров, что позволяет пользователям проводить анализ и прогнозирование для различных сценариев.

Рисунок 25 — Пример применения сценарного моделирования в ЦДП

5.5 Архитектура связи показателей

ЦДП связывает показатели территории (Цифровой двойник города) и показатели предприятия (Цифровой двойник предприятия) в единое пространство. Показатели социально-экономического развития и рынков (240 показателей), цены на продукты (667 позиций) и доли продуктов в потреблении формируют матрицы чувствительности факторов и инерционные прогнозы, которые затем сводятся в монопродуктовые балансы — фактические и сценарные.

Рисунок 26 — Архитектура связи показателей: Цифровой двойник города и Цифровой двойник предприятия

Рисунок 27 — Межотраслевые потоки энергетических ресурсов: Sankey-диаграмма взаимосвязей