Решение проблем с процессами Application Server

Описание

Наиболее часто встречаемые причины зависания служб Application Server:

  • Блокировка системных файлов
  • Ограничения безопасности
  • Нехватка системных ресурсов
  • Конфликты с программным обеспечением сторонних производителей

TN 508 дает общие рекомендации по устранению указанных неполадок, см. ниже раздел Источники

Версии приложений

Industrial Application Server 2.1 и выше (влючая Wonderware Application Server)

Описание служб и процессов

Процесс Описание
aaEngine.exe Engine Module
aaPlatformInfoSvr.exe PlatformInfoServer Module
aaBootstrap.exe Bootstrap Module
aaGlobalDataCacheMonitorSvr.exe GlobalDataCacheMonitorServer Module
aaGR.exe Galaxy Repository service that processes requests to the ArchestA configuration subsystem.
aahSCM.exe ArchestrA Historian SCM
aaLogger.exe aaLogger Module
aaUserValidator.exe UserValidator Module
NmxSvc.exe NmxSvc Module
slssvc.exe SuiteLink Inbound Connection Service

Даже если нет никаких конкретных сообщений об ошибках в журнале SMC, явно указывающих на замороженные или заблокированные процессы, непредсказуемое поведение системы может быть достаточным основанием для проверки этих процессов.

Зависание процессов можно определить используя:

  • SMC Ошибка Logger
  • Диспетчере задач Windows и сортировка по имени процесса (aaEngine aaBootstrap и т.д.).
  • Microsoft Программа просмотра событий и системных журналов

Блокировка файлов

Как правило причинами блокировки являются:

  • антивирусы
  • службы Windows для бэкапа и теневого копирования
  • службы индексирования Windows
  • сервис дефрагментации Windows
  • другие ресурсоемкие для дисковой подсистемы приложения и/или скрипты

Симптомы блокировки файлов

  • проблема при установке и регистрации LMX.DLL
  • в SMC logger ошибки: Checkpoint, например: INVARIANT FAILED LINE 489 FILE U:\MagellanDev\src\EngineServices\Checkpointer\CheckpointFileServer\
  • в SMC logger ошибки: Moved file failed error
  • при использовании redundant App Engine не хватает RAM памяти и система зависает
  • при использовании redundant App Engine загрузка ЦПУ достигает 100%

Как устранить блокировку файлов

  • Настроить антивирусное ПО — исключить из проверки каталоги. См. TN 861
  • Операции по архивированию, индексации, резервному копированию, дефрагментации и все др. ресурсоемкие процессы выполнять во время запланированного «окна» для технического обслуживания.

Ограничения безопасности

Как правило встречаются следующие проблемы:

  • Элементы управления безопасностью запрещают DCOM, открытые сетевые папки или другие ограничения уровня безопасности файлов относящиеся к локальным или групповым политикам. Например, групповая политика настроенная в домене.
  • Различные брандмауэры (софт, хард, встроенные в ОС и пр.) ограничивают обмен данными между сервисами Application Server
  • Ограничения прав текущего пользователя системы. Т.е. текущий пользователь не имеет прав на запуск служб и процессов
  • Фоновые пользователи (например. NT AUTHORITY\Network Service and ArchestrA Network User Account) не имеют соответствующих прав

Симптомы ограничения безопасности

  • Ошибки DCOM в Windows Event Viewer
  • При выполнении операции deploy объектов ошибки типа:
    • Failed to deploy Platform <PlatformName>: remote node’s UserID/password don’t match the GR Node.
    • Error: The Server is unavailable HRESULT=80070005 after failed deploy.
    • Error: Failed to deploy Platform <PlatformName>. Cannot communicate with remote node version information from bootstrap.
    • Error: Failed to deploy code modules to target when deploying objects to another node.
  • Сообщения в SMC logger типа:
    • ImpersonateUser failed(0x8000401a). ArchestrA Admin user has not been setup or machine is shutting down.

Как устранить ограничения безопасности

  • Запустить OS Configuration Utility. Примечание: Если система входит в домен, то может потребоваться применить настройки вручную (см.  Security Settings for Wonderware® Products  https://wdnresource.wonderware.com/support/kbcd/html/1/t002124.htm)
  • Проверить и при необходимости настроить групповые политики безопасности в соответствии с требованиями к приложениям
  • Настроить сетевое оборудование
  • Для любых действий по установке и настройке ПО использовать учетную запись Администратора

Нехватка системных ресурсов

Симптомы

  • Использование всего объема оперативной памяти
  • Высокая загруженность ЦПУ
  • Интенсивное использование ЖД
  • Интенсивное использование сетевых ресурсов

Как отследить и устранить проблемы нехватки ресурсов

  • Регулярно просматривать в диспетчере задач использование ЦПУ, RAM и сетевых ресурсов
  • Использовать монитор производительности встроенных в ОС
  • Анализировать и архивировать атрибуты WinPlatform и Engine относящиеся к производительности. Например, Scheduler.CheckpointPeriodAvg
  • При использовании резервирования каждый  из партнеров должен иметь запас по производительности для обработки всех объектов, в случае отключения redundant partner
  • Обновлять ПО Wonderware при выходе SP, Patch, новых версий

Источники

TN 508. Troubleshooting Wonderware Application Server Processes. Источник: https://wdnresource.wonderware.com/support/kbcd/html/1/t002234.htm

TN 861. Wonderware System Platform FAQs for IT Professionals. Источник: https://wdnresource.wonderware.com/support/kbcd/html/1/t002659.htm

Добавить комментарий