Перейти к содержимому


Фото
- - - - -

DrWeb ES v10 & Win2003 SBS


  • Please log in to reply
64 ответов в этой теме

#1 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 07 Август 2014 - 09:04

Здравствуйте.

С 22 июля периодически сражаюсь с новой версией :).

Имеется:

Windows 2003 SBS (контроллер домена, он же сервер DrWeb), работал бесперебойно много лет с версией 6.

После установки 10-й версии как то началась полоса всяких заморочек.

Сервер проработает дня 3-4, потом завалится с примерно такими ошибками:

Первая:

Spoiler

Вторая:

Spoiler

 

Третья:

Spoiler
 

Ну и, соответственно, все станции в сети отлучаются от групповой политики и ничего не работает толком.

Нашел рекомендацию от Microsoft: http://support.microsoft.com/kb/312362/ru, сначала применил только ее первую часть (по поводу PoolUsageMaximum=60)

Пару дней все поработало, вчера вылетел BlueScreen: 0x0000007e (0xc0000005, 0x8087dcdd, 0xf78f2bb0, 0xf78f28ac) + дамп памяти на 2 Гб, нашел старую тему, применил вторую часть рекомендованного решения от Microsoft.

Теперь сервер DrWeb не откликается. Какое то время работает и потом к нему нет доступа через web-интерфейс, на агентах указано "Отказ в соединении с сервером".

Попытка перезапустить сервер DrWeb неудачна, пишется, что изучайте журнал событий.

В журнале событий операционки пишется набор записей:

Первая:
Spoiler
 
Вторая:
Spoiler
 
Третья:
Spoiler
 
Четвертая:
Spoiler
 
Если это возможно, прошу содействия в разрешении проблем. Предлагаю начать по профильному направлению, то есть, понять что же сервер DrWeb-а то не хочет запускаться?
Прилагаю файл логов (в котором я не отыскал разгадку). Читать можно с 20140807.035227.53, в этот момент был рестарт.

 

Прикрепленные файлы:

  • Прикрепленный файл  drwcsd.rar   372,79К   8 Скачано раз


#2 VVS

VVS

    The Master

  • Moderators
  • 19 567 Сообщений:

Отправлено 07 Август 2014 - 09:29

C этим, наверно, всё-таки лучше в ТП... и дамп туда же.


меня вот что возмутило.  что даже не начинают толком диалог сразу дампы...... © alehas777
--------------------------------
Антивирус это как ремень безопасности - всего лишь увеличивает шансы выжить или получить менее тяжкую травму при аварии.
Есть, однако, категория людей, которые рассматривают средства безопасности как ауру неуязвимости. © basid


#3 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 07 Август 2014 - 09:32

C этим, наверно, всё-таки лучше в ТП... и дамп туда же.

Хорошо, сейчас сделаю.



#4 Valentina Yugai

Valentina Yugai

    Poster

  • Members
  • 1 102 Сообщений:

Отправлено 07 Август 2014 - 09:36

Добрый день.

 

В логах есть ряд вызывающих вопросы ошибок примерно от 05.08 и 06.08.

 

Первая:

20140805.151916.58 ERR [01492 068c] wrk:3  [Layer/Common] tcp://192.168.7.55:3849/st: Will disconnect due to violation command header exceed maximum header size
20140805.151916.58 ERR [01492 068c] wrk:3  [Server workers] Unable to execute job because of 
20140805.151916.58 ERR [01492 068c] wrk:3    command header exceed maximum header size
 
Вы создавали задачи в расписании станции, или что-то в этом духе?
 
Вторая:
20140805.173654.88 ERR [01492 0694] wrk:5  [DB] Failed, UNIQUE constraint failed: station_products.id, station_products.product, 00.000, INSERT INTO station_products VALUES(?,?,?,?,?,?) ["10c160ee-d11d-b211-a7a1-8c11e1d62606", "20-drwagent", "20140728095114", "20140728095114", "S", 20140805113654882]
20140805.173654.88 ERR [01492 0694] wrk:5  [DB] Unsuccessful SQL "update products status" transaction, rolling back
 
Это вызывает много вопросов само по себе, потому что плохо представляю себе, что произошло, что постоянно нарушается этот констрейнт.
 
Третья:
20140805.180251.75 ERR [01492 068c] wrk:3  Unable to process data block because of 
20140805.180251.75 ERR [01492 068c] wrk:3    single char after %: "Client detected VIOLATION: %Z"
 
Чтоб я вообще понимала, что здесь произошло. Какая-то проблема в пересылке данных сежду клиентом и сервером.
 
Ну а потом все просто - был аварийно убит и перезапущен сервер:
 
20140806.163731.53 ERR [01492 0690] wrk:4  [DB] Unsuccessful SQL "update products status" transaction, rolling back
20140806.170210.21 inf [01500 05e0] main   [Logger] Logfile has been opened by Dr.Web Server Version REL-1000 Build 10.00.0.201407150
 
И как результат, побилась база. Сейчас, поскольку база у вас частично живая, можно попытаться почистить проблемные таблицы, на которые идет ругань в логе, или (что в целом проще) восстановить бэкап до этого момента.

Ну и да, глобально лучше в ТП.



#5 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 07 Август 2014 - 10:01

> Первая

Вы создавали задачи в расписании станции, или что-то в этом духе?

192.168.7.55... - с точки зрения антивируса - обычная станция в сети, совершенно не имеет никаких задач в расписании, кроме предопределенных.

> Вторая

Это вызывает много вопросов само по себе, потому что плохо представляю себе, что произошло, что постоянно нарушается этот констрейнт.

Тут SQL запрос почему то не отрабатывает с ругалкой по поводу того что нарушена уникальность ключа для таблицы. Я вообще хотел поинтересоваться по встроенному формату базы данных. Я выбрал SQLite3 как рекомендуемую из встроенных, но при установке был еще один из вариантов IntDB, который, возможно, предпочтительнее.

Третья

Необъяснимо.

> Четвертая

Ну а потом все просто - был аварийно убит и перезапущен сервер

Это как раз момент когда вчера BlueScreen вылетел. В 17:02 сервер я запустил по новой.

Spoiler

 

В техподдержку письмо пишу, заливается файл дампа.



#6 Valentina Yugai

Valentina Yugai

    Poster

  • Members
  • 1 102 Сообщений:

Отправлено 07 Август 2014 - 10:16

Тут SQL запрос почему то не отрабатывает с ругалкой по поводу того что нарушена уникальность ключа для таблицы. Я вообще хотел поинтересоваться по встроенному формату базы данных. Я выбрал SQLite3 как рекомендуемую из встроенных, но при установке был еще один из вариантов IntDB, который, возможно, предпочтительнее.

 

Что запрос не отрабатывает из-за нарушения уникальности - это я поняла. :) Я не поняла, почему попытка записать в таблицу "station_products" может его нарушить, по логике такого быть не должно.

 

IntDB - это старый формат, по сути своей SQLite 2. Он хуже, чем SQLite 3, по ряду параметров, в том числе по производительности.

 

По поводу синего экрана ясно, значит, нужно поднять базу из бэкапа. Я подозреваю, ничего нового туда не записалось за это время - там постоянные фейлы транзакций из-за запорченных таблиц. Собственно, нужно выбрать последний бэкап, сделанный до BSoD'а и импортироваться с него. Вот тут: http://forum.drweb.com/index.php?showtopic=318252&p=730167 описана методика восстановления базы.


Сообщение было изменено Valentina Yugai: 07 Август 2014 - 10:16


#7 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 07 Август 2014 - 10:36

Последний (сегодняшнее утро) бэкап визуально мертвый, но есть и похожие на живые.

Судя по всему, мне нужен файл из бэкапа, который именован database.gz (в нем файл database). Видимо, его нужно поместить вместо database.sqlite (кстати, там еще рядом есть, похоже, журнал транзакций, который, видимо, надо совсем грохнуть database.sqlite-journal).

Но не дает! Файл удерживает, видимо, движок SQLite3, который не останавливается по команде остановки сервера DrWeb ES.

P.S. А! увидел как там реанимируют, через инициализацию базы в бэкапе (drwcsd initdb ...)

Сейчас попробую


Сообщение было изменено Thorvardr: 07 Август 2014 - 10:39


#8 Afalin

Afalin

    Guru

  • Dr.Web Staff
  • 5 914 Сообщений:

Отправлено 07 Август 2014 - 10:40

Вы создавали задачи в расписании станции, или что-то в этом духе?

Задачи тут ни при чём, это с агентов прилетают слишком большие команды (в данном случае >500 KiB). Откуда они столько берут – непонятно без логов.


Семь раз отрежь – один раз проверь

#9 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 07 Август 2014 - 11:09

При попытке импорта из любого бэкапа:

> main   [Server] Process exit code is 0x16/22 (error while importing database)

Буду ждать ответа техподдержки.



#10 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 07 Август 2014 - 11:38

Все манипуляции с базой неудачны, видимо, вот почему:

ERR [05396 1414] stp:1  [DB] Failed, database is locked, 00.000, UPDATE server_status SET state=?,marker=?,uptime=? WHERE id=? [0, 20140807082732952, 3, "504075d6-c711-e411-2a5e-d0a9d95b9ffc"]

Смотрю, в самом деле, в статусе службы (запущена в 03:52:27   07.08.2014) "Dr.Web Server" указано "Остановка", то есть, она пытается остановиться уже несколько часов и держит базу. Останавливается, видимо, потому что я пытался программно перезапустить сервер. Процесс не убивается, говорит, что прав нет. Видимо, придется компьютер перегрузить.



#11 Valentina Yugai

Valentina Yugai

    Poster

  • Members
  • 1 102 Сообщений:

Отправлено 07 Август 2014 - 12:23

У вас агент на этой машине стоит? Если да, то для того, чтобы что-то сделать, нужно отключить самозащиту.



#12 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 07 Август 2014 - 13:07

У вас агент на этой машине стоит? Если да, то для того, чтобы что-то сделать, нужно отключить самозащиту.

Это понятно. Но ее не отключить, т.к. я не разрешал ее отключение при настройке прав, а изменить я права не могу, т.к. не могу зайти в web интерфейс. Сервер (компьютер) я перегрузить тоже не могу, народ работает, жду вечер.



#13 Valentina Yugai

Valentina Yugai

    Poster

  • Members
  • 1 102 Сообщений:

Отправлено 07 Август 2014 - 13:26

Перезагрузка вам не поможет, файлы не блокируются сервером, а защищаются самозащитой. Нужно снести агента.



#14 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 07 Август 2014 - 19:28

Народ разбежался, просто перегрузил компьютер. Все работает. Агент обновился, вход в web интерфейс управления сервером отличный, принудительное обновление репозитория без нареканий. В общем, все как было вчера вечером, все было отлично, но утром он почему то оказался в ауте. Завтра снова посмотрю как сервер ночь переживет.



#15 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 07 Август 2014 - 20:17

Пощелкал по разделам web-интерфейса. Оказалось, что база все таки сломана. Я вижу группы, станции, права. Но! 

В разделе "Журнал обновлений репозитория", например, написано:

Database error - database disk image is malformed

Попробовал сделать импорт бэкапа (точнее, всех доступных бэкапов поочередно, предварительно остановив сервер):

"C:\Program files\DrWeb Enterprise Server\bin\drwcsd.exe" importdb "C:\Program files\DrWeb Enterprise Server\var\backup\20140805233000009\database.gz"

в лог пишет:

20140807.225112.30 FTL [03836 09d4] main     import file "C:\Program files\DrWeb Enterprise Server\var\backup\20140805233000009\database.gz" is corrupted because of 

20140807.225112.30 FTL [03836 09d4] main     unable to clear table `update_srv_files`
 
Снова запустил сервер.

Зашел в раздел "Управление базой данных", сделал "Анализ базы данных", пишет "Операция успешно завершена"

Там же нажал "Экспорт" в варианте "полный", пишет: Ошибка

Там же нажал "Экспорт" в варианте "только станции и группы", в web интерфейсе не ругается, но в лог пишет вот такую вот штуку: 

Spoiler


#16 HHH

HHH

    Massive Poster

  • Posters
  • 2 714 Сообщений:

Отправлено 07 Август 2014 - 21:40

Дайте права на отключение самозащиты и потом восстанавливайте БД.



#17 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 08 Август 2014 - 04:18

Дайте права на отключение самозащиты и потом восстанавливайте БД.

Да, я так и сделал. Утро вечера мудренее. База теперь целая, все теперь работает. Стану снова смотреть не возникнут ли ошибки, с которых начался пост.



#18 Kirill Polubelov

Kirill Polubelov

    Hr. Schreibikus

  • Dr.Web Staff
  • 4 392 Сообщений:

Отправлено 11 Август 2014 - 14:46

Thorvardr, а почему вы решили, что первые три ошибки из первого сообщения, имеют отношение к Dr.Web серверу? Из сообщений под спойлерами не видно причастности, к ним, ес-сервера и/или ес-агента.


Тут что-то в ОС, что привело к краху и ес-сервера.


(exit 0)

#19 Thorvardr

Thorvardr

    Member

  • Posters
  • 137 Сообщений:

Отправлено 12 Август 2014 - 16:26

Thorvardr, а почему вы решили, что первые три ошибки из первого сообщения, имеют отношение к Dr.Web серверу? Из сообщений под спойлерами не видно причастности, к ним, ес-сервера и/или ес-агента.


Тут что-то в ОС, что привело к краху и ес-сервера.

Да я понимаю, что связь неочевидна. Но вот в чем дело. Этот сервер работал до того годами без проблем, я вообще не помню уже когда к нему подходил, но тут я поменял 6-ю версию ES на 10-ю, причем это единственное что я сделал, и стабильность закончилась. Косвенно это и наводит на мысли, что поиск проблем надо искать где то тут. Вы не думайте, что я хочу шашкой помахать или крайнего найти, ответы людей позволяют проверить те или иные нюансы настроек сервера и вообще, дают какой то вектор для разрешения ситуации, тем более, что люди отвечают профильные, то есть, те, что занимаются плотно подобными задачами.

Сегодня сервер снова после 4 с половиной дней работы выдал при обращении к сетевому диску на нем "Недостаточно ресурсов сервера для выполнения команды" и все, пришлось перегружать. В логи записалось:

Spoiler
Логи сервера DrWeb ES во вложении, может кто натолкнет на то, куда копать, техподдержка что то не ответила ничего, наверное как раз потому что связь между антивирусом и проблемами неочевидна. :(
Вот какие типы записей настораживают:
Spoiler
Spoiler
Пока остановил сервер DrWeb ES.

Кстати, может не сервера логи то надо смотреть, а клиентской части (агента, guard-а)? Поищу и в них, вдруг что нибудь полезное промелькнет.

Прикрепленные файлы:

  • Прикрепленный файл  drwcsd.rar   449,57К   3 Скачано раз


#20 Kirill Polubelov

Kirill Polubelov

    Hr. Schreibikus

  • Dr.Web Staff
  • 4 392 Сообщений:

Отправлено 12 Август 2014 - 17:01

"Вы не думайте, что я хочу шашкой помахать или крайнего найти"

Так я тоже без претензий :) Уточнил, почему сделан такой вывод.

 

"Сегодня сервер снова после 4 с половиной дней работы выдал при обращении к сетевому диску на нем "Недостаточно ресурсов сервера для выполнения команды" и все, пришлось перегружать"

Погодите, какой сервер? ОС или ЕС-сервер? Если ЕС, то к какому сетевому диску он обращался и для чего?

 

Если это сообщение ОС, то да, смотреть надо в сторону агента и гварда.


Сообщение было изменено Kirill Polubelov: 12 Август 2014 - 17:02

(exit 0)


Читают тему: 0

0 пользователей, 0 гостей, 0 скрытых