Имеется пара DNS серверов, один master, второй slave, исправно работали несколько лет. Master обслуживает как внутренних так и внешних клиентов (четыре внешних зоны), slave только внутренних. С нового года начались проблемы - систематически (2-3 раза в неделю, иногда пару раз в день) ответы обоих серверов начинают приходить с большой задержкой и в конце концов пропадают синхронно на обоих серверах. Логфайлы обоих bind показывают, что запросы приходят, но ответов клиенты не получают (time out), даже если запрос делать на самом сервере. Помогает только рестарт всей машины, рестарт только bind9 не помогает. В то же время другие сервисы (почта, ssh) работают. То есть, проблема пока наблюдается только с работой bind. В то же время, поскольку bind продолжает записывать в лог запросы и его рестарт не помогает, причина связана с чем то еще.
Какая-то корреляция наблюдается с нагрузкой - когда оба сервера обслуживают всех клиентов внутренних сетей, то перестают отвечать синхронно и время работы меньше двух суток. Когда сервера обслужиавют разные сети (клиенты не прекрываются), то работают немного дольше и ответы пропадают в разное время. Физически машины не нагружены - процессор менше 1%, память 3.5%, диск 1%.
Кто либо встречался с подобным? И как определить, куда деваются ответы bind (запросы он получает и пишет в лог, рестарт bind9 на помогает)?