Як виявити апаратну проблему з сервером

У даній статті ми розглянемо виявлення і діагностування збійних вінчестерів, можливості для перевірки оперативної пам'яті, так само розглянемо подачу заявки в службу технічної підтримки.

Аналізуючи запити в службу підтримки, пов'язані з апаратними проблемами на виділених серверах, можна резюмувати наступне: більшість клієнтів просто не вміють правильно ідентифікувати проблему, що виникла на сервері, а так само скласти чіткий запит фахівцям компанії.

Допомогти клієнтам в цьому питанні і буде метою даної статті. У безлічі заявок клієнт не вказує всієї необхідної інформації про сервер, з'ясування якої затягує вирішення питань.

Сервер, який є електронним приладом, може рано чи пізно вийти з ладу. Будь-який сучасний електронний прилад, і сервер зокрема, побудований за модульним принципом, що має безліч переваг: взаємозамінність, швидка заміна і діагностика без застосування спеціального обладнання. При виході сервера з експлуатації, ці переваги грають величезну роль.

Найбільш типовою є ситуація, коли сервер перестає відповідати на запити. Перед тим, як написати запит до служби технічної підтримки, слід провести наступні діагностичні заходи:

Для початку необхідно перезавантажити сервер, використовуючи панель управління DCImanager, "Обновити".

Якщо сервер не завантажився, після деякого часу, слід запросити IP-KVM для того, щоб мати доступ до консолі сервера і бачити результат помилок.

Можливо, йде перевірка файлової системи, при гіршому розкладі - на консолі помилки "kernel panic", помилки "disk boot failure, insert system disk and press enter", темний екран. У першому випадку вам просто слід почекати, сервер «підніметься». У другому випадку бажано звернутися до технічних фахівців компанії.

Після завантаження сервера, необхідно перевірити стан вінчестерів.

Щоб встановити пакет скористайтеся командою для вашого дистрибутива ОС:


Перевіряємо диск так:

Ім'я диска може відрізнятися і бути одним з наступних:

Віртуальний сервер на віртуалізації KVM має диски / dev / vda

Наприклад, для FreeBSD команда може виглядати так:

а для Linux так:

Детальний опис можна подивитися на офіційному сайті проекту smartmontools. опис атрибутів російською мовою на Вікіпедії.

Отримавши дані SMART з диска, слід звернути увагу на наступні показники:

Reallocated Sectors Count - Показує кількість перепризначених секторів (remaping). Велике число свідчить про проблеми з поверхнею дисків. Можна вважати ключовим параметром при оцінці стану диска, особливо при постійному збільшенні даного параметра.

Uncorrectable Sector Count - Кількість нескоректована помилок. Атрибут показує загальну кількість помилок, що виникли при читанні / запису сектора і які не вдалося скорегувати. Зростання значення в поле raw value цього атрибута вказує на явні дефекти поверхні і / або проблеми в роботі механіки накопичувача.

Розгляд інших параметрів має менш важливе значення і не входить в рамки даної статті. Більш детальний опис є на ресурсі, зазначеному вище.

В даному випадку спостерігається велике значення параметра "Reallocated Sectors Count" вказує на можливу наявність збійних секторів (bad blocks) і "Seek_Error_Rate" - помилки позиціонування голівок, що зчитують диска. В даному прикладі диск можна вважати збійних і найближчим часом, можливий вихід його з ладу.

Як показує наш досвід в разі якщо значення Uncorrectable Sector Count, Current Pending Sector Count, UDMA_CRC_Error_Count більше нуля, то жорсткий диск вимагає термінової заміни.

Так само буде корисно провести тест диска:

Стежити за процесом і подивитися результат можна командою:

Основний показник здоров'я диска:


Media Wearout Indicator - ця змінна безпосередньо вказує на знос диска. Лічильник має нульове значення на початку (100), і зменшується з часом. При досягненні якогось певного виробником порогового значення, диск визнається зношеним і переходить в read-only режим.

Якщо його значення впало нижче 10, значить пора диск міняти.

Так само варто звертати увагу на:

Отримавши і проаналізувавши показники SMART, необхідно написати запит до служби технічної підтримки. Правильно складений запит полегшує роботу фахівців і зменшує час реакції.

Інформація, необхідна для подання запиту:

  • Ідентифікаційні дані збійного диска, при неможливості вилучення, дані про цілому диску. Інформація буде передана технічним співробітникам в ДЦ, які будуть займатися заміною збійного диска.
  • Результат виконання команди smartctl -a на проблемному жорсткому диску.
  • Дані доступу на сервер, для підтвердження стану дисків співробітниками компанії.

Повідомлення, які містять даної інформації не можуть бути прийняті до розгляду.

Робота утиліти smartctl. Для визначення даних про збійному диску необхідний наступний блок інформації:

приклад запиту

Розглянемо невеликий приклад листування уявного клієнта До зі співробітником технічної підтримки З:

Даний діалог можна скоротити до запиту про заміну диска і відповіді про виконання робіт:

Такий запит буде виконаний співробітниками технічної підтримки без додаткових уточнюючих питань, що скорочує час виконання заявки і економить робочий час співробітників технічної підтримки.

Після виявлення проблеми з пам'яттю пишемо запит до служби технічної підтримки. У запиті необхідно долучити знімок екрана з помилкою. Повідомлення, які містять даної інформації не можуть бути прийняті до розгляду. Якщо ваш провайдер не надає доступ в панель DCImanager, то вам слід відразу написати звернення в службу підтримки з проханням провести даний тест. При підтвердженні помилки, пам'ять буде замінена.

Замість висновку хотілося б сказати наступне: проблеми виходу вінчестерів з ладу - явище прогнозоване і в цьому може допомогти сервіс моніторингу стану диска smartd, так само входить в пакет smartmontools. Його настройка і використання неодноразово розглядалися в інтернеті і не входить в рамки даної статті. Використання клієнтами цього кошти моніторингу може врятувати від небажаної втрати даних.

Проблеми оперативної пам'яті - явище непередбачуване і спонтанне. Вихід її з ладу не загрожує втратою інформації, однак викликає простої в експлуатації.

І останнє - бажаємо вам, щоб ваші сервера не ламалися, а звернень до служби технічної підтримки з даної тематики було менше.

Схожі статті