Вики IT-KB

Замена неисправного физического диска в СХД HP 3PAR 7200

Подозреваю, что в штатной обстановке СХД HP 3PAR 7200 должна автоматически перестраивать свой дисковый массив после физической замены диска в состоянии failed на новый диск. Но в некоторых случаях, спровоцированных самим администратором, обслуживающим СХД, может получиться так, что такое перестроение не отработает корректно. В таком случае потребуется выполнить ряд манипуляций по ручному выведению неисправного диска в Offline с последующим подключением нового диска. Здесь описан пример такой процедуры.

Подключаемся к СХД HP 3PAR 7200 по протоколу SSH, используя для аутентификации учётную запись 3paradm

Получаем список неисправных дисков:

% showpd -failed -degraded

                             -Size(MB)-- ----Ports----
Id CagePos Type RPM State     Total Free A      B      Capacity(GB)
31 1:7:0?  FC    15 failed   278528    0 1:0:2  0:0:2*          300
-------------------------------------------------------------------
 1 total                     278528    0

В данном случае мы видим, что неисправен диск с идентификатором Id 31 и размещением: дисковая полка 1, диск 7 (то есть восьмой дисковый слот в полке, так как отсчёт дисков в полке начинается с 0)

Убеждаемся в том, что не выполняется никаких сервисных операций:

cli% servicemag status

No servicemag operations logged.

Запускаем режим обслуживания диска с идентификатором 31 (на вопрос о запуске servicemag отвечаем утвердительно):

% servicemag start -pdid 31

Are you sure you want to run servicemag?
select q=quit y=yes n=no: y
servicemag start -pdid 31
... servicing disks in mag: 1 7
...      normal disks:  
...  not normal disks:  WWN [5000C5004F9F9E1C] Id [31]  diskpos [0]

The servicemag start operation will continue in the background.

Операция перевода диска в Offline будет запущена в фоновом режиме. Чтобы посмотреть текущий статус операции выполним:

% servicemag status

Cage 1, magazine 7:
The magazine is being brought offline due to a servicemag start.
The last status update was at Tue Mar 13 15:58:23 2018.
Chunklets relocated: 3 in 55 seconds
Chunklets remaining: 240
Chunklets marked for moving: 240
Estimated time for relocation completion based on 18 seconds per chunklet is: 
1 hours, 12 minutes and 0 seconds
servicemag start -pdid 31 -- is in Progress

Здесь мы увидим примерное рассчётное время до завершения операции. Дожидаемся пока операция не завершится.

% servicemag status

Cage 1, magazine 7:
The magazine was successfully brought offline by a servicemag start command.
The command completed at Tue Mar 13 17:04:16 2018.
servicemag start -pdid 31 -- Succeeded

Видим, что команда перевода проблемного диска в Offline выполнена успешно и завершена в нашем примере в 17:04:16.

Теперь давайте посмотрим то, как изменился статус диска (servicing - насколько я понимаю, признак того, что диск выведен в обслуживание):

% showpd -s 31

Id CagePos Type -State- -Detailed_State--
31 1:7:0   FC   failed  vacated,invalid_media,smart_threshold_exceeded,servicing
-----------------------------------------------------
 1 total

На данном этапе физически извлекаем неисправный диск из СХД и устанавливаем новый сменный диск.

После того, как сменный диск установлен, современные версии 3PAR OS могут в автоматическом режиме запустить процедуру вывода дискового слота из обслуживания и ввода нового диска в работу. Подождав 2-3 минуты после установки диска, проверим, не запустился ли этот процесс:

% servicemag status

Если процесс на запустился автоматически, вызываем процедуру вывода дискового слота из обслуживания, указав номер полки и номер слота в полке. При этом автоматически запустится процедура восстановления диска в массиве.

% servicemag resume 1 7

Are you sure you want to run servicemag?
select q=quit y=yes n=no: y
Failed --
Cage 1 mag 7 'servicemag resume' was started 
since Tue Mar 13 17:03:56 2018 or it has been interrupted.  
Please run 'servicemag status -d' for further details
servicemag resume 1 7 -- Failed
Command failed

В некоторых случаях, как в моём примере, на данном шаге может возникнуть ошибка, однако при этом процедура восстановления всё же запустится. Подтверждение информации о том, что утилита servicemag не всегда ведёт себя адекватно можно найти и в других источниках, например в статье Storage Exploration - HP 3PAR disk replacement.

Проверить статус запущенной нами задачи можно ранее упомянутой командой (причём лучше делать это не сразу, а через несколько минут, так как планируемое время выполнения операции начинает отображаться не сразу):

% servicemag status

Cage 1, magazine 7:
The magazine is being brought online due to a servicemag resume.
The last status update was at Tue Mar 13 17:16:00 2018.
Chunklets relocated: 6 in 1 minutes and 59 seconds
Chunklets remaining: 711
Chunklets marked for moving: 711
Estimated time for relocation completion based on 19 seconds per chunklet is: 
3 hours, 45 minutes and 9 seconds
servicemag resume 1 7 -- is in Progress

Дожидаясь завершения процесса выполнения, посмотрим как изменился статус диска:

% showpd -failed -degraded

                             -Size(MB)-- ----Ports----
Id CagePos Type RPM State     Total Free A      B      Capacity(GB)
48 1:7:0?  FC    15 degraded 278528    0 -----  -----           300
-------------------------------------------------------------------
 1 total                     278528    0

Обратите внимание на то, что новый диск имеет Id отличный от того, с каким был старый диск (48 вместо 31) То есть при установке ранее неизвестного СХД диска идентификатор Id присваивается следующий по счётчику с учётом всех имеющихся в СХД дисков.

Дожидаемся завершения процедуры восстановления…

% servicemag status

Cage 1, magazine 7:
The magazine is being brought online due to a servicemag resume.
The last status update was at Tue Mar 13 17:16:00 2018.
Chunklet relocations have completed 243 in 56 minutes and 24 seconds
servicemag resume 1 7 -- is in Progress

…до тех пор, пока задание восстановления не завершится и не перестанет отображаться в статусе servicemag:

% servicemag status

No servicemag operations logged.

Осталось удостоверится в том, что неисправных дисков в СХД нет:

% showpd -failed -degraded

No PDs listed

А также убедимся в том, что новый диск, который имел идентификатор 48, теперь изменил свой идентификатор на 31, то есть «встал на своё место»:

% showpd -s 31

Id CagePos Type -State- -Detailed_State- -SedState--
31 1:7:0   FC   normal  normal           not_capable
----------------------------------------------------
 1 total

В завершении хочу обратить Ваше внимание на то, что выполнять подобные процедуры на СХД, имеющей контракт технической поддержки нежелательно, а лучше всё-же доверить эту работу специально обученным гражданам из HPE. Как говорится, на Ваш страх и риск :)

Дополнительные источники информации:

Проверено на следующих конфигурациях:

Версия 3PAR OS
3.2.2 (MU3)

Автор первичной редакции:
Алексей Максимов
Время публикации: 14.03.2018 11:07

HP, HPE, 3PAR, 3PAR 7200, Storage

Обсуждение

Михаил, 22.07.2019 12:03

Алексей, подскажите, если у полученного от HPE нового диска версия прошивки диска не соответствует заменяемому, то каким образом можно самостоятельно установить новую прошивку на 3PAR? (Техподдержку не продлили пока...).

Михаил, 23.07.2019 14:30

Добрый день, Алексей.
Этот вопрос возник в связи с тем, что год назад на одном из HPE 3PAR StoreServ 8000 меняли диск - вместо производителя HGST, модель HCBF1200S5xeN010, 3P05 SAS, Magnetic был получен SEAGATE STHB1200S5xeN010 3P03 SAS, Magnetic. С ними процедура восстановления диска в массиве после простой физической замены не запустилась. Создали заявку в НРЕ, подключался их специалист через HPE MyRoom и устанавливал новую прошивку для диска SEAGATE. Скорее всего, для успешной замены он проверял по таблице совместимости версии прошивок на дисках, полках и самой системе, но как мне сообщили - это закрытая информация, только для сервис-инженеров HPE.
Сейчас ожидаем диск, попробуем заменить самостоятельно, в соответствии с Administrator's Manual.
А у Вас есть опыт обслуживания 3PAR без техподдержки? И как на Ваш взгляд, реально ли своими силами выстроить растянутый метро-кластер между двумя площадками на паре 3PAR+BladeSystem?

Олег, 25.07.2024 18:07

Здравствуйте.
Такая проблема: hp 3par 7200
Отмонтировал раздел с виртуалками а после того как подмонтировал обратно - раздел пустой!!!
Нужно вытащить виртуалки!
Что то похожее нашел тут: https://hddprofi.ru/vosstanovlenie-dannyh-hp-3par-storeserv-7400c/
Но пысы3000 у меня нет и они делали свой софт.
Есть у кого то опыт восстановления данных с таких или похожих 3par?
Может можно обойтись более простым путем через админку?
HELP!!!

Олег, 01.11.2024 11:24

Здравствуйте!
3PAR StoreServ 7200, при попытке замены degrade диска servicemag завершается с ошибкой. Есть один чанклет, который невозможно ни перенести, ни удалить. Как следствие, LD в preserved и vLUN заблокирована.
Можно восстановить работу vLUN штатными средствами?

Юрий, 03.12.2024 13:22

Добрый день.
По незнанию, как правильно менять неисправный диск в СХД 3PAR, неисправный диск был физически извлечен из СХД и отправлен поставщику на замену по гарантии. Получил новый диск, установил на место старого. Теперь по команде showpd -failed в системе два диска. Новый диск ID не получил.
Попытался произвести замену, как здесь описано, но без неисправного диска, так как его нет в наличии. До установки нового диска всё идёт нормально, после установки нового диска получаю ошибку servicemag resume 0 22 -- Failed. Не подскажите, что можно сделать?
Команда showpdch -mov выдаёт 1109 чанклета с диска 22.
22 - id неисправного диска.
Версия 3PAR OS: 3.3.1 (MU5).

Полное имя:

Эл. адрес:

Ваш комментарий:

Имя друга Чебурашки (при написании вместо буквы "а" используйте @) Пожалуйста, оставьте это поле пустым:

Подписаться на комментарии