Вики IT-KB

Пошаговые руководства, шпаргалки, полезные ссылки...

Инструменты пользователя

Инструменты сайта


hewlett-packard:hp-3par-storeserv-7200-replacing-failed-physical-disk-with-new

Замена неисправного физического диска в СХД HP 3PAR 7200

Подозреваю, что в штатной обстановке СХД HP 3PAR 7200 должна автоматически перестраивать свой дисковый массив после физической замены диска в состоянии failed на новый диск. Но в некоторых случаях, спровоцированных самим администратором, обслуживающим СХД, может получиться так, что такое перестроение не отработает корректно. В таком случае потребуется выполнить ряд манипуляций по ручному выведению неисправного диска в Offline с последующим подключением нового диска. Здесь описан пример такой процедуры.

Подключаемся к СХД HP 3PAR 7200 по протоколу SSH, используя для аутентификации учётную запись 3paradm

Получаем список неисправных дисков:

% showpd -failed -degraded
-Size(MB)-- ----Ports---- Id CagePos Type RPM State Total Free A B Capacity(GB) 31 1:7:0? FC 15 failed 278528 0 1:0:2 0:0:2* 300 ------------------------------------------------------------------- 1 total 278528 0

В данном случае мы видим, что неисправен диск с идентификатором Id 31 и размещением: дисковая полка 1, диск 7 (то есть восьмой дисковый слот в полке, так как отсчёт дисков в полке начинается с 0)

Убеждаемся в том, что не выполняется никаких сервисных операций:

cli% servicemag status
No servicemag operations logged.

Запускаем режим обслуживания диска с идентификатором 31 (на вопрос о запуске servicemag отвечаем утвердительно):

% servicemag start -pdid 31
Are you sure you want to run servicemag? select q=quit y=yes n=no: y servicemag start -pdid 31 ... servicing disks in mag: 1 7 ... normal disks: ... not normal disks: WWN [5000C5004F9F9E1C] Id [31] diskpos [0] The servicemag start operation will continue in the background.

Операция перевода диска в Offline будет запущена в фоновом режиме. Чтобы посмотреть текущий статус операции выполним:

% servicemag status
Cage 1, magazine 7: The magazine is being brought offline due to a servicemag start. The last status update was at Tue Mar 13 15:58:23 2018. Chunklets relocated: 3 in 55 seconds Chunklets remaining: 240 Chunklets marked for moving: 240 Estimated time for relocation completion based on 18 seconds per chunklet is: 1 hours, 12 minutes and 0 seconds servicemag start -pdid 31 -- is in Progress

Здесь мы увидим примерное рассчётное время до завершения операции. Дожидаемся пока операция не завершится.

% servicemag status
Cage 1, magazine 7: The magazine was successfully brought offline by a servicemag start command. The command completed at Tue Mar 13 17:04:16 2018. servicemag start -pdid 31 -- Succeeded

Видим, что команда перевода проблемного диска в Offline выполнена успешно и завершена в нашем примере в 17:04:16.

Теперь давайте посмотрим то, как изменился статус диска (servicing - насколько я понимаю, признак того, что диск выведен в обслуживание):

% showpd -s 31
Id CagePos Type -State- -Detailed_State-- 31 1:7:0 FC failed vacated,invalid_media,smart_threshold_exceeded,servicing ----------------------------------------------------- 1 total

На данном этапе физически извлекаем неисправный диск из СХД и устанавливаем новый сменный диск.

После того, как сменный диск установлен, современные версии 3PAR OS могут в автоматическом режиме запустить процедуру вывода дискового слота из обслуживания и ввода нового диска в работу. Подождав 2-3 минуты после установки диска, проверим, не запустился ли этот процесс:

% servicemag status

Если процесс на запустился автоматически, вызываем процедуру вывода дискового слота из обслуживания, указав номер полки и номер слота в полке. При этом автоматически запустится процедура восстановления диска в массиве.

% servicemag resume 1 7
Are you sure you want to run servicemag? select q=quit y=yes n=no: y Failed -- Cage 1 mag 7 'servicemag resume' was started since Tue Mar 13 17:03:56 2018 or it has been interrupted. Please run 'servicemag status -d' for further details servicemag resume 1 7 -- Failed Command failed

В некоторых случаях, как в моём примере, на данном шаге может возникнуть ошибка, однако при этом процедура восстановления всё же запустится. Подтверждение информации о том, что утилита servicemag не всегда ведёт себя адекватно можно найти и в других источниках, например в статье Storage Exploration - HP 3PAR disk replacement.

Проверить статус запущенной нами задачи можно ранее упомянутой командой (причём лучше делать это не сразу, а через несколько минут, так как планируемое время выполнения операции начинает отображаться не сразу):

% servicemag status
Cage 1, magazine 7: The magazine is being brought online due to a servicemag resume. The last status update was at Tue Mar 13 17:16:00 2018. Chunklets relocated: 6 in 1 minutes and 59 seconds Chunklets remaining: 711 Chunklets marked for moving: 711 Estimated time for relocation completion based on 19 seconds per chunklet is: 3 hours, 45 minutes and 9 seconds servicemag resume 1 7 -- is in Progress

Дожидаясь завершения процесса выполнения, посмотрим как изменился статус диска:

% showpd -failed -degraded
-Size(MB)-- ----Ports---- Id CagePos Type RPM State Total Free A B Capacity(GB) 48 1:7:0? FC 15 degraded 278528 0 ----- ----- 300 ------------------------------------------------------------------- 1 total 278528 0

Обратите внимание на то, что новый диск имеет Id отличный от того, с каким был старый диск (48 вместо 31) То есть при установке ранее неизвестного СХД диска идентификатор Id присваивается следующий по счётчику с учётом всех имеющихся в СХД дисков.

Дожидаемся завершения процедуры восстановления…

% servicemag status
Cage 1, magazine 7: The magazine is being brought online due to a servicemag resume. The last status update was at Tue Mar 13 17:16:00 2018. Chunklet relocations have completed 243 in 56 minutes and 24 seconds servicemag resume 1 7 -- is in Progress

…до тех пор, пока задание восстановления не завершится и не перестанет отображаться в статусе servicemag:

% servicemag status
No servicemag operations logged.

Осталось удостоверится в том, что неисправных дисков в СХД нет:

% showpd -failed -degraded
No PDs listed

А также убедимся в том, что новый диск, который имел идентификатор 48, теперь изменил свой идентификатор на 31, то есть «встал на своё место»:

% showpd -s 31
Id CagePos Type -State- -Detailed_State- -SedState-- 31 1:7:0 FC normal normal not_capable ---------------------------------------------------- 1 total

В завершении хочу обратить Ваше внимание на то, что выполнять подобные процедуры на СХД, имеющей контракт технической поддержки нежелательно, а лучше всё-же доверить эту работу специально обученным гражданам из HPE. Как говорится, на Ваш страх и риск :)


Дополнительные источники информации:


Проверено на следующих конфигурациях:

Версия 3PAR OS
3.2.2 (MU3)

Автор первичной редакции:
Алексей Максимов
Время публикации: 14.03.2018 11:07

Обсуждение

МихаилМихаил, 22.07.2019 12:03
Алексей, подскажите, если у полученного от HPE нового диска версия прошивки диска не соответствует заменяемому, то каким образом можно самостоятельно установить новую прошивку на 3PAR? (Техподдержку не продлили пока...).
Алексей МаксимовАлексей Максимов, 23.07.2019 10:03
Полагаю, что при замене диска СХД должна сама обновить версию прошивки. Если этого не происходит, то можно посмотреть Administrator's Manual и почитать про команду upgradepd
МихаилМихаил, 23.07.2019 14:30
Добрый день, Алексей.
Этот вопрос возник в связи с тем, что год назад на одном из HPE 3PAR StoreServ 8000 меняли диск - вместо производителя HGST, модель HCBF1200S5xeN010, 3P05 SAS, Magnetic был получен SEAGATE STHB1200S5xeN010 3P03 SAS, Magnetic. С ними процедура восстановления диска в массиве после простой физической замены не запустилась. Создали заявку в НРЕ, подключался их специалист через HPE MyRoom и устанавливал новую прошивку для диска SEAGATE. Скорее всего, для успешной замены он проверял по таблице совместимости версии прошивок на дисках, полках и самой системе, но как мне сообщили - это закрытая информация, только для сервис-инженеров HPE.
Сейчас ожидаем диск, попробуем заменить самостоятельно, в соответствии с Administrator's Manual.
А у Вас есть опыт обслуживания 3PAR без техподдержки? И как на Ваш взгляд, реально ли своими силами выстроить растянутый метро-кластер между двумя площадками на паре 3PAR+BladeSystem?
Алексей МаксимовАлексей Максимов, 30.07.2019 10:19, 31.08.2023 11:09
Михаил, я не имею опыта настройки метро-кластера, поэтому ничего подсказать не смогу в этом плане.
NN, 17.10.2019 14:47
3PAR без техподдержки - жить сложно, но можно. Растянутый метро-кластер между двумя площадками, при наличии соответствующих лицензий сделать реально. С помощью HPE будет сделано быстрее, плюс будут получены ценные советы. Спецы там оч толковые. Кстати штука в плане отказоустойчивости реально классная, проверено.
ОлегОлег, 25.07.2024 18:07
Здравствуйте.
Такая проблема: hp 3par 7200
Отмонтировал раздел с виртуалками а после того как подмонтировал обратно - раздел пустой!!!
Нужно вытащить виртуалки!
Что то похожее нашел тут: https://hddprofi.ru/vosstanovlenie-dannyh-hp-3par-storeserv-7400c/
Но пысы3000 у меня нет и они делали свой софт.
Есть у кого то опыт восстановления данных с таких или похожих 3par?
Может можно обойтись более простым путем через админку?
HELP!!!
Алексей МаксимовАлексей Максимов, 25.07.2024 18:19
https://www.google.com/search?q=резервное+копирование
ОлегОлег, 01.11.2024 11:24
Здравствуйте!
3PAR StoreServ 7200, при попытке замены degrade диска servicemag завершается с ошибкой. Есть один чанклет, который невозможно ни перенести, ни удалить. Как следствие, LD в preserved и vLUN заблокирована.
Можно восстановить работу vLUN штатными средствами?
ЮрийЮрий, 03.12.2024 13:22
Добрый день.
По незнанию, как правильно менять неисправный диск в СХД 3PAR, неисправный диск был физически извлечен из СХД и отправлен поставщику на замену по гарантии. Получил новый диск, установил на место старого. Теперь по команде showpd -failed в системе два диска. Новый диск ID не получил.
Попытался произвести замену, как здесь описано, но без неисправного диска, так как его нет в наличии. До установки нового диска всё идёт нормально, после установки нового диска получаю ошибку servicemag resume 0 22 -- Failed. Не подскажите, что можно сделать?
Команда showpdch -mov выдаёт 1109 чанклета с диска 22.
22 - id неисправного диска.
Версия 3PAR OS: 3.3.1 (MU5).
Алексей МаксимовАлексей Максимов, 03.12.2024 13:33
Здравствуйте, Юрий.
Вообще, если СХД на гарантии, то правильней обратиться с вопросом к поставщику.
А по поводу вывода из работы любого диска посмотрите эту заметку:
https://wiki.it-kb.ru/hewlett-packard/hp-3par-storeserv-7200-remove-delete-physical-disk-from-storage.
ЮрийЮрий, 03.12.2024 14:00
К поставщику обращался, но по гарантии они могут только предоставить оборудование, а произвести замену (настройку и т.п.) нет.
Про вывод любого диска заметку смотрел.
И вот здесь проблема остаётся следующая: команда showpdch -mov выдаёт 1109 чанклета.
Команда: movepdtospare -devtype -ovrd -perm -nowait 22, возвращает: There are no chunklets to move.
Команда: showpdch -spr 22, возвращает: No chunklet information available.
А команда: dismisspd 22, возвращает: Error : Pd id 22 is referenced by chunklet 0:3267
Алексей МаксимовАлексей Максимов, 03.12.2024 14:27
Вывод команды "showpdch -mov" показывает те чанклеты, которые находятся в состоянии переноса и там видно, с каких дисков на какие выполняется перенос. Этот счётчик должен уменьшаться со временем. Как я понимаю, не следует предпринимать никаких действий пока эти переносы не закончены.
ЮрийЮрий, 05.12.2024 11:15
Чанклеты показанные командой "showpdch -mov" в состоянии переноса находятся очень давно. Это видимо "зависшие" в состоянии переноса чанклеты связанные с диском 22.
Помог комментарий к вашей заметке:
https://wiki.it-kb.ru/hewlett-packard/hp-3par-storeserv-7200-remove-delete-physical-disk-from-storage
от nikonorov_d
а точнее команда movech, с её помощью перенёс чанклеты на другие диски. Единственное, процедура заняла много времени так как чанклетов было много (1109 штук), адрес каждого нужно указать в movech (как указать диапазон не нашёл, если это вообще возможно).
Диск заменил. Но теперь меня беспокоит другой момент, так как в команде я указал параметр -perm, при котором чанклеты перемещаются навсегда и исходные местоположения чанклетов не запоминаются, то и при выполнении servicemag resume чанклеты обратно на диск не вернулись. И сейчас в системе один диск практически не заполнен в то время, как остальные диски заполнены примерно равномерно.
Не знаете, можно ли как-то перераспределить информацию равномерно по всем дискам?
Алексей МаксимовАлексей Максимов, 05.12.2024 12:58
Это выравнивание не происходит моментально. Теоретически управляющий код 3PAROS со временем должен выровнять чанклеты.
Ваш комментарий:
 
hewlett-packard/hp-3par-storeserv-7200-replacing-failed-physical-disk-with-new.txt · Последнее изменение: 08.09.2023 14:10 — Алексей Максимов

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki