切片 切片 切片 切片 切片 切片 切片 切片 切片 切片 切片 编组 3 切片 切片 路径 2 download 工具 配置对比 手册 切片 切片
DXN2000G2更换元数据盘
适用机型:服务器
知识编号:4281142025-06-04
催更新

DXN2000G2更换元数据盘

 

1操作前检查

1.1 检查集群健康状态

1. 登录到 MagnaScale 的任意节点,并执行 magcli -s 命令查看当前集群的健康状态。正常情况下,集群健康状

态应显示为 ‘HEALTH_OK’,且所有 vgs 状态应为 ‘active+clean’。如果集群健康状态不是

‘HEALTH_OK’ 或有 vgs 状态不为 ‘active+clean’,请先排查并解决集群问题,确保集群状态正常。

2.2 检查集群业务压力

用户需要在业务压力较小时,进行换盘操作。

2.2.1 检查iostat 状态

登陆到集群中所有主机的后台命令行,执行“iostat -x 1”持续观察所有节点的 CPU 使用率和磁盘压力,该命令会每1s 刷新输出 iostat,建议每台主机观察 2min 左右。如果偶有超过上限的情况,属于正常现象,但如果持续保持在上限以上,则需要等待业务压力变小或暂停部分业务,直到集群业务压力满足条件。

 

检查项

推荐值

空闲CPU %idle

40以上

%util(磁盘 IO 繁忙度)

40%以下

svctm(平均每次 IO 请求的处理时间)

20 以下(单位为 ms)

await(平均 IO 等待时间)

20 以下(单位为 ms)

r_await(平均读操作等待时间)

20 以下(单位为 ms)

w_await(平均写操作等待时间)

20 以下(单位为 ms)

说明:

上述检查项及数值仅是换盘操作推荐的执行压力范围。如果业务压力较大,换盘操作会对业务造成影响。

2.2.2 检查内存使用率

登陆到集群中所有主机的后台命令行,执行“sync;echo 3 > /proc/sys/vm/drop_caches”释放 内存 cache。等待约 1 分钟,然后执行“free -m”检查内存使用率。需要满足内存使用率在 60%以下。

注:内存使用率为第一行的 used 值与内存总容量的比值。

 

3.1 适用场景

当集群中元数据盘出现异常损坏时,可以按照本章节进行更换操作。

3.2 注意事项

用户重启节点/上下电整集群后10分钟内,请勿进行换盘操作。

如果用户从槽位A拔出磁盘,管理平台会触发磁盘不在位告警,槽位A插回磁盘,该告警会自动清除;槽位B插回磁盘,该告警不会自动清除,需要用户确认并手动消除该告警。

3.3 操作步骤

1. 用户可直接将待更换的元数据盘拔掉,插入一块新的空白元数据盘。

2. 插入新盘后,系统会进行数据均衡,均衡速度大概1TB需要 1小时,数据均衡之后再执行如下命令查看集群状

态是否为“HEALTH_OK”vgs状态均为“active+clean”,集群状态健康之后,更换元数据盘操作完成。

 

magcli -s

3. 用户需要执行如下命令更新管理平台磁盘信息

dsm update-node-disks --cluster_id <集群ID>--node_name <节点名字>

示例:dsm update-node-disks --cluster_id dc28b9d4-37c3-11ed-9be1-525400781293 --node_name                  node-3

4. 磁盘信息更新成功后,用户可在管理平台节点磁盘页面查看磁盘信息。

 

 

备注:

此处为备注和补充说明

0
知识有用,就点一下~
0
收藏 :
分享 :

鐢ㄦ埛鍚嶄笉姝g‘

鐧诲綍
鍏朵粬鐧诲綍鏂瑰紡

鎵撳紑鑱旀兂鏅洪€堿pp鎵爜杩涜鐧诲綍

鎵弿鎴愬姛!

璇峰嬁鍒锋柊鏈〉闈紝鎸夋墜鏈烘彁绀烘搷浣滐紒

浜岀淮鐮佸凡澶辨晥
鍒锋柊