【hcie-cloud】【10】华为云Stack资源与服务扩建【扩容工程简介、扩容管理规模、计算资源扩容与减容】【上】
前言
-
在很多情况下,云计算的建设不是一蹴而就的,有可能会分为很多期的建设,用户根据自己的业务情况,会逐步对资源和服务进行扩容。本章将针对这种场景,重点介绍如何进行资源和服务的扩容。
-
学完本课程后,您将能够:
- 掌握如何进行计算资源的扩容
- 掌握如何进行云服务的扩容
华为云Stack扩容工程简介
扩容工程概述
- 当系统的资源不满足当前使用需求时,可以对资源或云服务进行扩容的操作
- 常见的需要对现有系统资源进行扩容的场景包括:
- 新开局场景:用户试用稳定后决定进行大规模部署,试验局一般规模较小,试验局转商用后,一般涉及管理规模的扩容
- 维护场景:用户环境使用一段时间后,资源即将用尽,或对性能有更高要求,需要通过扩容实现
- 用户希望扩容的资源数量与已有的资源数量之和,在当前管理规模内时,可通过简单的资源扩容实现
- 用户希望扩容的资源数量与已有的资源数量之和,超过当前管理规模时,扩容时需要先扩容管理规模,然后再扩容相关资源
- 新增可选云服务场景:用户需要使用更多可选云服务的功能时,可通过扩容方式快速完成可选云服务的部署
华为云Stack支持的扩容场景
- 华为云Stack支持的扩容场景如下
- 扩容管理规模
- 扩容计算资源池
- 扩容业务存储资源
- 扩容网络节点及网络服务
- 新增安装可选云服务
- 扩容备份服务资源
- 扩容管理面容灾
华为云Stack扩容基本流程
在扩容前,先评估扩容场景:扩容管理规模、扩容计算资源、扩容业务存储资源、扩容网络节点及网络服务、新增安装可选云服务、扩容备份服务资源。如果是扩容计算资源,则还需要评估是否会引起管理规模的扩大,如果是,则要先扩容管理规模,然后再扩容计算资源;其他场景下直接按照相应章节进行操作。扩容结束后,执行自动化调测,检查局点功能是否正常。
华为云Stack扩容前准备工作
-
华为云Stack扩容前准备工作
- 集成设计
- 工具、文档和软件包准备
- 硬件初始化
- 扩容前预操作
- 对接CMDB
-
集成设计,在扩容任务开始前,请获取:
- 局点安装部署阶段使用的《华为云Stack 8.1.1 集成设计套件》,并在此基础上进行扩容资源的设计。
- 局点安装部署阶段安装Global和首个AZ过程中从HUAWEI CLOUD Stack Deploy导出的参数信息汇总文件,例如《xxx_export_all_v2_CN.xlsx》。
- 局点当前的帐号密码表。
CMDB的作用
- CMDB通过接入管理获取物理资源、资源池、服务等资源信息并使用统一模型对资源进行管理,为监控、自动化等运维场景提供数据支持。
- ManageOne运维面作为统一运维管理平台,提供了强大的南向对接能力。基于从南向对接系统中抽取资源对象的告警、性能、资源等信息,对资源进行监控、统计、分析与预测,从而实现云数据中心资源的统一运维管理。
- CMDB(Configuration Management Database):即配置管理数据库,是用来存储与管理企业IT架构中设备和系统的各种数据信息,依赖相关流程保证数据的及时有效,实现信息共享,发挥配置信息的价值。通过CMDB,可以实现对物理资源、资源池、云资源、VDC、应用资源等资源的管理,为监控、运维自动化、告警等场景提供可靠的资源对象信息和数据支持。同时,CMDB还支持全方位的展示和查看资源的详情、拓扑视图、告警、性能等信息,帮助运维人员实时了解资源的运行状况,提升运维效率。
CMDB的价值
- CMDB的价值
- 标准化的运维配置平台:CMDB将多种多样的数据信息统一标准化,让信息以最简洁的方式被维护,提高配置信息的精确度。
- 自动化数据采集:与各工具配合,实现自动化对象发现和数据采集,降低人工工作量,提高数据采集效率,管控因人工误操作带来的运维风险,保证数据的及时有效。
- 准确可信的数据信息:CMDB通过多来源数据采集,并采集可信来源和预设规则的数据,避免因数据来源多存在数据冲突,提高数据的准确性。
- 开放的接口:提供丰富的接口,支持各种接口组合查询资源信息,并通过接口管理资源实例,保证使用的灵活性。
- 自定义标签类型:通过资源打标签操作,对资源对象进行标记,方便资源快速查找过滤,帮助用户进行业务分析。
- 资源360度全方位展示:以当前资源为中心,将资源的自身属性、告警、性能指标、关联上下游资源的拓扑视图及操作等信息与能力统一集中呈现,保证运维人员快速故障排查与处理。
容量阈值灵活设置:当系统默认的容量阈值告警规则无法满足要求,管理员可根据需要自定义阈值规则,自定义规则可以指定具体的区域、AZ等作用范围,并可针对不同的告警级别设置阈值。
CMDB应用场景
-
CMDB应用场景
- 支撑运维业务
- 支撑安装升级
- 资源管理
- 故障定界定位
- 容量预测和规划
- 协助业务资源利用率统计
-
支撑运维业务:系统支持多来源的数据采集,提供数据调和和数据校验机制,控制CMDB数据写入口,避免产生不符合要求的数据,为监控、自动化、告警等场景提供可靠地资源对象信息和数据支持。
-
支撑安装升级:安装升级工具在新建安装时,存入部署信息,扩容/升级时从CMDB获取已有信息,完成扩容/升级后再存入新数据,保证CMDB及时获取数据,并支持数据消费。
-
资源管理:对物理资源、云资源、资源池、应用资源等资源进行统一管理,支持资源合并、资源打标签和建立资源间关系。
-
故障定界定位:当运维人员通过用户报障、告警通知或日常巡检发现应用故障时,使用资源仓库中的资源详情、拓扑视图、告警、性能等信息,帮助运维人员分析故障发生时的业务影响状态及范围,快速进行故障排查与处理。
-
容量预测和规划:了解计算、存储、网络等基础资源的容量信息和容量使用的历史趋势,预测容量瓶颈,做好容量规划和扩容。
-
协助业务资源利用率统计:一类业务往往包含多种业务资源类型,业务团队在运营业务过程中希望了解各个业务系统的资源使用情况,从而保证资源的合理利用。通过标签管理能够对资源对象实现便捷的业务类型标记,方便资源按照业务维度分类查找;结合报表等数据可视化能力,实现对业务资源的性能与利用率的详细分析。
对接CMDB的步骤
-
对CMDB功能介绍
- 是所有IT资产的参考点
- 在管理IT资产时提供可见性和透明度
- 允许跟踪IT基础设施架构中的更改
- CMDB有助于知识管理过程
-
为什么要对接CMDB
- 组件依赖关系管理与查询
- 配置参数管理与同步
- 安装自动化
- 安装错误定位定界
-
CMDB代表配置管理数据库,通常被称为任何ITSM系统的心脏
-
参考点:
- 组织拥有哪些硬件类型
- 特定软件许可证的确切用途是什么
- 有多少个版本的软件
- 分配给离开组织的用户的资产有哪些
-
在管理IT资产时提供可见性和透明度
- 组织具有有机实体的特征,它成长并且高度复杂。 随着增长,IT基础架构也很难保持跟踪。
- 记录谁拥有什么,每个资产面临的问题,并通过清晰地了解许可证使用情况进行风险评估,这就是CMDB如何使IT管理员的工作变得更加轻松
-
CMDB有助于知识管理过程,强大的知识管理需要高质量的数据输入。 使用适当的CMDB,可以在知识库中建立大量解决方案
- CMDB具有外来资产与事件,问题和变更管理的关系记录,允许对任何问题进行根本原因分析。
- 它维护对资产所做的所有更改的日志,以使技术人员能够识别不良更改。
- CMDB保存资产的属性详细信息,使技术人员可以方便地访问它们。
扩容管理规模
扩容管理规模概述
-
在扩容前,评估待扩容的扩展管理节点数量和管理存储容量
-
在扩容管理规模时,需要先完成管理存储的扩容或迁移,然后再进行管理规模的扩容
-
在扩容前,评估待扩容的扩展管理节点数量和管理存储容量
-
在扩容管理规模时,需要先完成管理存储的扩容或迁移,然后再进行管理规模的扩容
扩容/迁移管理存储流程及关键点说明
-
管理存储采用本地盘
- 需要先完成从本地盘到SAN存储或融合存储的迁移
-
管理存储采用融合存储
- 若管理存储资源不足,需要新增扩展管理节点服务器
-
管理存储采用SAN存储
- 待扩容的容量需要参考标准化配置和现网实际使用情况进行计算
-
本地盘
- 新建SAN存储池或新建华为分布式块存储池
- 迁移管理虚拟机
-
管理节点与存储融合部署时
- 如果管理存储资源不足,需要新增扩展管理节点服务器
- 完成新存储池扩容,但扩容规模时,原有组件默认在原存储池内扩容,原存储池存在资源不足的可能,完成不同场景下虚拟机或远端存储迁移到新存储池的操作,保证原有组件有足够的扩容空间
Global不同规模最低需求
Global管理规模 | 最低容量(G) | 原/目标存储池管理节点最低数量(台) |
---|---|---|
500vm规模 | 7970 | 3 |
1000vm规模 | 7970 | 3 |
2000vm规模 | 7970 | 4 |
5000vm规模 | 11820 | 5 |
10000vm规模 | 18620 | 6 |
30000vm规模 | 23570 | 6 |
OpenStack不同规模最低需求
OpenStack管理规模 | 最低容量(G) | 原/目标存储池管理节点最低数量(台) |
---|---|---|
500vm规模 | 4500+360+160 | 3 |
1000vm规模 | 4500+360+160 | 3 |
2000vm规模 | 4500+900+160 | 4 |
5000vm规模 | 4500+1500+160 | 5 |
10000vm规模 | 4500+1500+240 | 6 |
20000vm规模 | 4500+1500+300 | 7 |
新增扩展管理节点LLD重点参数说明
-
OpenStack管理&存储平面
- 管理存储网络平面起始结束地址:management_storage_data_range
- Management_Storage_Data的起始结束地址,使用英文中横线“-”进行分隔
- 管理存储网络平面起始结束地址:management_storage_data_range
-
管理存储网络平面的子网掩码:management_storage_data_netmask
- Management_Storage_Data的子网掩码
-
管理存储网络平面的VLAN ID:management_storage_data_vlan_id
- Management_Storage_Data的VLAN值
-
参数
- Management_Storage_Data的起始结束地址,使用英文中横线“-”进行分隔,如果业务存储为fusionStorage且未规划Service_storage_data,需要保证与fusionstorage_service_range不冲突。新增扩展管理节点,新增管理网络子网场景下,请与1.2管理网络规划表中填写的storage_data0的网段保持一致
- Management_Storage_Data的子网掩码
- Management_Storage_Data的VLAN值
-
当组网是单核心组网时,管理节点存储、计算节点存储、存储节点存储推荐共用Management_Storage_Data平面;
-
当组网是双核心组网时,仅管理节点存储单独使用Management_Storage_Data平面,计算节点与存储节点的存储平面需要单独规划Service_Storage_Data平面
扩容管理系统规模
- 扩容管理规模,需要先获取当前全局业务规模、Region区业务规模,并确定扩容后全局业务规模、Region区业务规模。
- 如果涉及多个区域的规模扩容,则需要按照上述原则进行组合操作,比如Region区业务规模和全局业务规模都扩容,则需要执行扩容OpenStack规模、扩容云服务规模
计算资源扩容与减容
计算资源扩容
扩容计算资源场景
- 扩容计算资源场景
- 新建Region
- 新建AZ
- 增加计算节点
新建Region简介
- 客户对不同业务组网物理安全隔离需要用独立的 Region 来承载不同的业务
- 新建Region可以有主、备和从等不同的Region类型
- 扩容Region前,需检查新建Region中规划的云服务(除网络服务),是否在主Region已部署该云服务前端组件(前后端分离的云服务)或服务本身(前后端未分离的云服务)
- 若未部署,先在主Region中完成云服务前端组件(前后端分离的云服务)或服务本身(前后端未分离的云服务)的扩容,否则在新建Region中不能部署该服务
新增容灾Region特性简介
-
如图,说明见后面
-
启用CSHA+CSDR特性
在CSHA(云服务器高可用)+CSDR(云服务器容灾)场景下部署时需开启 -
启用CSDR
在CSDR (含CSDR+VHA)场景下部署时需开启 -
启用CSHA特性
在CSHA场景下部署时需开启 -
启用VHA(虚拟硬盘高可用)特性
在VHA场景下部署时需开启 -
启动管理面两地三中心
在管理面两地三种心场景时,主备Region都开启 -
启用管理面跨Region容灾
在容灾主Region和备Region都开始 -
待新增Region为容灾从Region“必须关闭
在安装容灾备Region的首个AZ时必须关闭
新建AZ简介
- 新建AZ是指完成Global和首个AZ的安装后,在当前局点增加新的AZ供用户使用
- 新增的AZ可以选择x86架构,也可以选择ARM架构
- 新建AZ可使用HCSD自动化完成
- 新建的AZ可与首个AZ共用华为分布式块存储存储池,但不可以共享SAN存储池
- 新建的AZ可以与首个AZ共用相同的网络出口,也可以不同
- 一个华为分布式块存储存储池最多3个AZ共享使用。
- 多AZ共用存储池时,每个AZ的存储后端,瘦分配比务必保持相同,否则当存储可用容量变少后,瘦分配比低的AZ会无存储空间可分配
- 部署了管理面跨AZ高可用后,云平台的网络出口类型默认采用“主备出口”
- 在多出口场景下,每个物理出口需要配置各自的网络节点(每套网络节点2节点起配),每个出口之间的网络节点没有关系,是两套独立的网络集群,网络服务相关的网络平面每个出口都需要单独规划,且保证网络不冲突。
- 在主备出口场景下,只部署一套网络集群,一套网络集群拉远部署在两个站点,每个站点2台网络节点起配。主备出口适用于容灾切换或跨站点热迁移后虚机IP地址保持不变、容灾切换后EIP地址保持不变等场景。
- 企业内部接入中L3GW,L2BR不支持主备出口
- 随着规计算模扩容,网络带宽评估后仍然满足业务需求时,网络出口无需扩容,选择“不扩容网络出口”,否则需要根据当前已有网络出口类型选择对应的扩容网络出口方式。当前网络出口为主备出口时,扩容需要选择扩容主备出口;若当前为多出口场景,扩容需要选择扩容多出口
新增AZ LLD表中重点参数说明
-
网络集群出口标识
- 不扩容网络出口
-
需指定网络集群出口标识
- 扩容主备出口
-
设置Inter_Connect网络
- 指定待扩容网络集群出口标识
-
扩容多出口
- 设置新网络集群出口信息
-
当前新增AZ资源是需要与外界网络连通,因此需要有对应网络出口。所以新增AZ时,选择“不扩容网络出口时”,需要对应指定当前环境已有的某个网络集群出口标识。
-
已使用的集群出口编号查找方法:登录ManageOne运维面,进入资源拓扑->资源管理->资源列表->系统资源页面搜索VPC找到当前region下的VPC服务,点击该服务,在资源信息中,扩展参数列表键值为cluster_group_id的值就是当前region已使用的集群出口编号
-
Inter_Connect网络平面与与Tunnel_Bearing三层互通,是BR网元使用的公网地址网段。
-
Inter_Connect是BR连接处网的互连平面,用于Internet流量接入
-
在主备出口时,每个DC独立规划一个网段
新增计算节点简介
-
新增计算节点,可以是KVM类型,可以是BMS类型
-
新增BMS类型下的分布式场景,涉及SDI卡扩容
-
新增计算节点,架构需和AZ的架构保持一致
-
新增计算节点可以使用HCSD完成
-
新增SDI计算节点:是在裸金属的分布式网关扩容场景下,在新增裸金属服务器节点后,需要对其分布式网关进行扩容
-
SDI的含义,software define infrastructure (软件定义架构)。是面向云计算裸机部署场景推出的一种智能网卡,主要是为了解决裸机部署场景下共享分布式存储遇到的存储网络安全问题。
-
新增MCS计算节点:当:MCS业务计算资源不够时,需要扩容对应的MCS计算节点。
-
系统容器(MCS:Machine Container Service)是以容器技术为基础的轻量级主机虚拟化技术。系统容器提供与虚拟机一致的行为,拥有完整的 GuestOS,具有更轻量、更易分发、性能更高、损耗更小的特点。在HCS中,MCS仅提供创建、开机、关机、resize/live-resize,监控等基本操作
新增节点计算LLD表中重点参数说明
-
单个计算节点的虚拟机个数:openstack_vm_per_node
- 在【设备信息】中存在【设备用途】为dpdk的计算节点,必填写,否则可选填写
- 默认值为10,用于计算节点的资源隔离配置和预留cpu数量
-
业务主机组的CPU复用比:aggregate_cpu_allocation_ratio
- 非必填
- 新增业务主机组的CPU复用比,业务主机组名称和复用比之间用“:”分隔,不同业务主机组名称之间用“,” 分隔,不能包含空格
- 主机组名称必须为设备信息中业务主机组一个或者多个,CPU复用比支持配置为1/2/3三种,不配置的主机组默认CPU复用比为3
-
openstack_vm_per_node
请在部署前确认单个计算节点上部署虚拟机的最大个数,每增加10个VM,会导致IaaS层资源管理消耗增加2个vcpu。该值配置越大,IaaS层管理消耗vcpu数量需求越大,同时业务虚拟机可用的vcpu数量越少,建议用户根据每个主机上的vcpu总数和实际业务需求谨慎规划
计算资源减容
计算减容背景介绍
-
计算减容场景
- AZ内的计算资源占用率持续较低
- 业务设计或计划变更
-
当AZ内的计算资源占用率持续较低时,可将主机上的计算资源迁移至其他主机,并在AZ内删除该主机
-
当现网部署了多AZ后又不想使用时,对AZ进行减容,仅保留首个AZ
-
减容操作无回退方案,减容/删除后数据无法恢复,请谨慎操作
-
非必要不减容,可以适当通过控制VDC配额镜像资源重新分配,让资源重新在内部盘活
AZ内减容主机介绍
- 当AZ内的计算资源占用率持续较低时,可将主机上的计算资源迁移至其他主机,并在AZ内删除该主机
- 不支持控制节点的主机减容
- 减容前,若待减容节点上有重要角色,需完成角色迁移
- 减容前,待减容主机需运行正常
- 减容前,需明确并获取待减容主机的主机名ID
AZ内减容主机流程
-
AZ内减容主机流程
- 登陆ServiceOM,找到待减容主机
- 在ServiceOM上,完成虚拟机进行热迁移
- 在ServiceOM上,待减容主机安全下电
- 登陆OpenStack控制节点,解除主机锁定状态
- 在ServiceOM上,OpenStack告警批量清除
- 在ServiceOM和CPS上移除被减容的主机
-
迁移注意事项
- 迁移虚拟机时,需要逐个虚拟机进行迁移,即一个虚拟机迁移成功后,再迁移下一个
需等所有虚拟机均迁移完成后,才能继续执行下面的步骤。 - 对于无法热迁移的虚拟机,请选择“更多 > 冷迁移”。
- 迁移虚拟机时,如果界面显示“保持原亲和性规则”的勾选框,说明此虚拟机之前配置过亲和性规则,则在迁移时需要将此勾选。
- 迁移虚拟机时,需要逐个虚拟机进行迁移,即一个虚拟机迁移成功后,再迁移下一个
-
主机下电
- 如果主机未加入到Service OM界面中进行管理,则需要手动对主机进行下电
- 下电主机约需5分钟,当主机的“服务状态”变成“故障”时,可再PING主机的IP地址,如果无法PING通,则表明主机下电完成。
-
使用PuTTY,通过External OM平面IP地址登录OpenStack控制节点
裸金属服务器减容介绍
- 裸金属服务不需要使用某一裸金属服务器时,需要从系统中删除该裸金属服务器实例及裸金属服务器节点信息
- 减容分为在集中式和分布式两个场景
- 减容前,需要先明确并获取待减容BMS节点的BMC IP地址
- 减容前,需确保待减容BMS节点和控制节点在BMC平面互通
裸金属服务器集中式网关场景减容
-
裸金属服务器集中式网关场景减容
- 登录ServiceOM,找到待减容主机
- 在ServiceOM上,找到待减容裸金属服务器节点,并获取实例名称ID
- 在ServiceOM上,删除裸金属服务器实例
- 在ServiceOM上,删除裸金属服务器
-
裸金属服务器实例删除操作一般需要3~5分钟
裸金属服务器分布式网关场景减容
- 裸金属服务器分布式网关场景减容
- 登录ServiceOM界面,找到待减容主机
- 在ServiceOM上,进入配置页面,获取待减容裸金属服务器的SDI卡管理IP
- 在ServiceOM上,删除裸金属服务器
- 登录FusionSphere CPS界面,依据SDI卡管理IP删除SDI卡
- FusionSphere CPS为FusionSphere Openstack安装部署UI界面
云服务扩容、自动化变更平台&公共服务组件、华为云Stack典型高阶服务扩容简介、缩略词
看下面这篇文章
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!