【运维面试100问】(七)ceph基础题面试
??本站以分享各种运维经验和运维所需要的技能为主
《python零基础入门》:python零基础入门学习
《python运维脚本》:?python运维脚本实践
《shell》:shell学习
《terraform》持续更新中:terraform_Aws学习零基础入门到最佳实战
《k8》暂未更新
《docker学习》暂未更新
《ceph学习》ceph日常问题解决分享
《日志收集》ELK+各种中间件
《运维日常》运维日常
《linux》运维面试100问
问题:
ceph的概念,各个角色,怎么使用,举例12台机器怎么分配mon/mgr/osd这些,最大宕机数多少,以及纠错码的含义
Ceph 是一个分布式存储系统,具有高可靠性、可扩展性和性能的特点。它包含多个角色,包括 Monitor(监视器)、Manager(管理器)和 OSD(对象存储守护程序)。下面是对这些角色的简要说明:
Monitor(监视器):监视器维护了集群的状态信息,包括存储映射、健康状况和集群配置等。通常建议至少部署 3 个 Monitor 实例以确保高可用性。
Manager(管理器):管理器负责集群的管理和监控,提供诸如性能统计、日志分析、调度等功能。通常建议至少部署 1 个 Manager 实例。
OSD(对象存储守护程序):OSD 是实际存储数据的组件,负责将数据分布在集群中的多个节点上,并处理数据的读写请求。通常每个节点都会部署一个或多个 OSD。
对于您提到的 12 台机器,以下是一种可能的分配方式:
Monitor:至少部署 3 个 Monitor 实例,可以将它们分配在不同的节点上,例如节点 1、节点 2 和节点 3。
Manager:部署 1 个 Manager 实例,可以选择其中一个节点,例如节点 1。
OSD:剩余的 9 台机器可以用于部署 OSD。您可以根据具体的硬件配置和性能需求来决定每个节点上部署的 OSD 数量。例如,您可以在每个节点上部署 2 个 OSD,其中节点 4-6 部署 2 个 OSD,节点 7-9 部署 2 个 OSD。
关于最大宕机数,Ceph 的设计目标是在集群中容忍多个节点的故障。通常情况下,Ceph 可以容忍多个 OSD 和 Monitor 的故障。具体的最大宕机数取决于集群的配置和副本数设置。例如,如果您将数据配置为具有 3 个副本,那么即使有 2 个 OSD 或 Monitor 失效,集群仍然可以继续正常运行。
如果您在 Ceph 中使用纠错码(Erasure Coding),则会有额外的角色和配置要考虑。
纠错码是一种在数据分布中引入冗余以实现数据容错的技术。在 Ceph 中,Jerasure 和 ISA-L 是两种常用的纠错码实现方式。
在纠错码配置中,除了 Monitor、Manager 和 OSD 角色外,还涉及到以下两个角色:
CRUSH Map Builder(CRUSH 映射构建器):CRUSH 是 Ceph 中用于数据分布和故障域管理的算法。CRUSH Map Builder 用于构建和维护 CRUSH 映射规则,以确保数据块的正确分布和冗余。
Erasure Code Profile(纠错码配置文件):纠错码配置文件定义了纠错码的参数,如数据块数量、纠错码片段数量、冗余度等。您可以根据需求创建并配置不同的纠错码配置文件。
对于 12 台机器的例子,纠错码的分配方式可能如下:
Monitor:至少部署 3 个 Monitor 实例,例如节点 1、节点 2 和节点 3。
Manager:部署 1 个 Manager 实例,例如节点 1。
OSD:剩余的 9 台机器可以用于部署 OSD。您可以根据性能需求和纠错码配置来决定每个节点上部署的 OSD 数量。
CRUSH Map Builder:CRUSH Map Builder 角色通常不需要单独的节点,而是在 Monitor 或 Manager 节点上执行。
Erasure Code Profile:您需要根据纠错码的要求创建并配置相应的纠错码配置文件,并将其应用到 Ceph 集群中。
关于最大宕机数,纠错码的具体容错能力取决于纠错码的配置和参数设置。通常情况下,纠错码可以容忍多个 OSD 或节点的故障,具体的容错能力取决于纠错码的设置和冗余度。
例子:
对于 EC(Erasure Coding) 4+4 的配置,其中有 4 个节点,每个节点有 42 个 OSD。在这种情况下,我们可以分析最大的 OSD(对象存储守护程序)宕机数。
EC 4+4 表示数据被分为 4 个数据块和 4 个纠错码块。在 Ceph 中,纠错码块用于恢复数据,当某个 OSD 宕机时,可以使用纠错码块来重建数据。
在这种配置下,最大 OSD 宕机数取决于两个因素:
数据块的数量:在 EC 4+4 的配置中,有 4 个数据块。这意味着最多可以同时宕机 4 个 OSD,而不会导致数据丢失。
纠错码块的数量:同样,EC 4+4 的配置中有 4 个纠错码块。这意味着即使有 4 个 OSD 宕机,仍然可以通过纠错码块来恢复数据。
综上所述,对于 EC 4+4 的配置,最大 OSD 宕机数为 4。这意味着在最坏的情况下,最多可以同时宕机 4 个 OSD,而不会导致数据丢失。
需要注意的是,这是一种理论上的计算。实际上,Ceph 的容错能力还受到其他因素的影响,如网络故障、硬件故障等。
?
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!