飘逸的米饭 · kafka(启动集群,集成spring,自定 ...· 2 周前 · |
逆袭的小笼包 · 认识、使用C++vector和array-阿 ...· 3 月前 · |
风流倜傥的火车 · 池化层详细介绍-CSDN博客· 6 月前 · |
拉风的蘑菇 · ClickHouse ...· 7 月前 · |
阳刚的小狗 · numpy.where() in ...· 1 年前 · |
暗恋学妹的饼干 · javascript - JS ...· 1 年前 · |
nsx 集群服务器 |
https://docs.vmware.com/cn/VMware-NSX-T-Data-Center/3.1/rn/VMware-NSX-T-Data-Center-31-Release-Notes.html |
绅士的创口贴
1 年前 |
NSX-T Data Center 3.1 包含一系列新特性,为私有云、公有云和多云环境的虚拟化网络连接和安全提供多种新功能。主要特性和增强功能涵盖以下重点领域:
除了这些增强功能以外,在产品的每个部分中还添加了很多其他功能。在 NSX-T Data Center 3.1.0 版本中提供了有关 NSX-T 3.1 新功能和增强功能的更多详细信息。
更改 TCP/IP 栈的显示名称 : 网络栈键仍为“vxlan”和“hyperbus”,但 UI 中的显示名称现在为“nsx-overlay”和“nsx-hyperbus”。
L2 网桥监控和故障排除改进
在不同的子网中支持 TEP 以充分利用不同的物理上行链路
传输节点可能具有多个主机交换机,这些交换机连接到多个覆盖网络传输区域。不过,所有这些主机交换机的 TEP 需要具有位于同一子网的 IP 地址。已消除该限制,以允许将不同的主机交换机固定到属于不同 L2 域的不同物理上行链路。
改进了 IP 发现和 NS 组 :IP 发现配置文件现在可以应用于 NS 组,从而简化了防火墙管理员使用它们的过程。
策略 API 增强功能
BGP 增强功能
NSX-T 3.1 是一个提供多播的主要版本,它扩展了其功能集并确认了其企业部署就绪状态。
防火墙可用性功能
分布式 IPS
有关兼容性和系统要求信息,请参见 《NSX-T Data Center 安装指南》 。
未分配的标记的保留期 :在 NSX-T 3.0.x 中,系统在 5 天后自动删除分配了 0 个虚拟机的 NSX 标记。在 NSX-T 3.1.0 中,系统任务已修改为每天运行,从而清理时间超过一天的未分配标记。无法通过手动方法强制删除未分配的标记。
请参见 code.vmware.com 以使用 NSX-T Data Center API 或 CLI 实现自动化。
NSX-T Data Center 已本地化为多种语言:英语、德语、法语、日语、简体中文、韩语、繁体中文和西班牙语。由于 NSX-T Data Center 本地化使用浏览器语言设置,因此,请确保您的设置与期望的语言相匹配。
2020 年 10 月 29 日。第一版。
2020 年 11 月 13 日。第二版。添加了已知问题 2659168、2655295、2658950、2609681、2562189、2657943、2550492、2653227、2636771、2637241、2658092、2643610、2658199、2555383、2658713、2662225、2610851、2652154、2622576、2587257、2659234、2622846、2656929、2587513、2639671、2645877。
2021 年 3 月 11 日。第三版。在“新增功能”中添加了对 L3 网络的 BGP 增强功能。
2021 年 4 月 22 日。第四版。在“新增功能”中添加了对 Edge 平台和服务的 Edge 网络性能改进。添加了已知问题 2738345 和 2740587。添加了已解决的问题 2628121。
2021 年 9 月 17 日。第五版。添加了已知问题 2761589。
对于运行 ESXi 6.5-U2/U3 和/或 6.7-U1/U2 的主机,在维护模式升级到 NSX-T 2.5.1 时,如果在移出虚拟机后发现主机上存在失效的 DV 筛选器,则主机可能会重新引导。
由于 ESXi 主机上 bootbank 中的空间不足,导致无法安装 NSX-T VIB,并返回 BootBankInstaller.pyc:错误。第三方供应商提供的某些 ESXi 映像可能包括未使用的 VIB(可能相对较大)。在安装/升级任何 VIB 时,这可能会导致 bootbank/alt-bootbank 中的空间不足。
如果在已连接的网关上未配置 DHCP 时尝试在分段上配置网关 DHCP,因为没有要保存的有效 DHCP,所以无法应用 DHCP 配置文件。
通过使用全局管理器,可以创建包含在管理器模式下创建的 IP 集的组。将接受配置,但不会在本地管理器上实现组。
通过 VPN 的流量将在对等端丢弃。IPSec 重放错误将会增加。
在集群中重新添加同一主机后,不会在 NSX 中创建服务实例,即使主机上存在服务虚拟机也如此。部署状态将显示为成功,但将关闭对给定主机的保护。
在 NSX 中将 vCenter 注册为计算管理器时,即使在 vCenter 上创建了“com.vmware.nsx.management.nsxt”扩展,NSX-T 中的计算管理器注册状态仍然是“未注册”。vCenter 上的操作(比如自动安装 Edge 等)无法使用 vCenter Server 计算管理器来执行。
与 CLI 输出相比,从 UI 下载的路由表具有额外数量的路由。从策略下载的输出中列出了一个额外的路由(默认路由)。这对功能没有任何影响。
升级期间,在简化的 UI(或策略 API)上创建的任何现有路由映射和规则都将替换直接在高级 UI(或 MP API)上完成的配置。
会话定时器设置不起作用。连接会话(例如 tcp established 和 tcp fin wait)将使用其系统默认会话定时器,而不是自定义会话定时器。这可能会导致建立连接 (tcp/udp/icmp) 会话的时间比预期更长或更短。
最近生成的警报不会反映在管理器实体屏幕上。
由于 UDP 数据包中的校验和错误,导致流量被丢弃。
尝试登录的用户将被拒绝访问 NSX。
在某些极端情况下,不会生成计划的备份。
在 Kubernetes pod 上配置 L7 规则后,应匹配 L7 规则的流量反而会达到默认规则。
使用具有 PNIC 安装和卸载映射的传输节点配置文件创建传输节点时,PNIC 将从 VDS 迁移到 NVDS。稍后从传输节点中移除 NSX-T Data Center 时,PNIC 将迁移回 VDS,但 PNIC 至上行链路的映射可能不同于 VDS 中的原始映射。
从 NVDS 到 CVDS 的迁移将失败,并且主机将保持处于维护模式。
无法使用 NVDS 到 CVDS 迁移工具来迁移使用 NVDS 的传输节点。
在负载均衡器上的大量虚拟服务器中配置源 IP 持久性后,会消耗大量内存,并且可能导致 NSX Edge 内存不足。但是,如果添加更多虚拟服务器,可能会再次出现该问题。
从备份中还原 CSM 设备时,在“还原”向导中输入备份文件服务器的详细信息后,UI 中却不显示备份列表,即使备份在服务器上可用也不会显示。
全局管理器与站点的通信受到影响。
NAT 规则在 UI 中仍然可见,但处于灰显状态。您必须等待系统清理这些规则,然后才能创建具有相同名称的 NAT 规则。使用不同名称时则不受影响。
对于同时提供 DNS/DHCP 服务和单臂 LB 服务的 Tier-1 网关,系统将阻止载入操作。阻止载入操作属于预期行为。
UI 中显示的关于可行解决方案的文本仅涉及 DHCP 服务。但同样的解决方案也适用于 DNS 服务。
如果在 Linux OS 中创建一个绑定接口,然后在 NSX 上行链路配置文件中使用该接口,将会看到以下错误消息:“创建传输节点可能会失败”(Transport Node creation may fail)。出现该问题是因为,VMware 不支持 Linux OS 绑定。不过,VMware 在裸机服务器传输节点中支持 Open vSwitch (OVS) 绑定。
如果服务虚拟机部署在恰好包含两个主机的集群中,则具有反关联性规则的 HA 对将会在执行任何维护模式任务期间阻止虚拟机对其他主机执行 vMotion。这可能会阻止主机自动进入维护模式。
如果在重新分发规则中使用管理平面 UI/API 添加了路由映射,并在简化的(策略)UI/API 中修改了相同的重新分发规则,则将会移除该映射。
“上下文配置文件”页面显示以下错误消息:“此上下文配置文件使用不支持的 APP_ID - [<APP_ID>]。请在确保任何规则中均未使用此上下文配置文件后,手动将其删除。”这是由于升级后存在六个已弃用且在数据路径上已无效的 APP_ID(AD_BKUP、SKIP、AD_NSP、SAP、SUNRPC 和 SVN)所导致的。
在某些配置中,如果两个安全组配置了相同的动态条件,在极少数情况下,可能不会将与条件匹配的计算虚拟机添加到安全组中。
已知问题分为以下几类。
为新添加的数据存储添加第三方虚拟机后,即使可以通过集群上的所有主机来访问该存储,也会出现“服务部署无法访问存储” 错误。该错误状态持续长达三十分钟的时间。
在三十分钟后重试。作为替代方法,进行以下 API 调用以更新数据存储的缓存条目:
https://<nsx-manager>/api/v1/fabric/compute-collections/<CC Ext ID>/storage-resources?uniform_cluster_access=true&source=realtime
其中 <nsx-manager> 是服务部署 API 失败的 NSX Manager 的 IP 地址,< CC Ext ID> 是集群中正在尝试执行部署的 NSX 标识符。
不支持在同一 Edge 节点上两次桥接一个分段。但是,可以将两个 VLAN 桥接到两个不同 Edge 节点上的同一分段。
解决办法:无
在 Microsoft Azure 中,如果在基于 RedHat(7.4 或更高版本)或 CentOS(7.4 或更高版本)的操作系统上,启用加速网络连接并在其中安装 NSX 代理,那么以太网接口不包含 IP 地址。
解决办法:在 Microsoft Azure 中启动基于 RedHat 或 CentOS 的虚拟机后且在安装 NSX Tools 之前,请安装 https://www.microsoft.com/en-us/download/details.aspx?id=55106 上提供的最新 Linux Integration Services 驱动程序。
具体来说,可以在“高级”界面“分布式防火墙排除列表”设置中删除作为分布式防火墙排除列表的一部分添加的组。这会导致界面中出现不一致的行为。
解决办法:使用以下过程来解决此问题:
您当前可以在 Type-0 编码和 Type-0 编码中配置手动路由标识。但是,强烈建议使用 Type-1 编码方案在 EVPN 部署中配置手动路由标识。此外,仅允许手动路由目标配置的 Type-0 编码。
解决办法:仅为路由标识配置 Type-1 编码。
在具有“外部 LB”的 NSX 上启用 VMware Identity Manager 集成后,如果您尝试通过关闭“外部 LB”来禁用集成,则在大约一分钟后,初始配置将重新出现并覆盖本地更改。
解决办法:尝试禁用 vIDM 时,请勿将外部 LB 标记切换为关闭状态;仅将 vIDM 集成切换为关闭状态。这会将该配置保存到数据库并同步到其他节点。
如果在具有虚拟 IP 的集群上配置了 VMware Identity Manager,则禁用虚拟 IP 不会导致在整个集群中清除 VMware Identity Manager 集成。如果禁用了 VIP,则必须在每个单独的节点上手动修复 vIDM 集成。
解决办法:分别访问每个节点,手动修复每个节点上的 vIDM 配置。
通过在管理器 N2 上发出“join”命令尝试将管理器 N2 加入到管理器 N1 时,join 命令失败。您无法形成管理平面集群,这可能会影响可用性。
解决办法:
在多节点集群上启动还原时,还原会失败,您必须重新部署该设备。
解决办法:部署新的设置(一个节点集群),然后启动还原过程。
对 nsx-policy-manager 的 API 调用将开始失败,并且服务不可用。直到策略管理器重新启动并变为可用之后,您才能访问该管理器。
解决办法:调用最多包含 2000 个对象的 API。
分段的整合状态将仍为“错误”。这是由于在给定 NSX 站点上创建网桥端点失败所导致的。您将无法在通过全局管理器创建的分段上成功配置 BridgeProfile。
解决办法:在 NSX 站点创建分段,并使用网桥配置文件对其进行配置。
这对功能没有任何影响。这条错误消息不正确,应报告 DHCP 服务器未配置。
解决办法:无。
用户身份验证失败,并且用户无法登录到 NSX 用户界面。
解决办法:无。
从 vCenter 中删除已启用 IDFW/IDS 的集群时,不会通知 NSX 管理平面所需的更新。这会导致启用了 IDFW/IDS 的集群的计数不准确。这对功能没有任何影响。只有启用的集群的计数是错误的。
解决办法:无。
您不能将具有 LDAP CDP 的 CA 签名证书用作集群/tomcat 证书。
解决办法:请参见 VMware 知识库文章 78794 。
主机迁移页面上显示以下错误消息:
在主机迁移期间预迁移阶段失败 [原因: [vMotion] 无法继续迁移: 对虚拟机 b'3-vm_Client_VM_Ubuntu_1404-shared-1410' 执行 vMotion 操作的尝试次数达到上限] (Pre-migrate stage failed during host migration [Reason: [Vmotion] Can not proceed with migration: Max attempt done to vmotion vm b'3-vm_Client_VM_Ubuntu_1404-shared-1410'])。
解决办法:重试主机迁移。
在还原的设备上看不到任何备份后完成的 TNP 更新。
解决办法:在对 TNP 进行更新后进行备份。
NSX Manager 节点获得新 IP 时,由于搜索不同步,策略搜索失败。
解决办法:确保所有 NSX Manager 的 DNS PTR 记录(DNS 服务器中的 IP 到主机名映射)正确无误。
对于无状态 ESX 主机,如果 NVDS 交换机上具有 VMK,则将无法使用 NVDS 到 CVDS 交换机迁移程序进行迁移。
解决办法:将 VMK 从 NVDS 中迁移出来或者从 NSX 中移除该主机,然后再执行迁移。
系统将为每个原始传输节点配置文件生成一个额外的传输节点配置文件。
解决办法:无。
迁移失败,但未显示失败(DHCP 插件异常)原因。
解决办法:回滚迁移,然后重试。
创建的备份太多,因为即使没有进行配置更改,也会创建备份。
解决办法:增加与该选项关联的时间,从而降低创建备份的速度。
API LDAP 身份验证无法可靠地工作,并且仅在负载均衡器将 API 请求转发到特定管理器时才有效。
解决办法:无。
这样做不会向 DC 网关(对等项 BGP 路由器)通告 TIER0_EVPN_TEP_IP。在 Tier-0 VRF LR 路由重新分发中,您可以选择“TIER0_EVPN_TEP_IP”以作为类型,但在 Tier-0 VRF LR 上没有“TIER0_EVPN_TEP_IP”的路由。
解决办法:在父 Tier-0 LR(而不是 VRF Tier-0 LR)的路由重新分发中选择“TIER0_EVPN_TEP_IP”,并移除从 VRF Tier-0 LR 中选择它的选项。
PATCH API 调用无法更新 BGP 路由配置实体,并显示“BGP 服务路由器间路由需要启用全局 BGP 和 ECMP 标记”(BGP inter SR routing requires global BGP and ECMP flags enabled) 错误消息。不会更新 BgpRoutingConfig。
解决办法:在 PATCH API 调用中指定 inter_sr_ibgp 属性,以允许更改其他字段。
UA 节点停止接受任何新的 API 调用,并显示“某些设备组件未正常运行”(Some appliance components are not functioning properly) 消息。大约有 200 个连接卡在 CLOSE_WAIT 状态。这些连接尚未关闭。将拒绝新的 API 调用。
解决办法:重新启动 proton 服务 (service proton restart) 或重新启动 Unified Appliance 节点。
不会在 Edge 和管理平面上实现该规则。
解决办法:对于 source-network/destination-network/translated-network 属性,请指定正确的地址或将值设置为 Null。
NSX 宣称每个大型 Edge 支持 512 个 VPN 会话,但由于策略自动检测安全策略,因此,策略最多仅允许 500 个 VPN 会话。在 Tier-0 上配置第 501 个 VPN 会话时,将显示以下错误消息:
{'httpStatus': 'BAD_REQUEST', 'error_code': 500230, 'module_name': 'Policy', 'error_message': 'GatewayPolicy 路径 [/infra/domains/default/gateway-policies/VPN_SYSTEM_GATEWAY_POLICY] 的每个网关路径 [/infra/tier-0s/inc_1_tier_0_1] 具有 1,000 个以上允许的规则。(GatewayPolicy path=[/infra/domains/default/gateway-policies/VPN_SYSTEM_GATEWAY_POLICY] has more than 1,000 allowed rules per Gateway path=[/infra/tier-0s/inc_1_tier_0_1].)'}
解决办法:使用管理平面 API 创建其他 VPN 会话。
NSX 配置状态为部分成功,因为无法更新交换机的运行状况。
解决办法:更改主机交换机名称,以使其不包含任何单引号。
在策略日志中观察到 NsxTRestException。无法使用 API 创建分段端口。
解决办法:在 PortAttachmentDto 中填充 Id 字段,或者在 API 输入中将其作为 Null 传递。
将显示“在尝试更新 vIDM 属性时出错”(An error occurred attempting to update the vidm properties) 错误。您只能使用 UI 或直接通过 REST API 连接 vIDM,或者在通过 CLI 连接时明确定义 lb_enable 和 vidm_enable 标记。
解决办法:在使用 nsx-cli 连接 vIDM 时,请将 vidm_enable 或 lb_enable 标记视为非可选标记。
在强制删除 NS 组时,可能仍会阻止流量。
解决办法:不要强制删除 DFW 规则仍使用的 NS 组,而是清空 NS 组或删除 DFW 规则。
通常,在升级和/或还原环境后,尝试还原已启动并运行 vIDM 集成的设备将导致该集成被破坏,您必须重新进行配置。
解决办法:在还原后,手动重新配置 vIDM。
NVDS 到 CVDS 的迁移将在迁移阶段失败。
解决办法:无。
在“添加新的 SPAN 会话”对话框中未列出 SRIOV vNIC。在添加新的 SPAN 会话时,您将看不到 SRIOV vNIC。
解决办法:无。
没有任何影响。可以忽略该实现状态。
解决办法:无。
在实现 T0 逻辑路由器端口时,您可能会注意到实现失败并显示错误。如果使用策略 API,该问题是暂时性的,将在 T0-T1 检测完成时解决。
解决办法:如果使用管理平面或管理平面 API,请删除在 T0 上创建的用于连接到 T1 的逻辑路由器端口,或者完成与 T1 之间的连接。
合并状态显示 IN_PROGRESS,但未提供有关哪个站点具有 IN_PROGRESS 状态的信息。
解决办法:无。在同步完成后,将正确反映状态。
这仅适用于为 NSX 3.0.0 和更高版本配置的无状态 ESX 主机。
解决办法:无。
在创建 LTA/流跟踪会话时,您将会在 nsxapi.log 中看到重复的 ObjectNotFoundException 日志内容。
解决办法:无。
没有可见的 UI 指示,以说明您需要等到传输节点状态变为“成功”,然后再继续为 Windows 物理服务器创建分段端口。如果尝试在传输节点成功之前创建分段端口,该操作将失败并且主机完全断开连接。
解决办法:在安装 Windows 物理服务器时,在到达向导的步骤 3 时,选择“稍后继续”选项。
在稍后成功安装了传输节点时,通过“管理分段”操作创建分段端口。
如果在并行模式下通过 vSphere Update Manager 升级 ESX 以触发 NVDS 到 CVDS 的迁移,则可能会出现迁移问题。交换机不会自动从 NVDS 迁移到 CVDS。系统可能会处于不一致状态。
解决办法:
在 Update Manager 并行模式下,将要升级的主机数设置为最多 4 个。
如果您已运行 Update Manager 升级而没有实施任何限制,请根据系统状态使用以下选项之一:
在创建具有大量规则的区域时,将会失败。
解决办法:无。
在使用 T0 A/A 进行故障切换期间,南北向连接最多丢失 6 秒的 v6 流量。
解决办法:避免不对称流量,并依靠 BGP 1/3 定时器检测 T0 上行链路上的 HA 故障切换。
L3 转发模式配置是在 NSX-T 3.0.0 版本的策略中引入的。该问题影响从 NSX-T 3.0.1 和 3.0.2 升级到 NSX-T 3.1.0。从 NSX-T 2.5.x 升级到 NSX-T 3.1.0 以及从 NSX-T 3.0.0 升级到 NSX-T 3.1.0 不受影响。将在数据路径中禁用 IPv6 转发,从而导致 IPv6 连接中断。
解决办法:有关详细信息,请参见 VMware 知识库文章 81349 。
主机的修复进度将停留在 95%,并在到达 70 分钟的超时时间后失败。
解决办法:请参见 VMware 知识库文章 81447 。
在系统范围的逻辑交换机端口数超过 25K 个时,将引发最大容量警报。但实际上,对于 PKS 大型环境,容器端口的限制为 60K 个;PKS 环境中的逻辑交换机端口数超过 25K 个是正常情况。
解决办法:无。
在执行 vMotion 后,流量将不符合预期的规则。规则匹配是不正确的,它允许本应阻止的流量通过。
解决办法:无。
物理服务器上的分段端口的连接接口配置为“使用现有的 IP”。 如果从 NSX 中移除物理服务器而未先移除分段端口,到物理服务器的连接将断开,并且 NSX 卸载失败。
解决办法:先移除分段端口,然后再卸载物理服务器。
这会影响使用标记和范围条件的搜索查询。如果标记和范围与任何对匹配,筛选器可能会返回额外的数据。
解决办法:无。
未设置 API 的统计信息。您看不到负载均衡器状态。
解决办法:减少配置的负载均衡器数。
不管错误消息如何(可能存在问题,也可能不存在),安装似乎继续进行并最终正确完成。
解决办法:不要立即解决问题,而是等待安装完成。
在 API 调用执行期间观察到内部服务器错误。API 将导致 500 错误,并且未提供所需的输出。
解决办法:遇到该错误是因为会话失效。在这种情况下,请重新执行会话创建 API 以创建新的会话。
在连接到 T0 分段的工作负载为 G 组发送 IGMP 退出时,没有从 T0 SR 上的 IGMP 侦听表中移除该条目。
解决办法:无。
当前南北向流在多播活动节点上运行。TOR 上到源的首选路由应仅通过多播活动 Edge 节点。
启动另一个 Edge 可能会接替多播活动节点(级别较低的 Edge 成为活动多播节点)。当前的南北向流量将丢失最多 4 分钟的时间。如果停止并重新启动当前流,这不会影响新的流。
解决办法:当前的南北向流量将在 3.5 到 4 分钟内自动恢复。要更快地进行恢复,请禁用多播并通过配置重新启用。
即使具有符合条件的数据,同时为几种类型应用多个筛选器也不会返回任何结果。这不是一种常见的情况,仅对于以下筛选器属性组合,这些网格的筛选器才会失败:
解决办法:您可以每次为这些资源类型应用一个筛选器。
PMTU 发现失败而导致分段和重组,并丢弃数据包。这会导致性能下降或流量中断。
解决办法:无。
当存在未清除的 LTA 会话时:
解决办法:重新引导存在 LTA 会话的 ESXi 主机。
下载签名包的新更新将失败。
解决办法:如果没有网络连接,请使用脱机下载功能下载和上载签名。
分段端口将显示失败。
解决办法:等待传输节点的配置状态变为“成功”,然后再创建分段端口。
您将看到“VLAN ID 无效”(INVALID VLAN IDs) 错误消息。
解决办法:在分段上使用 VLAN 范围创建多个网桥端点,而不是使用所有 VLAN 范围创建一个网桥端点。
不会影响功能,但在 syslog 中看到“java.io.IOException: 管道中断”(java.io.IOException: Broken pipe) 错误。
解决办法:无。
链路伙伴上的数据包捕获显示,收到的数据包没有校验和,但在 IP 标头中具有分段偏移。将丢弃跨 VRF 网关的流量,因为数据包已损坏。
解决办法:要充分利用 VRF Lite 功能,请使用虚拟机 Edge。
在 vSphere 集群修复过程中,操作可能会失败,并且 NSX 显示主机处于“已跳过的主机”状态。日志文件可能会显示消息“Host scan task failed”、“com.vmware.vcIntegrity.lifecycle.EsxImage.UnknownError<An unknown error occurred while performing the operation.>”
解决办法:将 root 用户添加到例外列表中,然后重试该操作。
在 vSphere 集群上启用 NSX IDS/IPS(以仅检测模式或检测并阻止模式)并将 IDS/IPS 应用于工作负载时,启用 IDPS 引擎就可能会触发锁定状况。结果,将丢弃与 Hypervisor 上受 IDS/IPS 或深度数据包检查服务 (L7 App-ID) 限制的所有工作负载之间的所有流量。不受 IDS/IPS 或深度数据包检查限制的流量不会受到影响;在禁用 IDS/IPS 或不再将其应用于流量时,将会立即恢复流量。解决办法:
解决办法:请参见 VMware 知识库文章 82043 。
如果使用正则表达式配置 BGP 扩展大型社区属性,则 FRR-CLI 将失败,并且配置不会生效,由此导致 BGP 路由筛选无法正常执行。
解决办法:无。
这没有任何影响,但在删除最后一个上行链路后,Tier-0-HA 将处于“关闭”状态,因为没有北向连接。
解决办法:在删除上行链路之前,禁用 BFD 或删除 BGP 邻居。
仅当未通过策略配置规则,且管理平面上的默认第 3 层规则具有丢弃操作时,才会出现此问题。升级后,管理平面上的默认第 3 层规则配置从 DENY_ALL 更改为 ALLOW_ALL。
解决办法:升级后,从策略 UI 中将默认第 3 层规则的操作设置为“丢弃”。
升级处于失败状态,并显示错误的 URL,阻止进行升级。
在执行还原操作后,受影响的传输节点显示为挂起状态。传输节点状态变为挂起状态,并且还原的数据库中的配置可能不会推送到传输节点。
解决办法:使用以下 POST API 重新应用现有的传输节点配置。
POST /api/v1/transport-nodes/<transportnode-id>?action=resync_host_config
在主机上重新同步传输节点配置。这类似于使用现有配置更新传输节点,
但强制将这些配置同步到主机(无后端优化)。
仅在 NSX 联合和单节点 NSX Manager 集群中出现该问题。如果您替换单节点 NSX Manager 上的 APH-AR 证书,该 NSX Manager 将与 NSX 联合环境的其余设备断开连接。
解决办法:单节点 NSX Manager 集群部署不是支持的部署选项,因此,请使用三节点 NSX Manager 集群。
如果在删除传输节点时关闭了 NSX Manager 电源,在没有用户干预的情况下,可能会无限期地执行传输节点删除操作。
解决办法:在备份 Manager 后,请再次准备节点,然后再次启动删除过程。
如果使用 vIDM,您必须在成功升级后重新登录,然后在集群上重新启用 vIDM。
解决办法:在升级后,禁用 vIDM 配置,然后重新启用。
在升级期间显示暂时性的错误消息。
解决办法:无。
尽管未在任何集群上启用 vSphere Lifecycle Management,但为所有集群激活了“转储”按钮。如果单击“转储”选项,将显示一条确认消息,如果您随后单击“是”,集群显示好像已进行了升级转储。如果您随后单击“开始”以开始升级,集群执行的升级就像从常规 NSX 主机升级中启动一样。
解决办法:忽略“转储”选项,并按照常规 NSX 主机升级过程执行 NSX 主机升级。
存储库同步状态在 NSX Manager UI 上显示为“失败”。不过,您可以执行所有安装和升级相关操作。
解决办法:从 NSX Manager UI 中执行解决操作。
当系统在更新期间重新引导时,引导失败并显示与挂载文件系统相关的错误。Edge 升级将失败。
解决办法:确保 Edge 在裸机服务器上只有一个磁盘。
如果 Edge 的 RIB 包含 65k 多个路由且 FIB 包含 100k 多个路由,从 MP 到 Edge 的请求将耗时 10 秒以上,从而导致超时。这是只读 API,仅当需要使用 API/UI 下载 RIB 中的 65k 多个路由和 FIB 中的 100k 多个路由时才会产生影响。
解决办法:获取 RIB/FIB 有两种方案可供选择。
BGP 和 BFD 可以单独设置其会话。作为“get bgp neighbor summary”的一部分,BGP 还会显示 BFD 状态。如果 BGP 已关闭,则不会处理任何 BFD 通知,并将继续显示上次已知状态。这可能会导致 BFD 显示失效状态。
解决办法:依赖于“get bfd-sessions”的输出,然后选中“状态”字段以获取最新的 BFD 状态。
如果通过 vMotion 迁移 Edge 并在 TOR 上启用了 IGMP 侦听,TOR 需要了解新的 Edge 位置。从 Edge 中获取任何多播控制或数据流量时,TOR 可以了解该信息。在通过 vMotion 迁移 Edge 时,最多丢失 30 秒的多播流量。
解决办法:无。将在 TOR 收到多播数据包后恢复流量,或者,要更快地进行恢复,请在连接到 TOR 的上行链路接口上禁用/启用 PIM。
如果用户将 CSM 上 AWS 帐户的 PCG 角色从 old-pcg-role 更新为 new-pcg-role,则 CSM 会将 AWS 上 PCG 实例的角色更新为 new-pcg-role 。但是,PCM 不知道 PCG 角色已经更新,因此继续使用通过 old-pcg-role 创建的旧 AWS 客户端。这会导致 AWS 云清单扫描和其他 AWS 云调用失败。
解决办法:如果遇到此问题,请在更改为新角色至少 6.5 小时内,不要立即修改/删除旧的 PCG 角色。重新启动 PCG 将使用新的角色凭据重新初始化所有 AWS 客户端。
连接将使用已过期/已吊销的 SSL。
解决办法:重新启动管理器节点上的 APH 以触发重新连接。
如果使用本地管理器的 VIP 将其添加到全局管理器,并随后发布了本地管理器的 FQDN,则全局管理器无法访问本地管理器以执行升级。
解决办法:在发布本地管理器的 FQDN 后,对其进行更新。
如果启动了 SRM 恢复测试或运行,则灾难恢复位置中的副本计算虚拟机将不会应用任何 NSX 标记。
虽然并行配置载入操作互不干扰,但在 GM 上执行多个此类配置载入操作通常会使 GM 在处理其他操作时变得缓慢。
解决办法:安全管理员/用户必须同步维护时段,以避免并发启动配置载入操作。
UI 在全局管理器中显示本地管理器载入操作处于 IN_PROGRESS 状态。无法导入已还原站点的配置。
解决办法:如果需要,使用本地管理器 API 启动本地管理器站点的载入操作。
在大规模设置中,如果频繁修改太多区域,全局管理器将需要一些时间才能反映配置的正确状态。这会导致稍后才能在 UI/API 上看到“分布式防火墙配置已完成”这一正确状态。
解决办法:无。
这会影响联合拓扑中的站点间连接。
解决办法:使物理网卡的 MTU 和中间路由器的 MTU 大于全局 MTU(即由 SR 间端口使用的 MTU)。由于封装,数据包的大小将大于 MTU,并且数据包无法通过。
静态路由需要很长时间进行编程且会影响数据路径。更改站点角色后,将会有大约 6-8 分钟的流量丢失。根据配置的规模,该时间甚至可能会更长。
解决办法:无。
未按预期方式推送规则。
解决办法:重新配置规则。
载入 API 失败,并显示“在站点上找不到默认传输区域”(Default transport zone not found at site) 错误消息。
解决办法:等待全局管理器和本地管理器之间的 Fabric 同步完成。
策略意图创建成功,但实现失败。不会在管理平面上实现本地服务,因此,无法在分布式防火墙规则中使用该服务。
解决办法:重新配置该服务以移除全局服务条目,并将本地服务添加为成员。从本地策略管理器中创建的服务只应将本地嵌套服务作为其成员。
在选择子组以作为在系统创建的区域中的组(具有相同位置)的成员时,您将看不到在站点特定的自定义区域中创建的组。
需要大量时间才能完成删除过程。
解决办法:使用分层 API 进行批量删除。
缓慢的 API 需要更多的时间才能创建规则。
解决办法:使用分层 API 创建多个规则。
您无法在全局管理器上缩小域的跨度。
解决办法:不要在两个具有不同跨度的父组中添加相同的子组。
删除速度较慢。
解决办法:使用分层 API 进行批量删除。
显示旧主机名。
解决办法:无。
在备用全局管理器变为活动状态时,添加到活动全局管理器的计算管理器在全局管理器上不可见。如果备用全局管理器在发生故障切换时变为活动状态,您无法使用自动部署功能部署新的全局管理器节点。
解决办法:在现在处于活动状态的全局管理器上将 vCenter 添加为计算管理器。
API 失败,但全局管理器切换完成。
解决办法:无。
如果需要在同一 LM 上使用联合和 PKS,则应先完成创建外部 VIP 和更改 LM 证书的 PKS 任务,然后再在 GM 上注册 LM。如果按相反的顺序操作,则在更改 LM 证书后将无法在 LM 和 GM 之间进行通信,并且必须重新注册 LM。
在切换到备用全局管理器(新的活动全局管理器)后,如果以前的活动全局管理器恢复联机,则旧活动全局管理器的状态为“无”。在您尝试从 UI 中将其设置为备用全局管理器时,该操作将失败。
解决办法:将以下 API 与包含 connection_info 的负载一起使用,以将全局管理器的状态从“无”更改为“备用”:
PUT https://<active-GM-IP>/global-manager/api/v1/global-infra/global-managers/<ID of GM with the status NONE> 示例请求正文: "display_name": "<Display Name of GM with status NONE>", "mode": "STANDBY", "_revision" : <Revision-Number>, "connection_info": [ {"fqdn": "<FQDN or IP of the GM with status NONE>", "username": "<username>", "password": "<password>", "thumbprint": "<API thumbprint of the GM with status NONE>"}
同步状态为“关闭”。全局管理器上的更改不会传输到本地管理器。
解决办法:发出“service async-replicator-service restart”命令以重新启动异步复制程序进程。
载入失败并显示主体身份错误,您无法使用主体身份用户载入系统。
解决办法:通过 NSX Intelligence 使用的相同主体身份名称创建一个临时主体身份用户。
显示错误消息,以指出无法创建或删除特定的资源,因为它将影响站点上的很多待清理资源的范围。这些错误消息指示全局管理器仍在确认从所有站点中清理很多资源的操作。
解决办法:将 Tier-1 与 Tier-0 断开连接以移除继承的范围。如果它们无法断开连接,并且您要将资源发回到另一个站点,请等待几分钟,然后再重试该操作。
在进行载入时,您看到“载入失败”(Onboarding Failure) 消息。
解决办法:还原本地管理器,然后重试载入。
全局管理器到本地管理器的通信缺少状态更新和某些功能。
解决办法:使用 API 调用在全局管理器上更换本地管理器指纹。
风流倜傥的火车 · 池化层详细介绍-CSDN博客 6 月前 |