系统极客一直在努力
专注操作系统及软件使用技能

Windows Server 2025 Hyper-V:新功能全面解析

Windows Server

Hyper-V 在近年来的创新相对较少,最近两个版本的 Windows Server 在这方面可谓是裹足不前。现在,随着 AI 的爆火,Microsoft 也终于开始着手改进一些长期存在的问题。

Windows Server 2025 为 Hyper-V 带来了多项增强功能和新的存储特性,主要用于优化虚拟机的运行体验。这些新特性涵盖 GPU 虚拟化、新的 ReFS 去重功能,以及在非 AD 域的集群上进行虚拟机实时迁移。

Windows Server 2025 Hyper-V 增强功能

GPU 虚拟化(跨 VM 共享 GPU)

随着 GPU(图形处理器)在 AI 等领域中的核心地位不断上升,Hyper-V 对 GPU 的现有支持显然已经落后于当前需求。直到现在,也只能通过直通(DDA)的方式将 GPU 分配给单一 VM,使其成为该 VM 的专属资源。

然而,考虑到现代 GPU 的高性能和高成本,这种分配方式显得「非常降智」。因此,在 Windows Server 2025 中,引入了一项重要变革:允许对 GPU 进行划分,让它能够在多 VM 之间共享。

在多 VM 之间划分 GPU
在多 VM 之间划分 GPU

除了提高资源利用率,这种 GPU 虚拟化还支持在 Cluster 内和独立 Host 之间进行实时迁移。以前,采用直接将物理硬件分配给 VM 的概念,会阻碍 VM 在不中断的情况下迁移到另一个主机。而在采用 GPU 划分(GPU-P)的情况下,VM 的高可用性同样得到了全面支持。

要使用 CPU-P,需要满足一定的前提条件:

先决条件要求
硬件支持 SR-IOV 的服务器,搭载 AMD Milan 或 Intel Sapphire Rapids 处理器,并搭载 Nvidia 的 GPU A2、A10、A16 和 A40。
软件Guest OS 支持 SR-IOV,包括 Windows 10/11、Windows Server 2019/2022 以及 Ubuntu 18.04/20.04/22.04 LTS。

GPU 池化

除了 GPU-P,Windows Server 2025 还支持反向操作:将多个图形处理器合并成一个虚拟 GPU。这种汇聚专为故障切换设计,不支持实时迁移,因为它依赖于 DDA。

用于 VM Failover 的 GPU 池化
用于 VM Failover 的 GPU 池化

管理员需要在每个集群节点上创建一个同名池,并将虚拟机分配到该池中。在节点故障的情况下,集群将会在另一台服务器上启动虚拟机,并自动将其连接到相应的池。

无 AD 集群中的实时迁移(基于 CA)

自 Server 2016 版本以来,Windows Server 允许在工作组中建立集群。这种配置主要适用于小规模部署,例如远程办公,或组织希望基础架构尽可能简单。

传统上,不属于 AD 域的集群不支持所有工作负载。而对于 Hyper-V 角色,它仅提供了快速迁移的选项。但在 Windows Server 2025 中,事情正在起变化,引入了基于证书的在无 AD 集群上进行实时迁移的功能。

集群中不同类型的(混合) CPU

另外,关于动态处理器兼容性的更新也值得一提。该功能允许将来自同一厂商,但不同代差 CPU 的服务器分组到同一 Cluster 中。在这种情况下,Windows 会仅利用它们共同拥有的最基本、最低层级的 CPU 功能,以确保整个 Cluster 的稳定性和一致性。

动态处理器兼容性允许在集群中使用不同型号的 Xeon 处理器
动态处理器兼容性允许在集群中使用不同型号的 Xeon 处理器

在 Windows Server 2025 版本中,甚至可以混合使用来自第三和第四代的 Intel Xeon 处理器。

默认使用 Gen2 VM

目前,在使用 Hyper-V 管理器或 Windows Admin Center 创建虚拟机时,默认仍然是 Gen1。

但在 Windows Server 2025 中,将会默认选择第二代虚拟机。Gen2 虚拟机不仅提供更高的可扩展性,而且支持一系列先进功能,如安全启动、TPM 和 UEFI 等。

存储改进

Windows Server 2025 在存储功能方面也引入了一系列增强,特别有益于虚拟化工作负载:

  • NVMe 性能提升:借助新的本机驱动程序,NVMe 性能得到显著改进。相较于 Server 2022,将使 IOPS 提高高达 90%。此外,新操作系统还将包含一个用于连接到 SAN(存储区域网络)的 NVMe over Fabric 初始程序。
  • 新的 ReFS 去重功能:ReFS 迎来了一项全新的去重功能,与当前实现不同的是,它不再局限于冷存储。这一改进涉及文件服务器上(不太变化)的数据。而且,新的 ReFS 去重也适用于热数据,如虚拟驱动器,为 VHD(X) 和 ISO 文件带来高达 90% 的存储空间节省。

在「假死」一段时间之后,Windows Server 2025 中的 Hyper-V 迎来了一些引人注目的更新。其中之一是 GPU 虚拟化,这是 VMware 早就拥有的功能,但对于 AI 应用尤为关键。GPU 虚拟化支持 GPU 的划分和池化两种方向,其中:后者仅用于故障切换,而 GPU-P 则允许分配了虚拟 GPU 的 VM 进行实时迁移。

在未加入 AD 的集群中支持实时迁移是另一项新增功能,而且动态处理器兼容性功能让第三代和第四代 Xeon 处理器能够在同一集群中共存。

赞(2) 赞赏

评论 抢沙发

微信赞赏