您当前的位置 : > 财商

Supermicro推出适用于人工智能的新型多功能系统设计,实现终端优化并确保灵活性

日期: 2024-10-10

新3U服务器支持最多18个GPU,搭载双Intel® Xeon® 6900系列P核处理器

加利福尼亚州圣何塞2024年10月10日 /美通社/ -- Super Micro Computer, Inc. (SMCI),一家为人工智能(AI)、云计算、存储和5G/终端提供全方位IT解决方案的企业,宣布推出一款全新高密度多功能基础设施平台,专为网络终端的人工智能推理进行优化。 企业在日常运营中需要应用复杂的大型语言模型(LLM),这意味着在终端位置需要新的硬件,以最小的延迟处理大量数据。 Supermicro的创新系统结合了多功能性、性能和热效率,能够在传统的空气冷却环境中运行,并在单一系统中支持多达10个双宽GPU。

支持8块双宽GPU加速卡的3U终端人工智能推理系统
支持8块双宽GPU加速卡的3U终端人工智能推理系统

“凭借系统的优化热设计,Supermicro能够在高密度的3U 20 PCIe系统中提供256核的强大性能,并可部署在终端数据中心,”Supermicro总裁兼首席执行官Charles Liang表示, “随着人工智能市场的迅猛发展,客户需要一个功能强大、用途广泛的推理数据解决方案,以便在内部运行基于LLM的应用程序,同时确保与数据生成地相近。 我们的全新3U终端人工智能系统使他们能够以最小延迟运行创新解决方案。”

如需了解更多信息,请访问:https://www.supermicro.com/en/solutions/edge-ai

新款SYS-322GB-NR配备了两个强大的Intel® Xeon® 6900处理器,支持8800 MT/s MRDIMM和最多20个PCIe 5.0扩展槽。 该Supermicro系统支持多种单宽或双宽GPU,或将部分扩展槽用于高性能I/O或其他附加卡。 此外,该服务器支持最多6TB的RDIMM内存和多达14个E1.S或6个U.2 NVMe驱动器。

该系统用例之一是在制造行业,Supermicro的新系统可以部署在自动化生产环境中,在现场处理来自摄像头和传感器的数据流,而无需将数据传输到远程端口。 这种能力减少了网络需求,提高了响应速度。 另一个适合SYS-322GB-NR的环境是大型控制室,AI加速卡可以部分替换为多显示卡,支持多达64个独立显示器。

Supermicro亮相拉斯维加斯世界移动通信大会(MWC)

SYS-322GB-NR将于10月8日至10日在拉斯维加斯MWC的Supermicro#518展台进行展示。 此外,Supermicro还将展示集成NVIDIA、AMD和Intel Xeon 6处理器的系统,包括X14系列终端和电信系统,如:

SYS-222HE-FTN——Hyper-E将数据中心性能带到电信终端,采用双Intel Xeon 6处理器,2U短深度设计,具有前置I/O接口

SYS-212B-FN2T——一款用于电信和终端人工智能部署的2U短深度系统,配备单颗Intel Xeon 6700系列E核处理器,支持GPU

SYS-E403-14B-FRN2T——一款盒式PC尺寸的壁挂式终端设备,能够将Intel Xeon 6700系列E核处理器和GPU支持置于远程环境中

AS-1115S-FDWTRT——1U NEBS兼容系统,为ORAN、核心网和托管服务提供电信级性能。 该系统使用AMD EPYC 8004系列处理器,并支持1个单宽GPU加速卡以应对繁重工作负载。

除了展示Supermicro硬件系统外,Supermicro还将与NVIDIA合作,共同展示推理和人工智能解决方案,涵盖本地和终端应用场景,包括企业AI、零售、电信终端和金融服务。 我们将展示包括NVIDIA NIM、NVIDIA NeMo、NVIDIA Metropolis、远程管理、安全和网络在内的关键生成式人工智能解决方案。 对于电信行业,Supermicro和NVIDIA将展示使用NVIDIA和Supermicro解决方案的实时AI RAN策略,展示其性能、管理方式和人工智能应用场景。

此外,拉斯维加斯MWC还将展出Supermicro与Intel联合推出的全新解决方案,该方案结合了坚固的IP65室外终端系统,内置AI网络加速器和Intel®数据中心GPU Flex 170。 该解决方案可实现多种私有5G网络快速、经济的部署,以及在单一设备中运行的终端人工智能应用。 这些网络可被不同用户应用,因此提供了可扩展的解决方案,适用于工业园区、校园、赛事演出场馆和智慧城市等高密度环境。