技术参数及配置要求 | 高性能计算集成平台招标参数: 数量:1台 本集群包括3个节点。2个计算节点,一个管理节点。并配备高性能计算系统 主节点参数如下: CPU: 2颗,Intel 铂金5代,单颗≥60核心,主频≥2.1G,缓存≥300MB。 RAM:16条ECC RDIMM内存,单条容量≥32G,频率≥5600Mhz。 SSD:容量≥4TB,顺序读速≥7000MB/s,顺序写入≥6000MB/S,总写入量≥2400 TBW。 HDD:2块,单盘≥16TB,转速≥7200。 Infiniband:速率≥100G,协议支持:OpenMPI,IBM PE,OSU MPI(MVAPICH/2),Intel MPI,Platform MPI,UPC,Mellanox SHMEM,TCP/UDP,EoIB,IPoIB,SDP,RDS,MPLS,VxLAN,NVGRE,GENEVE,SRP,iSER,NFS RDMA,SMB Direct,uDAPL 平台:支持2颗第四代或第五代英特尔至强可扩展处理器,最大功率385W;Intel C741芯片组;支持16个DDR5 内存插槽,1DPC,最高5600MHz, 支持RDIMM、3DS RDIMM,最大支持4TB内存;支持6个标准PCIe扩展插槽(4个PCIe 5.0 x16,2个PCIe 5.0 x8);板载2个1Gb RJ45数据网口,支持NCSI;:10个SATA 3.0(2个SFF-8643+2个7pin SATA),3个MCIO(PCIe 5.0x8),可支持6个NVMe,2个M.2 接口, PCIe 4.0 x4 , 2280 22110; 1个COM,4个USB 3.0,1个1Gb RJ45管理网口,2个1Gb RJ45数据网口,1个VGA,1个UID(按键及指示灯);8个4pin FAN,支持风扇转速侦测及自动调速,1个VGA header for FP,1个SPI TPM header,2个USB 3.0 header、2个USB 2.0 header、1个USB 2.0 Type A; 集成BMC管理芯片AST2600,支持IPMI2.0、Redfish、KVM、虚拟媒介等功能;可选TPM模块;工作温度:5oC - 35oC,存储温度:-40oC - 65oC;工作相对湿度:8% to 90% (无冷凝),存储相对湿度:5% to 95% (无冷凝);支持Windows Server、Hyper-V Server、Red Hat Enterprise Linux、SUSE Linux Enterprise Server、CentOS、Ubuntu、VMware ESXi、Rocky等主流操作系统;塔式,含4个利民TL-C14X高性能风扇;2000W全模组电源 从节点参数如下: CPU: 2颗,Intel 铂金5代,单颗≥60核心,主频≥2.1G,缓存≥300MB。 RAM:16条ECC RDIMM内存,单条容量≥32G,频率≥5600Mhz。 SSD:容量≥2TB,顺序读速≥7000MB/s,顺序写入≥6000MB/S,总写入量≥1200 TBW。 Infiniband:速率≥100G,协议支持:OpenMPI,IBM PE,OSU MPI(MVAPICH/2),Intel MPI,Platform MPI,UPC,Mellanox SHMEM,TCP/UDP,EoIB,IPoIB,SDP,RDS,MPLS,VxLAN,NVGRE,GENEVE,SRP,iSER,NFS RDMA,SMB Direct,uDAPL 平台:支持2颗第四代或第五代英特尔至强可扩展处理器,最大功率385W;Intel C741芯片组;支持16个DDR5 内存插槽,1DPC,最高5600MHz,支持RDIMM、3DS RDIMM,最大支持4TB内存;支持6个标准PCIe扩展插槽(4个PCIe 5.0 x16,2个PCIe 5.0 x8);板载2个1Gb RJ45数据网口,支持NCSI;:10个SATA 3.0(2个SFF-8643+2个7pin SATA),3个MCIO(PCIe 5.0x8),可支持6个NVMe,2个M.2 接口, PCIe 4.0 x4 , 2280 22110; 1个COM,4个USB 3.0,1个1Gb RJ45管理网口,2个1Gb RJ45数据网口,1个VGA,1个UID(按键及指示灯);8个4pin FAN,支持风扇转速侦测及自动调速,1个VGA header for FP,1个SPI TPM header,2个USB 3.0 header、2个USB 2.0 header、1个USB 2.0 Type A; 集成BMC管理芯片AST2600,支持IPMI2.0、Redfish、KVM、虚拟媒介等功能;可选TPM模块;工作温度:5oC - 35oC,存储温度:-40oC - 65oC;工作相对湿度:8% to 90% (无冷凝),存储相对湿度:5% to 95% (无冷凝);支持Windows Server、Hyper-V Server、Red Hat Enterprise Linux、SUSE Linux Enterprise Server、CentOS、Ubuntu、VMware ESXi、Rocky等主流操作系统;塔式,含4个利民TL-C14X高性能风扇;2000W全模组电源 管理节点参数如下: CPU:配置≥1颗 酷睿 Ultra。每颗处理器物理核心数≥24,线程数≥24;CPU基础频率≥3.2GHz,最大加速频率≥5.7GHz;三级缓存36MB。 主板及内存:ROG STRIX Z890-A GAMING WIFI S主板内存插槽≥4个,配置≥2条DDR5 32GB内存,频率≥ 6400MHz。 硬盘1:配置≥1块nvme固态硬盘致态TiPlus 7100,容量≥2TB; 硬盘2:配置≥1块nvme固态硬盘致态TiPlus 7100,容量≥2TB; 硬盘3:配置≥1块nvme固态硬盘致态TiPlus 7100,容量≥2TB; 硬盘4:配置≥1块nvme固态硬盘致态TiPlus 7100, 容量≥2TB; 显卡:综合性能≥1块NVIDIA RTX 3080显卡,显存容量≥12 G,显存类型:GDDR6X, 显存位宽≥384bit 散热器:配置≥1套风冷散热器, 电源:配置≥1套电源;电源功率≥850W;SEASONIC海韵FOCUS 850W ATX3(2024)电源 机箱及配件:CPU散热采用风扇主动散热方式。 高性能计算系统要求: 1) 系统集成:卖方需要对招标文件中采购的硬件和客户现有的硬件、软件和网络设备提供系统集成服务,提供系统集成方案,具有对招标文件中采购的软硬件系统进行专业、快速地维护与服务的能力。 2) 投标方必须在客户指定的现场进行服务器的组装及平台的搭建工作,以确保服务器内各配件接受客户方的检测及验收。 3) 投标方所投产品必须保证各个零配件为全新产品。提供全新产品承诺书。* 4) Rockylinux8.8 系统的安装,ssh 远程登录、远程桌面、sftp 数据传输等软件的安装调试。提供详细的数据传输方案,提供服务器网络优化。 5) 科学计算库:部署各种开源科学计算库包括BLAS、ATLAS、LAPACK、ScaLAPAC、FFTW等。编译及并行环境搭建:提供python、fftw、openmpi、mpich、intel oneapi的部署(包含icpc, icc,ifort, mkl, impi, fftw接口等)。 6) 需安装计算软件并优化:gromacs /vasp /qe /lammps /ms /cp2k /gaussian /abaqus /MS 计算软件在gcc、intel编译器环境下的编译与测试,帮助客户确定最优的编译方案。Vesta / gnuplot /ovito /atomsk /vaspkit /VMD /Multiwfn等及建模可视化软件编译与调试,并给出详细的使用说明。(*投标单位应按照上述要求提供证明材料,未提供视为不满足)。 7) Slurm 作业调度管理系统的搭建:提供每个计算的slurm计算脚本,根据客户要求个性化定制slurm部分功能。Module环境变量控制:保证服务器所有计算环境受module控制,提供完整的module加载情况。(投标单位应按照上述要求提供证明材料,未提供视为不满足)。 8) 服务器web管理:通过WEB界面实现服务器系统的统一管理、调度和监控;支持与NIS、LDAP、password文件或者统一身份认证集成,支持用户组织架构管理和用户审批;支持项目管理,可创建、修改、删除项目信息,以及配置项目中所包含的用户或用户组,支持项目管理员功能,可以查看项目组内所有用户的作业情况;支持二级管理员功能,可以对部门内的用户进行管理,可以查看部门内所有用户的作业情况、计费和报表等功能;允许在界面上对单机或批量节点进行操作,包括:远程开机、关机、重启等操作;在WEB界面集成图形化的文件管理,支持文件的:浏览、新建、在线编辑、压缩、解压、上传、下载等操作。投标单位须提供web系统图形界面,以证其拥有相应技术。(投标单位应按照上述要求提供证明材料,未提供者视为该项技术要求不满足)*。 9) 作业调度控制:采用主流的作业调度软件,支持Slurm和PBS等2种及以上调度器;支持常用高性能计算软件的应用模板,与第三方科学工程软件集成,可通过拖拽式编辑方式,生成个性化应用模板;可以配置应用模板访问权限,被授予访问权限的用户在界面上可见该应用模板;应用模板中应包含应用提交、作业列表、作业操作、应用终端输出显示、作业提交目录数据查询、应用交互页面显示、应用运行占用CPU/内存等信息查看;支持WEB界面的作业查询、删除、挂起和释放等操作,可以根据作业ID, 作业名, 用户名, 状态, 和队列排序;提供主流的调度策略:公平竞争,抢占,回填,资源预留等;支持多种作业提交方式:支持命令行、WEB界面、应用模板、作业脚本和可执行文件等;禁止普通用户以交互式方式登录计算节点,但可登陆已经运行作业的节点进行资源查看及进程操作。 10) 服务器计算性能要求1:提供单台机器在相关计算软件中计算性能测试。举例:可以使用lammps开源软件,对原子数为20W,50W,80W, 100W规模的金属进行MD模拟(分子动力学模拟),绘制出计算速度曲线,并以此说明所报方案的性能优势及其在高性能计算模拟中的潜在的注意事项。注:投标方需介绍清楚其性能测试中所用算例的具体说明,并给出相关模拟结果图(原子构型图等)。若投标方无法提供详细性能测试说明,则判定其不了解所投产品是否适用于该领域科学计算,即不能提供合适计算硬件方案及售后的技术支持,其所投产品不符合技术参数要求。(投标单位应按照上述要求提供证明材料,未提供者视为该项技术要求不满足)*。 11) 服务器计算性能要求2:为了实现材料的宏观尺度模拟计算,有限元、有限体积、有限差分等数值方法将应用于材料的数值模拟中,请以某一款连续体力学软件为基础,阐述所投标产品如何在具体的材料模拟中加速计算、分析、可视化。投标单位须结合文字及图片展示所投产品计算性能表现。(投标单位应按照上述要求提供证明材料,未提供者视为该项技术要求不满足)*。 12) 平台整体并行性能分析:由于平台需要进行大量的多节点并行计算,投标单位须对并行计算有深入的了解。投标单位须提供并行计算效率分析说明。该说明须以常见计算软件为例,详细阐述用户在该软件计算中应该如何确保并行效率最高化。若投标单位无法阐述清楚,则判定其对于并行计算技术了解浅薄,无法合理整合现有硬件资源,进行高效率的科学计算模拟。(投标单位应按照上述要求提供证明材料,未提供者视为该项技术要求不满足)*。 安装作业管理软件,将新设备融入原有集群。使用主流的编译环境、并行环境、以及最优的计算通信协议,组建成安全可靠、高效率、易上手的计算系统。 主要功能特点 一、作业调度功能 作业提交 支持多种方式提交作业,包括命令行、脚本文件、图形界面等。 允许用户指定作业的资源需求、运行时间等参数。 作业排队 自动将提交的作业放入合适的队列中等待执行。 队列可根据不同的资源需求等进行分类。 作业分配 根据集群中节点的资源状态和作业需求,智能地将作业分配到合适的计算节点上。 用户和管理员可以随时查看作业的状态信息。 作业控制 用户可以对自己提交的作业进行暂停、恢复、取消等操作。 管理员可以对所有作业进行强制终止等操作。 二、资源管理功能 节点管理 监控集群中各个计算节点的状态,包括在线 / 离线状态、资源使用情况等。 可以对节点进行禁用等操作。 资源限制 为用户和作业设置资源使用上限,防止单个用户或作业占用过多资源。 可以限制 CPU 核数、作业总数、GPU卡总数等。 四、账户管理功能 账户创建和删除 创建账户功能,多个用户可以属于同一账户,方便管理。 删除账户。 账户配额管理 为每个账户设置资源配额,限制账户的用户在一定时间内可以使用的资源总量。 可以根据账户的需求和贡献度调整配额。 五、集群源监控功能 1.实时监控集群的整体状态,包括作业数量、资源使用情况、节点状态等。 2.提供可视化的监控界面,方便管理员及时了解集群的运行情况。 |