第一,事情站市场容量稳定并增长迅速。事情站的需求一贯在稳定增长,抛开疫情影响, IDC给出的预测可以达到年增长9%-10%。2023年MNC加上渠道客户方案的整体容量在120万台,个中渠道占1/4,并且增幅大于均匀涨幅。
第二,渠道产品生产日趋成熟。上游和周边厂商的事情站业务的策略调度和定制化需求增多,渠道的参与度增强,周边产品生态已经成熟。比如说硬件上的主板、散热、机箱等, 以及本土化运用软件的遍及等。
第三,政策对渠道方案友好。目前在干系政策的驱动下,国产品牌呈现明显的增长趋势,加持渠道事情站的业务。

第四,产品方案多种多样,加速渠道业务发展。定制化、云化、AI化等等都是比来的趋势,而且形态也由最初的卡式向多形态发展,比如说机架式、便携式等。
第五,热点运用加速渠道方案落地。热点运用的落地催生了各种各样的方案,尤其是去年下半年,AIGC在各个场景下的表现,给了事情站更为广阔的空间。
而在事情站领域,英特尔为其打造的至强W处理器平台,可以说是目前单路最强核芯,尤其是在AI以及AIGC的运用领域,至强W可以说是助力全体行业快速发展的基石。
当前,英特尔在这一领域已经汇聚了近50家核心企业。个中不仅包括像昱格电子这样的OEM,同时也包括像智微智能这样既是OEM又是ODM的企业,当然也有像璇米科技这样方案供应商,以及浩瀚ISV互助伙伴。
·至强W为何是英特尔单路最强芯?
那么问题来了,至强W为何是英特尔单路最强芯?
对此,英特尔事情站品类产品经理葛林给出了答案。
至强W处理器(单路)与至强处理器(多路)的差异便是把UPI模块换成了PCIe模块。UPI 可以让两颗或者是多颗CPU构建双路乃至多路协同事情状态。而至强W聚焦于单路,因此英特尔将UPI换成了PCIe,而PCIe能够充分拓展通路,以搪塞算力均衡的需求。
从技能层面来看,至强W每颗核心与同级别至强处理器去比的话主频更高,尤其是在拥有相同核心数、相同加速器,且具备AI干系指令集、加速器的情形下,至强W具备更高主频和PCIe带来的更强扩展能力,从而带来了更加强劲的平台级打算能力,这是至强W被称为英特尔单路最强芯的根本缘故原由。
此外,至强W对付企业用户而言有着更好的TCO(总体拥有本钱),能够单独运行,扩展能力强,且算力补偿方面英特尔也做了优化,因此可以应对客户多样化的需求,为客户供应更好的经济性。
·至强W为何能玩转AIGC?
时下,AIGC运用已经成为事情站设备的范例运用处景。至强W对付“玩转AIGC”来说,是非常得当的硬件平台。
当前,AIGC的业务逻辑紧张包含三类:
其一是像OpenAI,Stable Diffusion,Midjourney等等的大模型供应商;
其二是AIGC的利用者或消费者。
其三只专业做事供应商、运营商,如建筑设计、工业设计、加工等领域。
在三大类业务逻辑中,除了大模型供应商之外,其余两大类用户实在对算力的哀求并不是那么极致,因此这类用户每每会选择经济性更好的单路至强W设备来得到更好的收益。
葛林先容说,“从产品端,英特尔通过建立TSS部门来做干系验证。并根据验证结果对AIGC事情站和做事器提出了六个方向上的建议。”这些建议紧张包括:
第一,核心。英特尔的最强芯不但是32核心,但由于核心再连续堆叠的情形下所带来的上升空间不大,以是“甜蜜值”是在16核到32核之间。
第二,频率的关系。在知足大核的核心数条件下,频率肯定是线性关系的,频率越高,效率越高。
第三,AMX加速器。根据英特尔实验室数据,有无AMX加速器的情形下,效率差距会达到4倍,可见其非常关键。
第四,内存。英特尔建议4通道起步,由于4通道至少可以支持到2T,应对各种各样参数的大模型时,如7B、13B乃至几十亿参数大模型时,大内存可以快速支持大模型数据的导入和导出。
第五,RDIMM DDR5 ECC内存的稳定支持。ECC内存自带纠错,其上风就在于稳定,联系运行数小时、数天、乃至更永劫光,ECC内存都能担保稳定不宕机。
第六,PCIe通道数,这是支持到更多的加速打算卡事情的根本。比如一个加速打算卡须要占16x的通道,而加速打算卡堆叠越多性能越高,所带来的本钱也越高。至强W平台的TCO就表示在这里,它能够供应足够的PCIe通道支持,可以支持4-6块加速卡,对付不须要超高算力客户来说,知足算力需求的同时也更加经济实惠。
·海内AIGC的紧张寻衅
AIGC是当前最为火爆的行业,那么AIGC到底能给人们带来什么?有哪些范例场景?在做这些场景的时候须要若何的算力架构?英特尔中国AI架构师赵朝卿分享了自己的不雅观点。
首先从技能脉络和算法来说,AI发展到本日经历了机器学习、深度学习阶段,而AIGC无疑是建立在这两个阶段之上,实现大众化运用的新阶段。因此,各种大模型数据的参数量一贯 上升,并且达到10亿级乃至是更多。此时,更加弘大的算力需求纷至沓来。
AIGC技能成熟度是从语音合成、识别开始的,这个在十年前没有办理的问题,现在已经办理掉了,再今后则是自然措辞处理。而现在,随着ChatGPT等大措辞模型的发布,文本类的天生也向前跨了一大步,而视觉、语音就要把各种模态整合到一起从而形成多模态。
赵朝卿认为,目前海内AIGC的紧张寻衅包含三个方面:
其一,构建一个大措辞模型去做预演习,所谓的预演习便是从头演习所有参数。比如微软的模型都是千亿级别的,而演习这种模型一样平常都须要千卡、万卡,海内没有几家可以这么做,演习一个模型须要巨大的本钱支出。
其二,对付海内来说,可以利用开源的预演习模型做行业的微调,但是哪怕是微调,我们依然须要大量的算力,一方面须要很多显卡来完成演习,另一方面须要花费大量韶光去做演习。
其三,在支配阶段仍旧须要算力。比如一个7B的大措辞入门级模型,最少要有一张16G显存的显卡才能放进去,而且这是在做完量化的情形下。以是整体来说AIGC的算力哀求很高,同时在效率和韶光方面也都有着非比平凡的寻衅。
·至强W知足算力均衡需求本钱更加可控
赵朝卿还分享了三种AIGC运用处景,来解释算力需求的弘大。
首先是平面设计。原来一个设计师设计一个布料花色须要两周韶光,还要一直去调度色彩方案和呈现。现在通过AIGC可以快速天生很多张不同配色的方案,韶光可以压缩到2天旁边。节省了大量人力、韶光本钱,而转化成算力本钱, 须要很大的算力支撑。
其次是影视制作,比如OpenAI Sora的涌现,它可以随便天生一个视频来利用,但对付影视来说不足专业,依然须要更加风雅地打磨。比如《流浪地球》这部电影中,某一帧图像渲染韶光达到了99个小时,算力花费巨大。因此行业须要一个平台,能够把算力扩充起来,还要有图形化的渲染和编辑能力。
再者便是时下火爆的数字人。如数字主播或直播带货,它可以借助AI针对不同地区天生不同的措辞。比如虽然说的是普通话,但不同地区用户听到的可能是阿拉伯语或者是英语,且还可以针对不同地区定制不同的数字人形象,这些都须要算力支持。
这三个范例运用处景都须要高性能的打算以及图形处理能力这样的专业需求。今年,发展新质生产力被写进政府事情报告中,所有企业都在做“AI+”的领悟,因此要供应高性能打算和图形处理能力,CPU就须要具备高主频、多核心、高密度低异构的可扩展性。一张显卡不能只配一个核,而是要达到算力均衡,也便是CPU的算力须要与GPU匹配。而至强W平台高达112路线程,可以支持到6卡,内存支持DDR5 ECC高速内存,容量可以支持到4T,且全体平台比双路8卡成本相对更加可控,从而能够更好地知足客户对付更多AI算力场景的需求。
·至强W的实际办理方案分享
在近期举办的“英特尔单路最强‘芯’,助力玩转AIGC”活动上,璇米科技、昱格电子以及智微智能三家互助伙伴分享了至强W的运用案例,展现了“算力均衡”的上风。
璇米科技总经理李洪刚分享了其在3D体育赛事重修方面的履历。从北京冬奥会到CBA等大型赛事,璇米科技是唯一一家在比赛现场就能够实现赛事数据大量采集的公司。利用专业相机、高清摄影机、乃至手机采集数据,并将素材交付给由山景电子打造的至强W事情站,再借助二三十个核心以及高达4.8GHz频率的至强W平台,可以迅速实现由2D检测到3D重修的事情负载。
李洪刚说,“一个至强W可以支持16x的PCIe,也便是说可以带4-6块显卡。在实际利用中,如果可以带4块显卡,再加上2到3台这样的机器,就能够实时处理一场篮球比赛。现在与AIGC相结合,从2D图像到3D重修的过程中加入AIGC。也便是说,首先从图像中拿到2D的骨骼,这一步被称作检测。检测之后将2D重修为3D的人物形象和骨骼的过程,在引入AIGC之后,技能的超过式发展进一步加速。”
昱格电子产品经理张康则分享了至强W在影视事情流方面的运用。从原来的720p、1080p到现在的4K 60帧、120帧,全体事情流中的效率如何办理,包括用手机或用条记本在AIGC的情形下如何提高事情效率,是昱格电子须要思考的问题,并给出相应的办理方案。
昱格电子紧张采取虚拟化的办法,由于虚拟化可以合理地分配至强W这样高主频多核心的处理器,做到算力均衡。如分8个核心给用户做剪辑,再分8个核心给用户做渲染。这样带来的好处是整体效率非常高,同时全体方案性价比也会非常高。
张康先容说,“至强W系列在PCIe通道里额外增加了直连的PCIe,和双路至强比较,在全闪NAS中,我们也是用至强W的产品去做的。而且在我们的测试过程当中,同样的核心,比较双路至强,单路至强W速率会快一倍。做影视事情流的都知道,在4K或者是8K剪辑的时候,全体全闪的速率快一倍是非常胆怯的。”
实在不仅是影视后期,在诸如工程设计、人工智能开拓中,都可以用到昱格电子的虚拟化系统。在昱格电子这套虚拟化系统中,通过远程访问这些高性能算力的同时,昱格电子的备份系统、永恒操作系统,在NAS层面可以给客户供应非常好的数据和算力支撑。在永恒操作系统当中还可以给客户供应非常强的多模型数据支撑,这就形成了昱格电子的高性能AIGC云事情站方案。此外,它不仅带来的是可靠性和算力的提升,还有数据安全的提升。
智微智能架构工程师王海利分享了智微智能基于单路最强芯至强W的整体硬件办理方案。
智微智能目前在多个细分行业做到了行业第一,比如消费电子、教诲、零售等,并与海内近百家头部客户有深度互助。公司拥有500名研发职员,紧张基于英特尔平台做各种各样的硬件开拓。同时智微智能也有自主的工厂,是一家能为各行各业供应硬件办理方案的公司。
王海利说,“至强W在AIGC当中有多样的运用,大家也可以看到AIGC对算力的需求是很大的。算力需求紧张会涉及几个方面,一是处理器核数的需求, 二是我们对多算力的需求。 我们的平台支持W34系列,最大可以支持60个核心。W34系列实在还有一个最紧张的特点便是可以做超频。比如56核112线程的W9-3495X处理器,可通过睿频加速Max技能3.0实现最大睿频4.8GHz 。我们在机器上增加了硬件的超频系列,只要我们能办理散热问题,频率就可以不断提升,功耗开释可以达到600W旁边。其余是支持DDR内存,目前我们支持8条内存条,全部都是主通道,最大容量支持到2T。刚刚英特尔专家也说了,在这个平台上支持ECC内存纠错功能。除此之外,我们还支持很多的功能,比如说RAS、内存加密技能等,这些技能都是为了提高我们全体的数据可靠性、稳定性等方面。其余,现场展示的这套方案支持12个硬盘盘位,它可以支持SATA 、SAS 、SSD相应的设备,包括U.2,为企业供应各种各样可配置的办理方案。”
基于至强W平台打造的智微做事用具备研制一体化,性能强劲;支持图形加速,深度学习;可靠、可管理、更安全以及灵巧扩展特性,可轻松知足客户对打算的不同哀求。
实在除了第四代至强W之外,英特尔将在今年8月份推出的第五代至强上连续强化AI打算支持。
·结语
当前,打算呈现出越来越专注化、针对化、云化、AI化的新特点。基于这样的背景,对付算力平台的哀求已经由原来的总成开始往分散性组件去发展。根据IDC预测,单路打算规模已经占到了10%,这是总成化拆解的大趋势。
同时,CPU与GPU的算力均衡,以及相应平台的经济性也在AI时期被凸显出来。面对不同类型的用户供应不同类型的办理方案,而不是一股脑去通过多路方案办理问题,已经成为了市场发展的一定。至强W作为最强单路核芯,虽然不太善于面对大模型演习需求,但是其强大的扩展性和自身的性能实力,却可以在AIGC消费端、运营商、做事商办理方案运用中供应足够可靠的算力支持。比较双路或多路的办理方案,拥有更好的TCO,同时也能与双路和多路方案一起,知足不同用户的多元化需求,并确保算力均衡,这是时期发展的一定,也是用户需求转变之后的一定。
(8622520)