为什么国产大飞机今年才正式运营,chat-GPT为什么能早于文心一言出现,为什么我国各大医院、高校、科研单位至今用的最多的科学仪器,如像核磁共振,X射线衍射,红外,紫 外,都是外国的产品? 有一个共同的原因,基础科技发展落后。 基础的、底层的科技、技术、工艺,牵一发,动全身。 为什么不发展基础的、底层的科技? 因为基础科技不仅靠努力,更需要一代又一代人花费大量的时间来创新。 就好比,当你会走路的时候,别人已经会跑了;你会跑的时候,别人已经骑上了自行车。 要想超越别人,最好的办法是用速度换时间。 比如修建好科研基建高速路,才有机会弯道超车。4月18日,科技部明确了这条路叫“超算互联网”。 相关的技术我们称之为高性能计算。 正视差距,才能弥补差距,那么我国的高性能计算发展水平与国外相比如何?有什么样的差距,我们又能从中看到哪些机会? 1、技术水平差距: 最核心的2个差距一个是芯片工艺,一个是应用软件。虽然芯片总体性能相当,但是单核性能与X86比较起来还是差一些,尤其是芯片制造这一块。 在生态上,国内各种体系架构百花齐放,海光的X86,飞腾的ARM、江南计算所的申威,还有各种GPU。较之国外成熟的X86+CUDA生态相比差距还是比较大。 在应用软件上,我国虽然已大力发展,但在高性能计算的软件和算法上还有差距。比如多次登顶TOP500的美国超算能力是一股自底而上的完整技术生态,从最基础的计算单元 (CPU和加速器),到基础软件、工业软件或商业软件,再到上层应用开发,是一个完善的生态闭环;而我们的超算,绝大多数设备的计算核心并非国产,基础软件对外依赖,工业 和商业软件亦不例外。 2、设备和基础设施差距: 美国E级超算项目相关的报告中,会将他们对未来E级超算的使用,精确到非常细致的程度。他们在计划书中会写到用E级计算机来提高发动机的效率;他们能将发动机内燃烧的各种 化学反应、流体计算方程等都呈现在上,关于其在T级计算机能算到什么水平,P级、E级计算到什么程度……也就是说,一个关于超级计算机研制的申请报告中,不仅有计算机研制 的框架、方案、意义,还有关乎未来应用的、非常细节的展现。 美国超算的强大,在于其计算机硬件、基础软件,以及其应用是一脉相承的。反观我国超算,真正实现商品化落地,不过20多年。2013年~2015年稳坐世界最快超算头把交椅的“天 河二号”,曾因年耗电亿元之巨、实用性和效率却难令人满意,一度成为众矢之的。在“2018年全国高性能计算学术年会”(HPC 2018)上,仍有院士吐槽:“超算在应用层面的滞后 是我们长期以来的一个痛点。” 目前,我国超算中心主要业务基本还是高校、科研院所,很多企业想用上超算,却不知该从何处下手。而且超算系统的生命周期有限,如何在它5~7年的“巅峰生涯”里发挥更大作 用,服务国计民生更多方面是现阶段需解决的主要问题。 只有超算越易用、好用,各行各业拥抱超算的门槛才真的降低了。门槛低了,用得人才能多起来,生态才会活起来。 3、学术研究差距: 不可否认,国外在算法、模拟和应用方面的研究更加深入和前沿,一些国外机构和大学拥有更多的研究资源和顶尖学者。 比如,要着力构建“系统软件和中间件”接口或平台,这是应用生态中非常关键的内容。系统软件和中间件是连接超算底层和上层应用的关键环节,通常在超算上跑应用的技术人员, 如果对计算机底层不太熟悉,会感到束手束脚,牵扯大量精力。 只有解放这一部分生产力,让做应用的专注于应用软件的开发、让专业的人做专业的事情,才能提升应用环境的优化和应用效率。 但这并不容易做到,一支高水平的支撑队伍需要很强的交叉学科能力,才能把对超算的应用服务做到比超算的建设和维护还要出色。 因此只懂计算机是不够的,还要“混搭”与应用相关的知识背景。 常参加SC、ISC的业内人士可能会比较清楚,中国的展台更重视硬件展示,与软件或应用相关的展示和报告很少,且作报告的百分之八九十都来自大学、科研院所。而美国人的展台 则完全不同:几乎每个展台上都有大量来自学术界、工业界等混搭作报告的人,报告内容包括学术研究、应用进展、超算系统新用途,应用与软硬件产品展示等等。 4、人才储备差距: 国外在高性能计算领域拥有更多的顶尖科学家、工程师和专业人才。但是国内既懂算法、懂体系架构、还懂应用算法的复合型人才特别少。 目前这种情况是因为国内整个培养体系不完善造成的。异构计算、并行计算这些概念直到近几年才得到大家的重视,很多高校根本来不及培养这类人才。 而且高性能计算相关人才培养不像传统的开发那么容易。因为程序员的思维模式需要从根本上做转变。原来是基于单线程的思维模式,现在要将算法设计成多线程。怎么样能把任务 很好地分配到各个处理器上,怎么去利用好各个处理器上的硬件资源,这都是很难的。 虽然有些高校会开相关的选修课,但开课老师一直是待在学校,本身并没有太多实战经验,也没有经历过来自工业界的摔打。所以,总的来说,培养效果不很明显。 这几年随着深度学习的崛起,工业界对于人才的需求越来越旺盛,学校的培养不仅跟不上,而且鸿沟越来越大。尤其大模型一出,几乎所有的公司都在抱怨,这个领域的人才不够用。 要解决人才的问题,首先是得解决有人来学的问题。其次是培养一批非常好的老师,然后想办法让尽可能多的学生能触及并获取到这部分资源。 硬件拿钱可以堆出来,但人才不行,这是有培养周期的。 高性能计算是中国科技进步的重要支柱,也是我们国家实现创新驱动发展的关键之一。尽管存在这么多的差距,尽管很多人说差距已经大到无法赶上,但我们国家一直在追赶的路 上。不可否认的是,我国在高性能计算领域也已经取得了巨大的进步。 我国一直在加大对高性能计算的投资和支持,不断提升技术水平和人才储备。2022年,超算作为第四个关键词;2023年,科技部确立部署超算互联网,搭建科研基建高速路。我们 看到越来越多的高校和企业积极开展超算竞赛及活动,中国超算队多次在世界级的超算大赛中摘金夺银;越来越多的高校在研究生阶段甚至本科阶段开设了高性能计算相关专业,越 来越多的企业放出了更多高性能计算相关的岗位。 路要一步一步走,饭要一口一口吃。抱怨没有未来,只有相信,才有未来。愿我们都有光明的未来。 在这里,猿代码科技(https://www.ydma.com)为您准备了一份高性能计算培训课程,涵盖CPU、GPU以及超算运维。其中尤其推荐的是猿代码-高性能计算从新手到大师系列课程(CPU和GPU并行优化) 这是由国内顶尖科研院所专家及知名企业工程师合作研发的高性能计算专项课程,涵盖高性能计算之并行计算等多个方面,包括CPU并行计算实战课程、GPU并行计算实战课程以及 超算运维等。您将有机会通过工程化实战项目来学习所学知识,并与来自国内顶级专家及工程师近距离合作与学习。 |
说点什么...