中科天算布局全国产太空“机房”
“卫星卫星,你看到多少艘船?数一数。”在距离地面500多公里的太空中,中科天算部署在卫星上的智能计算机极光1000·慧眼,10秒钟就能回复地面的问题。在这背后,是天基智能机搭载的算力卡的硬核支撑。算力、算法与数据是人工智能三要素。当前,太空算力已成为全球竞逐的前沿科技赛道,是算力体系升级与航天技术深度融合的方向。天算团队从2023年开始将搭载算力卡的天基智能机陆续送入太空,验证算力在卫星上运用的可行性,为今后在太空部署算力“机房”探路。日前,记者探访中关村科学城企业中科天算,就为什么要在太空部署算力,需要克服哪些困难,未来有什么布局等问题,与企业相关负责人进行深入交流。
算力为什么要上天
记者了解到,早在2024年初,中科天算就发射了极光1000·慧眼,搭载了国产NPU(神经网络处理器),并在2024年底通过上传的方式部署运行了天基大模型。图像识别、云图判别、图像压缩任务均成功完成,地面的飞机、船只都被精准识别。
算力为什么要上天?一个重要原因是,“天下苦卫星数据久矣”。卫星相当于太空照相机或者探测器,拍摄的照片、采集的数据,一股脑儿传给地面接收站。由于带宽受限,以及卫星大部分时间不在地面接收站覆盖范围等原因,仅有不到10%的有效数据能传回,大部分数据浪费了。
中科天算战略发展部部长李泓辛表示,未来,太空中会有越来越多的数据。卫星遥感、雷达等产生多种数据;星间互联网等组成“天网”,大量数据在太空中自由流动、实时传输。在更靠近太空数据产生的地方进行计算,可以大幅降低传输带来的带宽压力,提高时效性。太空算力将成为重要基础设施。
据介绍,卫星把图像和数据传回地面后,地面处理往往要经历数据传输、分析处理、结果分发等步骤,过程可能需要数分钟到数小时。在轨处理可以做到“数据就地筛选、就地压缩、就地判断”,及时把价值高的数据传回地面。在应急救援、遥感监测等要求快速响应的场景,在轨处理数据优势更为明显。
算力上天,还有一个很紧迫的问题,就是地面算力压力大。微软CEO纳德拉近期在一档节目中承认,公司正面临一个前所未有的窘境,手上有成堆的GPU,却因为缺电、缺空间,只能闲置。
相比之下,太空足够大,没有土地、建筑、水费、电费等成本。太空太阳能充足、稳定,可为算力提供长期、可预期的能源,且比地面上的能源利用效率高很多。同时,太空低温环境便于散热,可以节省大量制冷开销。
李泓辛预测,未来地面互联网中的部分数据,可能也会在太空中完成传输和计算。中科天算希望把原本部署在地面机房的高性能计算和AI大模型能力,搬到卫星和太空平台上,让卫星不只负责“拍照、传回数据”,而是具备在轨实时分析和智能决策能力,降低回传带宽、提升响应速度。
今天,“人算”不如“天算”,未来,可能“地算”也不如“天算”。
算力上天难在哪
人工智能行业的超级计算上天,不是简单地把搭载算力的卫星送上天那么简单。李泓辛介绍,让算力系统在太空极端环境中长时间稳定地运行,最大的两个挑战是“容错”和“散热”。太空中的强辐射、大温差(太阳光直射面温度可达150℃,背阳面却低至-100℃以下)、微震动等,对硬件和软件的稳定性都是巨大考验。太空是真空环境,没有空气对流,传统散热方式在轨难以实现,网友们常说的“GPU干烧了”在太空并不是玩笑话。太空中的设备难以人工维修,一旦出现问题就可能直接导致整套算力不可恢复,或整颗卫星报废。
为把算力送上天,中科天算从硬件到软件逐步进行在轨验证。2023年,天算团队将搭载国产高性能AI芯片的极光1000星载智能机发射上天,目前已在轨稳定运行超过1000天。
2023年,天算团队研发了极光1000-3,完成了三机在轨协同验证实验,推动“太空超算协同计算”关键技术突破。
2024年初,天算团队发射了极光1000·慧眼。
2024年6月,中科天算成立,定位于天基智能计算与应用系统提供商,专注于突破“超算上天”“太空人工智能”核心技术,产品体系包括极光系列星载智能机以及配套的模块卡组、极光OS操作系统和极光算子库。
李泓辛介绍说,中科天算通过软硬件协同构建了系统级容错架构,电路板分区隔离、关键总线双备份、存储多硬盘启动,一系列“太空级保险措施”保障系统即使在部分故障的情况下也能自动恢复,使基于商用芯片构建的算力系统,在轨具备接近航天级的可靠性。设计了主、被动结合的散热方案,通过泵驱流体回路,即“液冷”形式,解决高热流密度器件的散热问题。这两项能力,既需要长期在轨数据积累,也需要跨学科的系统工程设计。中科天算在容错技术和散热技术上取得突破后,随着视觉语言模型轻量化部署,太空算力已从概念阶段走向可用阶段。
让AI自主管理卫星
目前,中科天算正在进行新一代太空超算产品——极光5000星载智能机的研发。极光5000具备多备份、高可靠性、高性能等关键特性,采用流体
散热方式,支持超10张对标英伟达H100的国产全尺寸GPU并行计算与稳定运行,将于明年进行在轨验证。
中科天算在今年启动了“天算计划”,目标是实现万卡级超级计算与数据中心的在轨部署,形成突破地面能耗、供电、空间与网络延迟瓶颈的新型计算基础设施,计划于2030年逐步建成。
按照规划,“天算计划”将采用集中式高能效超算架构,建成由1平方公里太阳能电池阵列构成的能源舱,基于国产GPU的万卡级算力舱,由激光通信装置构成的通信舱,构建完整的天基超算系统。
“天上卫星数量众多,无法逐一进行人工管理,未来一定是
依靠AI进行自主协同。”李泓辛举例说,由卫星自主决定拍摄地点、数据处理主体及传输分发方式,AI在这一过程中将发挥重要作用。天上各类数据需要适配农业、森林防火、应急救灾等不同场景,这些在轨数据的融合与加工可以通过AI实现,让卫星从“看得见”变成“看得懂”,再进一步变成“能主动提醒、能参与决策”。
海淀区“十五五”规划建议提出,聚焦空天地一体化卫星通信、天基算力基础设施、即时遥感星座、太空旅游等前沿领域抢滩卡位,搭建商业航天公共技术和创新服务平台,打造太空算力网络系统,高质量建设卫星小镇。李泓辛表示,中科天算作为中关村科学城企业,将把“天算计划”和海淀区的发展战略结合起来,共同做大做强全国产太空算力平台。“待卫星互联网(天数、天网)建成后,天算就成为一个刚需,可能几年之内相关行业就能用上这类服务。”
记者 倪恒虎
随便看看:
相关推荐:
网友评论:
推荐使用友言、多说、畅言(需备案后使用)等社会化评论插件








