上海“数字城市底座”四大基建领域已基本成型
数字化的出现,为人类社会带来了巨大的变革。城市数字化转型成为提升城市竞争力的重要手段。2020年12月,上海市委、市政府印发了《关于全面推进上海城市数字化转型的意见》,提出“到2025年,上海全面推进城市数字化转型取得显著成效,国际数字之都建设形成基本框架;到2035年,成为具有世界影响力的国际数字之都”。
当下,上海城市数字化转型进展如何?已经取得了哪些成果,又经历着怎样的挑战。在上海市城市数字化转型工作领导小组办公室的指导下,由上海市经济和信息化委员会组织,澎湃科技推出“数都上海:上海国际数字之都建设深度调研”系列报道,聚焦数字基建、数字制造、数字农业、数字医疗、数字金融、数字出行、数字教育等10大领域,全方位展现上海在城市生产、生活不同场景中的数字化转型。
·算力的发展离不开芯片,而芯片的生态适配在超算领域一直是个难题。上海超级计算中心主任李根国指出,当下国产硬件研发不断创新,但苦于没有底层基础软件支撑。“基础软件实际上就是生态。硬件出来后,却没有底层大规模软件来支持核心操作系统以及各种应用软件。”
·好的数据也是提高算力效率的方式,发展计算最核心的是数据。要实现算法的价值就要加快推进数据开放利用。目前上海有很多潜在的算法应用场景,比如智慧交通、智慧医疗、智慧教育等,但数据壁垒阻碍了算法的落地。
站在屏幕面前,近万幢建筑、十万余个城市部件,包括电线杆、窨井盖、电话亭、市政箱体等呈现在按比例缩小的数字沙盘模型上。浦东新区花木街道的数字孪生沙盘可以洞察到每幢建筑、每个部件的具体情况……小到垃圾分类,大到整个街道的交通情况、城市建设的全周期数据,在花木街道的数字孪生沙盘前尽收眼底。
花木街道是上海建设国际数字之都的一小步,但推进其建成的背后,是上海数字底座的一大步。
2023年上海政府工作报告提出,“着力推动城市数字化转型,加快建设具有世界影响力的国际数字之都。”数字底座是上海迈向数字之都的“新基建”,与传统基础设施不同,数字底座“看不见摸不着”,却又遍布城市的每一个角落。
上海市经济和信息委员会信息化推进处(大数据发展处)副处长陈斐斐在接受澎湃科技(www.thepaper.cn)专访时表示,数字底座是指构建面向未来的数字城市基础设施体系,为城市数字化转型提供数据支撑、技术赋能和平台服务。
“数字城市底座”的顶层设计目前已基本成型,正在制定细化的标准体系。
陈斐斐表示,不同于公路、电网等传统基础设施,数字底座不仅需要建设,还需要运营。运营新型基础设施要求具备高水平的技术能力和专业知识,不能单纯依赖政府部门,而需要市场化的主体来参与和竞争,以适应市场的变化和需求。
《上海市全面推进城市数字化转型“十四五”规划》为上海的数字底座建设明确了主要目标——到2025年,上海基本构建起底座、中枢、平台互联互通的城市数基,为2035年建成具有世界影响力的国际数字之都奠定坚实基础。在这一目标的具体执行中,放在第一条的是“形成面向未来的数字城市底座支撑”。陈斐斐向澎湃科技(www.thepaper.cn)介绍说,上海建设数字之都的数字底座分为四个领域,分别为算力、算法、网络、数据。据了解,“数字城市底座”的顶层设计目前已基本成型,正在制定细化的标准体系。
其中,数据贯穿了数字底座建设的各个环节。现在,人工智能的兴起为数字底座开拓了新的思路,陈斐斐认为,作为未来上海数字底座的重要支撑,数据要素将加持人工智能技术,逐步赋能各个行业领域。
跨越70年的超算纷争
算力是在数字底座建设的“地基”,为数字底座提供可靠的支撑。作为城市算力的提供者,上海超算中心于2000年由上海市政府建设,成立20多年来,为上海的数字化发展提供了源源不竭的动力。
目前,上海超级计算中心由“魔方III” 超级计算机(峰值计算速度3.3PFlops,P表示每秒十亿亿次浮点运算数)对外提供服务。多年来,上海超级计算中心为科研院所、工业企业、公益事业的许多项目提供了计算服务,硕果累累。2016年以来,上海超级计算中心全力支持和保障环境监测中心对空气质量的预报工作;2012年超算中心参与的项目“超大直径、超长距离隧道盾构推进技术”(沪崇苏隧桥工程)获得“上海市科技进步奖”一等奖等等。
2020年1月12日“魔方Ⅲ”超级计算机正式对外运营。魔方Ⅲ全机CPU核数达35840个,峰值计算速度为3.3PFlops,是当时国内采用全通用CPU的计算能力较强的超级计算机之一。
上海超级计算中心主任李根国日前在接受澎湃科技(www.thepaper.cn)专访时表示,这一路走来并不容易,“美国对我国超级计算机方面的封锁,从上世纪五六十年代就开始了。”
美国曾多次对中国的超级计算机实施出口管制和制裁,限制中国进口高端芯片和技术。据悉,上世纪五六十年代美国对中国超级计算机的限制主要是技术封锁,不向中国出售或提供关键的芯片和软件,这种情况一直延续到80年代初。后来,为进行石油勘测,中国石油工业部花大价钱向美国购买了一台IBM超级计算机,但仍受到严密的监控和限制。
1978年,中国开启自主研发超级计算机的大门。包括“曙光”系列,“天河”系列以及“神威”系列,一路走来,中国自主研发的超级计算机性能和技术不断提升,与国际先进水平差距逐渐缩小,甚至开始领跑。
然而,美国对中国高科技产业的打压从未停止。继中兴、华为被制裁后,2021年,美国商务部瞄准了中国超算领域,将7家中国超级计算机实体列入“黑名单”,限制美国供应商对其出口,我国的超算事业被再次蒙上一层阴影。
但这一系列的制裁与打压也促使中国加快了自主研发和创新的步伐。据了解,上海超算中心新一代的人工智能算力平台正在积极与华为开展合作,使用华为昇腾达芬奇架构的人工智能芯片和服务器集群产品,华为对外表示,人工智能芯片昇腾910的算力已达到全球领先水平。
算力:市场化+公共服务缓解资源紧缺
虽然算力有了很大的发展,但李根国指出,上海超算中心的算力资源一直很紧缺,常年处于满负荷运行的状态。在上海超算中心一楼机房外的屏幕上,红、绿两色色块的比重各占一半,红色表示排队,绿色表示运行。“这种情况是这儿的常态,永远都有用户在排队,现在由于人工智能发展迅速,算力需求更加旺盛。”
“算力问题可以通过市场化的方式来解决,由企业投入建设。”陈斐斐表示,事实上现在已经有很多企业投入算力建设,因为能看到其商业回报。“在这方面,政府需要做的就是考虑如何提供一些普惠性的或兜底性的公共服务。”
随着人工智能行业的蓬勃发展,许多厂商纷纷看到商业算力的市场前景。其中,上海本土企业商汤科技充分发挥自身算法积累优势,打造开放共享的商汤科技人工智能计算中心,通过弹性调配闲置算力,实现算力资源的最大化利用。商汤表示,这不仅能够支撑内部算法研发,也能为其他算法团队提供可靠、高效的商业化算力支持和灵活的算力解决方案。
上海超算中心新一代的人工智能算力平台正在积极与华为开展合作,使用华为昇腾达芬奇架构的人工智能芯片和服务器集群产品,华为对外表示,人工智能芯片昇腾910的算力已达到全球领先水平。
李根国也向澎湃科技表示,上海超算中心作为普惠的算力平台,不希望让用户承包超算中心的计算资源。“尽管用户提供的资金可能足以支付我们的运营费用,但我们仍然会尽量避免这种情况的发生。作为公共基础设施,我们致力于让资源能够开放共享,供大家使用,而不是被独占。”
因此,为了满足众多用户的科学计算需求,超算中心也希望利用自身作为有公信力的公共服务平台的优势,成为用户和厂商之间的桥梁。超算中心既可以为用户提供算力资源,同时也可以成为用户寻找算力资源的入口,借用其他商业算力,帮助解决算力供需之间的矛盾。
为了更好地满足企业的需要,上海市曾派发过科技券。通过企业使用科技券,算力中心申报获得补贴的形式,鼓励企业进行研发创新。但由于“结算周期长、申报过程繁琐”,导致科技券的使用效率不高,企业的算力需求难以及时满足。李根国建议,“政府应该不仅仅补贴最终用户,也要考虑算力供给侧的扶持和补贴,从两个方面结合才能更好地能让算力能够更快地达到最终用户。”
面对算力供需矛盾,上海市正在制定最新政策。据悉,上海即将出台《上海市推动人工智能大模型创新发展的若干措施》(下称“措施”),推出智能算力加速专项计划,强化大模型智能算力建设力度,建立绿色通道;打造智能算力调度平台,构建上海规模化先进算力调度和供给能力。上海市经信委副主任张英也曾表示,上海将加大财政专项政策和贴息支持力度,大力支持智能算力建设,降低大模型算力成本。
算法:与产业深度融合是关键
在人工智能时代,人脑逻辑性的思维问题可以利用算法转化为基于大数据的概率计算问题。陈斐斐指出,在数字底座中,算法应用更多集中在城市管理和治理两个方面,利用先进的算法,可以解决城市管理中交通规划、治安管理、医疗资源分配等许多问题。
上海在算法方面已经展现了一些优势,在人脸识别、语音识别、自然语言处理等领域已经取得了领先的成绩。“在大的维度上,典型的算法应用就是大模型。”陈斐斐指出,上海积极推动算法与产业的深度融合,打造了一批具有国际影响力的算法创新企业和平台。而其中最具有代表性的就是上海人工智能实验室“书生”系列开源通用大模型、商汤科技的日日新(SenseNova)等人工智能基础大模型。
人工智能大模型的出现,为千行百业打开了新的机会窗口,也为数字底座的建设带来了新的机遇。但在细分赛道内,“大模型如何高效率、低成本、规模化落地”成为了亟待解决的难题。
商汤科技联合创始人、大装置事业群总裁杨帆向澎湃科技表示,过去人工智能在产业侧“落地难”是因为技术产生的高门槛。“过去商汤在做AI应用产业落地时,需要把全环节都做了,包括客户的安装实施等,这导致了人力成本高昂、效率低下等问题。”
作为上海的本土企业,商汤科技希望旗下的商汤大装置能够成为AI版的“发电厂”,打通算力、算法和平台,能做到批量化生产各种AI算法模型,并进一步部署、迭代和升级,帮助AI产业落地。“未来,正如任何一个成熟产业链一样,人工智能产业将在未来几年,变成多分工、多分化的,开放的生态。”杨帆说道,“而现阶段对于人工智能大模型的建设最重要的不是本身的利润,现在行业还处在非常早期的阶段,更重要的是整个的技术领先性。”利用先进算法优化城市管理和服务,提高城市智能化水平。
据统计,目前国内10亿参数规模以上的大模型已发布近百个,但算法相较于国外仍然存在差距。杨帆表示,出现这一现象的原因是中国和国外在产业结构和经济社会发展阶段不同。另一方面是缺乏高端人才,构建数字底座需要大量顶级算法人才,但是真正能研发核心算法的高端人才稀缺,制约了算法创新进展。
此外,要实现算法的价值就要加快推进数据开放利用。目前上海有很多潜在的算法应用场景,比如智慧交通、智慧医疗、智慧教育等,但数据壁垒阻碍了算法的落地。例如,在智慧医疗领域,可以通过算法分析医学影像来诊断肺结核。但这种算法需要大量的肺部X光片来训练和验证,然而不同的医院、诊所、实验室等可能有自己的数据管理系统和标准,不愿意或不能够将数据提供给算法开发者。这就形成了数据壁垒,阻碍了算法的落地应用,也影响了肺结核的早期发现和治疗。
数据:流通机制亟待完善
作为数字城市运行的基石,数字化的各个环节都需要数据的参与,近年来上海也在持续探索构建数据流通和教育制度,培育数据要素市场体系。上海数据交易所自2021年底揭牌以来,在数据的流通中扮演了重要角色。在张江的上海数据交易所大厅内,处处都是数据的流动——蓝色显示屏上滚动播放着各类数据产品信息,企业在柜台前交易着数据产品……目前,交易所累计挂牌数据产品已经超1300个。“数据交易市场已经成为一个独立赛道,而且它现在还是一片蓝海。”上海市经济和信息化委员会信息化推进处(大数据发展处)副处长山栋明此前在接受澎湃科技采访时表示。
“数据交易市场已经成为一个独立赛道,而且它现在还是一片蓝海。”
现在,全国已经建有数十家交易机构,但场内交易至今仍处于探索阶段,背后既有尚待完善的制度因素,也因为数据交易本身的复杂性。“确权难、定价难、互信难、入场难、监管难”,被普遍认为是实现场内数据交易的五大难点。
在实际交易的过程,数据本身的质量问题便是一个难题。比如数据的格式不统一,数据的来源不可信等。在数字化基础设施建设中,这些问题会影响数据的价值和效用,也会增加数据的处理成本和风险。
以智慧医疗为例,如果医疗机构想要利用大数据技术来提高诊断和治疗的效率,它需要从各种渠道收集患者的健康数据进行整合分析,例如体检报告、病历记录、医保信息等。但在这一过程中,体检报告有错误或遗漏、病历记录中有模糊或不一致、医保信息中有重复或冲突等,都会导致数据分析的结果不准确或不可靠,也会增加数据清洗和校验的工作量和成本。
此外,当下数据流通仍存在障碍,现阶段数据所有权不明确,数据保护规则不完善,数据交易市场不成熟在一定程度上限制了数据的流通性和可用性。
星环科技技术副总裁刘汪根早前在接受澎湃科技采访曾表示,“数据必须被深加工才能交易,譬如银行需要的数据产品可能光有一家机构的数据还不够,还要结合其他类别的公共数据,在加工过程中,必须保证所有环节合规合法,只要任何一环无法合规,前期所有的投入都要打水漂。”当下数据交易市场尚处于培育时期,缺乏数据处理技术和经验的数据持有方不愿意投入,银行也不愿意为这种不确定性买单,技术提供商若独立投入则必须承担巨大风险。
数据流通和交易制度是数字底座的重要组成部分,也是数字底座发挥作用的重要保障。华鑫证券的报告显示,根据工业信息安全发展研究中心的测算,2022年数据要素市场规模已经突破900亿元,预计到2025年将达到近1750亿元,当前规范的场内交易占比仅为2%—3%。可见,尽管数据要素市场规模正在快速增长,但真正规范化的交易仍处于起步阶段。
普华永道中国合伙人詹睿在接受澎湃科技采访时表示,现阶段多数企业依然处于数据资源化阶段,即信息化建设和优化阶段,对于数据交易的认知度较低,这方面尚需更多的指导和支持。
网络:5G深入千行百业
建设“数都”,就需要使数字化遍布城市的每个角落。而5G的超高速率、超低延时、海量连接等特征,使网络能够覆盖所有领域和场景,为上海的智能物联网、自动驾驶、智慧医疗、远程教育等场景提供实时且稳定的通信支持,助力城市底座建设驶入快车道。
5G产业是上海的特色产业。记者了解到,截至2022年底,上海已建成超6.8万室外基站,并计划到2023年底累计建设超7.2万个室外5G基站,同时累计打造1000项5G应用。
产业方面,芯片、模组、通用网关等产品设备的研发和产业化进程不断推进,5G模组供给稳步提升、成本持续下降,价格相比于5G商用初期下降80%左右,为5G规模化应用奠定基础。
应用方面,5G网络已深入千行百业,根据上海市通信管理局发布的行动计划,上海将继续围绕工业互联网、智慧交通、智慧城市、智慧园区四大领域拓展5G应用。例如,利用5G网络实现车路协同、智能信号灯、智能停车等应用,提升道路通行效率和安全性,缓解交通拥堵和污染。基于5G+交通,上海嘉定区已成为国内首个5G车联网示范区,实现5G车联网全覆盖,拥有1300多公里的智能网联汽车开放测试道路,服务于智能网联乘用车、商用车、客车等多种车型的测试与应用。
中国移动5G基站作业。
此外,随着数字城市应用场景的复杂化和专业化,对基础网络性能的要求还将进一步提升。“比如远程手术,它对实时视频传输带宽和延迟时间都提出了极高要求,需要5G甚至更先进的网络才能满足。如果网络延迟超过几十毫秒,远端医生无法观察到实时手术过程,无法准确控制手术器械,远程手术就无法实施。”李根国在采访中解释道。
值得注意的是,在构建数字城市的过程中,公网和专网需要“双轮驱动”。陈斐斐指出,相较于运营商搭建的公共网络,各行各业在数字化过程中,更需要面向业务定制化的专用网络。例如无人驾驶,公共网络的可靠性难以满足无人驾驶对实时性和确定性的要求。“自动驾驶车辆在行驶中突然遇到公网延迟甚至是中断,都可能引发严重事故。”她表示,这就需要通过构建专用的自动驾驶网络,提供高可靠、低时延的连接服务。
数字底座需多方协同共筑
算力、算法、数据、网络是构建城市数字底座的关键环节,这四个要素不仅缺一不可,同时环环相扣、互相影响。譬如,好的数据是提高算力效率的有效方式。李根国指出,“发展计算最核心的是数据。模型的训练质量取决于数据质量。”
此外,促进城市数字化转型不仅需要筑牢关键环节,构建一个有利于数字化发展的生态才能最终推动城市数字化持续推进,生态中不仅需要硬件的新陈代谢,也需要不断创新的软件支持。
仍以算力为例,算力的发展离不开芯片,而芯片的生态适配在超算领域一直是个难题。李根国指出,当下国产硬件研发不断创新,但苦于没有底层基础软件支撑。“基础软件实际上就是生态。硬件出来后,却没有底层大规模软件来支持核心操作系统以及各种应用软件。”有的用户用国产芯片,有的用户用国外芯片,生态不统一,导致软件开发和移植成本高,难以形成规模效应。李根国表示,“过去在英伟达设备上运行的程序,现在要移植到国内厂商的设备上运行,那么就需要重新进行生态适配,重新开发和测试,”李根国说道,“这对许多用户而言十分麻烦。”他建议每一个厂家在推广自家产品的时候,就做好生态的培育工作。“生态培育非一日之功,英伟达的产品也并非一开始就是行业标准,通过长期的培育过程,不断更新和升级,才逐步形成今天的生态。”算力发展长路漫漫。李根国认为,“只有从芯片到服务器到网络到算法整体的需求提升,算力才可以提升。”
作为一项新生事物,原有的配套政策和制度也面临着更新换代,技术生态需要同步推进,制度生态也不例外。“在数字底座的建设过程中,要从整体上推进,形成完整的制度链条,而不仅仅是突破某个点。”陈斐斐表示,如果制度创新仅仅是点上的,就很容易失败或遭遇阻力。“如果只在数据条例中增加一条授权条款,其他配套制度不跟进,这条授权条款就很容易遭遇质疑。”
杨帆在接受澎湃科技采访时也表示,作为上海人工智能企业的代表,商汤科技坚信人工智能在医疗、金融、交通等领域有广泛的应用场景和创新价值,希望未来可以通过与政府、学术、行业的合作,共筑数字底座。
澎湃新闻 2023-7-31