2023年的进度条虽然已走过四分之三,但科技圈对大模型的热情却只增不减。自年初以来,科技公司、科研机构纷纷抢抓产业风口,大模型产品更是如雨后春笋般涌现。
根据赛迪顾问发布的多个方面数据显示,2023年,受ChatGPT驱动,大模型发展迈向新阶段,国产大模型一时间呈现出爆发式增长态势。截至2023年7月,中国累计已经有130个大模型问世。但与此同时,我们正真看到,由于大模型技术上尚且处于摸索阶段,面临着隐私安全、滥用风险、伦理等问题。
因此,产业如何在抢抓大模型发展机遇的同时,推动大模型的良性发展,也成为值得思考的问题。
日前,我们邀请到企商在线AI算力与云服务能力中心副总经理张轶男做客天极网&比特网π圆桌视频访谈栏目,围绕“大模型时代下的机遇与挑战”这一主题,进行了深入地交流探讨。同时,用友网络助理总裁兼iuap智能中台部总经理方高林也在主题采访中分享了观点。
ChatGPT的横空出世,迅速在全世界内掀起一股巨大浪潮,由此拉开了大模型产业蒸蒸日上的序幕。OpenAI、微软、谷歌、Meta等海外厂商在这一赛道动作频频,国内的大模型市场也处于一个百花齐放的状态。显然,大模型已成为当下全球科学技术领域的焦点之一。
在大模型发展如火如荼的背景下,其商业化落地也被慢慢的变多地提及,但“落地”却也是大模型面临的最大挑战。
在张轶男看来,解决大模型落地难的重点是要有明确的目标。大模型分为通用大模型和垂直大模型两种,实施方案是不一样的,所以大模型企业首先要确定好发力方向。方向确定之后,要有相关的资源,无论是算力资源池资源,还是算力服务器资源,假如没有这些算力基础设施支撑,就不会实现结果输出,这是一个比较关键的问题。
近年来,在国家加速推进算力建设的背景下,企商在线也在积极融入国家发展大局在算力产业大力布局。例如,在数据中心层面,除了京津冀片区有自己的智算中心以外,现在在西北、华中、华南也有相关布局,以服务千行百业的客户。智算中心要用到大量的GPU算力,我们有不同的方案,为不一样的行业,针对不同的需求的客户提供相关的服务和能力。
截至目前,企商在线个自有机架和算力资源,算力规模达2000PFLOPS,数据中心资源遍布全国,运营13个稀缺型算力中心和数据中心,累计已为近100,000家客户提供过服务。
“技术的迭代推动着人类社会的进步,不管是工业革命还是互联网革命,亦或是现在的大模型技术,都在驱动三大产业的蓬勃发展,”张轶男表示,“业界有一种说法,大模型时代的到来,所有产业都可能会重新做一遍。相信大模型至少在未来三五年,仍然还是一个非常火热的行业。”
深谙此道的用友,在布局大模型之初就明确了一点,那就是聚焦垂直领域,基于数字和智能技术服务企业和公共组织数智化的最新研发成果,打造出企业服务大模型YonGPT,为公司可以提供管理决策及价值创造服务,赋能财务、人力、业务智能化。
其中,在智能化业务运营方面,通过数据分析和预测能力,深入洞察公司运营、识别潜在的业务风险和机会,并提供智能化的解决方案,来提升经营决策水平和业务运营效率;在自然化人机交互方面,通过自然语言处理技术和理解能力,使能企业应用和服务与用户进行自然且流畅的对话体验,以“人”为本的方式实现不同应用的调用、连接、组装,更自然、高效地完成工作;在智慧化知识生成方面,通过从海量数据和信息中提取、整合知识,生成新的、有价值的知识内容,涵盖了行业解决方案、专业领域知识分享,助力企业和用户全面利用自身知识的储备和积累,促进知识的传播和应用;在语义化应用生成方面,通过对客户的真实需求、企业业务和数据特征的理解,可以自动生成具有语义化能力的应用程序,全方位提升企业个性化应用服务的创建效率。
“构建企业服务大模型用友具备四个独有的优势,一是领先和有着非常丰富应用场景的企业软件与服务产品体系;二是覆盖数十个行业的数百万客户基础;三是35年服务企业客户积累的行业知识经验;四是专业的智能化团队和能力。未来,在应用方面,YonGPT将与用友的产品做深度集成,以产品矩阵的方式提供大模型能力,并在业务运营、人机交互、知识生成、应用生成四个方面开展大模型应用,让大模型和各领域产品深层次地融合。同时,持续完善大模型配套能力、产品深度集成能力,提高大模型任务分解/调度能力,对于大模型解决不了的问题,通过配套能力进行完善;对于大模型能够解决的问题,通过训练数据进一步调优。此外,还将提高基于低代码的语义化应用生成能力,以及自研大模型技术能力。”方高林说道。
由此可见,实现大模型落地的关键是跨越技术与业务场景之间的鸿沟。简单来说,就是以实际的需求为导向,满足具体业务运行所需的各项能力,最终实现大模型的真正落地。
众所周知,大模型的底层逻辑由数据、算力和算法三要素构成,但现阶段,这三要素究竟孰轻孰重,业界看法不一。
张轶男认为,算力作为底层资源能力,其实是0到1的过程,没有前面的“1”,后面有再多“0”都毫无意义;数据是算力以外的能力,在算法能力恒定的情况下,数据维度越多就越精准;最后才是技术迭代,包括算法的精准度。
需要注意的是,随着大模型的发展,算力需求也在持续增长。工业与信息化部多个方面数据显示,目前我国算力总规模位居全球第二位,近五年保持30%左右的年增长率,新增算力设施中智能算力占比过半,成为算力增长的新引擎。
然而,智能算力增长过快也带来一定的问题,过去算力增长遵循摩尔定律,每18个月性能会提升一倍,但到了智算时代,算力翻倍的时间已缩短至3-4个月,智能算力成为“稀缺资产”。
张轶男表示,作为国内最早从事互联网基础设施建设和运营的公司之一,企商在线始终聚焦“AI算力服务”、“云服务”、“数据中心服务”三大核心业务领域。针对底层服务器资源的紧缺问题,企商在线与国内的一些TOP级厂商,保持着良好的上下游合作伙伴关系,例如,企商在线打造的石景山智能算力中心项目,将提供610PFlops的算力服务,以更好地满足金融、科技公司及科研机构的算力需求。同时,企商在线专门干服务器代采二十余年,积累了丰富的经验,在价格、供货周期等方面,都具有强大的竞争力。此外,企商在线还面向行业端的具体需求为客户提供定制化能力,以金融行业为例,一定要通过JR/T-0131、0132认证,企商在线数据中心依照国家A级机房标准建设,并满足三级等保2.0标准。并且,相关的配套服务能力,包括算力选型、异构算力平台,能同时纳管英伟达全系列GPU资源。另外,寒武纪、昆仑芯已完成适配,摩尔线程、燧源科技等其他厂商也在适配过程中。
如果说算力是推进大模型的快速地发展的核心驱动力,那么网络则是影响大模型训练质量和速度的重要因素。
张轶男认为,大模型训练对网络提出了更高的要求,作为数据中心运营方来说,挑战是必然的,但反过来这也是企商在线的优势。为了给最终用户带来无感延迟体验,企商在线做了很多工作,其中,在普通以太网场景下,采用BGP多线路融合、动态带宽扩容、融合CDN等方式解决有关问题;在高性能计算场景下,采用IB组网和ROCE方案,目前,这两种方案都已具备落地条件,可让客户根据不同的环境和资源池进行适配。
如今,“双碳”发展慢慢的变成了时代发展的主旋律。节能减排不但可以减少温室气体的排放,减缓气候平均状态随时间的变化,还能够在一定程度上促进经济社会的发展,实现可持续发展。
在数字经济蒸蒸日上的浪潮下,数据中心作为承载算力、传输、存储的基础平台,扮演着至关重要的角色。然而,随着数字化的经济建设的持续深入,数据中心的能耗问题也日益凸显。
张轶男指出,一般来说,数据中心机柜功率通常为4.4千瓦,而随着大模型时代的到来,从算力发展的新趋势来看,面向大模型训练的服务器,如A800服务器就要消耗6.5千瓦的功率,H800会更高。所以,在新建数据中心时,不会再按照传统的方式来规划,而是使用高密度、高电力的机柜部署方式,以提升性能、减少占地面积,但同时也对电力、冷却等技术造成巨大挑战。
从数据中心运营角度来看,在数据中心端,传统数据中心一般会用的是风冷或水冷架构,成本比较高、维护和管理相对较为复杂。企商在线三里屯数据中心使用的就是行业最新的风冷氟泵技术,并采用科学气流组织、智慧照明、智慧运维等技术,达到了绿色节能的标准。在服务器端,服务器正逐步从机架式发展到液冷式。液冷服务器分为浸没式与冷板式两种不同主流方案,浸没式是指将液体注入服务器,为发热部件进行换热,带走热量。液冷散热可以明显提升服务器的性能,降低运行温度。此外,还有绿电交易、风能、碳交易,都是推动数据中心低碳发展的重要手段,企商在线作为智算中心运营方与技术服务方都会提供满足多种客户需求的定制化方案供客户选择。
此外,企商在线正与下游合作方针对数据分析、分类管理相关措施进行探讨,具体而言,就是将数据分为热数据、温数据和冷数据,分别采取了不同的存储策略,以更好地管理和存储数据,从而节约存储成本。并且,企商在线还与合作方共同制定了有关标准,团体标准已正式对外发布,下一步会争取参与行业标准,甚至国家标准的制定。
前不久,我们就类似话题还采访到希捷中国区产品线管理总监刘嘉,他从循环再利用的角度,阐述了希捷践行节能减排的实践与规划。
他表示,随着AIGC技术的不断成熟,应用会慢慢的多,也将产生更多的数据。希捷将不断研发推出高可靠性、高性能、大容量和低总体拥有成本的存储产品,帮助客户应对一直增长的数据量所带来的挑战。与此同时,希捷计划在2030年将研发和生产的资源100%采用可再次生产的能源,到2024年实现碳中和。其中,希捷在2022年通过翻新计划延长了一百多万块机械硬盘和固态硬盘的常规使用的寿命,通过翻新和重新部署实现回收,避免了540多公吨的电子垃圾进入填埋场。面向未来,希捷也有一些新的硬盘技术能帮助到用户更方便地进行硬盘回收,例如针对即将下线的硬盘,希捷硬盘快速安全擦除技术可确保数据在离开数据中心之前被擦除、没办法恢复,这将有利于硬盘的回收和二次利用。
实际上,在大模型加快速度进行发展的同时,其引发的安全风险也成为人类关注的焦点。如何防患于未然,实现AI的安全性和可控性,成为当下亟待解决的问题之一。
张轶男表示,现如今,隐私安全问题显得越发重要,尤其是在大模型时代变得特别突出。我国陆续颁布了《网络安全法》《个人隐私保护法》《数据安全法》《生成式人工智能服务管理暂行办法》等政策文件,并于今年3月正式组建国家数据局,快构筑起网络安全屏障。相信不久的将来,将会有一个牵头机构,将行业标准制定起来,企业在基于标准的前提下,将安全可信、隐私性结合到业务中,为整个产业的安全发展提供支持。
据方高林介绍,YonGPT拥有配套的数智化技术和能力,包括promote生成、ADM代理执行、上下文语义,以及数据或向量的访问引擎等,基于这些配套能力可提升大模型的可靠性。同时,在数据分析层面,通过配套的工具集做相应的数据稽查、计算,并将已生成的能力、自然语言处理调度表达能力和涉及安全权限、数据库表访问、以及查询的能力放在大模型中执行。
深耕网络安全领多年的新华三,对技术发展的新趋势有着深刻的理解和洞察。此前,我们采访到新华三集团副总裁、新华三信息安全技术有限公司总裁孙松儿,他表示,安全的模型训练与互联网内容不一样,如何将一个场景化的模型放进去,让安全在整个模型中发挥作用和判断力,是比较任重道远的工作。
“对新华三来说,第一,原有的AI智能和网络安全的结合,在一些大容量的数据处理还是有用武之地的。第二,基于现成的一些大模型,内置到设备中提供一些通用的安全运维服务机器人;第三,基于新华三百业灵犀大模型,在上面叠加更多的安全的数据,这三部分是齐头并进的。”孙松儿说。
可以说,无论是从国家政策层面还是企业层面,安全可控均成为了大模型未来发展的重中之重。
总的来看,大模型给各行各业带来了巨大的机遇和潜力。若想在竞争中把握市场机遇,不仅需要技术能力的不断的提高,更需要深入到产业需求中去,并在有关政策的规范和引导下,推动大模型产业的可持续发展。