北京时间11月7日凌晨,在OpenAI首次开发者大会上,CEO山姆·阿尔特曼(SamAltman)用45分钟的时间,公布了过去一年中GPT的各项数据,以及最新版本GPT-4Turbo的升级功能,一时间引爆了科技圈。
之后不久,2023年世界互联网大会乌镇峰会拉开大幕。各个会场内,关于大模型(生成式AI)的讨论声不绝于耳。
事实上,今年以来,大模型就受到了前所未有的关注,如同一场绚丽的技术盛宴,激荡着人工智能时代的澎湃浪潮。
“超级大脑”成为“超强助手”
在繁华都市的一隅,从事创意策划工作的小林经常陷入深深的思考。作为一名广告策划师,她日常要面对各种复杂的项目,挖掘独特的创意,并将其巧妙地融入策划方案中。但每次,小林都要花大量时间了解学习客户所处的行业和产品信息,这让她感到力不从心。正当苦恼之际,朋友向她推荐了一位人工智能领域的“新星”——AI大模型。
“它就像一位‘超强助手’,不仅能迅速帮我搜集一些材料,完成一些基础性的工作,而且能迅速分析市场需求,提供灵感丰富的创意建议。”小林说,拥有了这位“助手”,她的工作效率大幅提升,原本需要一周完成的策划案,现在两天就可做完。
今年以来,大模型的热度高居不下。追溯起这个词的“出圈”,还要将镜头拉回到去年11月底ChatGPT的发布。
在不到一年的时间里,大模型风起云涌,成为人工智能企业、相关厂商以及社会各界讨论的热词。
浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林在接受中国城市报记者采访时表示,模型就是算法,大模型就是多个算法,通过海量数据训练和调参来实现想要达到的效果。
简单理解,大模型就像是一个“超级大脑”,它通过学习和记忆大量的信息,能够理解和解答各种问题。这个“大脑”越大,它能处理的问题就越复杂,答案也就越准确。
比如在金融领域,大模型可以帮助银行更好地评估风险、预测市场走势;在医疗领域,大模型可以帮助医生更准确地诊断疾病、制定治疗方案。此外,大模型还可以帮助企业实现智能化管理,提高决策效率和精度。
科技部新一代人工智能发展研究中心发布的报告显示,今年上半年我国10亿参数规模以上的大模型已发布79个。
“我认为大模型的火爆主要得益于算法和算力的突破,使得在不同领域应用突破性成果层出不穷,并开始探索商业化的可行性。大模型的火爆也使得更多人关注和重视人工智能的发展潜力,这将给科技创新和产业升级带来广阔的空间。”深度科技研究院院长张孝荣在接受中国城市报记者采访时表示,与之前常提的大数据和云计算不同,大模型更注重通过训练和学习海量数据得到更准确的结果和智能决策,而云计算则主要关注计算能力的提供和存储大数据。
以应用为王让生态繁荣
今年3月16日,百度发布知识增强大语言模型文心一言,一石激起千层浪。经过半年多的迭代升级,10月中旬,文心大模型4.0揭开面纱。中国城市报记者从百度了解到,文心大模型4.0的理解、生成、逻辑、记忆四大能力都有显著提升。
在4.0版本发布的当天,李彦宏依次演示了其四大能力的特点与应用场景。例如文心一言如何在短短几分钟内,根据一张素材图片迅速生成了一组广告海报、5条广告文案以及一条营销视频。李彦宏称其综合能力“与GPT-4相比毫不逊色”。
在输入同样的问题后,中国城市报记者发现,相较于3.5版本,4.0版本的回答更加简练,但也更加精准。
就在文心大模型4.0发布一周后,10月24日,科大讯飞也发布了讯飞星火认知大模型V3.0,宣布新版本从文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力以及多模态能力方面都有了提升;还联合行业龙头共同发布金融、汽车、运营商、工业、住建等12个行业大模型,加速产业落地。
“我们基于政务大模型打造‘数字社工’和‘无差别综窗助手’两大核心应用,助力打造7×24小时政务服务不打烊,帮助基层城运智能提效,真正减轻基层人员工作负担。”科大讯飞相关负责人向中国城市报记者举例表示。
11月9日,阿里巴巴集团CEO吴泳铭在2023年世界互联网大会乌镇峰会“互联网企业家论坛”上透露,阿里巴巴即将开源720亿参数大模型,这或是国内参数规模最大的开源大模型。
“传统AI时代下,一个场景对应一个模型,存在模型参数量小、泛化性差,模型维护困难、行业人才短缺等问题。”北大纵横管理咨询集团高级副总裁孙连才在接受中国城市报记者采访时表示,但过去10年内,AI算法的算力需求提升了40万倍,模型复杂度持续提升。而大模型凭借着资本优势及技术优势,可能收编高度定制化的小模型,导致市场向大公司集中。
科技发展日新月异,新的词汇一个接一个出现,刺激着人们的神经。大模型究竟是昙花一现,还是持续扩大的风口?
一位大型科技公司相关人员告诉中国城市报记者,相比于元宇宙等概念,大模型的应用更易落地。
如今,行业的共识是,大模型将开启一个繁荣的AI原生应用生态。
李彦宏表示,AI原生应用不是对移动互联网APP和PC软件的简单重复,而是要能“解决过去解决不了或解决不好的问题”。
科大讯飞也提出“面向社会刚需,以应用为王,让生态繁荣”的愿景。
据悉,未来阿里所有产品将接入大模型全面升级,目前钉钉、天猫精灵等产品已率先接入通义千问测试,高德地图、饿了么、盒马、优酷、淘票票等产品也将有序接入通义千问大模型。
多重挑战仍待突破
随着大模型的繁荣发展和广泛应用,挑战也随之而来。
“我发现这些AI助手会‘一本正经地胡说八道’。比如我让它帮我查一些资料,给出的答案看似正确,但只要稍微核对下,就会发现都是编造的信息。”小林说。
在回答“大模型发展还有哪些堵点”这一问题时,文心大模型4.0版给出首个回答就是:“尽管大模型在性能上有所提升,但仍面临技术不成熟的问题。例如,模型的精准度和判断力在某些情况下可能受到限制,可能无法满足所有领域的高精度要求。”它还表示,“尽管大模型在特定任务上表现出色,但在泛化到新任务或场景时性能可能下降”。
数据安全也被多方诟病。“大模型涉及大量的个人数据和敏感信息,对于隐私和安全的保护非常重要。要建立起完善的数据隐私保护体系,在保证技术发展的同时,确保数据的合法、安全和隐私的保护。”张孝荣说。
此外,接受中国城市报记者采访的专家都不约而同地提到了计算资源和成本问题。
“大模型的训练和推理需要大量的计算资源,如GPU、TPU等,而这些计算资源的价格相对较高,也会增加大模型的开发和运行成本。”中关村物联网产业联盟副秘书长、专精特新企业高质量发展促进工程执行主任袁帅表示。
孙连才持有相似观点。他表示,AI商业化落地受算力、算法、数据、场景、用户等多种因素共同影响,需要大量资金投入。若商业化进度不及预期,可能进一步影响到研发资金的供给,导致技术发展缓慢,影响用户体验。
全联并购公会信用管理委员会专家安光勇还提到,今年以来大模型的火爆也导致一些项目盲目跟风,缺乏深思熟虑的实际需求匹配。
中国城市报记者注意到,部分针对C端的升级版应用已启动收费模式,但基础版仍免费。有分析认为,随着AI大模型C端应用的持续落地,部分企业并非直接通过大模型收费方式实现商业变现,而是将通过侧面驱动行业换机潮来实现商业闭环。
尽管面临着诸多挑战,但大模型商业化的前景广阔已是多方共识。更为重要的是,走出自己的技术路线、产业方向,形成自己完整的生态,已成为行业灯塔,照亮前行之路。
从这个角度来说,大模型时代的序幕才刚刚拉开。
(责编:张若涵)