随着百度发布文心一言,国内类GPT产品高调推出,成为公众和业界关注热点。3月29日,在360主办的2023数字安全与发展高峰论坛上,360集团创始人周鸿祎发布了关于大语言模型的中国版ChatGPT产品,“翻车”随之成为坊间话题。
在现场演示环节,当周鸿祎提出“梅西在阿根廷国家队进了几个球”时,360 AI给出的答案是:100个球。而根据媒体公开信息,目前该问题的答案应该是102个球。周鸿祎让其进行再次检索,360 AI生成的答案仍为100球。
周鸿祎称,对这个答案我不满意,并称360 AI就像是个“孩子”,今天为了满足大家的好奇心,把“孩子”抱出去展示下,还要赶快抱回来。
360版ChatGPT在现场演示“翻车”,也是预料之中。此前,百度文心一言采用“DEMO演示”形式,用提前准备好的问题和答案做演示,却由于视频生成能力成本较高,目前还未向用户开放,引来了不少吐槽。而媒体试用过程中,发现文心一言在交流时仍有不少漏洞。
在国内率先做吃螃蟹的人,非议之外也有“多给一点时间”的声音。毕竟,哪怕是ChatGPT自身,其数据库也只截止到2021年,在之前用户的测试中,ChatGPT回复内容出错并非个例。谷歌同样因为刚推出的聊天机器人Bard,首秀中回答错误,导致其股价大跌。
如果放置在更宏观的视野当中,AI目前所代表的恐怕仍只是“有限理性”。据2014年的一项报告显示,自印刷机问世以来,人类已经出版了约1.29亿本书,其中近12%(1500多万本书)已经数字化,在数字化的书中只有一小部分可以在网络上免费获得。而只有公开的、免费的数字化内容,才能进入AI可引用的数据集。包括ChatGPT在内的智能生成内容,受限于基础数据内容的局部性和不完整性,在与人类交互时给出错误答案的概率不低。
因此,自ChatGPT问世以来,一方面,其开发方OPEN AI持续迭代升级,推动其性能的提升。另一方面,世界各国也对ChatGPT的应用持谨慎乐观态度,多个政府部门或高校明令禁止用户使用ChatGPT生成的内容,除了防止作弊等行为,未尝不是对其内容准确性的顾虑。
与此同理,对于360版ChatGPT“翻车”应抱以宽容的态度。作为后发者,国内企业在预训练大模型的积累上相比ChatGPT尚有不小差距。人工智能深度学习,要从人工知识表达转向大数据驱动的自动学习技术,从分类型处理的多媒体数据转向跨媒体的认知、学习、推理演进,从追求智能机器到高水平的人机、脑机相互协同和融合,从聚焦个体智能到基于互联网和大数据的群体智能融合。如此多的要素组成都在说明一个道理:生成式AI距离公众预期,仍有很长的路要走。
包括360在内的国内企业,无论是长周期的资金、人才等投入,还是数据积累的量和质渐进式推进,都将不断经历试错过程,在反复试验和内外测试中去了解自身类GPT产品的成熟度。所谓出错及BUG,也将让工程师们在真实运行环境中,检验相关技术和产品在人机交互过程中所能达到的智能化水平,从而更有针对性地予以完善。
之前周鸿祎曾提出,有开源技术做基础,以及中国企业工程化和技术落地能力强的优势,造ChatGPT比造芯容易。他甚至乐观预言,在技术创新、生态构建以及产学研合作等问题上,再加上国家鼓励性政策的扶持,两三年,中企就能赶上来。
这其实也隐含了另一层意义,在ChatGPT所构建的开源生态体系当中,国内AI企业既是快速获取底层技术资源、搭建产品框架的受益者,同样会利用自身在垂类应用和技术转化的经验,加快类GPT产品集群的开发和应用,加速生成式AI在更多行业和领域落地。而持续的试错,迭代,将让生成式AI在中国这个超大规模市场,获得巨大的应用场景,为GPT生态的扩容做出贡献。
作为用户,应对国内类GPT产品的推出持欢迎态度,而不是一味地冷嘲热讽。毕竟,所有参与其中的国内企业和用户,都将有助于人类已有的经验、知识,转化为生成式AI深度学习的养料。让国内AI产业通过主动参与最前沿科技的研究和应用,在新一轮信息工业革命中成为参与者而非旁观者,从而掌握更强的创造力和竞争力。
这,不也是之前国内新能源车产业发展的必经之路?
文/毕舸(财经评论人)
责任编辑:刘德宾