记者 陈奇杰
10月24日,科大讯飞发布星火认知大模型V3.0。该公司董事长刘庆峰称,讯飞星火全面对标ChatGPT(GPT-3.5),在中文能力上实现超越,英文能力达到相当水平,并在医疗领域已超越GPT-4。同时,科大讯飞还宣布联合华为推出基于昇腾生态的“飞星一号”大模型算力平台。
在接受包括在内的媒体采访时,刘庆峰称,“今天发布的星火3.0,可以说是除了华为内部应用之外,当前第一个真正在国产算力平台上训练出来的大模型,且能够对标 GPT-3.5。”刘庆峰表示,“这件事的意义是,我们做的很多探索性工作以及已有算子库成果,将来对于国内科研单位和企业都有非常好的借鉴参考作用。”
虽然没有透露华为新一代昇腾芯片性能参数,但刘庆峰提到,“飞星一号”半年内就实现了星火大模型训练和推理效率均翻番。他表示,讯飞将于“飞星一号”平台上正式启动更大参数规模的星火大模型训练,预计在2024年上半年实现对标GPT-4。
不过,或受学习机出现不当内容舆情影响,当天科大讯飞股价表现并不理想,截至下午收盘大跌9.97%。
刘庆峰向记者回应称,在发现问题后内部已第一时间下架内容,对合作伙伴进行了处罚。同时,科大讯飞已经把大模型的内容审核机制放到学习机上,以做更严的审核。“相关内容由合作伙伴提供,我们审核过程还没结束,相关人员就匆匆忙忙让大家试用,导致问题的出现。”
刘庆峰表示,中国的创新不容易。刚刚开完发布会,突然就发现铺天盖地的负面舆情,“已经给有关部门报告,并在取证。”
“我觉得越是打压越激发我们的斗志,同时让我们看到确实还要更加严格地把内容保障好,把阳光健康的教育领域做得更实。”刘庆峰说。
差距
目前,讯飞星火已更新至第三代。刘庆峰介绍,新一代星火大模型在文本生成、语言理解、知识问答、逻辑推理、数学、代码、多模态七大方面能力均获提升。
这推动了讯飞星火在应用场景落地。具体而言,科大讯飞进一步升级智能编程助手iFlyCode2.0,并针对科研人员推出了星火科研助手;面向学生群体,推出AI心理伙伴关爱青少年心理健康,首次发布启发互动式英语AI答疑辅学并落地讯飞AI学习机;面向每个家庭,发布讯飞星火医疗大模型,打造个人AI健康助手。另外,讯飞机器人超脑平台迎来升级,亮相业界首个大模型+具身智能的人形机器人。
产业生态上,讯飞还联合行业龙头共同发布12个行业大模型,加速产业落地。据悉,自5月6日星火发布以来,讯飞开放平台新增143万开发者团队,同比增幅331%,其中新增大模型开发者17.8万。
尽管显得对明年上半年追上GPT-4胸有成竹,刘庆峰依然表示要正视和ChatGPT之间的距离。“国产大模型在复杂知识推理、小样本快速学习、超长文本处理、跨模态统一理解上,与GPT-4还有差距。”
对标
10月19日晚间,科大讯飞公布2023年第三季度报告。报告显示,前三季度科大讯飞实现营业收入126.14亿元,同比下降0.37%;归母净利润0.99亿元,同比下降76.36%。该公司称,归母净利下滑主要原因是积极抢抓通用人工智能历史新机遇,在认知大模型等方面坚定投入。
近期,美国进一步加码限制英伟达等面向中国出口高端芯片,科大讯飞此前于三季度业绩交流会上回应称,该公司于2019年被列入美国实体清单后,2022年10月7日,再次被美国加码制裁。2023年初,讯飞与华为昇腾启动专项攻关,与华为联合研发高性能算子库,合力打造我国通用人工智能新底座,让国产大模型架构在自主创新的软硬件基础之上。当前,华为昇腾910B能力已经基本做到可对标英伟达A100。
在与华为合作的分工上,刘庆峰称,华为更聚焦在底座能力层面,而科大讯飞则更多投入于应用和算法。谈及国内大模型行业如何走向独立,刘庆峰向记者表示,国产算力平台需要有从不好用到好用、再到生态繁荣的过程。“如果谁都不往前走一步,且没有能坚定地提供底座的厂商,那始终无法自立自强。”
刘庆峰将这一步形容为“非干不可”的事情,“算法在新硬件上跑,需要验证结果。”尽管早期不可避免地需要花费大量时间投入,但“都是值得的”。
京公网安备 11010802028547号