2023年是中国大模型的元年,百川智能也在这一年成立。这一年百川跑的非常快,6月份发第一款大模型,7月份发第二款,8月份发530亿参数大模型,2024年1月发布超千亿参数大模型,期间还迭代开源产品,发布角色大模型,一直在往前进行中。
2023年我们把精力放在大模型本身,应用还在初期状态。接下来的2024年,中国各家公司都会有应用层面的成绩出现,百川也会发布应用层面的产品。
大模型是一个快速发展的行业,每天会有新的进展。百川的技术人员每天都在跟进最新的东西,把自己不断迭代、不断改进。行业的发展速度其实是超出外界媒体和资本圈看法的,目前仍然在快速迭代。
经过2023年一整年的追赶,目前国内的大模型做到了GPT3.5的水平,距离美国仍有距离,但不再是0和100的区别。今天百川大模型的核心,集中在文本领域,这是最应该关注的事,因为文字代表智力化的水平,把文本放在第一位的公司,是在往长远方向走的。百川也已经用大模型+搜索构成了一个完整技术栈,当技术增强,就能实现互联网与垂直领域知识、全网知识的全线链接,这个完整的技术栈有利于大模型真正去落地应用。
从国内来看,搜索增强是大模型走向实用的第一步,甚至是最关键的一步,没有搜索增强的大模型在企业里是没法落地的。接下来落地的将是多模态领域,即音频、图像、视频等,多模态是离应用最近的一个领域,我预计中国公司在这个领域未来有弯道超车的机会。
与互联网时代的应用相比,大模型时代的应用将是一个新物种。以前我们更多的是造工具,无论是造火车、计算器,或是造电脑,我们希望它们用精确的方式跟我们互动,提高我们的效率。但现在,我们造的新物种,更像一个人类的伙伴,人类对伙伴的要求,不会要求它像工具一样精确,更希望让它与人类合作。我会看好大模型在健康、快乐领域做出超级应用。
(经济观察报 记者 任晓宁)