大模型正在教育领域加速落地。
7月12日,职教巨头粉笔(02469.HK)推出公考行业内首个自研的垂直大模型,并宣布将于8月1日上线粉笔AI老师“粉笔头”。
在此之前,网易有道(NYSE:DAO)、好未来(NYSE:TAL)、作业帮、猿辅导等教企均已推出各自训练的教育大模型,并结合口语陪练、作文批改、个性化学习等场景,在学习机、词典笔等硬件中落地。
此前业内有观点认为,随着通用大模型能力的普遍增强,垂直领域的模型没有存在的必要。对此,粉笔CTO陈建华有不同的看法。
据其介绍,粉笔从2023年一季度开始探索大模型和教育的结合。他发现,某些场景里,通用大模型的表现不及预期,比如在回答行测这类客观题时,正确率非常低。在命题方面,通用大模型只能做到模仿题目的形态,在题目的难度、内容和考点设置上无法满足需求。
但通用大模型在面试点评环节这类受限的小场景下,效果非常好且可控。面试点评是学生备考的刚需,之前主要由老师人工完成,工作量大、效率低、单价高,如果借助于AI辅助老师进行面试点评,老师的点评时间可以从20分钟缩短到5分钟之内。AI面试点评的可用率也可在90%以上。
面对通用大模型和垂直大模型之间的“纷争”,好未来CTO田密也曾公开表示,现在通用大模型可以来解决很多寻常的通用问题,但在某个专项任务上只能解决到六七分的水平,如果想取得更好的结果,必须在垂直领域上做更专项的训练。
“大模型在B端(企业)内部提效方面会更容易落地。”陈建华称,例如上述提到的面试点评场景,通过大模型给出点评的内容,再由辅导老师把关,输出到学生端,可提高效率。
在他看来,对于准确性要求比较高的教育场景,C端(用户)应用的落地会面临着非常大的挑战,其中最大的挑战就是大模型的“幻觉”问题,例如在一些历史人物类的尝试问题中,可能会存在张冠李戴的效果,“这一点对教育行业来说是非常致命的”。
目前,粉笔的做法是借助于RAG(Retrieval-Augmented Generation)检索增强生成的辅助来克服幻觉,同时利用CoT(思维链)让大模型按照步骤一步步进行推理。
另一方面,采用分治法,尝试将复杂的问题拆分成足够简单的任务再让模型处理,陈建华称,效果会远远好过于直接将整个复杂的任务交给模型处理。
“每个产品都值得用大模型技术重做一遍。”陈建华认为,这里的重做不是要推倒过去已有的成果,而是要借助于大模型从效率、过程和结果上重塑整个流程,以提供更多可能性。
在应用场景上,粉笔AI老师已覆盖学员的入班测试、理论学习、强化练习、模拟套卷,直到最后的冲刺阶段。陈建华预计今年将上线申论AI老师。此外,面试AI老师、事业单位和教师项目的AI老师也在筹备中。
粉笔副总裁刘帅表示,粉笔AI老师将是未来粉笔主流的最高端的产品之一。
越来越多的AI老师上线,真人老师会失业吗?
当日发布会上,粉笔创始人、CEO张小龙对此予以否定,技术进步并不意味着就能取代行业人士,学习的过程不仅仅是知识学习,与此同时还伴随着老师提供的情绪价值。相反,技术解放了人之后,身体会变得越来越强,人也会变得越来越有智慧,更有趣、更有意识。
张小龙还表示,粉笔AI老师作为一款C端的AI产品,是“收费”且“收得起费”的。他同时呼吁:“中国科技领域的朋友们,不要都盯着通用大模型,可以多一些针对具体领域的具体服务,早日实现商业化。”
来源:界面新闻 作者:查沁君