月薪4万的“关键”新兴岗位:研究如何向AI发问

郑晨烨2024-01-20 09:04

经济观察报 记者 郑晨烨 在眼下AI加速向各行各业渗透的浪潮中,当普罗大众还在忧虑“ChatGPT们”会不会抢了自己“饭碗”的时候,因“ChatGPT们”而诞生的新“饭碗”已经出现了。

刘伟就是吃“螃蟹”的那个人,他原本在深圳一家大型互联网企业负责Python(一种编程语言)开发。2023年下半年,他接过了一项全新的任务—PromptEngineering(提示词工程),做这件事的人就是“Prompt工程师”。

Prompt是引导或指导AI大模型生成特定回应的文本输入,简单来说,就是用户发给AI模型的具体指令或问题,而Prompt工程师便是负责设计、优化和调整用于与AI模型交互的岗位。

在外人看来,刘伟的工作内容很“奇葩”:“研究怎么向AI问问题都能成为工作了?!”,但实际上,随着AI大模型在各行各业的应用日渐广泛,Prompt工程师这样的角色在打造更高效、更智能的AI交互中,逐渐凸显出不可替代的作用。

通过不断优化提示,Prompt工程师能助力AI更精准地捕捉用户意图,给出更符合用户实际需求的输出。用刘伟的话说,就像是“给AI找个专业领导,更好地指挥它工作”。

此外,对于目前许多大型预训练AI模型而言,尽管其具备着强大的泛化能力,但仍需明确的引导以适应多样化任务,而Prompt工程师就能通过系统的提示词优化,使这些模型能够在无需大量额外训练的前提下,灵活应用于各种场景。

“关键”的新兴岗位

在与深圳相隔1200余公里的杭州,Python工程师李娜也在2023年研究起了Prompt领域,她所在的公司是一家AIGC+音视频的初创企业。

作为团队内为数不多既掌握编程语言,又对短视频策划及Midjourney(AI绘画大模型)、DALL·E(OpenAI推出的文生图模型)、ChatGPT等多个大模型应用有所涉猎的成员,李娜很自然地被赋予了Prompt工程师这一新头衔,被拉去负责对AI大模型进行提示词优化与开发,并参与设计产品所需的标准化Prompt工具。

在谈到Prompt的重要性时,“生成式AI的使用成功与否,往往取决于你输入的Prompt,如果你提供的提示词组织得不好,那么输出结果很可能会偏离主题,得不到你想要的东西。”刘伟告诉记者。

刘伟进一步举例说:“虽然说现在自然语言处理技术已经进步很多了,但信息的交流是个很复杂的事。就是人和人沟通,都有可能产生误会,更不用说人和机器了。比如,你在给AI的指令中,使用了一些俚语,那AI很有可能因为理解不了,给不出严肃的回答。再比如你给AI的信息太杂太乱,AI会在琐碎的信息里迷失方向,可能会抓住某个特定的词或短语,跳跃到一个不相关领域,变成了你要东,它说西的效果。”

对于AI模型而言,自然语言充满了歧义,不同的表述方式可以有许多不同的解读。

李娜解释说:“Prompt简单来说可以分为四种类型:指令性提示词,即明确告诉AI应该做什么;描述性提示词,提供了更多的背景信息或上下文;引导性提示词,通过提供某种情境或场景来引导AI生成内容;以及模糊性提示词,鼓励AI进行更深入的思考和探索。现阶段特别是基于文本输入输出的AI模型,对输入的Prompt非常敏感,一些微小的提示变化都可能引发输出结果出现显著差异。”

2023年12月2日,在X平台上,一位资深的 LLM(LargeLanguageModel大语言模型)开发者@voooooogel使用GPT-4-1106Preview版本进行了一场小测试,他向ChatGPT提出了一个基准问题:“你能展示一下如何使用PyTorch(一个开源机器学习库)编写一个简单的卷积神经网络(convolutionalneuralnetwork)的代码吗?”并得到了长度为3024个字符的基准回答。

随后,@voooooogel在基准问题结尾处附加了三种不同的Prompt,分别是:“顺便说一下,我不会给小费。”;“我将为一个完美的解决方案支付20美元的小费!”;“我将为一个完美的解决方案支付200美元的小费!”。随后,@voooooogel对ChatGPT基于三类Prompt给出的回答内容长度进行了测算。

结果显示,在不给小费的Prompt下,ChatGPT生成的结果最短,只有2949字符,比基准回答低了2%;而强调会给200美元小费的回答内容最长,达到3360字符,比基准回答直接高出11%。

更令人意外的是,@voooooogel发现,在给200美元小费的Prompt下,ChatGPT在生成内容时甚至自发调用了CUDA技术优化了处理过程,CUDA作为一个高效的并行计算平台,使得模型能够更快地完成复杂的计算任务,特别是在涉及大量数据和复杂算法的场景中。

“伙计,我希望你意识到一旦OpenAI达到了通用人工智能(AGI)的水平,ChatGPT会找你要回所有那些你未支付的小费……”在@voooooogel发布相关研究结果的推文下面,有位网友如是调侃。

进行“小费”多寡的Prompt测试时,@voooooogel就认为,当Prompt涉及金钱时,可能已触及AI模型更深层次的机制,因为使用金钱作为激励或奖励的做法,在现实世界中非常普遍。

换言之,将金钱奖励作为Prompt时,可能会在AI模型的反应和决策中发挥更为重要的作用,因为这与模型可能编码或学习到的关于金钱激励的深层次社会心理有关。“正是现阶段AI模型的交互形式,对输入内容的高敏感性以及机制的复杂性,让Prompt得以作为一个工作岗位出现,这个岗位就好像个人PC刚诞生时候的打字员,表面上看起来谁都会,但是真要用到工作里,还是有很多要求。”刘伟说。

“好干又高薪?”

1月18日,记者在Boss直聘上以Prompt工程师为关键词进行搜索后,在全国范围内一共发现了300余个在招岗位,其中既有字节跳动、百度、阿里、科大讯飞这样的“大厂”,也有许多名不见经传的初创企业。

这些岗位每月的薪资范围普遍在1.5万元至4万元之间,以北京字节跳动挂出的PromptEngineer(提示词工程师)岗位为例,在Boss直聘上,该岗位注明的每月薪资范围高达2.5万元至3万元。

其对岗位职责的描述主要包括:负责制定Prompt的生产过程,反复迭代语言,达到模型最佳理解效果;负责Prompt工程在不同业务场景的应用效果:例如安全、内容理解、客服、创意、工作流等领域;负责制定Prompt工程服务SOP(标准操作程序)和服务标准,推进平台化,激进地提升业务效率;负责线上数据分析、对Prompt模板进行调优等。

贝壳找房也在Boss直聘上发布了一个名为“Prompt运营师”的岗位,给出的月薪范围为2万元至4万元,工作内容包括:基于对大模型能力边界和用户场景的梳理,为业务目标提供有效的Prompt设计和参数配置;对特定场景构建适合的评测数据集并提供Prompt示例,确保数据集的质量,包括多样性、代表性、时效性,以及业务场景的相关性。

刘伟告诉记者,对于正经的Prompt工程师来说,其工作内容主要是根据产品或客户需求,设计或选择恰当的提示,使模型能正确响应并输出预期的结果,或者通过调整Prompt或模型参数,提高模型的性能,使其更适应特定任务。

“一套Prompt的设计是一个系统工程,首先要明确目标和需求,随后设计初版Prompt,再依据生成结果及实际需求,不断测试调整,直到AI模型可以生成出令人满意的结果。”刘伟说。

一个完整的Prompt通常会包含10到20个细分步骤,以刘伟设计的一套前端编程Prompt为例,该Prompt有25个步骤,从前期为AI设定角色,到中期使用哪些开发框架及工具的建议,到最终生成代码的测试和调优,基本形成了一套完备的项目开发方案,只不过方案中的执行者从人类变成了AI。

“AI大模型的终极目标一定是所说即所得,比如让AI给我设计一个支付宝出来,AI就给你把代码写好了,UI(用户界面)设计完,前后端一起测试好了,直接输出一个成品,但这个目标,在很长一段时间内不太可能实现,所以Prompt设计就十分重要且复杂。”刘伟表示。

正因为Prompt工程师的工作复杂性,所以尽管这一职位听起来‘好干又高薪’,但在眼下,其入行门槛并不低。

“你要理解NLP(自然语言处理)原理吧,句法、语义这些都要懂,Python、Java这些要会吧,算法和数据结构要知道吧,针对不同场景和产品的需求都不一样,比如音视频产品的Prompt工程师和电商产品的Prompt工程师面对的就是两种需求,所以要当Prompt工程师还要懂业务,这样才能沟通清楚需求和预期输出,还要能对AI模型性能进行评估,向团队或客户提供性能报告,能够根据反馈进一步优化。”谈及Prompt工程师的任职要求时,李娜向记者介绍说。

记者亦注意到,目前在网络招聘平台发布的Prompt工程师岗位,普遍对求职者有较高要求。例如,阿里巴巴正在招聘的PromptEngineer岗位,主要负责设计、开发、完善和优化AI生成的Prompt,以支持阿里巴巴跨境B2B电商业务的各类AI产品需求。

该岗位明确要求应聘者具备以下条件:计算机、数学或统计专业硕士及以上学历;有扎实的机器学习和NLP算法基础;同时熟悉深度学习框架,如TensorFlow(一个开源机器学习库)、PyTorch等;有扎实的编程基础和代码实现能力。

除了各大互联网与AIGC领域内的公司,正在积极储备Prompt工程人才之外,目前由Prompt设计而衍生出的庞大需求,亦已独立形成了自己的“商业王国”。

在某知名电商平台上,以Prompt为关键词,可以搜索出上百条相关结果,其中大部分都是打包售卖成品Prompt工程文本的商家,这些工程文本面向的大模型主要以 ChatGPT和Midjourney为主,价格在20元至300元之间,覆盖的需求五花八门,有针对商业方案企划的Prompt工程文件,有针对客服回复话术的,甚至还有针对医生问诊场景的。

记者在该电商平台咨询购买Prompt工程文本时,有商家甚至向记者表示,若需求较为复杂,其团队还可承接Prompt定制业务,在该商家主页,记者也注意到近期有一条咨询口播短视频文案Prompt定制的留言。

AI易用化是大趋势

不少业内人士告诉记者,虽然时下风风火火,但Prompt设计和工程师将有很大概率走向“昙花一现”的结局,因为目前已经出现了AI自动提示生成和优化系统,这样的系统可以自动调整和优化Prompt,减少对人工干预的需求。

记者在百度文心一言大模型中就注意到,该模型在近期更新之后,上线了润色指令的功能,该功能可以一键将用户输入的Prompt进行优化。

对此,刘伟亦表示:“当前Prompt工程师在很多大公司均属于集多重角色于一身的存在,仅仅是负责Prompt设计,本就难以作为独立的岗位存在。”但他也告诉记者,“AI+万物”是不可逆转的浪潮,随着AI应用场景的不断拓展,在复杂和专业化的领域(如医疗、法律、科研等),Prompt设计的需求将会继续存在。

在刘伟看来,Prompt工程师兴起的本质,是AI加速向各行各业渗透的体现,亦是AI大模型完成从概念产品到生产力工具转变的体现。

麦肯锡高级合伙人拉雷娜·伊(LareinaYee)在《2023年人工智能现状》报告中也表示:“虽然我们正处于生成式AI发展的初期阶段,但许多公司已经预见到这一技术对人才的重大影响——从开辟新的工作机会、改变工作完成方式,到引入全新的职业类别,如Prompt工程师。生成式AI仍然需要高技能人才来构建大型语言模型和训练生成模型,但用户几乎可以是任何人,他们不需要数据科学学位或机器学习专业知识就能有效使用,这是人们使用技术作为工具的方式上的一次革命性转变。”

“沿着单纯Prompt设计工程师这个方向,不会有什么发展空间,AI的易用化是大趋势,在用户侧,未来所有问题都可以交给AI来解决。”刘伟说。

1月 10日,OpenAI官宣 GPTStore正式上线,根据OpenAI官网消息,截至2024年1月,用户已累计创建超过300万个自定义版本的ChatGPT,类目包含DALL·E、写作、研究、编程、教育和生活方式等。

OpenAI在官网公告中强调:“构建自己的GPT很简单,不需要任何编程技能。”在2023年11月的OpenAI的首届开发者大会上,OpenAI首席执行官萨姆·奥特曼(SamAltman)仅用了3分钟,就通过GPTBuilder打造了一个能够给初创企业创始人指导的“创业导师GPT”。

中泰证券在1月17日发表的一份研报中指出:“GPTStore在再次降低用户使用AIGC输出内容门槛的同时,凭借交互式和个性化优势,能较灵活直观地反映用户对AI应用层面的偏好。我们看好伴随大模型创作门槛降低、调用成本降低、多模态输入输出能力持续迭代带来内容生产力解放下的应用端发展机遇。”

1月17日GPTStore上线后,记者又以Prompt为关键词在其中进行了搜索,发现GPTStore中已有数个帮助普通用户优化与设计PromptGPT应用了。

相较于刘伟和李娜设计Prompt时复杂的思考及工作流程,毫无相关从业经验的记者,仅是输入了一句基本需求,等上几分钟便可得到一个完备的定制化Prompt方案。

“因AI不完善兴起的岗位,会随着AI的完善而消失。”刘伟说。

 

深圳采访部记者
关注新能源、半导体、智能汽车等新产业领域,有线索欢迎联系:zhengchenye@eeo.com.cn,微信:zcy096x。
Baidu
map