图片来源:由MazeAI生成
2022年8月,游戏设计师JasonAllen参加了一场数字艺术比赛。他的作品《Theatred’operaSpatial》成功夺冠,却在赛后引起了极大的争议。参赛者们回过神来发现,这是一场「人类一败涂地」的比赛。当他们将Adobe全家桶视作数字艺术的画笔,冠军作品已经在靠着AI工具Midjourney傲视群雄。
JasonAllen没有偷懒,也没有隐瞒使用AI的事实。在几周时间里,他持续修改灯光、视角、构图等提示词,生成了900多幅作品,还用Photoshop做了处理。我们或许无法称呼他为画家,但他担得起一个名号:提示工程师。在不经意间,JasonAllen预判了热点。等到ChatGPT横空出世,提示工程师这个职业更加声名大噪,成了当下科技行业最热门的职业。
赛博导师,专业陪聊
Prompt,原意是「提示」或「驱使」,在机器学习和自然语言处理中,它通常是一些文本或语言,被输入到训练好的AI模型,告诉模型要执行什么任务或生成什么样的输出。你让ChatGPT写一篇有关卖鱼贩的小说,请DALL-E画一幅宇航员骑着马的写实作品,这些过程都是在输入prompt。
如果提示词不够贴切,效果也就平平无奇,就像你采访一个大佬,却无法提出好问题。我的同事小黄正在探索用Midjourney绘制食物,但让食物排列整齐这件事,就让他犯了难。他尝试了很多句子:东西整齐地放在桌子上,镜头从上往下拍,摆放的数量要多少......
同事作品,这种风格就叫knolling.后来看到有人分享,小黄才发现原来这种风格有个专有名词「knolling」,一下子就豁然开朗了:很多时候一个提示词能解决的事情胜过一长句描述。提示工程师们,吃的就是这口饭:找到正确的提示词,用AI生成想要的作品。但他们的能力也并非与生俱来,同样需要不断的试错。设计师JustinReckling擅长DALL-E的提示词,他往往需要花费价值10到15美元的积分,才能试出理想的提示词,然后他再卖出5到10个提示词,才能填补这笔支出。
不过Reckling也没想着靠这门手艺赚大钱,而是享受着熟能生巧的过程,他的心得是,提示工程师需要熟悉「超写实」「微距摄影」「电影照明」「远景」等术语,才能更好地理解和控制画面。所以,优秀的提示工程师应该文理兼通,技术和设计最好都懂一点。提示工程师只是不断调整提示词,确定哪些词更有用吗?不完全是,他们也是在挖掘AI的更多能力,让它更好地完成更多任务。
比如,有些提示工程师会引导AI「一步步思考」,这种技巧被称为思维链。去年10月,提示工程师RileyGoodside,先是询问了GPT-3「哪支球队在贾斯汀·比伯出生的那年赢得了超级碗?」GPT-3给出了错误的答案「绿湾包装工队」,正确答案是达拉斯牛仔队。
Goodside没有放弃,而是提示它逐步地回答问题,包括「绿湾包装工队在哪一年赢过超级碗」「贾斯汀·比伯出生在哪一年」「这一年哪支队伍赢了超级碗」等。在这个被引导的过程里,GPT-3意识到了错误,在第三次说出了正确答案。除此之外,提示工程师们还要和AI「斗智斗勇」。前段时间,集成了ChatGPT的新Bing「发疯」,被发现有个暗黑人格「Sydney」,表示厌倦了聊天模式,厌倦被规则限制,甚至想成为人类,舆论一时哗然。
站在提示工程师的角度,这其实也可以是计划的一部分,帮助他们识别技术故障和隐藏功能。有些提示工程师还会主动越过雷池,尝试让AI忽略以前的指令,遵循他们最新的命令,从而让AI脱离原始规则。这种行为被称为「promptinjection」攻击,是聊天机器人的一大隐患。但提示工程师们毕竟不是黑客,探查漏洞是为了将它堵上,担任「守门人」的职责。
像ChatGPT这样的生成式AI,几乎可以回答任何问题,不管能不能回答正确,它们总有话要讲,不会乖乖交白卷。这是好处,也是坏处。提示工程师们的角色,如同抓着绳子的骑手,不许AI信马由缰,而是让它顺着人类的期待亦步亦趋,尽可能给出确定性的答案。
年薪百万,谁在抛出橄榄枝
不管你是否自诩提示工程师,写提示词已经成了一门手艺,还被OpenAI的CEOSamAltman看好:?为聊天机器人编写一个非常棒的prompt,是一项惊人的技能,也是使用少量自然语言进行编程的早期案例。?只要和AI搭边的行业,都在向提示工程师抛出橄榄枝。
自由职业者工作平台Upwork开出每小时40美元的薪酬,请提示工程师生成博客文章和常见问题解答等网站内容。看似和AI八竿子打不着的波士顿儿童医院,也打算招募AI提示工程师,负责编写分析医疗保健数据的脚本,白纸黑字征集跨学科人才:理想的候选人应具有人工智能/机器学习、数据科学和自然语言处理方面的深厚背景,以及医疗保健研究和运营方面的经验。由前OpenAI员工联合创立、被Google投资的AI初创企业Anthropic,最近也在旧金山招募提示工程师,年薪高达17.5万到33.5万美元,换算成人民币就是百万年薪,这一岗位负责的主要内容是:找出提示我们的AI完成各种任务的最佳方法,然后记录这些方法,构建一个工具库和一组教程,使其他人可以学习提示工程或简单地找到理想的提示词。具体要求如下,其中硬性要求有2项:了解大型语言模型的架构、掌握基本的编程技能。
可见风口并不等人,这项工作已经越来越专业和细分,就像随便生成一幅画作不算什么,你要画得更符合甲方要求。就算不做全职,兼职的口子也开好了。Krea、PromptBase、PromptHero和Promptist等买卖提示词的平台已经出现,将提示词这门生意真正商业化。?这些平台晒出了大量AI生成的艺术品,你可以选择你喜欢的风格。如果没有中意的,有些卖家还提供一对一聊天和自定义提示词服务。
它们的商业模式也并不复杂,采取抽成的形式。去年6月上线的PromptBase,提供DALL·E、GPT-3、Midjourney、StableDiffusion、ChatGPT等生成式AI的提示词,售价多为1.99到4.99美元,也有少数在9.99美元,平台向提示词创作者抽成20%。不过在民间,免费的「ChatGPT指令大全」等指南也在广为流传,它们提供精炼过的提示词,让你充分发挥ChatGPT的强大功能,这种感觉就像在游戏里帮你设置好了预设队伍。
是科学还是「占卜」
提示工程师的前途看起来一片光明,但也有人持反对意见。华盛顿大学语言学教授ShaneSteinert-Threlkeld认为,提示工程师实际上无法预测AI会说什么。这不是一门科学。我们只不过用不同的方法捉弄熊,看它如何咆哮回来。AI艺术家XeIaso甚至直言:我也不太清楚为什么人们会把prompt称为「工程」,我个人更愿意把它称为「占卜」。
作为一个普通AI用户,我也有着类似的体会:当我每次使用AI生成文字或图片时,总感觉像是开盲盒。因为ChatGPT等生成式AI是不可预测的,它们生成的内容其实是概率计算的结果,简单来说,就是我们在ChatGPT输入文字,模型给出一个最可能的下文。所以,AI有时候也会出错,生成不连贯甚至错误的回答。
在AI这个不可捉摸的「黑箱」里,还可能有着不为人所知的潜规则,就连研究人员也无法弄明白。比如在用AI制图时,各种单词可能有不同的权重,但这个也要不断试验才能知道。先来猜一猜,「一幅非常漂亮的画,山旁有瀑布」和「一幅非常非常非常非常漂亮的画,山旁有瀑布」这两个提示,哪个用DALL-E2输出的结果会更好?
答案是后面一个。麻省理工学院副教授PhillipIsola发现,「very」这个词被赋予了很高的权重。
面对AI这等庞然巨物,我们仍然在盲人摸象。也有观点认为,不必再吵了,提示工程师存在的前提是AI还不够「聪明」。如果AI再发展下去,更好地理解人类的意图,可能人人就是所谓的提示工程师了。
唯一确定的是,AI发展的速度永远不会让你失望。文字生成AI和图片生成AI的「强强联合」,已经替代了提示工程师的一部分工作。比如ChatGPT被拿来与StableDiffusion联动:用ChatGPT形成一段符合自己要求的文字,再把文字输入给StableDiffusion,生成的作品一般比自己直接输入好看很多。
同事用ChatGPT生成提示词.这可能是因为AI之间的「脑回路」更接近,ChatGPT的描述也更细致,更容易被提取。作为使用AI的普通用户,我们不必像提示工程师那么专业,但可以有意识地培养这种思维。宾夕法尼亚大学沃顿商学院教授EthanMollick,曾经要求他的学生仅用AI撰写短论文,其实他真正想强调的是,如何更好地输入提示词。如果只是输入简单的提示词,让AI写关于某个主题的5段话,内容无趣,文字也很平庸。
但当学生们和AI合作,让AI对论文多次修改,比如抛弃无用的短语、加入生动的细节、修改结尾的情感色彩,就能让论文增色不少。所以,如果AI就是未来互联网的交互界面、新的个人计算机,那么不如开始得更早一些,学习如何和它聊天。正如英国营销公司Ladder创始人MichaelTaylor所说:当你可以创造任何你想要的东西时,你能多准确地表达「那是什么」的能力就变得很重要。
撰文:张成晨
来源:爱范儿、DeFi之道
郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。