扫描分享
本文共字,预计阅读时间。
要让为ChatGPT、Claude和Gemini等应用程序提供支持的大型语言模型(LLM)成为优秀的对话伙伴和助手,就需要人类对其训练,使其获得大量适当答案的实例。
人工智能公司通常使用“人类反馈强化学习”(RLHF)等技术,即人类向人工智能系统提供优秀答案的范例,或对人工智能提供的答案进行评估和打分。要将人工智能训练到当今聊天机器人和代理的水平,需要耗费大量人力,但像OpenAI和Anthropic这样的大型人工智能实验室的员工数量却都不多。
为了提供训练生成式人工智能所需的劳动力,包括寻找能够帮助人工智能学习解决数学和科学问题等深奥技能的专业专家,人工智能公司和其他希望开发和完善人工智能模型的企业越来越多地开始向专业企业寻求帮助,而Scale就是一家提供此类服务的机构。
Scale大约在七年前起步,当时主要从事预生成人工智能工作,比如建立标注图像数据管道,帮助自动驾驶汽车学习识别行人、路标和其他行驶中可能遇到的景物。
大约三年前,Scale开始与OpenAI合作研究RLHF技术,以完善ChatGPT等系统。 如今,Scale运营着一个名为Outlier的大型人工智能培训平台,Outlier总经理Xiaote Zhu表示,大约在过去一年里,该平台向全球数万名自由职业者支付了数亿美元。其运营的另一个规模较小的工作平台Remotasks主要与美国以外的自由职业者合作,仍主要专注于计算机视觉和自动驾驶汽车。
目前,Scale的客户包括OpenAI、微软、Meta、Nvidia和Character.ai,以及众多其他企业和政府机构,该公司的迅速崛起让创始人兼首席执行官Alexandr Wang在27岁时就成为了亿万富翁。 Outlier会定期发布广告,招聘数百个职位,帮助人工智能掌握从挪威语到波斯语的各种语言,以及文科课程的各种技能,包括编码、音乐、核物理、哲学和法律。
该公司首席技术官Vijay Karunamurthy表示:“领域专家对于这类工作来说非常重要。在微调这些模型时,不仅要有专家反馈,还要有文化意识和特定语言的反馈,所有这些都是需要考虑的重要因素。”
尽管Scale公司运营的一个重要且必要的部分是管理这些员工——找到那些有经验的员工,让人工智能系统了解客户希望他们从事的最深奥的领域——但该公司远不止是一家专业的临时工机构。 Scale与人工智能公司合作,不断测试其模型的最新版本,这些模型通常在价值数十亿美元的强大GPU阵列上进行24小时不间断的训练和调整,并就实际变化提供详细的专家反馈。
Scale的专家可以就如何解决特定问题为人工智能提供详细指导,或帮助确保模型能够解释自己的工作,这在人工智能可能受到审计的某些应用中是必要的。该公司还开发了一套专有基准,一般方法公开,但细节保密,这样人工智能开发人员(或人工智能本身)就不能简单地为测试而学习。这些基准衡量了各个领域的性能。 其中一些测试验证了模型在多种语言中的良好表现,这对那些部署在医疗保健等领域的模型至关重要,因为它们可能会被问到各种语言的问题,并确保即使用户试图操纵它们破坏自己的规则,人工智能也能表现正常。
此外,Scale还与使用人工智能的企业以及构建公共系统的公司合作。该公司可以帮助客户评估最佳的人工智能、数据设置和其他参数,有时大牌人工智能实验室会请Scale为企业客户提供帮助。 Scale还可以帮助企业对开源模型进行微调,以便在自己的数据中心内将其用于专有信息(如保险理赔数据或金融交易)。 例如在今年7月,该公司宣布与Meta公司合作,帮助企业 "定制、评估和部署 Meta公司的Llama开源人工智能模型,11月19日,该公司又宣布了一项类似的协议,帮助企业构建微软Azure人工智能系统。
而Scale与外部承包商合作训练人工智能时也会采取保密措施。 据报道,该公司使用代号来指代大型科技公司,因此自由职业者往往不知道他们在训练谁的人工智能。
最近一个月,该公司还推出了一些措施来防止欺诈行为,比如有人谎报身份,或使用ChatGPT等机器人编写拟人回复。
当然,作为一个快速发展的平台,Scale有时也会接到抱怨,称任务和费率可能无法预测。虽然员工可以选择自己的工作时间,但他们可能无法提前知道有多少工作可以做。一些参与人员还抱怨说,即使出现付款问题,也很难联系到支持人员。为此,Scale推出了一些新功能来解决这些问题。比如,通过详细的收入选项卡和任务期间可见的薪酬率提高薪酬透明度,而改良后的支持系统现在可以在三天内解决90%的薪酬相关咨询。
随着平台越来越依赖于专业的贡献者,有时甚至需要招聘像拥有博士学位的学者或国际数学竞赛获奖者这样的专家,因此提供及时的付款和良好的工作环境对于招聘和留住拥有人工智能系统所需的知识的可靠员工可能尤为重要。
Scale负责人表示,对于一些Outlier的贡献者来说,学习是双向的。在加入 Outlier 之前,人工智能可能是那种可怕的东西,因为他们对人工智能的工作原理没有太多了解。 而在加入这个平台之后,他们了解了模型的工作原理,他们觉得自己更了解它的局限性和用例,因此这改变了他们的看法。
非常感谢您的报名,请您扫描下方二维码进入沙龙分享群。
非常感谢您的报名,请您点击下方链接保存课件。
点击下载金融科技大讲堂课件本文系未央网专栏作者发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!
本文为作者授权未央网发表,属作者个人观点,不代表网站观点,未经许可严禁转载,违者必究!
本文版权归原作者所有,如有侵权,请联系删除。