当地时间周一,人工智能行业龙头OpenAI的历史首届开发者大会揭幕。OpenAI首席执行官山姆·奥特曼在接近45分钟的开幕演讲中,向全球开发者和ChatGPT用户展示了AI龙头即将推出的一系列产品更新。
在发布会的开始,奥特曼简短回顾了公司过去一年的发展历程,特别提到“公司在今年3月发布的GPT-4,至今仍是世界上能力最强的AI大模型”。时至今日,已经有200万开发者正在使用OpenAI的API(应用程序接口),在全球各地提供多种多样的服务;92%的财富500强公司正在使用OpenAI的产品搭建服务,而ChatGPT的周活用户数也达到1亿人。
GPT-4 Turbo模型登场
随后便进入了新品发布时间,首先登场的是GPT-4 Turbo模型。
简单来说,相较于全球股民都很熟悉的GPT-4,GPT-4 Turbo的进步主要体现在6个方面。
1、AI能够理解更长的上下文对话长度(context length)。标准版GPT-4模型最多支持8192个token,此前的升级将其提高至最多3.2万个token。而GPT-4 Turbo支持最高12.8万个token,相当于一本标准大小的300页纸质书所包含的文本量;奥特曼也表示,新模型在处理长文本情境下的准确度也有所提高;
2、给予开发者更多的控制权。新的模型允许开发者指示模型固定以特定形式返回有效JSON—JSON模式。同时开发者可以通过访问seed参数和system_fingerprint响应字段,来实现“模型对每次请求都给出确定性的输出”。
3、GPT-4对于现实世界的知识截止于2021年9月,GPT-4 Trubo的知识则截止于2023年4月。
4、多模态API来了。文生图模型DALL·E 3、具有视觉输入能力的GPT-4 Trubo,以及新的声音合成模型(TTS)都在今日进入API。OpenAI也在今天发布了新的语音识别模型Whisper V3,将在近期向开发者提供API。
5、继向全球开发者开放GPT 3.5微调(Fine-tuning)后,OpenAI宣布将向活跃开发者提供GPT-4微调的资格。对于开发细分行业的垂直AI应用而言,微调是必经的过程。对于这类开发者,OpenAI也推出了定制化模型项目,帮助一些组织训练针对特定领域的定制化GPT-4模型。奥特曼也表示,这件事情一开始并不会便宜。
6、OpenAI将所有GPT-4用户的Token速率限制扩大了一倍,开发者可以申请进一步提高速率。
与微软、Adobe类似,OpenAI也引入了“版权护盾”机制。在ChatGPT企业版用户和API用户遭到版权官司时,公司将会出面辩护,并支付因此产生的赔偿责任。
在市场极为关注的定价方面,作为行业领先的大模型,GPT-4 Turbo的价格要远低于GPT-4。其中输入Token的价格只有三分之一,而输出Token的价格只有一半。也就是说,输入1000个Token的定价为1美分,而输出1000个Token的定价为3美分。与此同时,GPT-3 Turbo 16K模型的价格也有所下调。
在新品发布间隙,微软CEO纳德拉也来到现场,猛夸了一顿OpenAI并再次强调“微软深爱着OpenAI”。
ChatGPT也有更新
奥特曼宣布,虽然今天是开发者大会,但OpenAI也忍不住对ChatGPT做出一些更新。
首先,从今天开始ChatGPT将使用刚刚发布的GPT-4 Trubo模型。另外,针对用户每次对话前都要选择不同模式的困扰,GPT-4 Trubo也将迎来产品逻辑的更新,现在机器人能够主动根据对话来适配对应的功能。
接下来本场活动的第二个重要产品登场——GPTs。用户将能通过自定义指令、拓展(模型)的知识边界和下达行动命令,来构建自己的GPT,并能对外发布给全球更多的人使用。更重要的是,整个构建“自定义GPT”的过程也是通过自然语言对话形成的。
奥特曼也在现场演示了如何通过聊天搭建一个GPT。他给GPT Builder的指令是“希望帮助创业者思考商业灵感并提供建议,然后‘拷问’他们为何公司发展得不够快。”
随后ChatGPT迅速搭建了一个创业咨询GPT,还顺手生成了一个Logo。
随后奥特曼在属性页面中上传了一份他自己关于创业公司的演讲稿,向这个用例提供了额外的知识。至此,自定义用途的GPT初步搭建完成。用户可以保存这个用例只给自己使用,也能对外公开发布。
既然说到“公开发布”,OpenAI也顺势宣布,将在本月晚些时候上线“GPT应用商店”。对于那些最热门的GPT,公司还将分享一部分的营收,来推进GPT应用生态的进步。
Assistants API
最后是面向开发者的新品Assistants API。“助理API”是一个专门构建的人工智能,具有特定的指令,利用额外的知识,并能调用模型和工具来执行任务。新的助手API提供了如代码解释器、检索以及函数调用等功能,以处理此前开发者必须自己完成的诸多繁重工作。
OpenAI介绍称,这个API的用例范围非常灵活,例如基于自然语言的数据分析应用、编程助手、AI度假规划器、语音控制DJ、智能视觉画布等等。
作为示例,OpenAI的首席开发者体验官Romain Huet搭建了一个“知晓整场开发者大会”的用例,并调用Whisper来实现语音输入。
同时由于这个API可以联网,所以Romain也在现场用语音指示AI随机挑选5位现场观众,给他们的OpenAI账户里各充值500美金。
作为本场活动的最后一个惊喜环节,Romain再一次向AI发出指令,给现场所有人的账户里各打了500美元。