中信建投11月8日研报指出,北京时间11月7日凌晨,OpenAI首届开发者大会召开,发布全新的GPT4-Turbo、GPT Store、Assistants API及版权保护机制Copyright Shield,其中GPT4-Turbo在支持更多功能的升级后降低了调用价格,GPT-Store允许用户和企业上传定制化的GPT应用并获得利润分成,Assistants API帮助非专业和专业开发者简化开发流程并缩短开发时间,Copyright Shield承诺保护商业客户免受与OpenAI应用程序和服务相关的版权侵权索赔。我们认为,OpenAI在AI大模型的商业化和生态建设上做出了重大突破,利好相关应用厂商和AI大模型商业化推进,同时促进国内算力需求。
全文如下中信建投:OpenAI首届开发者大会点评
北京时间 11 月 7 日凌晨,OpenAI首届开发者大会召开,发布全新的GPT4-Turbo、GPT Store、Assistants API及版权保护机制Copyright Shield,其中GPT4-Turbo在支持更多功能的升级后降低了调用价格,GPT-Store允许用户和企业上传定制化的GPT应用并获得利润分成,Assistants API帮助非专业和专业开发者简化开发流程并缩短开发时间,Copyright Shield承诺保护商业客户免受与OpenAI应用程序和服务相关的版权侵权索赔。
我们认为,OpenAI在AI大模型的商业化和生态建设上做出了重大突破,利好相关应用厂商和AI大模型商业化推进,同时促进国内算力需求。
中信建投证券人工智能、计算机、传媒互联网等研究团队推出【open AI大会投资机遇】,持续更新相关研究成果。
01、OpenAI召开首届开发者大会,强力新产品助力应用商店模式
OpenAI首届开发者大会召开,发布全新的GPT4-Turbo、GPT Store、Assistants API及版权保护机制Copyright Shield,其中GPT4-Turbo在支持更多功能的升级后降低了调用价格,GPT-Store允许用户和企业上传定制化的GPT应用并获得利润分成,Assistants API帮助非专业和专业开发者简化开发流程并缩短开发时间,Copyright Shield承诺保护商业客户免受与OpenAI应用程序和服务相关的版权侵权索赔。OpenAI在AI大模型的商业化和生态建设上做出了重大突破,利好相关应用厂商和AI大模型商业化推进,同时促进国内算力需求。
事件
OpenAI召开首届开发者大会,发布全新的GPT4-Turbo,支持更多功能和更低的调用价格;发布GPT Store,用户可以上传自定义的GPT应用;发布Assistants API,帮助开发者简化流程;发布Copyright Shield,承诺将保护其商业客户免受与OpenAI应用程序和服务相关的版权侵权索赔。
简评
全新的GPT4-Turbo,更多功能更低价格。新的GPT4-Turbo在多个功能模块进行升级并降低了调用价格,提高了相关商业应用的实用性,为开发者和企业提供更多支持并降低商业化成本。
1、更多的内容长度:OpenA原本提供的最长的上下文长度为 32k ,GPT4Turbo支持多达128K的内容长度,大概相当于300页的文档。
2、更强的函数调用能力:可以一次性调用多个函数,准确性也更高。在新的json模式下,API参数response format使模型能够约束模型输出,以生成语法正确的JSON 对象。新的seed参数能使模型在大多数时间返回一致的结果来实现可重现的输出。
3、内外部知识库升级:内部知识库更新到2023年4月,GPT4-Turbo可以上传外部知识库和文件获取支持。
4、多模态功能更新:新模型支持视觉模型DALL·E3,可以实现以图生图;并且支持从文本到语音模型,开发者可以从六种预设声音中选择所需的声音。
5、模型微调与定制:GPT3.5 Turbo 16K版本支持微调定制,GPT-4的微调正在申请中。微调模型可以针对特定领域定制专属模型。
6、降价增速:GPT-4 用户在发布会后可享受每分钟速率限制翻倍的体验,并可通过API账户设置请求更改进一步的速率限制和配额。新发布的 GPT-4 Turbo,输入方面比 GPT-4 降价 3 倍,而输出方面降价 2 倍。新模型的价格是每千输入 token 1 美分,而每千输出 token 3 美分。
正式发布GPT Store,用户可上传定制化应用:OpenAI 重新梳理了其应用商店的体系,原有的插件更名为GPT,整个应用商店命名为GPT Store,允许用户或开发者自定义并发布自己的GPT版本。GPT 发布后,应用可以选择私有,专属企业拥有和公开所有三种方式。个人和企业能够将自己的知识库上传到GPT Store创建专属应用,并借此获得利润分享。OpenAI借鉴成熟的应用商店模式,鼓励个人和企业在OpenAI平台上参与和创造,旨在形成一个自我维持和扩展的AI服务生态系统。
发布Assistants API,简化开发流程。基于AI的agent获得广泛欢迎,但是建立难度大、时间长。新的Assistants API提供了持久状态(persistent threads)、知识检索(Retrieval)、代码解释器(Code Interpreter)和函数调用(Function calling)等能力,帮助开发者简化开发流程并缩短开发时间。
发布版权护盾机制Copyright Shield。在系统中内置版权保护措施,承诺将保护其商业客户免受与OpenAI应用程序和服务相关的版权侵权索赔,覆盖使用OpenAI开发者平台上“普遍可用”的功能以及ChatGPT企业版的客户。
投资建议:OpenAI召开首届开发者大会,发布了多个强力的新产品和全新的应用商店新模式,新的GPT4-Turbo、Assistants API和Copyright Shield为个人和企业开发者提供更多更强的支持,并在版权方面提供版权保护措施,助力开发者在OpenAI 的GPT Store商业模式上积极参与与创造,培养可持续和不断拓展的AI服务生态系统。我们认为OpenAI在ChatGPT的商业化和生态建设上做出了重大突破,利好国内相关应用开发商,并为国内大模型生态发展提供了新的商业化思路,同时建议重视国内算力需求。
风险提示:(1)技术可行性风险:新产品如GPT Store和Assistants API的市场接受度仍有不确定性,相关企业在新技术实际部署时可能遇到预料之外的技术挑战和商业化挑战;(2)知识产权风险:尽管OpenAI推出了Copyright Shield来保护客户免受知识产权诉讼的风险,但这一领域的法律挑战仍然复杂并且不断发展;(3)依赖于单一供应商的风险:对OpenAI技术的依赖可能会使企业面临供应商锁定的风险,如果OpenAI出现服务中断或价格上涨,可能对企业产生负面影响(4)研发成本风险:大型AI模型的开发和维护成本非常高,需要持续的投资。如果投入的资本不能产生预期的回报,可能会影响相关公司的财务状况。
02、OpenAI大会在即,利好科技板块核心标的和AI应用投资机会
近期科技行业催化不断,OpenAI开发者大会在即,微软Copilot自11月1日起正式向企业客户提供商用服务,国内软件公司推出多款AI应用。另一方面,万亿国债及稳经济政策出台,宏观环境向好,有望带动低估值分位的计算机板块整体受益。当前板块整体估值处于2017年以来近5年中位数以下水平,一些前期调整较多的计算机核心标的投资性价比提升。我们建议关注前期调整较多且基本面向好的核心标的和受中美技术共振影响的AI应用板块投资机会。
OpenAI开发者大会即将召开,模型降本后有望助力AI应用产品加速落地。2023年11月6日,OpenAI首届开发者大会将于旧金山开幕,预计将吸引全球数百名开发者与OpenAI团队预览新工具,交流开发想法。本次大会上OpenAI计划推出包括视觉功能、储存能力在内的新工具,有助于开发者构建具备分析和描述图像能力的应用程序,将开发商成本缩减至1/20。近期国内多款AI应用及产品加速落地,如美图MiracleVision3.0、中文在线文字写作模型、讯飞星火模型、大华股份多模态AI模型等陆续发布或迭代升级;商业端看,11月1日Microsoft 365 Copilot正式向企业客户提供商用服务,预期仅国内首批客户数超百家。展望未来,年底前包括OpenAI开发者大会、SC23、CAIT2023、广州国际人工智能展览会等多个关于AI行业的会议即将开幕。此外,具备多模态能力的GPT5有望在年底或明年初发布,预计将进一步加速AI产业发展,推动AI应用有望加速落地。
风险提示:(1)宏观经济下行风险:计算机行业下游涉及千行百业,宏观经济下行压力下,行业IT支出不及预期将直接影响计算机行业需求;(2)国内疫情反复风险:计算机多数公司业务实施和签单等需要到场服务,若人员复阳情况增加,将直接影响公司业务开展;(3)行业竞争加剧:计算机行业需求较为确定,但供给端竞争加剧或将导致行业格局发生变化;(4)国际环境变化影响(目前美国持续加息,影响科技行业估值,同时市场对于海外衰退预期加强,对于海外收入占比较高公司可能形成影响,此外美国不断对中国科技施压)。
03、互动游戏/短剧爆火,OpenAI大会在即,坚定看好反弹
OpenAI大会在即,看好AI应用
关注11/6 OpenAI首次开发者大会,预计:1)推出含内存存储的API,调用成本有望再次下降;2)持续布局多模态,GPT-4V 和 DALL·E 3 的 API 接口可能推出。从9月以来,AI应用出圈频率加快,包括9月ChatGPT多模态、AI教育数据佳;10月AI视频“郭德纲说英语”出圈;11月电商AI亮相,AI正多点开花。
当前,传媒板块回调至3月初大涨前位置,AI的溢价基本归零。随着三季报落地,持续关注后续AI对传媒板块催化,主要分两大主线:
1)AI爆款多点开花、频率加快,关注上线节奏。9月ChatGPT引入图像与语音交互功能;10月AI教育应用访问量亮眼;近期“AI郭德纲说英语相声”视频出圈;11月1日微软面向商业版用户发布365 Copilot。AI应用正多点开花,实际落地速度或快于预期,AI爆款上线频率有望加快,助力C端体验的跃升,或B端效率的极大优化。
我们认为,基于更强的底层模型,AI应用的体验也会更加强大,关注海内外模型迭代。
2)海外模型:关注OpenAI11月6日首届开发者大会。届时,我们预计,OpenAI会发布含内存存储的API,以减少模型调用成本;或发布GPT-4V和DALL·E 3的API接口,从而让AI应用更方便地使用多模态能力;也关注其他相关技术进展。
3)国内模型:持续追赶海外,新添第二批备案模型,关注升级节奏。10月31日,千亿级参数大模型通义千问2.0发布,在10个权威测评中,其模型综合性能超过GPT-3.5,正在加速追赶GPT-4;据《每日经济新闻》,腾讯混元中文能力整体超过GPT3.5,也在10月底开放了文生图功能;11月4日,第二批 AI 大模型通过备案落地,包括昆仑万维天工、网易有道子曰、面壁智能面壁露卡 Luca、出门问问序列猴子 、美团、知乎知海图 AI、月之暗面、金山办公WPS AI、好未来MathGPT 大模型,当前累计共20家大模型获得备案。更多优质模型家加速模型竞争迭代,升级应用体验。
生成式AI推动传媒行业进入全新技术周期,看好其对传媒各领域的升级催化,包括C端的游戏、影视、娱乐、社交、教育等,B端的办公、营销、电商、文旅展览等。
风险提示:
版权保护力度不及预期,知识产权未划分明确的风险,IP影响力下降风险,与IP或明星合作中断的风险,大众审美取向发生转变的风险,竞争加剧的风险,用户付费意愿低的风险,消费习惯难以改变的风险,关联公司公司治理风险,内容上线表现不及预期的风险,生成式AI技术发展不及预期的风险,产品研发难度大的风险,产品上线延期的风险,营销买量成本上升风险,人才流失的风险,人力成本上升的风险,政策监管的风险,商业化能力不及预期的风险。
04、OpenAI开发者大会前瞻:降成本,多模态,做生态
Open AI首届开发者大会将于11月6日召开,根据路透社报道,我们预计有如下更新:1)推出含内存存储的API,减少历史记录的重复上传,实现大模型计算速度增加,及API调用成本可能下降95%;2)持续布局多模态:10月底已开启GPT 4灰度测试,推出“支持多格式文件上传”和“一站式工具整合”两大功能,优化多模态体验。GPT-4V和DALL·E 3的API接口可能推出。
长期看,OpenAI有望推动大模型逐渐迭代为AI智能体,并构建以ChatGPT大模型为基础的新生态体系。
关注:1)基于ChatGPT等大模型开发AI应用,或布局多模态生成的公司;2)真人互动游戏或将成为游戏公司新的盈利增长点,AI换脸等多模态AI技术可以增加玩家体验,看好多模态AI技术在游戏、影视行业的应用,同时关注其在营销&电商、教育等领域的发展。
事件
据Open AI官网,Open AI首届开发者大会将于11月6日在旧金山举行,来自全国各地的数百名开发人员和Open AI团队将参与其中,预览新工具并交流想法。据路透社,开发者大会旨在吸引更多开发者付费访问Open AI模型,长期基于OpenAI模型构建新生态系统。
简评
我们预计开发者大会可能发布公司在GPT-4、DALLE等模型的新进展,主要包括:1)发布内存存储API,减少重复上传历史文本带来的token耗用,从而降低API调用成本;2)持续推进多模态布局,推出GPT-4 V和DALLE 3的API调用服务等。
1、内存存储API有望有效降低API调用成本
目前大量token用于历史文本传输,内存存储API有望降低API调用成本达95%。据公司官网,目前通过GPT-4、GPT-3.5Turbo上传750词的文档分别需要0.06、0.003美元(以最高速度计算)。2023年6月,公司CEO Sam Altman接受AI开发平台Humanloop采访时曾透露公司的发展路线图,包括推出“有记忆的API”,解决大量token用于历史文本传输的情况。据路透社,内存存储API可能在开发者大会中推出,提高大模型计算速度,降低开发者的API调用成本达95%。
1)降低API调用成本:当前运行AI应用时,都需要将其历史记录通过API上传至大模型,以便大模型依据历史记录进行内容生成,导致大量token用于历史记录传输。内存存储API推出后,使用AI应用时,只需通过API上传最新的对话记录,大模型即可结合该记录和其维护的历史记录,生成新的内容,以此降低token使用量。
2)提高大模型计算速度:内存存储API推出后,大模型只需进行新记录的计算,无需对历史记录进行重复计算,可以提高计算速度,减小算力浪费。
2、多模态持续推进,GPT-4和DALLE 3或将向开发者开放
GPT-4新版本开启灰度测试,提升多模态体验。据theverge,公司于10月底向部分ChatGPT PLUS用户开放了新版本的GPT-4,主要功能更新包括:
1)支持多格式文件上传:旧版本中,用户需要使用“Advanced Data Analysis”等功能完成PDF文档上传和信息提取;新版本中,用户可以直接上传PDF、数据文件等多种格式文件,未来或将支持更多文件类型;
2)一站式工具整合:GPT-4的不同模式各具优势和功能短板,其中多模态模式可以同时处理文本、图像、声音等多种类型数据,但仅支持图片上传;数据分析模式具备较强的数据处理和分析能力,但不能实时联网;实时联网模式和DALL-E则不支持文件上传。旧版本中,用户需要自主进行模式选择;新版本中,GPT-4将根据用户需求,自动选择和编排多个工具完成任务,向AI智能体角色迭代。
GPT-4V和DALLE 3可能推出API接口。据路透社,公司可能在开发者大会上推出多模态API,功能为处理和生成除文本以外的多种类型数据,包括图像和音视频,开发者可以借此构建具有多模态能力的AI应用。基于目前公司的大模型,我们预计GPT-4V和DALLE 3的API接口可能推出:
1)GPT-4V:据领英,Logan Kilpatrick是OpenAI首位负责开发者关系的工程师,于2022年12月入职,长期通过X(Twitter)与开发者交流。11月1日他发布新帖子,宣布ChatGPT于9月更新的多模态功能将很快面向所有人开放,并就通过API接口向GPT-4V上传图片,回答开发者希望获得的信息。由此我们预计,公司或将在开发者大会推出GPT-4V的API接口。
2)DALLE 3:2023年9月,公司推出图像生成模型DALLE 3,目前已向ChatGPT PLUS和企业用户开放。据公司官网,其计划于今年秋季开放API接口。
风险提示:国际政治风险、生成式AI技术发展不及预期、VR硬件效果不及预期、各领域技术融合进度不及预期的风险、算力支持程度不及预期、数据质量及数量支持程度不及预期、用户需求不及预期、技术垄断风险、原始训练数据存在偏见风险、算法偏见与歧视风险、算法透明度风险、增加监管难度风险、政策监管风险、商业化能力不及预期、相关法律法规完善不及预期、版权归属风险、深度造假风险、人权道德风险、影响互联网内容生态健康安全风险、企业风险识别与治理能力不足风险、用户审美取向发生变化的风险。
05、海外AI再迎催化,关注大模型行业相关投资机会
OpenAI首届开发者大会将于11月6日在旧金山举行,来自全国各地的数百名开发人员和Open AI团队将参与其中,据相关消息报道,开发者大会可能发布GPT-4等模型的新进展,主要包括:全新的界面以及一些新功能:自定义聊天机器人、新的订阅模式、新的API接口。OpenAI开发者大会不断加速大模型的落地进程,值得重点期待。同时,国内大模型近期也取得了显著突破,百度文心一言大模型专业版正式上线,成为国内首个面向C端收费的大模型产品。讯飞星火认知大模型核心能力进一步提升,全面对标ChatGPT。智谱AI ChatGLM3、阿里云通义大模型也迎来重要更新。随着国内生成式AI产品的迅速迭代,大模型的商业化落地进程也会进一步加快,建议关注大模型行业的相关投资机会。
OpenAI即将召开首次开发者大会,大模型行业商业落地加速。
Open AI首届开发者大会将于11月6日在旧金山举行,来自全国各地的数百名开发人员和Open AI团队将参与其中。据相关消息报道,开发者大会可能发布GPT-4等模型的新进展,主要包括:
1)全新的界面以及一些新功能:自定义聊天机器人。可能发布的GPT-4 All Tools使得ChatGPT 可以浏览网页、分析数据和生成图像,此外还能更快地访问 DALL-E、Data Analyst和自定义GPT。OpenAI 发展成为一个成熟的 UGC 平台,在其上用户可以创建和共享任何AI智能体。ChatGPT成为RPA、自定义AI和插件商店的集合体。
2)新的订阅模式。或将推出新的企业订阅和工作空间管理。团队计划的价格为每月30美元,年度订阅价格为每月25美元。
3)新的API接口。将Google Drive和Microsoft 365等其他应用连接到ChatGPT。
2.国内大模型龙头发展近况梳理
2.1 百度文心一言大模型:专业版正式上线,成为国内首个面向C端收费的大模型产品
11月1日,百度正式上线文心一言专业版,技术持续升级。文心一言大模型专业版基于公司最新自研的文心大模型4.0,与原有的3.5版本相比,具有以下优势:1)更强的模型能力和图片生成能力。根据测试,文心大模型4.0版本在理解、生成、逻辑、记忆四大功能上都有明显提升,具有显著优化的模型性能。2)支持接入丰富的API插件,可以实现撰写代码、润色文案、设计与绘图等多种功能。
文心一言成为首个国内面向C端收费的大模型产品。文心一言专业版的分为单独订阅和联合会员两种收费模式。单独订阅模式下,会员月付59.9元,选择连续包月可以享受49.9元的优惠价格;该模式下会员可以使用文心一言大模型3.5和4.0两个版本,而非会员只可使用免费的文心大模型3.5版本。联合模式下,用户月付99元,可以同时具有单独订阅模式的全部功能,并获得文心一格白银会员资格,享受AI修图改图等功能。
2.2 讯飞星火认知大模型:核心能力进一步提升,应用落地场景进一步扩充
讯飞星火认知大模型是科大讯飞集团2023年5月6日推出的新一代认知大模型,并于2023年8月15日发布讯飞星火认知大模型V2.0版本。
10月24日,讯飞召开“解放生产力,释放想象力”的主题发布会,重磅升级讯飞星火认知大模型V3.0。星火认知大模型V3.0多项基础能力均实现提升,文本生成(+7%),语言理解(+6%),知识问答(+7%),逻辑理解(+8%),数学能力(+3%),代码能力(+9%),多模态能力(+7%)七大能力持续提升,全面对标ChatGPT,中文能力客观评测超越ChatGPT,英文能力对标ChatGPT。星火代码大模型能力再度升级,在Python、Java等语言的代码能力上均超越ChatGPT,代码生成、代码补全、代码解释、测试检错、编程问答等细分领域能力也均超越ChatGPT。
核心能力多元,赋能广泛应用场景和使用人群。目前,讯飞星火认知大模型的应用场景包括但不限于1)办公场景。2)教育场景。3)金融场景。4)医疗场景。5)智能家居场景。讯飞星火认知大模型的适用人群包括但不限于:企业用户、政府机构、教育机构、医疗机构和个人用户等各类用户。
2.3 智谱AI ChatGLM3
2023年CNNC上,智谱AI推出全自研大模型ChatGLM3以及相关产品,较前两代模型实现重大突破。
ChatGLM3采用多阶段增强预训练方法,模型性能进一步提高。在44个中英文数据集上排名首位,实现了多模态理解、代码生成、网络搜索等多项新功能。与前一代产品ChatGLM2相比,ChatGLM3在数据集MMLU(大规模多任务语言理解)的性能提升36%、C-EVAL(中文大模型评估基准)提升33%、GSM8K(小学数学应用题数据集)提升179% 、BBH(BIG-Bench Hard,测试语言模型的通用能力,例如推理、常识、逻辑)提升126%。
推出可手机部署的端测模型ChatGLM3-1.5B。支持多种移动平台,推理速度快,成本低,同时也支持国产芯片生态,与国产硬件企业联合创新。赋能生成式AI助手智谱清言,智谱清言具备代码交互、搜索增强、图文理解等能力,可实现便捷用户服务。
2.4 阿里云通义大模型
阿里云大模型升级。阿里云旗下千亿级参数规模的大语言模型通义2.0发布,在多个权威测评中超越GPT-3.5和Llama2,加速追赶GPT-4。基于通义千问的8个行业大模型及一站式大模型应用开发平台阿里云百炼为开发者提供了便捷的大模型服务。
阿里云AI基础设施升级。阿里云为支持大模型训练和部署,对人工智能平台PAI进行了全新升级,采用了新一代AI集群网络架构,支持高达10万卡量级的集群可扩展规模,超大规模分布式训练加速比高达96%,节省超过50%算力资源。
阿里云开放共促生态繁荣。阿里云在AI时代的定位和目标是“服务好AI时代的创业者、开发者、企业客户等,打造AI时代最开放的大模型平台”。为此,阿里云开源通义千问72B模型,成为中国参数最大的开源模型;在魔搭社区上聚集2300多款AI模型,吸引280万名AI开发者;推出“云工开物计划”,给中国所有大学生每人送一台云服务器。
生成式AI产品的商业化落地正当时。大模型训练与运行过程中涉及服务器成本、数据集成本、研发人员成本等,费用较为高昂,实现商业化落地是生成式AI产品的共同趋势。在海外,OpenAI的ChatGPT Plus、Anthropolic的Claude Pro、微软的Microsoft 365 Copilot等已经通过订阅收费手段实现商业化落地,随着国内生成式AI产品的迅速迭代,大模型的商业化落地进程也会进一步加快,建议关注大模型行业的相关投资机会。
风险提示:北美经济衰退预期逐步增强,宏观环境存在较大的不确定性,国际环境变化影响供应链及海外拓展;芯片紧缺可能影响相关公司的正常生产和交付,公司出货不及预期。