北京:
纽约:
东京:
伦敦:
首页 市场速递 实时资讯 市场评论 财经日历 黄金原油 货币专题 会员分析 产品服务 投资学院 全网信息
计算机行业动态研究:GPT-4O、GEMINI新品接连发布 多模态技术奇点加速到来

作者:和讯网 2024-05-17 08:52


  事件:
  2024 年5 月14 日,OpenAI 在官网正式发布新旗舰模型GPT-4o 多模态大模型,其中o 代表的是omni,即“全能”,GPT-4o 可以实时对音频、视觉和文本进行推理,相较于GPT-4 Trubo 速度更快、价格更便宜。
  2024 年5 月15 日,2024 年谷歌I/O 大会正式召开,会上谷歌将搜索业务做了最彻底的AI 改造, 更新升级了Gemini1.5Pro 版本, 推出Gemini1.5Flash 轻量化小模型、生成视频模型Veo、AI 智能体ProjectAstra,并展示了与GPT-4o 相似的语音视觉交互功能Gemini Live。
  投资要点:
  GPT 持续迭代,GPT-4o 推动人机交互再上新台阶OpenAI 持续升级GPT 版本,2023 年3 月发布GPT-4 在图片识别、图文数据综合处理及逻辑推理等能力实现质变;2023 年11 月发布GPT-4Turbo,支持125 万tokens 的同时也在上下文等多个领域实现显著进步。本次发布GPT-4o 带来各种能力升级:
  ①多模态交互,具有更优质的视频和音频理解以及图像生成能力:
  GPT-4o 能够接受文本、音频和视频的任意组合作为输入,并生成文本、音频和图像的任意组合作为输出。与现有模型相比,GPT-4o 在视觉和音频理解方面有更好的表现;在理解和生成图像方面的能力优于现有模型,能完成过往模型无法完成的任务。
  ②情绪感知:GPT-4o 能够结合视频和音频感受对话者的情绪,并给出充满人类情感的反馈。例如:在根据工作人员要求讲故事时,工作人员可以随时插话打断并提出新要求,GPT-4o 能几乎毫无停顿地接上话题并按照要求变化音色、语调、情感等。
  ③毫秒级响应:GPT-4o 对音频输入的响应时间可以快到232 毫秒,平均为320 毫秒,这与人类在对话中的响应时间相近,此前GPT-4 的语音响应约5.4 秒。
  ④性能&成本优势:在传统基准测试中,GPT-4o 在文本、推理和编码智能方面,达到了GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉能力方面创下了新高。相比GPT-4 Turbo,GPT-4o 推理速度提升2倍的同时,价格降低50%。
  打造全新GPT 语音助手且免费开放,合作苹果&微软加速端侧落地OpenAI 通过GPT-4o 打造的语音版ChatGPT 助手,当前已在ChatGPT 中开放使用,同时模型API 同步放出。GPT 语音助手主要功能包括与用户跨音频、视频进行交流,例如,让GPT-4o 进行实时翻译、唱歌、做数学题、讲笑话等。未来,OpenAI 将会在ChatGPT Plus 中推出新版语音模式GPT-4o 的alpha 版。
  OpenAI 与苹果合作,加速ChatGPT 在端侧落地。OpenAI 宣布推出一款适用于macOS 的桌面级应用,使用键盘快捷键就可向ChatGPT提问。用户可通过电脑与ChatGPT 语音对话,GPT-4o 的新音频和视频功能后续将推出。据《每日经济新闻》援引彭博社5 月10 日报道,苹果被曝正与OpenAI 敲定一项协议,今年将后者的部分技术引入iPhone。
  借此苹果将能提供由ChatGPT 支持的“聊天机器人”,作为iOS 18 中人工智能功能的一部分。
  谷歌发布Project Astra、Veo 等,多模态技术奇点加速到来2024 年5 月15 日凌晨,Google I/O 开发者大会上发布了通用AI 智能体Project Astra,可实现跨文本、音频、视频多模态实时推理。同时,谷歌正式发布一款全新的视频生成模型Veo,谷歌声称,Veo 能够根据文本、图像创建超过60 秒的高质量1080P 视频,用户可以对光照、镜头语言、视频颜色风格等进行设定。
  我们认为,OpenAI、谷歌等新品的推出,体现出多模态大模型技术的持续升级,GPT-4o 的发布将革新人机交互模式,推动大模型在终端加速推广。随着多模态技术奇点加速到来,未来基于大模型的创新应用将更值得期待,大模型技术将全面赋能教育、办公等行业和场景。
  行业评级及投资策略:GPT-4o、Gemini 新品陆续发布,多模态大模型技术奇点加速到来,大模型的商业价值、AI 应用的创新突破以及AI 算力需求的持续增长可期,维持对计算机行业“推荐”评级。
  相关个股:
  (1)大模型:科大讯飞、三六零、拓尔思、云从科技;(2)AI 应用:金山办公、万兴科技、福昕软件、焦点科技、虹软科技、彩讯股份、佳发教育、鸥玛软件、拓维信息;(3)AI 终端:华勤技术、软通动力、海康威视、大华股份、芯海科技、联想集团、飞荣达;
  (4)AI 算力:浪潮信息、工业富联、中科曙光、神州数码、紫光股份、中际旭创、沪电股份、新易盛、海光信息、寒武纪等。
  风险提示:宏观经济影响下游需求、大模型发展不及预期、市场竞争加剧、中美博弈加剧、相关公司业绩不及预期等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

资讯来源: 和讯  国海证券刘熹

本站所载文章,数据仅供参考,使用前务请核实。未经同意,请勿转载
【免责声明】 本网站所有会员文章,其作者博客简介和文章内容,均由作者本人编写,仅代表作者本人观点,与网站无关。理财18网不对简介和内容的准确性、可靠性或完整性做任何保证。理财18网未授权任何机构或个人直接联系网站用户。任何网站用户因私加会员联系方式而导致的相关账户泄露与资金损失,均由网站用户自行承担。

文章标题搜索     
  博客搜索     
更多精彩文章

和讯网    和讯网创立于1996年,从中国早期金融证券资讯服务脱颖而出,建立了中国第一个财经资讯垂直网站,并始终保持高端财经领域用户排名第一。已经成为投资者提供“多层次金融信息和交易服务”的专业金融投资平台,并在该领域长期处于领先地位。

Copyright @ 2004 - 2024 licai18.com. All Rights Reserved 版权所有        关于我们