当前位置:首页 > 探索 > 财经观察:提升人机交互效率 多模态大模型易用性进一步推进

财经观察:提升人机交互效率 多模态大模型易用性进一步推进

人民网北京5月14日电 (焦磊、财经实习生张泊洋)陪人聊天、观察帮助分析工作中的提升态沧州市某某物流维修站问题并给出解决方案,甚至和人建立起情感羁绊……在科幻电影《Her》中,人机聊天机器人“Samantha”用充满智慧和幽默的交互进回答展示出高度的智能性和适应性。当下,效率性进这些来自过去的多模科幻想象正加速照入现实中。

北京时间5月14日凌晨,模型美国科技公司OpenAI在春季发布会上发布了最新GPT-4o多模态大模型。易用据OpenAI公司首席技术官米拉·穆拉蒂(Mira Murati)介绍,步推GPT-4o可以接收文本、财经沧州市某某物流维修站音频和图像的观察任意组合作为输入,并实时生成文本、提升态音频和图像的人机任意组合进行输出,其中“o”代表“omni全能”。交互进

一直以来,多模态人机交互便是AI领域重点研究发力方向之一。继文生视频大模型Sora之后,GPT-4o的发布迎合了业内对多模态大模型的更多期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。业内分析认为,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务。

作为面向未来人机交互范式的全新大模型,GPT-4o具有文本、语音、图像三种模态的理解力,并可以综合对话者语气和所处环境空间等因素进行回答,展现出了高度智能性。

发布会上,GPT-4o展示了多项多模态交互能力。在进行实时语音交流时,其响应极快,并且可以识别用户的语音情绪,语音有情感,还能用不同语言和多人同时交互。在语音的同时可以与视频实时交互,演示了一边聊天一边解答手写数学问题,以及实时交流阅读代码,指导编程、视频聊天等能力。

米拉·穆拉蒂表示,“这是我们第一次在易用性方面真正向前迈出了一大步。”

此前,大模型在各个领域的应用主要集中在文生文、文生图之上,今年初Sora的发布则推动文生视频领域进一步发展。业内分析表示,此次GPT-4o的发布,将促使多模态综合交互成为生成式AI的重点发展方向,进而提升人机交互效率,逐渐向AGI方向迈进。

国盛证券研报分析,GPT-4o是迈向更自然的人机交互的重大进步,新功能带来了崭新的多模态交互能力,通过新的端到端模型实现了体验上的新突破,有望在各类终端实现用户体验的最大化。

多模态大模型包含的图文、音频、视频内容数据量巨大,进而引发人们对算力供应的关注。业内分析认为,未来AI的发展对算力的需求将会是几何式增长,算力限制可能是影响生成式AI应用开放使用的重要因素,而算力的可获取性以及成本将是挑战之一。此外,多模态大模型还将带来更严峻的安全挑战。

米拉·穆拉蒂表示,在安全性问题上,GPT-4o通过过滤训练数据和通过训练后细化模型行为等技术,在跨模态设计中内置了安全性。OpenAI还创建了新的安全系统,为语音输出提供防护。

据介绍,用户可有数量限制地免费使用GPT-4o模型来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。

OpenAI CEO山姆·奥特曼在发布会后表示,“我们将创造人工智能,然后其他人将使用它来创造各种令人惊奇的事物,我们所有人都会从中受益。”此外,他还表示OpenAI其他业务收入将帮助公司向数十亿人提供免费的人工智能服务。

(责任编辑:热点)

推荐文章
  • 国安部:记者报道特大稀土走私,推动强化配额管理

    国安部:记者报道特大稀土走私,推动强化配额管理   微信公众号“国家安全部”12月13日消息,在信息爆炸的时代,国家安全的防线早已突破传统疆域,覆盖到舆论引导、真相揭露、民生福祉的每一个角落。作为时代的记录者、勇毅的发声者,一批优秀的中国记者或间接 ...[详细]
  • 高中生背新概念英语,可以考130吗?凡事试一试就知道了

    高中生背新概念英语,可以考130吗?凡事试一试就知道了 相信背新概念的课文,能够高考考130的,姑且就早点试一下,直接把新概念1~4的课文背完,怕就怕你相信背新概念的课文能考130,但是又没找到背新概念的方法,背一篇忘一篇,最后在背新概念这个执念里面反复地 ...[详细]
  • 永远不要这样爱孩子!除非你想养逆子,值得所有家长都读读

    永远不要这样爱孩子!除非你想养逆子,值得所有家长都读读 作者:主创团·枫子早上送小孩上学时,看到这样一幕:男孩想要吃油条,妈妈却觉得油条上火又不健康,就自作主张给男孩买了俩包子。结果,男孩一看到包子,脸立马垮了下来,不满道:“我都说了多少遍,油条!油条!你 ...[详细]
  • 首架直飞珠海的航展参展飞机顺利入境

    首架直飞珠海的航展参展飞机顺利入境   第十五届中国航展开幕临近,11月4日,首架从俄罗斯直飞珠海的安-124运输机顺利抵达,29名飞机机组人员顺利入境。  随着飞机发动机轰鸣声越来越近,安-124运输机顺利落地。珠海边检总站斗门边检站 ...[详细]
  • 未经俄方同意处置俄主权资产,扎哈罗娃回应

    未经俄方同意处置俄主权资产,扎哈罗娃回应   来源:北京青年报  编辑 | ‍‍李岩  央视中文国际消息,扎哈罗娃在俄外交部官网13日发布的答记者问中表示,未经俄罗斯联邦同意处置俄方主权资产,无论是无限期冻结、没收,还是试图将事实上的没收包装 ...[详细]
  • 河南:设置入境旅游团组人次激励奖

    河南:设置入境旅游团组人次激励奖 为进一步促进入境旅游市场稳定复苏和发展,推动河南文旅文创融合战略顺利实施,11月5日,河南省文化和旅游厅联合省财政厅印发《河南省促进入境旅游发展激励暂行办法》,将对组织入境旅游团组、开拓入境旅游境外市 ...[详细]
  • 哈里斯助手:哈里斯将于周三致电特朗普承认败选

    哈里斯助手:哈里斯将于周三致电特朗普承认败选   来源:财联社  财联社11月6日电,哈里斯助手表示,哈里斯预计将于周三致电特朗普承认败选。 NBC)  此前报道  哈里斯或于晚些时间发表讲话财联社)  财联社11月6日电,据美联社、美国全国广播 ...[详细]
  • 欧冠:曼城1

    欧冠:曼城1   来源:懂球帝  北京时间11月6日4:00,欧冠联赛阶段第4轮,曼城客场挑战葡萄牙体育。上半场,福登前场抢断后抽射破门,科瓦契奇远射被挡出,哲凯赖什单刀挑射被爱德森挡出,哈兰德抽射打偏,伯纳多-席 ...[详细]
  • 澳大利亚邦迪滩枪击事件已致3死 以总统发声谴责

    澳大利亚邦迪滩枪击事件已致3死 以总统发声谴责   当地时间14日,澳大利亚悉尼邦迪滩发生的枪击事件已致3人死亡。警方尚未证实。  另据澳大利亚新南威尔士州救护部门证实,悉尼邦迪海滩枪击事件发生后,已有13人被送往医院。  当地时间14日傍晚,澳大 ...[详细]
  • 蜂巢能源回应常州仓库起火:火情已控制住

    蜂巢能源回应常州仓库起火:火情已控制住   11月5日,有媒体报道称,蜂巢能源常州一工厂疑似出现火情。对此,蜂巢能源相关人士回应称:“常州四期原材料仓库发生起火,目前火情已控制住了。起火原因正在调查中,四期工厂只有小部分产线投产,影响轻微。 ...[详细]