美国开放人工智能研究中心(OpenAI)日前展示最新版本ChatGPT:与使用者展开语音对话、识别图像并展开讨论、翻译……相比先前版本,它与使用者对话基本无延迟,会倾听,能唠嗑,还善于察言观色,让人惊呼新版本ChatGPT“更像人”了。
这个人工智能模型名为GPT-4o,编号中的字母“o”代表“omni”(全能),既能接受文本、音频和图像的任意组合输入,还能生成文本、音频和图像的相关回应。
应用潜力如何
北京邮电大学人机交互与认知工程实验室主任刘伟说,无论是在文本生成、做题、问答系统还是情感分析等任务中,GPT-4o都表现出很好的能力。这种技术的突破,不仅推动了自然语言处理技术的发展,也让人工智能在多个领域的应用变得更加广泛和深入。
近年来,开发更人性化、功能更强大的生成式人工智能工具竞争激烈。就在开放人工智能研究中心发布GPT-4o的第二天,谷歌开发者年度会议召开,人工智能是重头戏。硅谷企业家埃隆·马斯克、技术企业“深层思维”创始人之一穆斯塔法·苏莱曼也分别投资开发了聊天机器人Grok和Pi,将拟人化特点作为产品主攻方向。
开放人工智能研究中心首席技术官米拉·穆拉蒂说,GPT-4o定于几周内上线,用户可免费试用。
需要担心什么
在开放人工智能研究中心公布的一段演示视频中,GPT-4o一步步引导一名男孩解答出数学题。一些网友直呼,再也不用辅导孩子写作业了。一些人却担心,教师这一职业会不会被人工智能取代。
一些人工智能专家认为,新版ChatGPT虽然可能比竞争对手水平更高且更易使用,但不太可能很快让一些职业彻底消失,从事教学或翻译工作的人更有可能会使用这些工具,而不是被它们取代。
刘伟说,GPT-4o的语音功能改变了对话式人工智能的游戏规则,但依然没有实现聊天机器人的深度态势感知能力,比如意图理解、动机分析等。此外,GPT-4o的进步在人工智能伦理和安全方面带来了新的挑战,需要我们在数据隐私、信息可信性、潜在偏见、恶意使用、意识和责任等方面开展新的思考。陈丹 袁原



前一期