导读 人工智能聊天机器人已成为帮助人们满足所有基于文本的需求(例如写作、编码、研究等)的宝贵工具。然而,它们通常仅限于文本,直到最近转向多
人工智能聊天机器人已成为帮助人们满足所有基于文本的需求(例如写作、编码、研究等)的宝贵工具。然而,它们通常仅限于文本,直到最近转向多模式输入,而BingChat现在也加入了这一趋势。
周二,微软宣布BingChat现在将在其提示输入中接受图像。这将允许用户上传他们想要更多信息的图像,或者以某种方式与提示相关的图像。
例如,如果用户看到一幅画,想知道是谁画的,他们只需上传照片并询问BingChat画家是谁,BingChat现在可以利用GPT-4解释图像并回答问题。
当GPT-4在3月份首次推出时,该模型最大的改进之一是它处理多模式提示的能力,特别是图像和文本。
此次BingChat集成是GPT-4的多模式功能首次集成到聊天机器人中,因为即使是ChatGPTPlus用户还无法访问此功能。
微软建议该功能还有其他有趣的用途,包括上传冰箱中物品的照片、请求午餐创意或询问新城市的建筑结构。
该功能今天开始在桌面和移动应用程序上向用户推出。该功能已经向我推出,所以我对其进行了测试。
我上传了我的小狗的图片,并询问BingChat他是什么品种。几秒钟之内,BingChat就发布了准确的响应,如文章顶部的图片所示。
在此版本发布之前,谷歌上周通过与GoogleLens集成为其GoogleBard聊天机器人添加了图像输入。