融合视觉能力,OpenAI 向开发人员提供 GPT-4 Turbo with Vision

日期:04-10
it之家

IT之家4月10日消息,OpenAI宣布,具有视觉能力的最新GPT-4Turbo模型GPT-4TurbowithVision现已通过OpenAIAPI向开发人员普遍提供。

融合视觉能力,OpenAI 向开发人员提供 GPT-4 Turbo with Vision

据IT之家了解,该模型延续了GPT-4Turbo系列128,000个token的窗口大小以及截止至2023年12月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而GPT-4TurbowithVision则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。

OpenAI也分享了一些开发者正在使用该模型的有趣案例。例如,AI软件工程助手Devin利用GPT-4TurbowithVision辅助编程;健康健身应用程序Healthify使用该模型扫描用户饮食照片,通过图像识别提供营养分析;创意平台MakeReal则利用该模型将用户的草图转化为可运行的网站。

目前,GPT-4TurbowithVision尚未应用于ChatGPT或开放给大众使用,不过OpenAI暗示该功能即将登陆ChatGPT。

租赁 4.5 万平方英尺,苹果公司计划在迈阿密开设大型办事处 苹果中国上线翻新 Apple Watch Series 9:GPS 版便宜 500 元、蜂窝版便宜 800 元
相关阅读: