IT之家4月10日消息,OpenAI宣布,具有视觉能力的最新GPT-4Turbo模型GPT-4TurbowithVision现已通过OpenAIAPI向开发人员普遍提供。
据IT之家了解,该模型延续了GPT-4Turbo系列128,000个token的窗口大小以及截止至2023年12月的知识库,最大的革新之处在于其新增的视觉理解能力。在过去,开发者需要调用不同的模型来处理文本和图像信息,而GPT-4TurbowithVision则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。
OpenAI也分享了一些开发者正在使用该模型的有趣案例。例如,AI软件工程助手Devin利用GPT-4TurbowithVision辅助编程;健康健身应用程序Healthify使用该模型扫描用户饮食照片,通过图像识别提供营养分析;创意平台MakeReal则利用该模型将用户的草图转化为可运行的网站。
目前,GPT-4TurbowithVision尚未应用于ChatGPT或开放给大众使用,不过OpenAI暗示该功能即将登陆ChatGPT。