融合视觉能力，OpenAI 向开发人员提供 GPT-4 Turbo with Vision

日期：04-10

IT之家4月10日消息，OpenAI宣布，具有视觉能力的最新GPT-4Turbo模型GPT-4TurbowithVision现已通过OpenAIAPI向开发人员普遍提供。

据IT之家了解，该模型延续了GPT-4Turbo系列128,000个token的窗口大小以及截止至2023年12月的知识库，最大的革新之处在于其新增的视觉理解能力。在过去，开发者需要调用不同的模型来处理文本和图像信息，而GPT-4TurbowithVision则将两者合二为一，极大简化了开发流程，并带来了广泛的应用前景。

OpenAI也分享了一些开发者正在使用该模型的有趣案例。例如，AI软件工程助手Devin利用GPT-4TurbowithVision辅助编程；健康健身应用程序Healthify使用该模型扫描用户饮食照片，通过图像识别提供营养分析；创意平台MakeReal则利用该模型将用户的草图转化为可运行的网站。

目前，GPT-4TurbowithVision尚未应用于ChatGPT或开放给大众使用，不过OpenAI暗示该功能即将登陆ChatGPT。

租赁 4.5 万平方英尺，苹果公司计划在迈阿密开设大型办事处苹果中国上线翻新 Apple Watch Series 9：GPS 版便宜 500 元、蜂窝版便宜 800 元

融合视觉能力，OpenAI 向开发人员提供 GPT-4 Turbo with Vision

小米 Redmi 显示器 A24 多功能支架版首销：100Hz 高刷 IPS 硬屏，519 元

三星电子今年 Q3 营收 79.1 万亿韩元，营业利润 9.18 万亿韩元

专业创作者福音：苹果 2024 款 M4 MacBook Pro 最多外接 4 台显示器

上海市场监管局：贝尔金召回 5915 件适配苹果 Apple Watch 快速无线充电器

扎克伯格押注 AI：Meta 正推动美国政府使用其 Llama 模型