Loading...

苹果发布 FastVLM 视觉语言模型，为新型智能眼镜等穿戴设备铺路

AI前沿资讯5个月前发布 GOODNAV.NET

2.3K 0 0

GoodNav 报道，苹果上周开源了视觉语言模型 FastVLM，包含 0.5B、1.5B 和 7B 三个版本。

该模型由苹果自研 MLX 框架开发，并基于 LLaVA 代码库训练，针对 Apple Silicon 芯片的端侧 AI 运算进行了优化。

FastVLM 在保证精度的情况下，实现了高分辨率图像的近实时处理，且计算量显著低于同类模型。

苹果发布 FastVLM 视觉语言模型，为新型智能眼镜等穿戴设备铺路

FastVLM 的核心是 FastViTHD 混合视觉编码器，该编码器优化了高分辨率图像处理。

# AI前沿资讯

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

ChatGPT 应用新特性：类 Operator 智能体，AI 实现点击、拖拽等操作

GoodNav.net

1.1K

ChatGPT 低调上线“记忆搜索”功能：个性化搜索结果更精准

GoodNav.net

2.5K

阿里通义千问 Qwen3 系列模型有望今日发布，支持 256K 上下文长度

GoodNav.net

2.4K

比尔・盖茨：我们生来不是为了工作，AI 将取代人类做大部分事情

GoodNav.net

2.5K

微软 Bing 重大革新：Copilot Search 上线，AI 与传统搜索结合

GoodNav.net

2.3K

《纽约时报》等媒体联盟宣战，向“白嫖”内容训练 AI 说不

GoodNav.net

2.7K

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

GoodNav - 发现优质资源网站，探索无限可能！我们精选全球设计、编程、AI、站长、游戏、工具、搜索、百科、生活、教育、娱乐等优质资源网站，助你提升效率，开启精彩网络世界！

友链申请免责声明广告合作关于我们

Copyright © 2022-2025 goodnav.net All Rights Reserved