香港正大国际期货有限公司

客服QQ 3963243750

期货要闻

距离AI硬件入口爆发还有多远,科大讯飞在澳门给

来源:正大期货    作者:正大国际期货    

当AI从数字走向物理,讯飞用一副眼镜讲述“数实共生”

大数据产业创新服务媒体

——聚焦数据 · 改变商业

“小飞小飞,打电话给我的同事安迪,问问他在展区做什么。”话音刚落,讲话者的眼镜便自动拨通了电话,并同步开启实时翻译功能。电话那头,一位西班牙语使用者开始介绍展区情况,而这边佩戴者眼前实时滚动着中文字幕,跨语言交流几乎没有停顿。

这并非电影中的场景,而是BEYOND Expo 2026中,科大讯飞发布会现场的一幕。2026年5月28日,澳门威尼斯人金光会展中心,科大讯飞穿戴设备业务部总经理林会杰仅通过语音指令就完成讯飞AI眼镜的控制,他慷慨激昂地宣布:讯飞AI眼镜正式发布。

对于深耕智能语音20多年的科大讯飞而言,这是AI能力从录音笔、翻译机、办公本等手持终端向第一视角可穿戴设备延伸,而放眼整个行业,亦也折射出加速前行的趋势:AI正从数字世界走向物理世界。

这恰好呼应了本届BEYOND Expo的主题——“AI:数实共生(AI: Digital to Physical)”。从NVIDIA机器人与边缘AI副总裁Deepu Talla谈具身智能,到XREAL创始人兼CEO徐驰分享智能眼镜的发展方向,再到Linux Foundation全球AI首席技术官Matt White探讨开源Agent,多个论坛释放出同一个信号:AI正在突破屏幕的边界,从数字世界走向现实场景,并不断获得新的感知与交互能力。

BEYOND Expo开幕式,BEYOND Expo联合创始人Jason Ho与Linux基金会全球AI首席技术官Matt White对谈,正大国际期货官网:数据猿

而眼镜,正是这一进程中最具代表性的“新感官”之一。

国内要开会,海外要翻译:

一副眼镜的多重面孔

走在BEYOND Expo展馆里,海内外买家穿梭其间。相比去年,今年中国参展商数量明显增加,这里正成为中国科技企业走向海外的重要展示窗口;而对于主打跨语言沟通的科大讯飞而言,这样的国际化场景本身,就是最好的产品展示现场。

林会杰在媒体采访中表示:“选择在澳门首发,正是看中其国际化窗口的定位。这款产品从设计之初就面向全球市场。”据介绍,讯飞翻译技术支持122种语言,覆盖全球200多个国家和地区,并内置17大行业专业词库,能为跨语言沟通带来全新体验。

事实上,在2026年3月举行的巴塞罗那MWC(世界移动通信大会)上,讯飞AI眼镜就进行了首次亮相,并获得北美科技媒体Digital Trends颁发的“2026 MWC Publisher Award”,成为展会期间备受关注的中国AI硬件产品之一。

在巴塞罗那世界移动通信大会上的讯飞AI眼镜,正大国际期货官网:科大讯飞

不过,对于任何一家希望走向全球市场的硬件厂商而言,全球化远不只是翻译能力,不同市场的用户习惯、使用场景乃至消费偏好,往往决定着产品功能的优先级和价值定位。在接受数据猿记者采访时,林会杰分享了团队对海内外用户需求差异的理解。

对于国内市场而言,轻量化是基础,效率提升则为核心。

林会杰表示,对于很多用户来说,多出5克、10克的重量变化,都可能影响长期佩戴体验。因此,舒适度和无感佩戴是产品进入市场的前提。但真正决定用户是否愿意买单的,往往是能否帮助其提升工作效率。

林会杰介绍道,例如在演讲、汇报、采访等场景中,智能提词器能够根据语速自动滚动内容;而针对会议纪要需求,讯飞GlassClaw超级AI助理则可将会议中的口语表达自动整理为结构化文本,并进一步生成纪要、邮件等内容。

讯飞AI眼镜“智能提词器”功能,正大国际期货官网:数据猿

发布会现场,林会杰演示了这样一个场景:他佩戴眼镜后直接发出指令——“帮我查一下BEYOND主办方和讯飞之前的合作,写一个合作提案发给主办方。”几秒钟后,一封邮件已经完成并发出,全程无需手机参与。从搜索、整理到生成、执行,多个环节被串联成一条完整的工作流。这种Agent能力所带来的效率提升,正成为国内用户关注的重要价值点。

相比之下,海外尤其是欧美市场的逻辑则有所不同。在多语种国家和地区,跨语言沟通本身就是工作与生活中的高频需求。因此,相较于会议记录、内容生成等效率工具,海外用户更关注翻译能力本身,对翻译准确率、响应速度以及交流过程中的自然流畅度有着更高要求。

如果说国内用户希望AI眼镜成为随身办公助手,那么海外用户更期待它成为实时翻译助手;前者关注的是工作流效率,后者解决的是沟通障碍。这种需求差异也意味着,同一款AI产品在不同市场需要展现出不同的产品价值。而这恰恰是中国科技企业出海过程中面临的共同课题:真正的全球化,不只是将产品卖向海外,更要理解不同市场背后的用户需求。

在BEYOND Expo期间,日本最大众筹平台Makuake CEO Ryotaro Nakayama表示,驱动用户消费的核心动力不仅仅是硬件参数,更是产品所传递的情绪价值以及用户对某种生活方式的认同。

阿布扎比投资委员会(ADIC)董事总经理高级顾问Mark Nicholas Cutis也在开幕式炉边对话中指出:“亚洲创新正在崛起,但出海需要彻底的本地化思维。你不能把在深圳做事的思维直接搬到斯图加特。”

从上述角度来看,讯飞AI眼镜的全球化路径并非简单复制同一套产品逻辑,而是在技术底座之上,根据不同市场需求调整产品功能与服务重点。其背后依托的,是科大讯飞在语音与语言技术领域二十余年的积累。

拆解技术护城河:

讯飞在“新战场”的独特打法

4299元。这是科大讯飞为其AI翻译眼镜给出的标准版定价。

在“百镜大战”当下,这并不是一个容易被冲动消费者接受的价格。尤其是在大量厂商持续卷硬件、卷配置、卷价格的背景下,用户自然会追问:一副眼镜,为什么值这个价?讯飞给出的思路:并非继续参与参数竞赛,而是将竞争焦点放在翻译、办公等具体场景中,尝试把技术能力转化为可感知的使用价值。

轻量化革命:40克机身的极限突破

在AI眼镜赛道,重量往往是决定用户能否长期佩戴的关键指标之一。徐驰在BEYOND Expo开幕式上曾提出一个观点:“眼镜是第一视角的超级AI助理。”而成为“助理”的前提,是它能让人愿意戴一整天。

发布会现场,科大讯飞邀请了三位用户代表分享体验。其中,资深汽车媒体人胡婷提到:“如果说40克这个数字不够直观,我想说它大概和我平时用的口红差不多重。”在她看来,这样的重量让产品更容易被女性用户接受,也更符合长时间佩戴的需求。

据悉,科大讯飞AI眼镜较同类产品减重约20%,看似只有5-10克的差距,背后却涉及显示、结构和硬件集成等多个环节的协同优化。

林会杰介绍说,讯飞采用了全球首创的全贴合树脂波导显示镜片,相比传统玻璃波导方案,树脂波导重量可降低40%至50%,同时具备更薄、更安全等特点,仅镜片部分便可减重5-10克;结构方面,产品采用航空级镁铝合金骨架,在兼顾轻量化的同时保证强度,通过了1.7米跌落测试和2万次弯折测试;此外,在双目显示、摄像头、5+1麦克风阵列以及语音播放等功能全部保留的情况下,讯飞通过定制化微型光机模组和内部空间优化,将整机重量控制在40克左右。

值得注意的是,轻量化并未以牺牲续航为代价,配合充电盒与充电胶囊使用,进一步缓解了智能眼镜长期面临的续航焦虑问题。

多模态降噪黑科技:音视频融合+唇动识别

如果说轻量化解决的是“戴不戴”的问题,那么多模态降噪解决的是“在真实场景下能不能用”的问题。

科大讯飞研究院语音翻译条线总监孔常青在接受媒体采访时表示,传统麦克风阵列降噪在多人近距离交谈的嘈杂环境中,只能“猜测”目标声源,识别效果会明显下降。为此,讯飞采用了5颗气导麦克风加1颗骨传导麦克风的硬件方案,并结合声源定位与前置摄像头捕捉的唇部关键点信息,将“视素(口型特征)”与“音素(声音特征)”对齐融合,最终实现“看谁、听谁、译谁”。

据介绍,在展会、地铁、餐厅等高噪音场景下,该方案可将识别与翻译准确率提升30%至40%。发布会现场,讯飞还模拟了一个超过80分贝、多人同时交流的复杂环境,翻译过程依然保持较高准确度。

讯飞AI眼镜在嘈杂环境下演示,正大国际期货官网:数据猿

从行业角度来看,多模态融合并非全新概念,但将其应用于AI眼镜这一轻量化终端,并在复杂场景下实现稳定识别,正在成为厂商拉开产品体验差距的重要方向。

全链路自研护城河与端云协同

与智能手机类似,AI眼镜的用户体验并非取决于某一个单独组件,而是光学显示、语音交互、多模态感知、端侧计算、网络连接等多个环节协同作用的结果,任何一个环节出现短板,都可能导致识别不准、响应延迟或使用卡顿。

林会杰表示,讯飞AI眼镜采用的是全栈软硬件协同方案,从算法、模型到硬件进行深度适配,而非简单集成,因此能够在延迟、稳定性和整体体验上实现系统性优化。

在孔常青看来,讯飞的竞争优势主要来自三个方面:一是全链路自研技术,语音识别、机器翻译、多模态降噪、端侧大模型推理等核心技术均为自主研发;二是长期积累的用户反馈和场景数据所形成的工程化能力;三是算法能够针对眼镜形态进行深度优化,而非将通用模型简单迁移至硬件终端。

讯飞还回应了AI眼镜行业普遍关注的端云协同问题。

在体验过程中,数据猿记者发现,调取在线翻译结果时,仍需要通过手机与眼镜协同完成。对此,林会杰解释称,受限于当前眼镜形态下的算力、功耗和散热条件,复杂的大模型任务仍需借助手机和云端完成处理。

这也是当前AI眼镜行业普遍采用的技术路线:眼镜负责采集和交互,手机承担部分计算任务,云端则提供更强的大模型能力。相比完全依赖云端的方案,讯飞已采用“离线优先”的设计思路,离线翻译等基础功能可直接在眼镜端运行,在保证功能可用性的同时减少对网络环境的依赖。

与此同时,随着AI眼镜逐渐具备拍摄、录音和实时感知能力,隐私保护也成为行业关注的焦点。我们注意到,讯飞为拍摄和录音功能设置了不可关闭的状态指示灯,并提供磁吸式摄像头遮挡片,为用户提供额外的隐私管理选项。

从行业发展来看,如何在有限的终端算力下平衡AI能力、响应速度与隐私保护,仍是AI眼镜厂商共同面对的课题。

智能眼镜距离AI入口还有多远?

纵观智能眼镜行业,2026年正在经历一场前所未有的爆发。Omdia数据显示,2025年全球AI眼镜出货量达870万台,同比增长322%。进入2026年,增长势头依然强劲:根据东方证券数据,今年第一季度全球AI眼镜销量达221万台,同比增长143%。其中,Meta旗下Ray-Ban、Oakley等品牌贡献约175万台销量,而Rokid、XREAL、雷鸟等中国品牌也带来了显著增量。如今,中国大陆市场占全球出货量的10.9%,已跃升为全球第二大市场。

正大国际期货官网:Omdia

但在这场爆发背后,一个更深层的问题也随之浮现:市场上已有超过300个品牌参与竞争,但真正能够长期留在用户脸上的产品并不多。行业退货率普遍达到30%至50%,远高于消费电子产品约15%的平均水平。消费者反馈也高度集中:翻译延迟、识别不准、依赖手机、场景有限。正如里斯咨询(Ries)在分析亚马逊四大站点上万条消费者评论后所指出的,当前AI眼镜面临的核心问题并非外观或续航,而是AI能力尚未真正满足用户预期。

里斯报告进一步指出,AI眼镜至今仍缺少一个足以定义品类价值的“杀手级场景”:翻译满足刚需,却不够高频;POV拍摄具有不可替代性,却并非刚需。回顾智能手机的App Store和大疆无人机的航拍生态,它们都同时满足了“高频、刚需、不可替代”三个条件,而目前大多数AI眼镜场景,本质上仍是手机功能的延伸,尚未形成让用户“非戴不可”的理由。

某种程度上,这也是讯飞选择聚焦商务人群和会议场景的原因。相比华为的生态协同、小米的性价比路线,以及Rokid在光学和B端市场的布局,讯飞试图将翻译与沟通效率做到极致,满足高价值用户群的真实需求。

林会杰判断,智能眼镜行业正从科技发烧友市场迈向早期大众市场,未来1至2年有望迎来关键突破期,而前提是同时解决两个问题:能够全天候舒适佩戴、真正满足高频刚需。前者对应轻量化设计,后者则对应全场景翻译、智能提词和超级助理等能力。

正大国际期货官网:Omdia

值得注意的是,尽管Meta目前占据超过85%的市场份额,但里斯报告认为,这更多是品牌层面的成功,而非品类层面的成熟。这恰恰为中国品牌留下了巨大的战略机会:谁能够率先完成品类定义,谁就有机会在下一阶段竞争中占据主动。

2026年5月,《人工智能终端智能化分级》国家标准正式发布,首次明确覆盖智能眼镜品类。发布会当天,讯飞联合舜宇光学、墨界科技、康耐特光学、万兴光学等产业链企业成立生态联盟,推动从材料、光学、显示到应用生态的协同发展。

国内市场之外,出海更是一场大考。科大讯飞2026年第一季度财报显示,其境外收入同比增长167%。与此同时,AI眼镜赛道的全球竞争也在持续升温:华为推出首款鸿蒙AI眼镜,谷歌发布音频版与显示版两款产品并联合三星等伙伴打造生态,XREAL与谷歌合作的AR眼镜也即将量产。随着越来越多科技巨头和创新企业入局,AI眼镜正从概念验证阶段迈向产业化竞争阶段。

AI眼镜功能三阶段演进:L1被动回答、L2主动建议、L3自主执行,正大国际期货官网:华泰研究

回到本届BEYOND Expo的主题,“AI:数实共生(Digital to Physical)”,多位演讲嘉宾讨论的其实都是同一个命题:AI如何真正进入现实世界。日本软银集团创始人兼CEO孙正义日前亦表示,“下一个万亿美元机会是Physical AI和人形机器人。”在这一趋势下,随着算力、模型、电池、传感器和光学显示等关键技术持续进步,智能眼镜或被视为最有潜力的终端形态之一。

从这个意义上看,科大讯飞此次发布的AI眼镜,更像是一次关于产品路径的探索:与其围绕参数展开竞争,不如围绕具体场景创造价值。这未必是AI眼镜行业的最终答案,但当AI从屏幕走向现实世界,真正决定产品价值的,终究不是参数表上的数字,而是它能否持续解决真实问题,并自然融入人们的工作与生活。

文:陆易斯/ 数据猿责编:凝视深空/ 数据猿