微软人工智能眼镜可通过声音反馈帮助盲人描述拍摄影像
微软在此次Build 2016首日主题演讲尾声,播放了一段影片后换来了台下开发者们非常热烈的掌声。影片中展示了如何通过结合影像识别技术的智能眼镜,让双眼失明的软件工程师Saqib Sheikh通过语音传递的方式,描绘了前方的景象。与去年年初微软宣布导入全息影像、扩增实境、语音与手势识别等技术的HoloLens很相似。
双目失明软件工程师Saqib Sheikh
智能眼镜在大学校园里还能识别正在玩滑板的状态
由微软所打造的概念式智能眼镜「Pivothead SMART」,主要结合微软本身云端运算、人工智能等资源,并且通过内置摄影镜头拍摄前方影像,配合影像识别技术与深度机器学习判断等方式,通过自然语音播报将所拍摄影像图片描述出来,很像是是一个大人看图说话的同时给孩子讲故事一样。在此次演示内容中,描述前方40岁的男性看起来有些吃惊,而一名20岁大的女性看起来十分开心,或是叙述街上有人在玩滑板,或是手持一组橙色飞盘等,借助智能眼镜的传达让双眼失明的配戴者可通过声音反馈方式传递出前方影像。
智能眼镜还可以帮助盲人识别年龄和情绪状态
智能眼镜可以识别手持一组橙色飞盘
而类似的技术其实在先前也曾经有过设计。例如在去年的Google I/O 2015开发者活动上,由英国皇家全国视障研究中心展示协助视障者制作的智能眼镜,主要目的就是协助未全盲的视觉障碍者,可通过眼睛装载镜头辅助,从而辨识前方是否有障碍物。但相比微软本次概念设计,更进一步应用人工智能辅助判断,并且通过人类的自然语意方式进行场景描述,让全盲配戴者可更具体掌握前方路况和环境信息。
微软表示,应用在「Pivothead SMART」的各项功能API,可以广泛应用在更多Windows相关应用服务,例如人脸识别、图像识别,并且整合搜索、语音播放等功能,融合多项人工智能可以创造各种方便生活的应用服务。
您可能也感兴趣:
官方微博/微信
每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。
想在手机上看科技资讯和科技八卦吗?
想第一时间看独家爆料和深度报道吗?
请关注TechWeb官方微信公众帐号:
1.用手机扫左侧二维码;
2.在添加朋友里,搜索关注TechWeb。
为您推荐
雷军:小米SU7定价时最纠结的是盈亏点
最终悬念,小米SU7卖多少钱合适?
恒大汽车 2023 年净亏损 119.95 亿元,努力改善经营状况
日赚0.82亿 比亚迪2023年净利润300.41亿元,同比大涨80.72%
苹果WWDC 2024将于6月10日举行,或将推出生成式AI技术
苹果A18 Pro芯片细节曝光:采用更大尺寸 以提升AI性能
阿里撤回菜鸟上市申请 拟37.5亿美元收购菜鸟少数股东股权
AI造富能力一流
飞书开启裁员 全员信称会提供补偿方案或转岗机会
更多
- 投行分析师预计特斯拉Q1交付42.5万辆到47.5万辆电动汽车
- 消息称苹果可折叠屏iPhone遇到技术挑战 将推迟到2027年一季度发布
- 苹果新一代iPad Pro和iPad Air下月或无望 消息称要到5月初
- 全球生成式人工智能领域去年或有近700笔投资交易 总额291亿美元
- 华尔街预计特斯拉Q1交付47.1万辆电动汽车 但也有分析师预计低于43万辆
- 苹果WWDC24还有望推出Mac Studio 但Mac Pro可能要下半年
- 亚马逊再向AI初创公司Anthropic投资27.5亿美元 兑现40亿美元投资承诺
- 消息称苹果在测试一款新Apple Pencil 有望用于Vision Pro
- 现代汽车计划到2030年将电动汽车增至31款 韩国年产能增至151万辆
- 消息称苹果没有在iOS 18等新一代系统中引入自研AI聊天机器人计划