首页>科技动态 > 科技前沿 > 正文

AI开发者设计出智能语音激活的背包 由人工智能驱动

人工智能(AI)开发者 Jagadish K. Mahendran 和他的团队设计了一款由人工智能驱动的语音激活的背包,可以帮助视障人士导航和感知路途。

这款背包可以帮助探测一些常见的路障,例如交通信号灯、悬挂的障碍物、人形横道、移动的物体和上下坡,这些探测的计算都在一款低功耗的交互式设备上运行。

Jagadish K. Mahendran 表示:“去年,我遇到了一位有视觉障碍的朋友,然后我发现讽刺的是,当我一直在训练机器人能够看东西的时候,反而有很多人是看不见的并且是需要帮助的。这激发了我建立这个视觉辅助系统,利用的是英特尔技术的 OpenCV 的人工智能工具包(OAK-D)”。

根据世界卫生组织估计全球有 2.85 亿视障人士。同时,帮助他们出行的视觉辅助系统目前却很有限,从基于全球定位系统(GPS)的语音辅助智能手机应用程序到搭载摄像头的智能拐杖,这些可用于视障人士的设备和系统不仅非常有限,还很缺乏深度感知能力,而这项功能对于视障人士独立出行非常必要。

工作原理:

这个系统位于一个小巧的背包内,其中包含一个主机计算装置,就像一个笔记本电脑。摄像头隐藏在马甲外套中,一个口袋大小的电池包放在腰包中,能够提供使用大约 8 个小时的电力。一个 Luxonis OAK-D 空间人工智能摄像头可以黏贴在马甲或腰包上,然后连接到背包中的计算装置。马甲上有三个放置 OAK-D 摄像头的小孔,而摄像头则位于马甲内侧。

Luxonis 创始人兼首席执行官 Brandon Gilles 表示:“Luxonis 的使命是使工程师能够开发出对人们有意义的东西,也帮助他们快速利用英特尔的人工智能技术。非常高兴看到有人在如此短的时间内利用 OAK-D 开发出人工智能动力背包这样的非凡设备。”

这个 OAK-D 装置是一个强大的多功能人工智能设备,采用英特尔 Movidius VPU 和英特尔 OpenVINO™工具包进行芯片上的边缘人工智能推理。它能够运行先进的神经网络,同时提供加速计算机视觉功能和来自其立体象对的实时深度图,以及一个 4K 摄像头的颜色信息。

借助一个蓝牙耳机,用户可以通过语音指令使用该系统,而该系统也会以语音给出回应。在用户四处走动时,该系统会以语音方式告知有关常见障碍物的信息,包括信号灯、树枝和行人。它还能提醒前面有交叉路口、路缘、楼梯和入口等。

标签: 背包 语音激活 人工智能

推荐DIY文章
性能旗舰一加 10 Pro首销战报出炉 1秒破亿
一加 10 Pro重磅发布,最强性能旗舰10至名归
千万销量千家售后 一加多触点布局国内市场
科技加持,未来已来,“头号玩家”不再是科幻
一加 10 Pro发布在即,性能屏幕影像全方位提升
一加中国区新任总裁李杰 :做好品牌与用户之间的连接器
精彩新闻

超前放送