小小的我,大大的AI
2025-01-03 23:36:28
  • 0
  • 0
  • 0

来源:脑极体

AI是工具,也是我们穿越生命洪流的舟楫

“刘春和只是脑瘫,不是个傻子。”

看过《小小的我》之后,非常欣慰于影视作品能正视障碍人群的真实处境。尝试向公众科普他们的客观境遇与需求,而不是一味给他们打上“悲惨”与“励志”的二元化标签。相信一部电影能够打破这些刻板偏见,背后是无数声音的汇总与凝结。

作为科技作者,最重要同时也最荣幸的工作之一,就是向大家科普科技无障碍事业。在讨论了众多科技无障碍项目,采访了众多相关用户之后,经常会有这样的感慨:科技正在高速发展,同时以极高的速度向医疗、康复,以及无障碍事业提供支持。但这些成果,往往是有需求的朋友并不知道的,公众对此则更是陌生。

我们往往会遇见这样的情况,一个被认为困扰个体终生的问题,可能突然之间就有了科技手段作为解决办法。这个办法上半年可能还在实验室里,下半年就能大规模应用了。

因此,去讨论和讲述科技无障碍的最新成果,始终是必须完成的工作。这项工作没有截止日期,必须终身现役。

比如说,这两年是AI大模型的集中爆发期。这项科技趋势给无障碍事业带来了众多升级。本文中,我们将列举一些AI+无障碍事业的最新进展。

这些故事的主题,是小小的我,如何拥有大大的AI。

世上最初的善意

先来说刘春和所面对的脑瘫。

脑瘫是一项必须尽早发现,尽早干预治疗的疾病。同时如果患儿在成长过程中逐步发现脑瘫症状,也会给父母及学校教育带来极大的挑战。因此,婴幼儿是观察和识别脑瘫的最佳时机。但其临床判断方式,往往是通过观察婴幼儿的细微动作与反应情况来进行诊断。这就需要依靠医生的观察经验,有极大的误诊与漏诊概率。与此同时,观察识别脑瘫患儿也需要非常严格的培训,这导致具有相关资格的医生非常稀少。在医疗条件相对薄弱的地区,患儿及家属很难获得类似支持。

但捕捉动态模型,并进行分类判断,恰巧就是AI的专长。多年之前,学术界已经开始进行以机器视觉手段来识别早期脑瘫的尝试。

如今,在大模型的加持下AI脑瘫识别的正确率与完成效率都得到了显著提升。这项技术也从实验室阶段走向了临床。一些三甲医院已经开始采购脑瘫早期AI预测辅助系统。相信不久的将来AI脑瘫识别将向基层医院普及,解决医师力量不足,造成的基层医疗系统脑瘫患儿识别能力缺失的关键问题。

孩子来到这世间,应该先感受到科技的善意。除了脑瘫识别之外,AI技术正在从多个角度推动智能儿童保健系统的升级迭代,让可能困扰孩子一生的健康难题,在婴幼儿期间就被发现、矫正和治疗。

而在更远的未来,通过AI+脑机接口的组合帮助脑瘫为代表的瘫痪患者恢复感觉,重新获得运动能力的可能性,也已经在实验室中被反复打磨。

健康,必将是AI真正的应许之地。

用尽全力的声音

不久之前,我刷到了一个短视频。视频中的听障女孩,用手机修复了自己的声音,从容不迫的完成了包括咖啡店点单在内的日常生活。科技带来的改变有多美好,在这一刻得到了完美诠释。

仅仅在中国,就有超过2700万听障人士,以及超过2亿的65周岁以上老年人。他们中的许多人,都由于听力障碍影响了语言功能,产生了语言障碍。助听器等设备可以帮助他们听见,却无法帮助他们准确发出声音。这让听障、语障人士,以及众多老年人的沟通交流依旧困难。

在今年,华为在HarmonyOS NEXT中推出了小艺声音修复功能。这项技术能够使用鸿蒙原生智能,对用户输入的语音进行实时分析、修复和优化,进而输出高可懂度的清晰声音。与此同时,小艺声音修复还能尽可能保留用户音色,增强用户的使用体验。

在语音识别大模型和语音合成大模型的加持下,小艺声音修复功能能够满足四级和三级言语障碍的修复需求,并且做到了无门槛使用体验。为了满足这一功能的实用性,华为团队邀请了3700名语障用户参与测试,已经实现了可懂读提升80%以上的效果。

手机是距离我们最近的科技产品,也永远是科技无障碍事业的第一线。如今,AI识图、读屏软件已经成为视障人士生活中的必需品。主流软件的无障碍操作也在持续进化当中。我们曾经与一位视障开发者朋友探讨过手机的无障碍升级。他提到两个趋势,一是手机无障碍能力曾经完全是苹果的天下。这也导致很多听障、视障朋友必须选购价格昂贵的苹果手机。但现在随着华为、vivo等国产手机品牌不断重视无障碍体验,苹果独大的局面已经被彻底改变。甚至苹果在这方面的升级已经显得保守。二是原本大量能够帮助障碍人群的功能,都停留在具体的应用当中,但进入具体应用调用无障碍功能的使用体验非常差。因此现在相关功能的开发者也更多与手机品牌第一方合作,将相关功能集成在系统自带功能或者负一屏、快应用等端口内,最好是可以通过语音助手、快捷键等方式呼出。

手机厂商、开发者、AI技术人员,以及语障朋友的共同努力,才最终让一句声音被准确修复。

或许下一个需要使用这项功能的人会知道,这是世界用尽全力帮他们发出的声音。

披荆斩棘的代码

大家都知道,视障人士就业的第一大方向是按摩师。但第二大是什么?

很多人都不知道,答案是程序员。与其他工作相比,软件编程对视觉的需求更低,并且整体受益更高,人才缺口更大。因此在国家与相关协会的推动下,编程正在成为视障人士全新的就业选择。

即使如此,编程工作对于视障者依旧充满艰辛。读屏软件可以帮助解决一部分问题,但诸如检查代码,定位信息等需求依旧困扰着视障人士的工作。另外,读屏软件不能读懂图片上的信息,这也带给视障编程人员诸多不便。

为了帮助视障者跨越代码之旅途中的鸿沟,不久之前,百度智能代码助手文心快码联合信息无障碍研究会,推出了“文心快码无障碍版”。

这一系统能够将代码转换成流畅的自然语言,从而帮助视障人士迅速定位代码,完成查找,审核等功能。除此之外,文心快码无障碍版还能够提供一系列便捷指令,帮助用户定位需要修改的代码段。文心大模型提供的AIGC能力,则可以在用户输入自然语言描述后,自动生成可运行代码,从而极大程度提升视障人士的编程效率,让他们走向一个体面、高收入,且充满无限可能性的工作岗位。

AIGC代码生成,本来就是大模型带来的核心能力之一,而这一能力又与无障碍开发有着天然的结合点。顺理成章一般,文心快码成为国内首个支持无障碍开发的编程工具,并且相信这仅仅是个开始。

这些故事中不难看出,AI大模型正在与行业、终端、开发工具进行深度的结合,从而在医疗康复、日常生活、工作创业等不同领域,带给障碍人群全新的能力支点。

大大的AI,或许只是一件小小的工具。但它能让不公平的命运变得稍微公平,让湍流中的生活变得有些许平静。

它让小小的我们,终归相信这世界能变得更好。


 
最新文章
相关阅读