小小的我，大大的AI-人工智能的专栏

小小的我，大大的AI

2025-01-03 23:36:28栏目：默认栏目 IP属地：北京市丰台区

来源：脑极体

AI是工具，也是我们穿越生命洪流的舟楫

“刘春和只是脑瘫，不是个傻子。”

看过《小小的我》之后，非常欣慰于影视作品能正视障碍人群的真实处境。尝试向公众科普他们的客观境遇与需求，而不是一味给他们打上“悲惨”与“励志”的二元化标签。相信一部电影能够打破这些刻板偏见，背后是无数声音的汇总与凝结。

作为科技作者，最重要同时也最荣幸的工作之一，就是向大家科普科技无障碍事业。在讨论了众多科技无障碍项目，采访了众多相关用户之后，经常会有这样的感慨：科技正在高速发展，同时以极高的速度向医疗、康复，以及无障碍事业提供支持。但这些成果，往往是有需求的朋友并不知道的，公众对此则更是陌生。

我们往往会遇见这样的情况，一个被认为困扰个体终生的问题，可能突然之间就有了科技手段作为解决办法。这个办法上半年可能还在实验室里，下半年就能大规模应用了。

因此，去讨论和讲述科技无障碍的最新成果，始终是必须完成的工作。这项工作没有截止日期，必须终身现役。

比如说，这两年是AI大模型的集中爆发期。这项科技趋势给无障碍事业带来了众多升级。本文中，我们将列举一些AI+无障碍事业的最新进展。

这些故事的主题，是小小的我，如何拥有大大的AI。

世上最初的善意

先来说刘春和所面对的脑瘫。

脑瘫是一项必须尽早发现，尽早干预治疗的疾病。同时如果患儿在成长过程中逐步发现脑瘫症状，也会给父母及学校教育带来极大的挑战。因此，婴幼儿是观察和识别脑瘫的最佳时机。但其临床判断方式，往往是通过观察婴幼儿的细微动作与反应情况来进行诊断。这就需要依靠医生的观察经验，有极大的误诊与漏诊概率。与此同时，观察识别脑瘫患儿也需要非常严格的培训，这导致具有相关资格的医生非常稀少。在医疗条件相对薄弱的地区，患儿及家属很难获得类似支持。

但捕捉动态模型，并进行分类判断，恰巧就是AI的专长。多年之前，学术界已经开始进行以机器视觉手段来识别早期脑瘫的尝试。

如今，在大模型的加持下AI脑瘫识别的正确率与完成效率都得到了显著提升。这项技术也从实验室阶段走向了临床。一些三甲医院已经开始采购脑瘫早期AI预测辅助系统。相信不久的将来AI脑瘫识别将向基层医院普及，解决医师力量不足，造成的基层医疗系统脑瘫患儿识别能力缺失的关键问题。

孩子来到这世间，应该先感受到科技的善意。除了脑瘫识别之外，AI技术正在从多个角度推动智能儿童保健系统的升级迭代，让可能困扰孩子一生的健康难题，在婴幼儿期间就被发现、矫正和治疗。

而在更远的未来，通过AI+脑机接口的组合帮助脑瘫为代表的瘫痪患者恢复感觉，重新获得运动能力的可能性，也已经在实验室中被反复打磨。

健康，必将是AI真正的应许之地。

用尽全力的声音

不久之前，我刷到了一个短视频。视频中的听障女孩，用手机修复了自己的声音，从容不迫的完成了包括咖啡店点单在内的日常生活。科技带来的改变有多美好，在这一刻得到了完美诠释。

仅仅在中国，就有超过2700万听障人士，以及超过2亿的65周岁以上老年人。他们中的许多人，都由于听力障碍影响了语言功能，产生了语言障碍。助听器等设备可以帮助他们听见，却无法帮助他们准确发出声音。这让听障、语障人士，以及众多老年人的沟通交流依旧困难。

在今年，华为在HarmonyOS NEXT中推出了小艺声音修复功能。这项技术能够使用鸿蒙原生智能，对用户输入的语音进行实时分析、修复和优化，进而输出高可懂度的清晰声音。与此同时，小艺声音修复还能尽可能保留用户音色，增强用户的使用体验。

在语音识别大模型和语音合成大模型的加持下，小艺声音修复功能能够满足四级和三级言语障碍的修复需求，并且做到了无门槛使用体验。为了满足这一功能的实用性，华为团队邀请了3700名语障用户参与测试，已经实现了可懂读提升80%以上的效果。

手机是距离我们最近的科技产品，也永远是科技无障碍事业的第一线。如今，AI识图、读屏软件已经成为视障人士生活中的必需品。主流软件的无障碍操作也在持续进化当中。我们曾经与一位视障开发者朋友探讨过手机的无障碍升级。他提到两个趋势，一是手机无障碍能力曾经完全是苹果的天下。这也导致很多听障、视障朋友必须选购价格昂贵的苹果手机。但现在随着华为、vivo等国产手机品牌不断重视无障碍体验，苹果独大的局面已经被彻底改变。甚至苹果在这方面的升级已经显得保守。二是原本大量能够帮助障碍人群的功能，都停留在具体的应用当中，但进入具体应用调用无障碍功能的使用体验非常差。因此现在相关功能的开发者也更多与手机品牌第一方合作，将相关功能集成在系统自带功能或者负一屏、快应用等端口内，最好是可以通过语音助手、快捷键等方式呼出。

手机厂商、开发者、AI技术人员，以及语障朋友的共同努力，才最终让一句声音被准确修复。

或许下一个需要使用这项功能的人会知道，这是世界用尽全力帮他们发出的声音。

披荆斩棘的代码

大家都知道，视障人士就业的第一大方向是按摩师。但第二大是什么？

很多人都不知道，答案是程序员。与其他工作相比，软件编程对视觉的需求更低，并且整体受益更高，人才缺口更大。因此在国家与相关协会的推动下，编程正在成为视障人士全新的就业选择。

即使如此，编程工作对于视障者依旧充满艰辛。读屏软件可以帮助解决一部分问题，但诸如检查代码，定位信息等需求依旧困扰着视障人士的工作。另外，读屏软件不能读懂图片上的信息，这也带给视障编程人员诸多不便。

为了帮助视障者跨越代码之旅途中的鸿沟，不久之前，百度智能代码助手文心快码联合信息无障碍研究会，推出了“文心快码无障碍版”。

这一系统能够将代码转换成流畅的自然语言，从而帮助视障人士迅速定位代码，完成查找，审核等功能。除此之外，文心快码无障碍版还能够提供一系列便捷指令，帮助用户定位需要修改的代码段。文心大模型提供的AIGC能力，则可以在用户输入自然语言描述后，自动生成可运行代码，从而极大程度提升视障人士的编程效率，让他们走向一个体面、高收入，且充满无限可能性的工作岗位。

AIGC代码生成，本来就是大模型带来的核心能力之一，而这一能力又与无障碍开发有着天然的结合点。顺理成章一般，文心快码成为国内首个支持无障碍开发的编程工具，并且相信这仅仅是个开始。

这些故事中不难看出，AI大模型正在与行业、终端、开发工具进行深度的结合，从而在医疗康复、日常生活、工作创业等不同领域，带给障碍人群全新的能力支点。

大大的AI，或许只是一件小小的工具。但它能让不公平的命运变得稍微公平，让湍流中的生活变得有些许平静。

它让小小的我们，终归相信这世界能变得更好。