Transformer是一种基于自注意力机制的深度学习框架理论,它摒弃了传统的循环神经网络(RNN)或卷积神经网络(CNN)结构,通过并行计算全局信息依赖,高效捕捉序列中长距离特征关联,在自然语言处理(如机器翻译、文本生成)等领域极大提升了模型性能与训练效率。
ABA(应用行为分析,Applied Behavior Analysis) 是一种基于行为主义理论的心理学方法,主要通过系统地分析自闭症儿童的行为与环境之间的关系,应用奖励和惩罚等强化策略(奖励期望行为)和惩罚(减少不期望行为)来改变自闭症儿童的不良行为,以提高自闭症儿童的生活质量。
地板时光理论(Floor Time Theory)理论强调与孩子一起玩耍比如玩游戏、轻松对话等情感联结和亲密互动的方式来营造情感安全环境,激发孩子的社交技能、语言表达和问题解决的能力,并通过持续互动促进其整体认知与情感的协调发展。该理论的核心是轻松玩耍和亲密互动,是一种非常有效的疗育自闭症儿童的理论基础,在我们的自闭症儿童陪伴机器人的对话中也处处体现了这一理论原理。
BSR 的全称是行为-结构化-关系干预模式(Behavior-Structure-Relationship),是一种针对自闭症(孤独症)儿童的综合干预方法,整合行为疗法、结构化教学和社交训练,注重在自然情境中开展系统化干预。机器人通过结构化日程、视觉提示和社交故事等内容,帮助儿童提升行为管理、认知灵活性和社交参与能力,同时支持家庭在日常生活场景中的康复延伸。
强化学习人类反馈(RLHF)是一种结合强化学习与人类反馈的机器学习方法,其核心在于通过人类偏好指导模型学习,使模型生成更符合人类期望的输出。模型生成输出后,由人类评估者根据质量、相关性等因素给予反馈,如偏好排序、评分或二元偏好选择。将人类反馈转化为奖励信号,训练一个奖励模型来量化生成文本的质量,为后续强化学习提供反馈。利用奖励模型提供的奖励信号,通过强化学习算法调整模型策略,使其生成更符合人类偏好的输出。