邻家小妹让我欲罢不能我曾给我外甥和外甥女买过语音机器人-扑闪着两只萌萌大眼,配上胖墩墩的mini人物外形,本来以为会深受两个小不点的喜好,谁知两小不点在夜里被机器人吓得之后都不敢靠近。正如Meadows曾提出“恐怖谷理论”:与人类极其相近但不完全相同的事物容易引起人的恐慌,也因这件事引发了我对儿童语音产品的探究。
简单总结业内儿童语音机器人做的比较出色的其中三家(并未穷尽,聊表):科大讯飞的阿尔法蛋、狗尾草的公子小白、ROOBO的布丁豆豆。总结有误之处还请。
(1)水平对比分析:下图部分展示三家公司产品中其中三款产品的定位和交互、展示方式,且得到小结论:
狗尾草旗下有公子小白成长版I、公子小白成长版II、公子小白青春版、公子小白Pro等,旗下产品比较清晰地划分目标群体用户,成长版II主要针对婴幼儿,成长版I主要针对学龄前至少年期,青春版主要针对青年期,Pro版主要针对成年期。
小结思考:“是否需要为儿童提供屏幕动态视频展示功能”、“是否需要针对不同年龄段儿童制作不同功能版本的机器人”是我在了解行业产品后发现的有趣探讨点,在接下来“心理学角度思考:儿童语音机器人VUI设计”系列会进一步涉及个人观点。
意大利著名的“蒙特梭利教育”提到:宝宝在6岁前不同阶段对语言、动作、细节、程序、书写、阅读等特别,该段时期称为“期”,抓住该段时期让孩子从无意识状态过渡到有意识状态,并建立起宝宝所特有的心理结构和语言表达机制。
“用户会将你的VUI人格化,无论你是否有意让用户这样做,他们都会认为VUI具有某种人格特质,最好做法是你自己在设计时就确定好VUI人格。”
Siri的高冷女性形象、微软小冰的卖萌逗趣小可爱、小爱同学的青春二次元美少女便是主动打造VUI虚拟角色、树立不同人格特质的做法。
而0-6岁婴幼儿最需要家人陪伴,因此机器人形象树立为年轻温和的宝爸或宝妈,由于不同家庭宝爸宝妈陪伴孩子的时间各异,可构建两种形象版本让用户切换选择,比如:某户家庭中陪伴孩子时间比较少的是爸爸,用户可以选择“宝爸”版本,让语音产品填补宝宝缺乏的来自父母某方的陪伴。
而机器人语音音色的选择需要和产品形象保持一致,需要温和不严厉的年轻音色。目前科大讯飞已经推出声音复刻技术在小范围群体使用,往后若声音复刻技术达到推广应用水平,或许可让用户通过复刻自身声音来自主定义机器人语音音色,使得宝宝更真切感受到家人的陪伴。
流程图在IVR(互动式语音问答)设计中用于展示VUI系统所有可能发生径的图示,在绘制流程图前要先根据产品的定位和目标确定产品功能。
针对早教是否需搭配动态视频展示这个问题,有的机器人产品考虑孩童视力不增加动态视频功能。
个人观点是:根据“蒙特梭利教育”提到的0-6岁宝宝的“感官期”,4个月左右时,宝宝大脑中负责听觉、语言、嗅觉的颞叶和枕叶会变得更加活跃,色彩鲜艳、情节简单的拟人视频会对他们更有吸引力,且在有助在其不识字状态帮助理解学习。感官的全面调动也有助于开发宝宝智力。
同时,“蒙特梭利教育”提到:孩童6个月后会进入咿呀学语模仿阶段,9个月左右进入语言理解阶段,13个月左右可进入以词带句教育阶段,下图举例了3-6岁孩童的语言能力发展目标。
此阶段要让孩童多与中对应的事物互动并鼓励说出来、培养孩童的专注力和听力等,这种情况下趣味性的互动游戏便不可或缺。
美国著名的心理学家.西格尔在《全脑教养法》中提过“印证式倾听”,而印证式倾听的前提是让对方感受到自己是在用心了解其观点。孩童渴望得到关注和聆听,因此当机器人跟宝宝在沟通对话时,搭配上虚拟表情状态,表达对沟通者的关注和喜怒哀乐情绪的共情。
如果要打造宝宝状态追踪监护功能,机器人硬件最好设计为可移动+室内空间定位,搭配计算机视觉技术。家长可在离家时宝宝追踪,通过人物识别确定追踪对象身份而其活动,重点识别是否进入区域和人体姿态识别其是否出现摔倒等状况。打造该功能时产品方需要承担责任风险和考虑孩童抵触心理,以及遇到像扫地机器人无法抵达家里某些空间的问题。
宝宝6岁后进入探索事物的萌芽期,把的东西放入嘴里啃咬是他们探索世界、寻求安全感的一种方式,且长牙阶段的难受使得宝宝更频繁咬东西。弗洛伊德的儿童心理学理论将该阶段称为口唇期,孩童啃咬东西容易导致孩童长大后缺乏安全感和咬手指等坏习惯,因此要主动给宝宝提供安全卫生耐啃咬的产品。
以一张图讲述语音交互系统实现原理,帮助对语音交互理解,在语音对话技术实现过程中的需要注意的事项:
面对纷繁复杂的用户使用情景,可以区分使用人群,了解不同人群常见使用情景而重点梳理构建对话逻辑,在此要考虑到的是:儿童早教机器人的用户群体不仅有孩童,还有孩童的家人等群体。
针对中文早教的用户使用场景,、、是设计用户指令集时设置的槽位(slot),下图列举部分用户指令:
针对复杂问题,给出答案格式实例;设置更好的问题结构,避免问到一半,用户已抢先回答出不规范的答复;
构建N-Best列表,根据可能性和置信度排序问题答案,解决部分语音识别错误问题,兼容用户更多不同形式的回复;
区分无语音超时(NSP)和语音终止超时来设置语音超时时间,如确定用户说完词后无语音超时时间,一般为10s;
而面对儿童群体,还需要注意儿童群体存在发音口齿不清和吞音、尾音过短等问题,特别是有的孩童在3-6岁期间会出现短暂的口吃、失语症问题,要如何设计N-Best列表?
个体心理学派的创始人阿尔弗雷德.阿德勒在《儿童人格教育》一书中曾提到:儿童心理问题包括自卑、因心理补偿而出现的膨胀野心、缺乏安全感、懒惰、焦虑、孤僻、依赖等。
此部分思考针对孩童陪护功能,针对孩童缺乏安全感的心理问题,结合.西格尔的全脑教养论来设计对话应答脚本。
而.西格尔在《全脑教养法》提出:左脑是逻辑、语言的、求实的,而右脑是情感、非语言、经验化的。单独依赖右脑会引起感情泛滥、依赖左脑会引起情感荒芜。当孩童遇到不好经历而表明伤痛,这样的情感处理方式是退回左脑处于情感荒芜状态,如果不正确梳理容易造成孩童长大后缺乏安全感和对对应事物产生恐惧心理。
很多人会采用避开谈论孩子的,而正确的做法是引导孩子复述故事,帮助孩子整合左右脑,通过调用右脑理顺细节,然后引入右脑重访情绪,让孩子正面其内心的担心、害怕,随之让孩子意识到其在整个过程并非孤立无援,意识到问题已经解决过去。或者通过分享经历故事安抚情绪。
文章由325棋牌提供发布
网友评论 ()条 查看