——阅读《声音捕手:智能语音营销》,获得人们的感受、隐私和金钱
◎潘楷昕
当声音遇到人工智能技术时,一个崛起的新产业——“智能语音”开始重塑媒体沟通、营销沟通、社会治理等标准和结构。宾夕法尼亚大学传播学教授约瑟夫·图罗是媒体传播、营销和社会领域的顶尖学者。他创造性地利用各种信息来源,讲述了全球特别是欧美智能语音产业的发展,展示了如何形成新兴产业,如何影响商业生态、法律和社会,同时,引导人们看透被科技巨头伪装的表象,面对诱导监控、个人隐私数据保护、算法歧视等问题。
语音中隐藏着许多“宝藏”
“你的声音是独一无二的,只属于你自己。“人的声音是最好的个人身份识别符。声音不仅是一种物理现象,包括音调、速度、重音、停顿等生理数据,还嵌入围绕声音的产生、感知和传播形成的社会关系中。如今,语音分析主要用于验证一个人的身份。相应的手段是语音认证,人们越来越频繁地向银行、投资公司、电话公司等机构的工作人员证明他们与相关账户的关系。语音认证与指纹、面部识别和行为模式相同,可用于识别某人的身份。
在书中,作者提到,由于身体神经之间的联系,特定的情绪会影响声音的产生。这是因为支配喉咙肌肉的神经与许多神经有关,特别是迷走神经有关,而迷走神经会严重影响身体对情绪的反应。当人们说话时,他们会无意中提供其他关于自己的信息,也就是说,声音中隐藏着“宝藏”。
例如,许多研究证明了体重和声音之间有一定的联系。体重越重,男人的声音越高,女人的声音越低。研究人员甚至可以根据5岁儿童的声音频率来判断他们的体重。声音的某些特征可以揭示一个人的身高,与实际身高的误差不超过3英寸。高个子的声音不同于矮个子的声音,因为前者有更长的声道和更大的肺。一个人的健康状况也可以通过声音大致判断。健康人发出的元音明显更清晰,声音可以传得更远,不会有声音抖动。
通过这些发现,科技巨头的研究人员也试图利用人工智能技术来挖掘声纹与某些身体特征之间的联系模式。具体方法是在控制年龄、体重等身体特征变量的情况下,将声纹加载到计算机上,然后让计算机分析特定声纹与研究人员感兴趣的身体特征之间是否存在持续的联系。如果经过分析发现有这样的联系,计算机可以在每个人的声纹中检测到特定的声纹。
例如,一位伴有咳嗽和鼻塞症状的女性对一个智能扬声器说:“我饿了。“该设备通过“处理语音数据,分析用户声音的音调、节奏、声音方式、振动和和谐”,检测到发言人的声音异常,最终得出用户感冒的结论。基于这一结论,智能扬声器询问对方是否需要喝鸡汤。对方拒绝后,建议购买一小时即可送达的止咳糖浆。
这种情况让人觉得智能语音设备似乎给了人们很多帮助。然而,人工智能程序的真正目标是通过了解用户需要喝鸡汤和同意购买止咳糖浆的频率来推断短期或长期的健康状况。关于用户健康状况的信息具有市场价值。通过语音了解用户是否生病可以使药房盈利,可以相应地为用户提供治疗建议、订购和分发处方药。
一旦语音“定位”和“肖像”
在调查研究过程中,作者发现营销科学家或企业家可以利用“语音”实时洞察购物者的身份和偏好。这为营销人员提供了一个全新的工具,帮助他们更好地了解消费者,制定更准确的营销策略。
作者发现,在其隐私政策中,亚马逊有一个关于个性化广告的问答,需要点击才能阅读。它指出,它将使用人们与智能助理的语音对话来“定位”和“肖像”观众。谷歌在一般隐私政策中更直接地写道,当用户使用谷歌技术的音频功能时,它将收集和使用声音和音频信息进行个性化的定向营销。作者认为,谷歌的目的仍然是使用语音分析结果来补充它为客户创造的“个人肖像”。
许多科技“巨头”提出的所谓“肖像”是基于语音定向的“个性化营销”,即通过收集用户 构建虚拟版本的“声纹”和声信息数据,并提前预测您的选择和行为,以提供非常丝滑的个性化推荐和服务。
作者认为,最终版本的“肖像”甚至可以阅读你的“言外之意”,预测你的真实购买意图,而不是活营销人员基于你过去的声音和购买行为。这样的“肖像”也将完全融入公共生活。当你习惯用语音打开卧室灯,播放古典音乐时,你会被预测在睡觉前阅读,然后被及时推送你可能感兴趣的书籍、广告或其他信息。
通过对比研究,语音行业顾问布雷特·金塞拉还发现:“设计这些设备的初衷是帮助方便用户的生活。随着时间的推移,用户将为语音助手提供越来越多的权力,让语音助手代表用户完成某些任务。”
为了写这本书,作者还深入了许多科技“巨头”公司收集材料。在调查和访问过程中,作者发现,许多公司对“人们说话的内容和方式”的分析远远超过了他们透露和展示的内容。在语音助手几乎融入人们的生活之前,他们等待人们扩大语音设备的使用规模。当时,这些公司将进入“快速发展阶段”,将一系列关于人的声音、人口统计特征、行为、心理统计特征和位置数据,整合到近乎最终版本的“肖像”,让人们完全习惯性地获得“个性化购买建议、搜索结果、地图导航和广告”。
作者称这种全新的营销策略为“诱导监控”。这是科技研究专家皮内洛皮·特鲁利诺在2017年博士论文中发明的概念,是指企业积极向目标群体展示其产品的吸引力特征,以抵消客户的担忧,让他们认为购买和使用这些设备是值得的,即使他们有被监控的风险。正如特鲁利诺所指出的,“用户会被关于便利性、效率和娱乐性的言论所诱惑,并愿意交出个人数据,从而成为监控的对象”。
检查语音画像背后的“螺旋效应”
智能语音行业的一些专业人士正在传播这样一个概念:即使是从一个人的背景和行为中得出的最有用的结论也无法与更深层次的分析结果相比,因为这些分析将结合各种特征、个人词汇和词汇模式,甚至人们声音的物理特征。显然,他们的目标是利用“诱导监控”来实现极端的个性化营销:比用户自己更了解用户。营销人员正试图获得大量的声音、话语和其他新数据来实现这一目标。
苹果、亚马逊、谷歌、特斯拉、三星、微软等科技巨头拥有大量语音分析专利。现在他们的智能扬声器也在提取声纹进行识别,所以语音“肖像”更容易实现。然而,人们必须意识到,从某种意义上说,他们是世界上最大的“广告公司”,他们有能力将声纹与其他人口特征或购买行为数据相匹配,从而实现更准确的广告推送,从本质上加强他们的“垄断地位”。
作者在书中指出,关于隐私的争论将越来越激烈,企业经理有时认为消费者愿意牺牲隐私来获得便利,这可能只是进一步加强了个性化战略的“螺旋效应”:一方面,企业希望通过个性化创造新的竞争壁垒;另一方面,消费者似乎默认了这种个性化,因为语音肖像的歧视往往更容易和隐藏。
具体来说,通过“诱导监控”战略,企业可以避免重量,夸大产品的优势,让用户不断参与,披露身份信息,进一步扩大企业监控或跟踪用户的空间,然后采取各种策略塑造用户的使用习惯。这个过程值得各行各业的警惕。
随着人们越来越依赖语音助手等触发技术,个人贡献的数据将越来越多。此时,“自由”已成为您在企业为您提供的个性化选择中的选择,企业的基础是您的声音不会撒谎,这是您想要的。特别是当数亿人遇到数十亿这样的个性化选择时,我们的社会可能会面临一些危机和潜在的风险,人们可能会习惯性地在生活的各个领域失去真正的自由,从而陷入生物特征驱动的“命运陷阱”。
贝克的《风险社会》和吉登斯的《失控世界》都指向现代社会的一个共同命题,即技术与风险的相关性。作者不忘提醒世人,语音产业是一把双刃剑。我们应该更多地了解技术发展及其背后的科技伦理,而不必讨论一个笔尖能站多少天使。在这本书中,作者所做的就是让人们意识到智能语音技术的现状和未来发展前景,以及我们必须提前做好哪些应对策略和人文关怀。
市场观察所刊载信息,来源于网络,并不代表本媒体观点。本文所涉及的信息.数据和分析均来自公开渠道,如有任何不实之处、涉及版权问题,请联系我们及时处理。本文仅供读者参考,任何人不得将本文用于非法用途,由此产生的法律后果由使用者自负。投诉举报请联系邮箱:News_Jubao@163.com
聚焦商业经济报告和前瞻商业趋势分析,市场观察非新闻媒体不提供互联网新闻服务;