随着通讯技术的不断发展,呼叫中心的规模与日俱增,现阶段国内拥有上千席的呼叫中心不在少数,其每日所产生的语音数据体量难以想象,属于典型的非结构化“大数据”。这些数据中所蕴含的客户偏好、产品质量、坐席技能等相关指标是呼叫中心优化服务质量、提高运营效率的重要参考因素,直接关系着营销决策制定以及产品服务设计。
然而,语音数据作为呼叫中心一项重要的价值资产,在过去很长一段时间内却没有受到足够的重视。这是受限于传统技术条件下,语音数据存储成本过高,应用难度过大,更难说从中挖掘核心价值以支持决策分析。但随着大数据、云计算与人工智能技术的迅猛发展,使得海量数据存储成本不断降低,分布式并行计算效率不断提高,打破了语音数据存储及处理的技术壁垒,为呼叫中心提供了全新的运营模式,其具体应用场景如下:
1.分布式存储海量语音数据成为主流
呼叫中心体量的不断扩张,导致大量的语音数据堆积,以某金融机构呼叫中心为例,其坐席数量超过3000余个,每日产生的录音文件量高达100G以上,年录音文件总量超过50T,预计未来语音数据量的年平均增长率高达30%。如此海量的语音数据加剧了数据存储的难度,虽然现有计算机存储硬件的发展已经非常迅猛,但其发展速度还远不及数据量的几何式爆破增长,并且由于高性能的存储硬件存在造价成本的问题,大多数企业对于日益增长的进量数据以及原始积累的存量数据又爱又恨。
在现有职能体系下,多数企业还将呼叫中心评定为服务中心,一心旨在控制呼叫中心成本而并没有期待其能够产生收益。由此试图通过提高计算机硬件配置来解决呼叫中心语音数据存储的问题,并不具有一般可行性。
大数据技术的发展成功解决了呼叫中心语音数据量存储的问题,其特有的分布式存储技术能够将单一体量巨大语音数据文件夹切分为多个小的区块,并使其能够存放于由多台计算机所架构的集群上。这些计算机之间通过某种方式相互通信,进而将整个集群内所有存储空间资源整合、虚拟化并对外提供文件访问服务的文件系统。
利用大数据技术存储语音数据具有两大突出的优点:
其一,极大降低了数据存储所需的硬件成本,由于大数据技术能对单一体量的数据集进行切分、存储、再整合,因此数据存储就不再受限于高性能的计算机硬件,而只需要多个性能基本达标的存储硬件便能够对海量数据进行存储和处理;
其二,所保存的数据不易丢失或破坏,由于大数据技术会将单条语音数据重复分配到集群中多个计算机上,因此在数据提取时,若某个计算机的数据不慎丢失或其本身遭受破坏,我们也能正常的从集群中提取到完整的数据。
现阶段大多数呼叫中心运营高层都逐渐意识到日常语音数据的价值,也纷纷表示分布式存储技术确实能够帮助其解决语音数据体量过大的问题。由此如今众多呼叫中心都致力于从抽取部分语音进行存储变革为全量语音存储,从真正意义上使得分布式存储海量语音数据成为主流趋势。
2.实现“机器质检泛听+人工质检精听”新模式
呼叫中心是人力密集型行业,其质量监控管理一直是一项浩瀚的工程,如果都通过传统的人工监听进行质检管理,其所需的人力物力难以估计。因此在过去很长一段时间内,呼叫中心都利用抽听的方法进行质量监控管理,该方法一方面从业务角度而言,可能导致坐席人员工作的投机性,另一方面从统计学角度而言,简单的随机抽样所得出的结果并不能完整反映该坐席普遍的日常工作状态。
质量监控工作对于呼叫中心而言具有重要的意义,其通过对坐席人员服务质量的检测和监控,确保坐席通话过程中的规范性、完整性和准确性,提升坐席人员日常的营销技能和服务水平,保证业务一线人员高水平服务的持续性。然而,传统质检人员每天面对大量的录音,常用方法都是通过听录音进行合规性检查,无法识别批量录音中所蕴含的重要信息,例如客户投诉信息中,有多少客户是不满意坐席服务态度,有多少客户是不满意产品价格。又假设面对业务量陡然激增,管理者是否能在第一时间洞察背后原因,从而及时制定应对策略?
随着大数据技术实现呼叫中心语音数据全量存储,质检系统也由传统人工抽检转变为机器录音质检100%全覆盖。借助深度学习方法所构建的声学模型和语言模型,语音分析系统能够更精确的将海量通话内容转化为录音文本文件。在此基础上,加入全面的质检评分规则:通过设置业务术语、礼貌用语、禁忌用语、静默时长等质检点计算机能够自动地对所有坐席人员的业务熟练度进行打分,从而筛选出评分较低的通话供质检人员调听,在全方位覆盖每通录音的同时,大幅降低了人工质检所需的成本。如此系统筛选与人工调听相结合的质检方式,形成了“机器质检泛听+人工质检精听”的新模式,进而有利于全面把握呼叫中心人工坐席服务质量,提高呼叫中心运营效率。
3.文本分析结合机器学习深度挖掘客户价值
现阶段,大多数呼叫中心仍被定义为成本中心,那么如何充分利用呼叫中心数据资源,将呼叫中心打造为利润中心,是传统呼叫中心转型升级的关键。呼叫中心现有系统及分析报告中所包含的通话时长、响应率、成单量、投诉率等指标计算已经相当成熟,并且在关于构建客户群体划分、产品竞争分析、业务风险评估等机器学习模型上也小有建树,但仅此还无法完成呼叫中心由成本中心转向价值中心,最后成为利润中心的转型。这是由于单一结构化数据所构建的机器学习模型还无法全方位精准的预测客户行为,由此我们在构建机器学习模型时还需要添加诸如客户情绪等非结构化数据,以保证学习过程的完整性。
消费者金融保护局(CFPB)曾经就利用文本分析搭配机器学习的方法来探索自身的数据情况。他们的数据主要记录了客户对银行、信用卡公司和其他金融服务公司的投诉,其中包括客户信息、产品信息等结构化数据以及客户评论、语音文本等非结构化的数据。该分析方法首先使用文本分析技术来识别CFPB收集的自由形式数据中的负面情绪,然后利用机器学习算法建立一个预测模型,用来分析负面情绪程度与客户是否收到违规银行补偿,以及这两个变量之间的关系。
研究结果表明,客户得到补偿与负面情绪之间确实存在相关性,当客户评论表现出较强的负面情绪,违规银行很大概率上会针对这部分客户进行补偿,特别是当有客户使用“偷”或者与之类似的词语时,其获得补偿的概率会更大。这项数据分析工作充分展示了文本分析和机器学习结合的力量,一旦文本分析被引入机器学习的预测模型中,该模型就能在发现行为模式的同时,回答为什么会产生这种行为模式,以及如何解决这种行为模式所带来的问题。
相对于其他部门而言,呼叫中心所特有的语音数据属于典型的非结构化数据,通过文本分析技术能够对这些非结构化语音数据进行淬炼,从中提取高价值、新维度的变量,例如客户满意度、客户情绪、产品偏好系数等,进而改进现有机器学习模型。结合文本分析和机器学习所实现的智能数据挖掘系统,将突破呼叫中心传统数据分析方法的局限性,更深层次、全方位的对客户进行扫描,使得呼叫中心与客户之间关系由简单交易到亲密信赖,最终达到价值依托。
随着大数据、云计算和人工智能技术的发展,海量语音数据存储成本不断下降,智能质检系统的精确度不断提升,客户价值获得更深层次的挖掘,届时呼叫中心将突破传统业务逻辑,形成全新的运营模式。
在该模式下,呼叫中心日常运营将会主要围绕如下四个方面:
1)全方位挖掘客户需求,提升客户感知及服务质量;
2)关注员工发展,提高员工技能及日常工作满意度;
3)聚焦中心实际需求,降低运营成本,提高营销收入;
4)收集高价值信息,降低信息预测风险。
随着新运营模式的不断深入,呼叫中心将真正从过去的被动服务转向主动服务,由成本中心转向企业核心利润中心。
然而,语音数据作为呼叫中心一项重要的价值资产,在过去很长一段时间内却没有受到足够的重视。这是受限于传统技术条件下,语音数据存储成本过高,应用难度过大,更难说从中挖掘核心价值以支持决策分析。但随着大数据、云计算与人工智能技术的迅猛发展,使得海量数据存储成本不断降低,分布式并行计算效率不断提高,打破了语音数据存储及处理的技术壁垒,为呼叫中心提供了全新的运营模式,其具体应用场景如下:
1.分布式存储海量语音数据成为主流
呼叫中心体量的不断扩张,导致大量的语音数据堆积,以某金融机构呼叫中心为例,其坐席数量超过3000余个,每日产生的录音文件量高达100G以上,年录音文件总量超过50T,预计未来语音数据量的年平均增长率高达30%。如此海量的语音数据加剧了数据存储的难度,虽然现有计算机存储硬件的发展已经非常迅猛,但其发展速度还远不及数据量的几何式爆破增长,并且由于高性能的存储硬件存在造价成本的问题,大多数企业对于日益增长的进量数据以及原始积累的存量数据又爱又恨。
在现有职能体系下,多数企业还将呼叫中心评定为服务中心,一心旨在控制呼叫中心成本而并没有期待其能够产生收益。由此试图通过提高计算机硬件配置来解决呼叫中心语音数据存储的问题,并不具有一般可行性。
大数据技术的发展成功解决了呼叫中心语音数据量存储的问题,其特有的分布式存储技术能够将单一体量巨大语音数据文件夹切分为多个小的区块,并使其能够存放于由多台计算机所架构的集群上。这些计算机之间通过某种方式相互通信,进而将整个集群内所有存储空间资源整合、虚拟化并对外提供文件访问服务的文件系统。
利用大数据技术存储语音数据具有两大突出的优点:
其一,极大降低了数据存储所需的硬件成本,由于大数据技术能对单一体量的数据集进行切分、存储、再整合,因此数据存储就不再受限于高性能的计算机硬件,而只需要多个性能基本达标的存储硬件便能够对海量数据进行存储和处理;
其二,所保存的数据不易丢失或破坏,由于大数据技术会将单条语音数据重复分配到集群中多个计算机上,因此在数据提取时,若某个计算机的数据不慎丢失或其本身遭受破坏,我们也能正常的从集群中提取到完整的数据。
现阶段大多数呼叫中心运营高层都逐渐意识到日常语音数据的价值,也纷纷表示分布式存储技术确实能够帮助其解决语音数据体量过大的问题。由此如今众多呼叫中心都致力于从抽取部分语音进行存储变革为全量语音存储,从真正意义上使得分布式存储海量语音数据成为主流趋势。
2.实现“机器质检泛听+人工质检精听”新模式
呼叫中心是人力密集型行业,其质量监控管理一直是一项浩瀚的工程,如果都通过传统的人工监听进行质检管理,其所需的人力物力难以估计。因此在过去很长一段时间内,呼叫中心都利用抽听的方法进行质量监控管理,该方法一方面从业务角度而言,可能导致坐席人员工作的投机性,另一方面从统计学角度而言,简单的随机抽样所得出的结果并不能完整反映该坐席普遍的日常工作状态。
质量监控工作对于呼叫中心而言具有重要的意义,其通过对坐席人员服务质量的检测和监控,确保坐席通话过程中的规范性、完整性和准确性,提升坐席人员日常的营销技能和服务水平,保证业务一线人员高水平服务的持续性。然而,传统质检人员每天面对大量的录音,常用方法都是通过听录音进行合规性检查,无法识别批量录音中所蕴含的重要信息,例如客户投诉信息中,有多少客户是不满意坐席服务态度,有多少客户是不满意产品价格。又假设面对业务量陡然激增,管理者是否能在第一时间洞察背后原因,从而及时制定应对策略?
随着大数据技术实现呼叫中心语音数据全量存储,质检系统也由传统人工抽检转变为机器录音质检100%全覆盖。借助深度学习方法所构建的声学模型和语言模型,语音分析系统能够更精确的将海量通话内容转化为录音文本文件。在此基础上,加入全面的质检评分规则:通过设置业务术语、礼貌用语、禁忌用语、静默时长等质检点计算机能够自动地对所有坐席人员的业务熟练度进行打分,从而筛选出评分较低的通话供质检人员调听,在全方位覆盖每通录音的同时,大幅降低了人工质检所需的成本。如此系统筛选与人工调听相结合的质检方式,形成了“机器质检泛听+人工质检精听”的新模式,进而有利于全面把握呼叫中心人工坐席服务质量,提高呼叫中心运营效率。
3.文本分析结合机器学习深度挖掘客户价值
现阶段,大多数呼叫中心仍被定义为成本中心,那么如何充分利用呼叫中心数据资源,将呼叫中心打造为利润中心,是传统呼叫中心转型升级的关键。呼叫中心现有系统及分析报告中所包含的通话时长、响应率、成单量、投诉率等指标计算已经相当成熟,并且在关于构建客户群体划分、产品竞争分析、业务风险评估等机器学习模型上也小有建树,但仅此还无法完成呼叫中心由成本中心转向价值中心,最后成为利润中心的转型。这是由于单一结构化数据所构建的机器学习模型还无法全方位精准的预测客户行为,由此我们在构建机器学习模型时还需要添加诸如客户情绪等非结构化数据,以保证学习过程的完整性。
消费者金融保护局(CFPB)曾经就利用文本分析搭配机器学习的方法来探索自身的数据情况。他们的数据主要记录了客户对银行、信用卡公司和其他金融服务公司的投诉,其中包括客户信息、产品信息等结构化数据以及客户评论、语音文本等非结构化的数据。该分析方法首先使用文本分析技术来识别CFPB收集的自由形式数据中的负面情绪,然后利用机器学习算法建立一个预测模型,用来分析负面情绪程度与客户是否收到违规银行补偿,以及这两个变量之间的关系。
研究结果表明,客户得到补偿与负面情绪之间确实存在相关性,当客户评论表现出较强的负面情绪,违规银行很大概率上会针对这部分客户进行补偿,特别是当有客户使用“偷”或者与之类似的词语时,其获得补偿的概率会更大。这项数据分析工作充分展示了文本分析和机器学习结合的力量,一旦文本分析被引入机器学习的预测模型中,该模型就能在发现行为模式的同时,回答为什么会产生这种行为模式,以及如何解决这种行为模式所带来的问题。
相对于其他部门而言,呼叫中心所特有的语音数据属于典型的非结构化数据,通过文本分析技术能够对这些非结构化语音数据进行淬炼,从中提取高价值、新维度的变量,例如客户满意度、客户情绪、产品偏好系数等,进而改进现有机器学习模型。结合文本分析和机器学习所实现的智能数据挖掘系统,将突破呼叫中心传统数据分析方法的局限性,更深层次、全方位的对客户进行扫描,使得呼叫中心与客户之间关系由简单交易到亲密信赖,最终达到价值依托。
随着大数据、云计算和人工智能技术的发展,海量语音数据存储成本不断下降,智能质检系统的精确度不断提升,客户价值获得更深层次的挖掘,届时呼叫中心将突破传统业务逻辑,形成全新的运营模式。
在该模式下,呼叫中心日常运营将会主要围绕如下四个方面:
1)全方位挖掘客户需求,提升客户感知及服务质量;
2)关注员工发展,提高员工技能及日常工作满意度;
3)聚焦中心实际需求,降低运营成本,提高营销收入;
4)收集高价值信息,降低信息预测风险。
随着新运营模式的不断深入,呼叫中心将真正从过去的被动服务转向主动服务,由成本中心转向企业核心利润中心。