(12)发明专利申请
(10)申请公布号 CN 110175113 A(43)申请公布日 2019.08.27
(21)申请号 201910313063.5(22)申请日 2019.04.18
(71)申请人 阿里巴巴集团控股有限公司
地址 英属开曼群岛大开曼资本大厦一座四
层847号邮箱(72)发明人 黄晓光 郭飞 俞敬
(74)专利代理机构 北京国昊天诚知识产权代理
有限公司 11315
代理人 许振新 朱文杰(51)Int.Cl.
G06F 11/36(2006.01)G06K 9/62(2006.01)
权利要求书2页 说明书12页 附图4页
(54)发明名称
业务场景确定方法和装置(57)摘要
本说明书实施例公开了一种业务场景确定方法和装置,该方法包括:基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理,以得到所述业务系统的至少一个第二业务要素;根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。
CN 110175113 ACN 110175113 A
权 利 要 求 书
1/2页
1.一种业务场景确定方法,包括:
基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;
基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理,以得到所述业务系统的至少一个第二业务要素;
根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。
2.根据权利要求1所述的方法,得到所述业务系统的至少一个第一业务要素之后,所述方法还包括:
接收针对所述至少一个第一业务要素的标记校验结果;其中,基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理包括:基于所述至少一个第一业务要素的标记校验结果以及所述业务系统的实时业务数据对要素进行分类处理。
3.根据权利要求1所述的方法,确定所述业务系统的业务场景集合之后,所述方法还包括:
基于所述业务场景集合生成测试用例;基于所述测试用例执行下述至少一种操作:基于接收到的查询请求返回所述测试用例;基于接收到的管理指令管理所述测试用例;以及基于接收到回放指令运行所述测试用例。4.根据权利要求1所述的方法,基于业务系统的历史业务数据对要素进行聚类处理之前,所述方法还包括:
对所述业务系统的历史业务数据进行预处理;其中,所述预处理包括异常数据处理、缺失数据处理、归一化处理以及特征工程构建的至少一种;
基于业务系统的历史业务数据对要素进行聚类处理包括:基于所述预处理后的所述历史业务数据对要素进行聚类处理。
5.根据权利要求1至4任一项所述的方法,确定所述业务系统的业务场景集合之后,所述方法还包括:
将所述业务场景集合和预设业务场景集合进行比对;基于比对结果对所述聚类处理和所述分类处理进行评估。6.根据权利要求1至4任一项所述的方法,确定所述业务系统的业务场景集合之后,所述方法还包括:
基于所述业务场景集合对所述业务系统进行下述至少一种操作:业务场景监控;业务场景核对;应急预案推荐;业务系统分析以及测试用例管理。7.根据权利要求1所述的方法,基于业务系统的历史业务数据对要素进行聚类处理之前,所述方法还包括:
基于业务系统的业务数据进行模型训练,以生成业务要素模型;其中,基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素包括:将业务系统的历史业务数据输入所述业务要素模型,以得到所
2
CN 110175113 A
权 利 要 求 书
2/2页
述业务系统的至少一个第一业务要素。
8.一种业务场景确定装置,包括:聚类处理模块,基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;
分类处理模块,基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理,以得到所述业务系统的至少一个第二业务要素;
业务场景确定模块,根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。
9.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如下操作:
基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;
基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理,以得到所述业务系统的至少一个第二业务要素;
根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下操作:
基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;
基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理,以得到所述业务系统的至少一个第二业务要素;
根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。
3
CN 110175113 A
说 明 书
业务场景确定方法和装置
1/12页
技术领域
[0001]本说明书实施例涉及计算机数据处理技术领域,尤其涉及一种业务场景确定方法和装置。
背景技术
[0002]在软件的设计、研发和发布变更过程中,前置的风险分析评估;过程中的监控、对问题发现能力;出现问题后快速定位能力,每一层都至关重要。上述基础质量保障手段的实现,需要能够迅速、准确地确定出业务系统每一个精细化的业务场景。在实际应用过程中,一些复杂的业务系统通常包含极其复杂的业务入口和场景迭代,以及迅速变化拓展的业务范畴。相关技术中,通常是基于人工经验,手工梳理总结业务场景的全部范围和数量,处理效率较低;同时,由于人工梳理的易遗漏,容易引起各种线上事件和故障。发明内容
[0003]本说明书实施例提供一种业务场景确定方法和装置,用于解决人工梳理确定业务场景效率低和准确率低的问题。
[0004]本说明书实施例采用下述技术方案:[0005]第一方面,提供了一种业务场景确定方法,包括:
[0006]基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;
[0007]基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理,以得到所述业务系统的至少一个第二业务要素;
[0008]根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。[0009]第二方面,提供了一种业务场景确定装置,包括:[0010]聚类处理模块,基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;
[0011]分类处理模块,基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理,以得到所述业务系统的至少一个第二业务要素;[0012]业务场景确定模块,根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。[0013]第三方面,提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如下操作:
[0014]基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;
4
CN 110175113 A[0015]
说 明 书
2/12页
基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行
分类处理,以得到所述业务系统的至少一个第二业务要素;
[0016]根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。[0017]第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下操作:[0018]基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;
[0019]基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理,以得到所述业务系统的至少一个第二业务要素;
[0020]根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。
[0021]本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:基于业务系统的历史业务数据对要素进行聚类处理以得到第一业务要素;基于第一业务要素以及实时业务数据对要素进行分类处理以得到第二业务要素;最后根据第二业务要素的取值组合确定业务场景集合,由于通过聚类处理和分类处理的方式得到业务场景集合,相对于人工梳理业务场景的方式能够提高效率和准确度,避免人工遗漏。附图说明
[0022]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:[0023]图1为本说明书的一个实施例提供的业务场景确定方法流程示意图;[0024]图2为本说明书的另一个实施例提供的业务场景确定方法流程示意图;[0025]图3为本说明书的一个实施例提供的业务场景确定方法应用范围示意图;[0026]图4为本说明书的一个实施例提供的业务场景确定方法的系统架构示意图;[0027]图5为本说明书的一个实施例提供的业务场景确定装置结构示意图;[0028]图6为实现本说明书各个实施例的电子设备硬件结构示意图。
具体实施方式
[0029]为使本申请的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。[0030]如图1所示,本说明书的一个实施例提供一种业务场景确定方法,该实施例包括如下步骤:
[0031]S102:基于业务系统的历史业务数据对要素进行聚类处理,以得到业务系统的第一业务要素。[0032]其中,上述聚类处理用于将要素划分为业务要素和非业务要素,该处的要素通指上述业务要素和非业务要素。
5
CN 110175113 A[0033]
说 明 书
3/12页
业务系统运行以及维护等过程中通常会生成各种业务数据,上述业务系统,具体
可以是支付系统、理财系统、购物系统等中的一种或多种的组合系统;上述历史业务数据,包括但不限于下述至少一种:历史业务日志、历史消息数据、历史业务流水表等等。[0034]该步骤中提到的历史业务数据可以是业务系统历史时刻产生的业务数据,后续步骤中还会提到实时业务数据。需要说明的是,历史业务数据和实时业务数据是相对而言的,通常可以将某个时间点之前的业务数据称作是历史业务数据,而将该时间点之后的业务数据称作是实时业务数据。例如,可以将当天T之前连续3天的业务数据称作是历史业务数据,而将当天的业务数据称作是实时业务数据。又例如,将T-1天之前的所有业务数据称作是历史业务数据,而将T-1天(昨天)及当天T的业务数据称作是实时业务数据等等。[0035]可选地,上述实时业务数据,还可以是指某个事件之后业务系统产生的业务数据,例如,在当天的早上9点对业务系统进行改造,可以将业务系统9点到当前时刻产生的业务数据称作是实时业务数据。[0036]上述业务要素,通常可以分为单(业务)系统业务要素和链路业务要素。[0037]其中,单系统业务要素是一个系统内,该单系统业务要素的不同取值,会造成该系统内部处理逻辑不同从而决定了该系统不同业务场景。[0038]链路业务要素是全链路多个系统中,该链路业务要素的不同取值,会造成某单系统内部处理逻辑不同或系统间调用不同从而决定了全链路不同业务场景。[0039]逻辑要素是业务要素的特殊形式,逻辑要素只区分有值/无值,不区分取值的具体数值。
[0040]该步骤具体可通过聚类算法对历史业务数据中的要素进行聚类处理,以得到业务系统的第一业务要素,且第一业务要素的数量是至少一个。上述聚类算法可以包括无监督聚类算法,例如,K-means聚类算法,K-medoids聚类算法,DBSCAN密度聚类算法,高斯混合模型或层次聚类等。
[0041]需要说明的是,该步骤中提到第一业务要素,后续步骤中还会提到第二业务要素,第一业务要素和第二业务要素均是指上述业务系统的业务要素,该处出现的“第一”和“第二”,只是为了区分通过不同的算法、不同的时间或者不同的途径得到的业务要素。[0042]S104:基于第一业务要素以及业务系统的实时业务数据对要素进行分类处理,以得到业务系统的第二业务要素。[0043]其中,上述分类处理用于将要素划分为业务要素和非业务要素,该处的要素通指上述业务要素和非业务要素。
[0044]上述分类算法可以包括半监督算法,例如标签传播Label Spreading算法;还可以包括有监督分类算法,例如KNN算法,CART算法或GBDT算法等。[0045]考虑到聚类算法的准确度通常不能达到100%,因此,得到的至少一个第一业务要素中可能会掺杂有一些非业务要素。可选地,在一个实施例中,S102得到第一业务要素之后,还可以通过可视化界面展示上述第一业务要素,并通过人工反馈的方式对第一业务要素标记校验,例如,将第一业务要素中人工确定是业务要素的添加业务要素标签,将第一业务要素中人工确定是非业务要素的添加非业务要素标签。[0046]这样,S104之前还可以接收针对上述至少一个第一业务要素的标记校验结果,S104具体可以是基于所述至少一个第一业务要素的标记校验结果以及所述业务系统的实
6
CN 110175113 A
说 明 书
4/12页
时业务数据对要素进行分类处理,以得到业务系统的至少一个第二业务要素。[0047]通过上述针对第一业务要素的人工标记校验操作,可以保证得到的第一业务要素的准确度。同时,S104中的分类算法是基于第一业务要素进行分类处理的,能够进一步提高得到的第二业务要素的准确度。[0048]S106:根据业务系统中第二业务要素的取值组合,确定业务系统的业务场景集合。[0049]业务系统的业务场景通常是由业务要素取值组合决定的,例如,针对一个业务要素biz_product,其取值为A时,对应于第一业务场景;其取值为B时,对应于第二业务场景;其取值为C时,对应于第三业务场景等等。上述业务场景集合,可以是业务系统的全部业务场景。
[0050]上述第二业务要素的取值组合,具体可以是通过历史业务数据和实时业务数据等得到。与业务要素相对应,业务场景集合中的业务场景也可以分为单系统业务场景和全链路业务场景。
[0051]在一个具体的例子中,通过本说明书上述实施例提供的业务场景确定方法,生成的第二业务要素的数量为23个,分别是:biz_product,Product,t_b_rec_virt,Partner,t_b_rec_post,sub_platform_type,seller_sup_dcc,channel_partner,logistics_type,return_url,t_b_rec_expr,credit_card_default_display,credit_card_pay,sub_count,logistics_payment,goods_sup_dcc,input_charset,platform_type,sign_type,payment_type,t_b_rec_direct,t_b_pay,platform。
[0052]基于业务数据得到上述23个业务要素的可能取值组合,确定出的业务场景集合中的业务场景数为739个。而现有技术中通过人共梳理得到的业务要素数量6个,业务场景数量303个。通过上述对比可以得出,本说明书实施例提供的业务场景确定方法较人工经验梳理得到业务要素和业务场景而言业务要素数量,增加了17个,业务要素数提升了17/6=283.3%;业务场景数量增加了436个,业务场景覆盖率提升了436/303=143.9%。[0053]本说明书实施例提供的业务场景确定方法,基于业务系统的历史业务数据对要素进行聚类处理以得到第一业务要素;基于第一业务要素以及实时业务数据对要素进行分类处理以得到第二业务要素;最后根据第二业务要素的取值组合确定业务场景集合,由于是通过聚类处理和分类处理的方式得到业务场景集合,相对于人工梳理业务场景的方式能够提高效率和准确度,避免人工遗漏。
[0054]本说明书实施例同时根据历史业务数据和实时业务数据得到业务场景集合,如前所述,历史业务数据和实时业务数据是相对而言的,这样,在实际应用过程中,随着业务系统的变化拓展,本说明书实施例即可不断更新业务系统的业务场景,得到的业务场景更准确。
[0055]可选地,在上述实施例100的S106确定业务系统的业务场景之后还可以包括如下步骤:
[0056]基于确定出的业务场景集合中的业务场景生成测试用例;[0057]基于上述测试用例执行下述至少一种操作:[0058]1)基于接收到的查询请求返回测试用例,以方便业务人员查询测试用例;[0059]2)基于接收到的管理指令管理测试用例,以方便业务人员对测试用例进行删除、更改等操作;以及
7
CN 110175113 A[0060]
说 明 书
5/12页
3)基于接收到回放指令运行测试用例,以方便业务人员回放测试用例。
[0061]本说明书实施例提供的业务场景确定方法,能够方便业务人员进行测试用例查询、测试用例管理以及测试用例回放等等。[0062]可选地,在上述实施例100的S102基于业务系统的历史业务数据对要素进行聚类处理之前还可以包括如下步骤:
[0063]对业务系统的历史业务数据进行预处理;其中,上述预处理包括异常数据处理、缺失数据处理、归一化处理以及特征工程构建的至少一种。可选地,S104之前还可以对实时业务数据进行上述预处理。[0064]具体地,上述异常数据处理可以是删除异常数据;上述缺失数据处理可以是对缺失数据进行补全处理;上述归一化处理或称标准化处理,具体可以是min-max标准化或Z-score标准化等;上述特征工程构建,具体可以是筛选特征因子的过程。[0065]这样,S102基于业务系统的历史业务数据对要素进行聚类处理包括:基于上述预处理后的历史业务数据对要素进行聚类处理。[0066]可选地,通过上述多个实施例提供的业务场景确定方法确定出业务系统的业务场景之后,还可以包括如下步骤:
[0067]将确定出的业务场景集合和预设业务场景集合进行比对;[0068]基于比对结果对所述聚类处理和所述分类处理进行评估、反馈等操作。[0069]该实施例能够对S102中的聚类处理和S104中的分类处理进行评估和反馈,进而对聚类处理和分类处理的算法模型进行调参等优化操作,便于在后续的业务场景确定过程中提高聚类处理和分类处理后得到的业务场景集合的准确性。[0070]可选地,通过上述多个实施例提供的业务场景确定方法确定出业务系统的业务场景集合之后,还可以包括如下步骤:
[0071]基于确定出的业务场景集合对业务系统进行下述至少一种操作:[0072]业务场景监控;业务场景核对;应急预案推荐;业务系统分析以及测试用例管理。[0073]上述对业务系统进行业务场景监控,可以是监控业务系统的全部或部分业务场景是否运行异常;对业务场景的监控操作相关的阈值进行设置;以及监控的业务场景的覆盖度等。
[0074]上述对业务系统进行业务场景核对,可以是日常维护中对业务场景的总数量进行核对;生成区分不同的业务场景的区分规则;对某些业务场景的上游或下游业务场景归属的业务系统进行核对;核对的业务场景的覆盖度等。[0075]上述应急预案推荐,可以是基于上述业务场景确定方法,基于业务场景的细分能力,更有针对性地实现相应的应急预案推荐,同时确定应急机制的覆盖率等。[0076]上述对业务系统进行业务系统分析,可以是对业务系统老业务改造的影响范围进行评估;实现链路拓扑结构复现及业务场景嫁接能力;实现配置类/方法/入参后,返回改造点下游所有受影响业务场景;结合开发测试已评估业务场景比对,给出评估遗漏业务场景组合;补充用例回归测试,避免因评估遗漏导致的线上事件或线上问题。[0077]上述对业务系统进行测试用例管理,可以是智能端到端测试过程中,自动生成测试用例,实现端到端全链路场景覆盖率的提升和线上数据回放能力。[0078]可选地,在上述实施例100的S102基于业务系统的历史业务数据对要素进行聚类
8
CN 110175113 A
说 明 书
6/12页
处理之前还可以包括如下步骤:基于业务系统的业务数据进行模型训练,以生成业务要素模型;这样,实施例100的S102基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的第一业务要素包括:将业务系统的历史业务数据输入所述业务要素模型,以得到所述业务系统的第一业务要素。该实施例预先训练得到业务要素模型,后续过程中直接调用该模型即可,操作方便,快捷。
[0079]为详细说明本说明书实施例提供的业务场景确定方法,以下将结合一个具体的实施例进行说明,如图2所示,图2所示的实施例200可以应用在第一平台和第二平台中,该实施例200包括如下步骤:[0080]S202:获取业务系统的历史业务数据。[0081]S204:对获取到的历史业务数据进行预处理。[0082]上述预处理包括异常数据处理、缺失数据处理、标准化/归一化处理以及特征工程构建的至少一种。
[0083]上述特征工程构建的特征可以包括:
[0084]数值型要素和描述性统计量中的最大值/最小值/中间值/出现频次最高的数值/分位数/偏度/峰度系数等等;
[0085]字符型要素及其出现(非空)频数/频率;[0086]要素取值种类数;
[0087]要素不同取值的集中/离散程度;[0088]要素的调用量;
[0089]要素相邻记录调用时间间隔;
[0090]要素相邻记录调用时间间隔的分布特征,包括调用时间间隔的最大值/最小值/中间值/出现频次最高的数值/分位数/偏度/峰度系数等等;[0091]运行耗时;
[0092]要素两两间关系;
[0093]要素与其他要素间关系。[0094]S206:对预处理后的历史业务数据进行特征降维处理。[0095]该步骤可以通过自变量与自变量间分析,自变量与因变量间分析实现特征降维。[0096]S208:基于无监督聚类算法对要素进行聚类处理,以得到所述业务系统的业务要素。
[0097]该步骤中的无监督聚类算法可以包括:K-means聚类算法,K-medoids聚类算法,DBSCAN密度聚类算法,高斯混合模型或层次聚类等。得到的业务要素的苏数量为至少一个。[0098]S210:基于预设评估指标,对上述聚类处理进行评估。[0099]上述评估指标可以采用如下三种:[0100]1)算法评估指标,例如calinski-harabasz指标,轮廓系数等。[0101]2)模型稳定性评估指标,例如,对训练集train set、验证集validation set以及测试集test set进行k-折交叉验证。[0102]3)基于业务标注的效果评估,例如,准确率Precision、召回率Recall、F值F-Measure、兰德系数rand index;调整兰德系数Adjusted rand index;标准化互聚类信息Normalized Mutual information。
9
CN 110175113 A[0103]
说 明 书
7/12页
S212:选取得到业务要素的聚类簇。
[0104]S214:基于预设的业务要素推荐规则,得到所需的业务要素。[0105]上述步骤S212可能得到的是业务系统全部的业务要素,该步骤即可基于预设的推荐规则,仅仅得到所需的部分业务要素。[0106]S216:人工对业务要素打标签。
[0107]通过S214得到的业务要素中可能会掺杂有一些非业务要素,因此,该步骤可以通过人工反馈的方式对业务要素标记校验。[0108]S218:获取业务系统的实时业务数据。[0109]S220:基于有监督分类算法、获取的实时业务数据和标记过后的业务要素,对要素进行分类处理,以得到所述业务系统的业务要素。[0110]上述分类算法可以包括半监督算法,例如标签传播Label Spreading算法;还可以包括有监督分类算法,例如KNN算法,CART算法或GBDT算法等。[0111]S222:基于S216和S220得到业务系统的全部业务要素。[0112]该步骤得到的业务要素,不仅包括有S216标记过后的业务要素,还包括有根据实时业务数据得到的业务要素。[0113]S224:根据业务系统中业务要素的取值组合,确定业务系统的业务场景集合。[0114]上述业务要素的取值组合,具体可以是通过历史业务数据和实时业务数据等得到。其中,业务系统的全部业务场景可以成为是全场景分母。[0115]S226:将业务场景集合和预设业务场景集合进行比对,基于比对结果对有监督分类算法进行反馈评估。
[0116]该步骤可以对分类处理的算法模型进行调参等优化操作,便于在后续的业务场景确定过程中提高分类处理后得到的业务场景的准确性。[0117]基于上述实施例200提供的业务场景确定方法,可以利用业务场景分析确定的底盘能力,扩展应用到业务场景智能监控;业务场景智能核对;智能应急预案推荐;业务系统分析以及测试技术的测试用例管理,如图3所示。[0118]如图4所示的系统架构,从底层到高层可以分为元数据层、算法应用层、工程化层、透出查询层和业务应用层等。[0119]元数据层:元数据来源包括DB/Hbase实时业务日志、DB/Hbase实时业务流水表、ODPS离线业务日志、ODPS离线业务流水表、拦截自住录制日志以及消息数据等;平台依赖包括dateworks、functionstudio等工具。[0120]算法应用层:包括数据标准化、特征集市、模型集市和有监督反馈。其中,数据标准化包括采样标准化、字段解析提取标准化、异常值/缺失值标准化、归一化等。特征集市包括数据变换、衍生变量、特征选择以及特征降维等。特征集市包括聚类、半监督标签传播、分类和异常检测等。
[0121]工程化层:包括PMD可视化平台自助录入元数据,数据平台自助调度-数据标准化以及算法模型-定时调度等。[0122]透出查询层:单系统业务要素查询、链路业务要素查询、单系统业务场景查询、链路业务场景查询以及业务改造影响评估模块。[0123]上述业务应用层包括多个模块:
10
CN 110175113 A[0124]
说 明 书
8/12页
模块一:业务场景分析确定+监控专项——业务精细化监控机制
[0125]现有技术中没有业务场景分析应用于业务场景监控专项,即无业务精细化监控机制。业务系统通常对应海量业务场景,涉及千万级商家,亿万级用户,落地到单系统层面的业务场景就有上千级别,对单系统的业务场景配置就可能需要数月的时间甚至更多,配置的成本太高。[0126]因此,该实施例将业务场景确定方法所产出的业务要素和业务场景对接给业务场景监控专项,实现了业务产经精细化监控,极大地突破了现存业务系统的瓶颈。[0127]模块二:业务场景分析确定+核对专项——业务精细化核对机制[0128]当前无业务场景分析应用于核对专项,即无业务精细化核对机制。因此,该实施例将业务场景确定方法所产出的业务要素和业务场景对接给核对专项,助力于日常维护中对业务场景的总数量进行核对;生成区分不同的业务场景的区分规则;对某些业务场景的上游或下游业务场景归属的业务系统进行核对;核对的业务场景的覆盖度等。[0129]模块三:业务场景分析确定+应急专项——业务精细化应急机制[0130]当前无业务场景分析应用于应急专项,即无业务精细化应急机制。该实施例将业务场景确定方法所产出的业务要素和业务场景对接给应急专项,基于业务场景的细分能力,更有针对性地实现相应的应急预案推荐,同时确定应急机制的覆盖率等。[0131]模块四:业务场景分析确定+业务改造影响评估——业务系统分析工具[0132]当前无业务场景分析应用于老业务改造测试影响范围评估,即无系统分析工具。该实施例将业务场景确定方法所产出的业务要素和业务场景对接给业务系统分析专项,可以是对业务系统老业务改造的影响范围进行评估;实现链路拓扑结构复现及场景嫁接能力;实现配置类/方法/入参后,返回改造点下游所有受影响业务场景;结合开发测试已评估业务场景比对,给出评估遗漏业务场景组合;补充用例回归测试,避免因评估遗漏导致的线上事件或线上问题。[0133]模块五:业务场景分析+智能端到端测试——基于业务清洗的自动化回放机制[0134]当前无业务场景分析应用于智能端到端测试,即无基于业务清洗的自动化回放机制。该实施例将业务场景确定方法所产出的业务要素和业务场景对接给智能端到端测试,自动生成测试用例,实现端到端全链路场景覆盖率的提升和线上数据回放能力。[0135]当然,本说明书实施例的应用范围不局限于上述智能业务场景监控、智能业务场景核对、智能应急预案推荐、系统分析工具、智能端到端测试等技术风险研究等,还可以扩展应用于更多的范围。
[0136]上述图2至图4所示的实施例,通过将聚类–分类/无监督–半监督–有监督等一系列算法应用于业务场景分析中,利用数据和算法的处理方式,精准有效地判定业务要素和业务场景,并形成自动化闭环优化、可视化展示等。
[0137]上述实施例将业务场景分析确定作为底盘能力,受益范围囊括且不局限于智能业务场景监控、智能业务场景核对、智能应急预案推荐、系统分析工具、智能端到端测试等技术风险研究等。[0138]同时,上述实施例的普适性、可扩展性强,可广泛推广适用于任意业务场景分析相关的大数据质量体系。
[0139]以上结合图1至图4详细描述了根据本发明实施例的业务场景确定方法,如图5所
11
CN 110175113 A
说 明 书
9/12页
示,本说明书还提供了一种业务场景确定装置,如图5所示,该装置500包括:[0140]聚类处理模块502,可以用于基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素,所述聚类处理用于将要素划分为业务要素和非业务要素;
[0141]分类处理模块504,可以用于基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理,以得到所述业务系统的至少一个第二业务要素;[0142]业务场景确定模块506,可以用于根据所述业务系统中所述至少一个第二业务要素的取值组合,确定所述业务系统的业务场景集合。[0143]本说明书实施例提供的业务场景确定装置,基于业务系统的历史业务数据对要素进行聚类处理以得到第一业务要素;基于第一业务要素以及实时业务数据对要素进行分类处理以得到第二业务要素;最后根据第二业务要素的取值组合确定业务场景集合,由于通过聚类处理和分类处理的方式得到业务场景集合,相对于人工梳理业务场景的方式能够提高效率和准确度,避免人工遗漏。[0144]同时,本说明书实施例同时根据历史业务数据和实时业务数据得到业务场景集合,如前所述,历史业务数据和实时业务数据是相对而言的,这样,在实际应用过程中,随着业务系统的变化拓展,本说明书实施例即可不断更新业务系统的业务场景,得到的业务场景更准确。
[0145]可选地,作为一个实施例,上述装置500还包括接收模块,可以用于接收针对所述至少一个第一业务要素的标记校验结果;[0146]其中,分类处理模块504基于所述至少一个第一业务要素以及所述业务系统的实时业务数据对要素进行分类处理包括:基于所述至少一个第一业务要素的标记校验结果以及所述业务系统的实时业务数据对要素进行分类处理。[0147]可选地,作为一个实施例,上述装置500还包括测试用例处理模块,可以用于基于所述业务场景集合生成测试用例;基于所述测试用例执行下述至少一种操作:[0148]基于接收到的查询请求返回所述测试用例;[0149]基于接收到的管理指令管理所述测试用例;以及[0150]基于接收到回放指令运行所述测试用例。[0151]可选地,作为一个实施例,上述装置500还包括预处理模块,可以用于对所述业务系统的历史业务数据进行预处理;其中,所述预处理包括异常数据处理、缺失数据处理、归一化处理以及特征工程构建的至少一种;
[0152]聚类处理模块502基于业务系统的历史业务数据对要素进行聚类处理包括:基于所述预处理后的所述历史业务数据对要素进行聚类处理。[0153]可选地,作为一个实施例,上述装置500还包括评估模块,可以用于将所述业务场景集合和预设业务场景集合进行比对;
[0154]基于比对结果对所述聚类处理和所述分类处理进行评估。[0155]可选地,作为一个实施例,上述装置500还包括大数据处理模块,可以用于基于所述业务场景集合对所述业务系统进行下述至少一种操作:[0156]业务场景监控;业务场景核对;应急预案推荐;业务系统分析以及测试用例管理。[0157]可选地,作为一个实施例,上述装置500还包括模型训练模块,可以用于基于业务
12
CN 110175113 A
说 明 书
10/12页
系统的业务数据进行模型训练,以生成业务要素模型;[0158]其中,聚类处理模块502基于业务系统的历史业务数据对要素进行聚类处理,以得到所述业务系统的至少一个第一业务要素包括:将业务系统的历史业务数据输入所述业务要素模型,以得到所述业务系统的至少一个第一业务要素。
[0159]根据本说明书实施例的上述业务场景确定装置500可以参照对应前文本说明书实施例的业务场景确定方法100和200的流程,并且,该业务场景确定装置500中的各个单元/模块和上述其他操作和/或功能分别为了实现业务场景确定方法100和200中的相应流程,并且能够达到相同或等同的技术效果,为了简洁,在此不再赘述。[0160]下面将结合图6详细描述根据本说明书实施例的电子设备。参考图6,在硬件层面,电子设备包括处理器,可选地,包括内部总线、网络接口、存储器。其中,如图6所示,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括实现其他业务所需要的硬件。[0161]处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外设部件互连标准(Peripheral Component Interconnect,PCI)总线或扩展工业标准结构(Extended Industry Standard Architecture,EISA)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
[0162]存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。[0163]处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成转发聊天信息的装置。处理器,执行存储器所存放的程序,并具体用于执行本说明书前文所述的方法实施例的操作。
[0164]上述图1至图4所示实施例揭示的方法、装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0165]图6所示的电子设备还可执行图1至图4的方法,并实现业务场景确定方法在图1至
13
CN 110175113 A
说 明 书
11/12页
图4所示实施例的功能,本说明书实施例在此不再赘述。[0166]当然,除了软件实现方式之外,本申请的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
[0167]本说明书实施例还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述各个方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,简称ROM)、随机存取存储器(Random Access Memory,简称RAM)、磁碟或者光盘等。
[0168]本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0169]本申请是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0170]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0171]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。[0172]在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0173]内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0174]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、
14
CN 110175113 A
说 明 书
12/12页
数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。[0175]还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。[0176]以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
15
CN 110175113 A
说 明 书 附 图
1/4页
图1
图2
16
CN 110175113 A
说 明 书 附 图
2/4页
图3
17
CN 110175113 A
说 明 书 附 图
3/4页
图4
图5
18
CN 110175113 A
说 明 书 附 图
4/4页
图6
19
因篇幅问题不能全部显示,请点此查看更多更全内容