CN120144822A - 基于ab实验的视频推荐方法、系统、电子设备及存储介质 - Google Patents
基于ab实验的视频推荐方法、系统、电子设备及存储介质 Download PDFInfo
- Publication number
- CN120144822A CN120144822A CN202510279065.2A CN202510279065A CN120144822A CN 120144822 A CN120144822 A CN 120144822A CN 202510279065 A CN202510279065 A CN 202510279065A CN 120144822 A CN120144822 A CN 120144822A
- Authority
- CN
- China
- Prior art keywords
- video
- user
- data
- model
- shunt
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/738—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/7847—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/7867—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using information manually generated, e.g. tags, keywords, comments, title and artist information, manually generated time, location and usage information, user ratings
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
- G06V10/806—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level of extracted features
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Library & Information Science (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种基于AB实验的视频推荐方法、系统、电子设备及存储介质,基于用户发送的线上推荐请求获取用户的用户数据和实验数据;加载预训练的各个分流模型,通过分流模型根据用户数据和实验数据预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对分流模型的视频推荐结果的用户偏好得分;针对每个分流模型,统计分流模型的视频推荐结果的被选择次数,并根据被选择次数确定分流模型的模型胜率;根据每个分流模型的用户偏好得分和模型胜率,计算每个分流模型的视频推荐得分,并根据各个分流模型的视频推荐得分确定各个分流模型之间的分流比例;按照分流比例向用户展示各个分流模型当前的视频推荐结果。
Description
技术领域
本发明涉及计算机技术领域,更具体地说,涉及一种基于AB实验的视频推荐方法、系统、电子设备及存储介质。
背景技术
随着视频推荐领域的不断法阵,为了提升用户的体验,需要不断进行实验迭代以选出视频推荐效果最好的推荐模型。目前的推荐模型选择方式是通过AB实验测试,即将线上流量均匀分流到两个不同的实验桶,尽量保证每个桶的用户分布均匀,其中,每个桶部署的算法模型不同;经过一段时间的实验效果观察统计后,将效果较好的实验桶上部署的算法模型进行全量。
这种方式虽然可以筛选出效果较好的推荐模型,但是需要长期观察统计,效果回收周期较长,而且效果存在一定的波动;并且,不同的推荐模型侧重点不一样,导致不同的推荐模型得到的效果会受到时间周期、用户人群、用户情趣变化等因素的影响。
发明内容
有鉴于此,本发明提供一种基于AB实验的视频推荐方法、系统、电子设备及存储介质,以缩短效果回收周期,避免效果存在波动,以及避免不同分流模型的效果受到时间周期、用户人群和用户情趣变化等因素的影响的问题。
本申请第一方面提供一种基于AB实验的视频推荐方法,所述方法包括:
当接收到用户发送的线上推荐请求时,基于所述线上推荐请求获取所述用户的用户数据和实验数据;
加载预训练的各个分流模型,并通过所述分流模型根据所述用户数据和所述实验数据预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分;其中,所述分流模型是利用历史用户数据和历史实验数据对待训练的分流模型进行训练得到;
针对每个所述分流模型,统计所述分流模型的视频推荐结果的被选择次数,并根据所述被选择次数确定所述分流模型的模型胜率;
根据每个所述分流模型的用户偏好得分和模型胜率,计算每个所述分流模型的视频推荐得分,并根据各个所述分流模型的视频推荐得分确定各个所述分流模型之间的分流比例;
按照所述分流比例向所述用户展示各个所述分流模型当前的视频推荐结果。
可选的,所述加载预训练的各个分流模型,并通过所述分流模型根据所述用户数据和所述实验数据预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分,包括:
加载预训练的各个分流模型,并将所述用户数据和所述实验数据输入至每个所述分流模型;其中,所述分流模型包括序列编码模块、隐藏层、特征拼接层和多层激活层;
通过所述序列编码模块将每个曝光视频转化成多个视频特征向量,并根据每个所述曝光视频的各个视频特征向量生成一个一维的视频向量;其中,所述用户数据包括用户曝光数据和用户基础属性数据,所述用户曝光数据包括按照曝光时间排序的多个曝光视频;
通过所述隐藏层对所述用户基础属性数据、上下文数据和实验效果统计数据进行平滑处理,并通过所述特征拼接层将所述视频向量和进行平滑处理后的用户基础属性数据、上下文数据和实验效果统计数据进行拼接,得到视频拼接特征;
通过所述多层激活层对所述视频拼接特征进行处理,得到目标视频拼接特征;
调用归一化指标函数根据所述目标视频拼接特征预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分。
可选的,所述通过所述序列编码模块将每个曝光视频转化成多个视频特征向量,并根据每个所述曝光视频的各个视频特征向量生成一个一维的视频向量,包括:
通过所述序列编码模块将每个所述曝光视频转换成多个视频特征向量,并对每个所述视频特征向量进行加权处理,得到每个曝光视频对应的多个目标视频特征向量;
通过所述序列编码模块依次将除第一个曝光视频以外的曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,并利用激活单元对得到的处理结果进行激活得到激活数据,直至将最后一个曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,得到视频向量;其中,第一个曝光视频的激活数据是利用所述激活单元对第一个曝光视频的各个目标视频特征向量进行激活得到的。
可选的,所述调用归一化指标函数根据所述目标视频拼接特征预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分,包括:
调用归一化指标函数根据所述目标视频拼接特征预估每个实验指标的预估值,并根据实验指标的预估值及其权重计算每个实验指标的偏好得分,根据各个实验指标的偏好得分计算用户针对所述分流模型的视频推荐结果的用户偏好得分。
可选的,所述利用历史用户数据和历史实验数据对训练的分流模型进行训练,得到所述分流模型,包括:
获取历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值;
将历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值输入每个待训练的分流模型;
通过所述待训练的序列编码模块根据所述用户数据的用户曝光数据生成一个一维的历史视频向量;
通过所述待训练的隐藏层对所述历史用户数据中的历史用户基础属性数据和所述历史实验数据进行平滑处理,并通过所述待训练的特征拼接层将所述历史视频向量和进行平滑处理后的历史用户基础属性数据和历史实验数据进行拼接,得到历史视频拼接特征;
通过所述待训练的多层激活层对所述历史视频拼接特征进行处理,得到历史目标视频拼接特征;
调用归一化指数函数根据所述历史目标视频拼接特征预估每个实验指标的预测预估值,并以各个实验指标的预测预估值趋近于对应的实际预估值为训练目标对所述待训练的分流模型的参数进行调整,直至所述待训练的分流模型达到收敛,得到相应的分流模型。
本申请第二方面提供一种基于AB实验的视频推荐系统,所述系统包括:
第一获取单元,用于当接收到用户发送的线上推荐请求时,基于所述线上推荐请求获取所述用户的用户数据和实验数据;
用户偏好得分确定单元,用于加载预训练的各个分流模型,并通过所述分流模型根据所述用户数据和所述实验数据预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分;其中,所述分流模型是训练单元利用历史用户数据和历史实验数据对待训练的分流模型进行训练得到;
模型胜率确定单元,用于针对每个所述分流模型,统计所述分流模型的视频推荐结果的被选择次数,并根据所述被选择次数确定所述分流模型的模型胜率;
分流比例确定单元,用于根据每个所述分流模型的用户偏好得分和模型胜率,计算每个所述分流模型的视频推荐得分,并根据各个所述分流模型的视频推荐得分确定各个所述分流模型之间的分流比例;
视频推荐单元,用于按照所述分流比例向所述用户展示各个所述分流模型当前的视频推荐结果。
可选的,所述用户偏好得分确定单元,包括:
第一输入单元,用于加载预训练的各个分流模型,并将所述用户数据和所述实验数据输入至每个所述分流模型;其中,所述分流模型包括序列编码模块、隐藏层、特征拼接层和多层激活层;
视频向量生成单元,用于通过所述序列编码模块将每个曝光视频转化成多个视频特征向量,并根据每个所述曝光视频的各个视频特征向量生成一个一维的视频向量;其中,所述用户数据包括用户曝光数据和用户基础属性数据,所述用户曝光数据包括按照曝光时间排序的多个曝光视频;
第一特征拼接单元,用于通过所述隐藏层对所述用户基础属性数据、上下文数据和实验效果统计数据进行平滑处理,并通过所述特征拼接层将所述视频向量和进行平滑处理后的用户基础属性数据、上下文数据和实验效果统计数据进行拼接,得到视频拼接特征;
第二处理单元,用于通过所述多层激活层对所述视频拼接特征进行处理,得到目标视频拼接特征;
预估单元,用于调用归一化指标函数根据所述目标视频拼接特征预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分。
可选的,所述视频向量生成单元,包括:
加权处理单元,用于通过所述序列编码模块将每个所述曝光视频转换成多个视频特征向量,并对每个所述视频特征向量进行加权处理,得到每个曝光视频对应的多个目标视频特征向量;
视频向量生成子单元,用于通过所述序列编码模块依次将除第一个曝光视频以外的曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,并利用激活单元对得到的处理结果进行激活得到激活数据,直至将最后一个曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,得到视频向量;其中,第一个曝光视频的激活数据是利用所述激活单元对第一个曝光视频的各个目标视频特征向量进行激活得到的。
本申请第三方面提供一种电子设备,包括:处理器以及存储器,所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现如本申请第一方面提供的基于AB实验的视频推荐方法。
本申请第四方面提供一种存储介质,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行如本申请第一方面提供的基于AB实验的视频推荐方法。
本申请实施例提供一种基于AB实验的视频推荐方法、系统、电子设备及存储介质,可以预先利用历史用户数据和历史实验数据对各个待训练的分流模型进行训练,得到各个分流模型,以便在接收到用户发送的线上推荐请求时,基于该线上推荐请求获取该用户的用户数据和实验数据,通过每个分流模型根据用户数据和实验数据预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对每个分流模型的视频推荐结果的用户偏好得分,同时还可以计算每个分流模型的模型胜率,以便根据每个分流模型的用户偏好得分和模型胜率,计算每个分流模型的视频推荐得分,最后可以根据各个分流模型的视频推荐得分确定各个分流模型之间的分流比例,以根据得到的分流比例向用户展示各个分流模型当前的视频推荐结果。由此可见,本申请提供技术方案无需保证每个分流模型的用户分布均匀,也不用进行长期的实验效果观察统计,不仅可以缩短效果回收周期,避免效果存在波动,还能够避免不同分流模型的效果受到时间周期、用户人群和用户情趣变化等因素的影响。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种基于AB实验的视频推荐方法的流程示意图;
图2为本申请实施例提供的一种AB实验平台的结构示意图;
图3为本申请实施例提供一种分流模型的训练方法的流程示意图;
图4为本申请实施例提供的一种待训练的分流模型的结构示例图;
图5为本申请实施例提供的一种生成历史视频向量的示例图;
图6为本发明实施例提供的一种基于AB实验的视频推荐系统的结构示意图;
图7为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。
由上述背景技术可知,目前可以通过AB实验测试,即将线上流量均匀分流到两个不同的实验桶,经过一段时间的实验效果观察统计后,将效果较好的实验桶上部署的算法模型进行全量。其中,常见的AB实验方法可以包括随机分流(根据随机系数将用户随机地分配到实验组和对照组)、基于哈希的分流(根据用户的某个唯一标识(如用户ID)进行哈希运算,根据哈希值的范围来分配用户到不同的组)、分层抽样分流等。
但是,目前的AB实验方法会面临场景、用户人群、时间周期等因素复杂多变,导致不同推荐算法在不同条件下的效果可能存在较大差异。而且,目前的AB实验方法仅仅能够选取整体效果较好的推荐算法,无法保证所采用的推荐算法为各因素条件下的最优算法,且存在分组不完全均匀的风险,统计效果存在波动和偏差。
本申请实施例提供一种基于AB实验的视频推荐方法、系统、电子设备及存储介质,可以预先利用历史用户数据和历史实验数据对各个待训练的分流模型进行训练,得到各个分流模型,以便在接收到用户发送的线上推荐请求时,基于该线上推荐请求获取该用户的用户数据和实验数据,通过每个分流模型根据用户数据和实验数据预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对每个分流模型的视频推荐结果的用户偏好得分,同时还可以计算每个分流模型的模型胜率,以便根据每个分流模型的用户偏好得分和模型胜率,计算每个分流模型的视频推荐得分,最后可以根据各个分流模型的视频推荐得分确定各个分流模型之间的分流比例,以根据得到的分流比例向用户展示各个分流模型当前的视频推荐结果,可以根据实际情况动态调整各个分流模型的视频推荐结果的展示比例,能够解决目前的AB实验方法面临场景、用户人群、时间周期等因素复杂多变,导致不同推荐算法在不同条件下的效果可能存在较大差异的问题。并且,还可以解决目前的AB实验方法仅仅能够选取整体效果较好的推荐算法,无法保证所采用的推荐算法为各因素条件下的最优算法,且存在分组不完全均匀的风险,统计效果存在波动和偏差的问题。本申请提供的技术方案还可以实现不再以用户ID哈希分桶或者随机分桶等方式将不同用户分流到不同实验,而是对同一用户展示所有分流模型的视频推荐结果,因此本申请无需垂直正交等流量划分功能,仅需要实现不同分流模型的视频推荐结果以何种比例展示给用户。
参见图1,示出了本申请实施例提供的一种基于AB实验的视频推荐方法的流程示意图,该基于AB实验的视频推荐方法的过程具体包括以下步骤:
S101:当接收到用户发送的线上推荐请求时,基于线上推荐请求获取用户的用户数据和实验数据。
在本申请实施例中,可以预先搭建相应的AB视频平台,其中,AB视频平台包括数据层、服务层和展示层,如图2所示,数据层用于存储各个用户当前的用户数据和历史用户数据,以及各个分流模型对应的实验配置数据、当前的实验效果统计数据和历史实验效果统计数据;服务层用于实时检测并接收用户发送的线上推荐请求、流量分发和数据聚合,同时还可以实现每个分流模型的实验配置数据中的各个待训练的分流模型的参数设置(实验配置);展示层用于提供对应的操作页面配置,以及提供各种维度聚合的可视化效果报表(报表可视化)。
需要说明的是,用户数据可以包括用户曝光数据和用户基础属性数据,其中,用户曝光数据可以包括按照曝光时间排序的多个曝光视频,用户基础属性数据可以包括用户昵称、用户等级(普通用户、VIP用户、SVIP用户等等)等等;历史用户数据可以包括历史用户曝光数据和历史用户基础属性数据,历史用户曝光数据可以包括按照曝光时间排序的多个历史曝光视频,历史用户基础属性数据可以包括历史用户昵称、历史用户等级等等;实验效果统计数据可以包括各个实验交叉维度的曝光视频的点击率、转化率、观看时长等统计数据(例如某综艺视频A在B人群下的点击率、某电视剧视频D在C时间段的观看时长等等);实验配置数据包括每个分流模型相关的实验参数等数据。
还需要说明的是,多个曝光视频由各个分流模型的视频推荐结果中的各个推荐视频构成。
还需说明的是,实验交叉维度可以为视频与人群交叉、视频与时间段交叉等等,在词本申请实施例不加以限定。
在本申请实施例中,可以通过服务层实时检测当前是否存在用户发送的线上推荐请求,当检测到用户发送的线上推荐请求时,可以通过服务层接收到线上推荐请求,并基于该线上推荐请求中携带的用户唯一标识ID从数据层中获取该用户当前的用户数据和实验数据。其中,用户数据包括该用户的用户曝光数据和用户基础属性数据;实验数据包括上下文数据和实验效果统计数据。
需要说明的是,上下文数据包括每个曝光视频的上一下曝光视频的视频信息和下一个曝光视频的视频信息。
S102:加载预训练的各个分流模型,并通过分流模型根据用户数据和实验数据预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对分流模型的视频推荐结果的用户偏好得分;其中,分流模型是利用历史用户数据和历史实验数据对训练的分流模型进行训练得到。
在本申请实施例中,针对每个待训练的分流模型,可以预先利用历史用户数据和历史实验数据对待训练的分流模型进行训练得到相应的分流模型,并将得到各个分流模型存储至AB实验平台,以便在接收到线上推荐请求,并获取到对应的用户数据和实验数据后,调用服务层加载预先存储的各个分流模型,同时将用户数据和实验数据输入每个分流模型,使每个分流模型根据输入的用户数据和实验数据预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对分流模型的视频推荐结果的用户偏好得分。
需要说明的是,可以预先设置各个实验指标,其中,各个实验指标可以包括用户针对分流模型的视频推荐结果的点击率、转化率和观看时长等等,例如,各个实验指标的预估值可以为用户针对分流模型的视频推荐结果的点击率为80%、转化率70%和观看时长为两个小时,在此本申请实施例不加以限定。
参见图3,示出了本申请实施例提供一种分流模型的训练方法的流程示意图,该方法具体包括以下步骤:
S301:获取历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值;
在具体执行步骤S301的过程中,可以调用服务层从数据层中获取日志数据,并对获取到的日志数据进行数据清洗,以从进行数据清洗后的日志数据中提取历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值,最后将历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值输入每个待训练的分流模型;其中,历史用户数据包括历史用户曝光数据和历史用户基础属性数据,历史实验数据包括历史上下文数据、历史实验效果统计数据和每个待训练的分流模型的实验配置数据。
需要说明的是,历史用户曝光数据可以包括按照曝光时间排序的多个历史曝光视频,历史用户曝光数据可以包括按照曝光时间排序的多个历史曝光视频,历史用户基础属性数据可以包括历史用户昵称、历史用户等级等等;历史实验效果统计数据可以包括各个实验交叉维度的历史曝光视频的点击率、转化率、观看时长等统计数据;实验配置数据包括每个待训练的分流模型相关的实验参数等数据。
S302:将历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值输入每个待训练的分流模型。
在本申请实施例中,待训练的分流模型包括待训练的序列编码模块、待训练的隐藏层、待训练的特征拼接层、待训练的多层激活层和归一化指数函数,如图4所示。
在具体执行步骤S302的过程中,针对每个待训练的分流模型而言,可以将历史用户数据、历史上下文数据、历史实验效果统计数据和该待训练的分流模型的实验配置数据输入该待训练的分流模型中。
S303:通过待训练的序列编码模块根据用户数据的用户曝光数据生成一个一维的历史视频向量。
在本申请实施例中,通过待训练的序列编码模块将每个历史曝光视频转换成每个实验指标对应的历史视频特征向量,并按照每个实验指标对应的权重对每个实验指标对应的历史视频特征向量进行加权处理,得到每个实验指标对应的历史目标视频特征向量;从第二个历史曝光视频开始,依次将历史曝光视频的各个历史目标视频特征向量与其上一个历史曝光视频的历史激活数据进行pooling处理,并通过待训练的序列编码模块的激活单元对得到的处理结果进行激活得到历史激活数据,直至将最后一个历史曝光视频的各个历史目标视频特征向量与其上一个历史曝光视频的历史激活数据进行pooling处理,得到历史视频向量;其中,第一个历史曝光视频的历史激活数据是利用待训练的序列编码模块的激活单元对第一个历史曝光视频的各个历史目标视频特征向量进行激活得到的。
需要说明的是,各个实验指标可以包括点击率、转化率和观看时长,相应的各个实验指标的权重可以包括点击率的权重Wa、转化率的权重Wb和观看时长的权重Wc,可以根据实际应用设置每个实验指标对应的权重,在此本申请实施例不加以限定。
例如,参见图5,历史用户曝光视频包括按照曝光视频排序的n个历史光视频,可以通过待训练的序列编码模块将每个历史曝光视频转换成点击率、转化率和观看时长对应的历史视频特征向量;按照预先设置的点击率的权重Wa1对历史曝光视频V1的点击率的历史视频特征向量进行加权计算,得到历史目标视频特征向量V1,a,按照预先设置的转化率的权重Wb1对历史曝光视频V1的转化率的历史视频特征向量进行加权计算,得到历史目标视频特征向量V1,b,按照预先设置的观看时长的权重Wc1对历史曝光视频V1的观看时长的历史视频特征向量进行加权计算,得到历史目标视频特征向量V1,c,即得到一个三维向量(V1,a,V1,b,V1,c);.....;按照预先设置的点击率的权重Wan对历史曝光视频Vn的点击率的历史视频特征向量进行加权计算,得到历史目标视频特征向量Vn,a,按照预先设置的转化率的权重Wbn对历史曝光视频Vn的转化率的历史视频特征向量进行加权计算,得到历史目标视频特征向量Vn,b,按照预先设置的观看时长的权重Wcn对历史曝光视频Vn的观看时长的历史视频特征向量进行加权计算,得到历史目标视频特征向量Vn,c。
通过待训练的序列编码模块的激活单元将历史曝光视频V1的各个历史目标视频特征向量(V1,a,V1,b,V1,c)进行激活得到历史曝光视频V1的历史激活数据;将历史曝光视频V2的各个历史目标视频特征向量(V2,a,V2,b,V2,c)与历史曝光视频V1的历史激活数据进行pooling处理,并利用待训练的序列编码模块的激活单元对得到的处理结果进行激活得到历史曝光视频V2的历史激活数据;将历史曝光视频V3的各个历史目标视频特征向量(V3,a,V3,b,V3,c)与历史曝光视频V2的历史激活数据进行pooling处理,并利用待训练的序列编码模块的激活单元对得到的处理结果进行激活得到历史曝光视频V3的历史激活数据,如此循环处理,直至将历史曝光视频Vn的各个历史目标视频特征向量(V2,a,V2,b,V2,c)与历史曝光视频Vn-1的历史激活数据进行pooling处理,输出一个三维的视频向量,并将三维的视频向量进行降维处理,得到一个一维的历史视频向量。
S304:通过待训练的隐藏层对历史用户数据中的历史用户基础属性数据和历史实验数据进行平滑处理,并通过待训练的特征拼接层将历史视频向量和进行平滑处理后的历史用户基础属性数据和历史实验数据进行拼接,得到历史视频拼接特征。
在具体执行步骤S304的过程中,在将历史用户数据和历史实验数据输入待训练的分流模型后,通过待训练的序列编码模块根据历史用户数据中的历史用户曝光数据生成一个一维的历史视频向量同时,为了保证得到的各个实验指标的预测预估值的指标置信,可以通过待训练的隐藏层对历史用户数据中的历史用户基础属性数据、历史实验数据中的历史上下文数据、历史实验效果统计数据和实验配置数据进行平滑处理,并通过待训练的特征拼接层将历史视频向量和进行平滑处理后的历史用户基础属性数据、历史上下文数据、历史实验效果统计数据和实验配置数据进行拼接,得到相应的历史视频拼接特征。
S305:通过待训练的多层激活层对历史视频拼接特征进行处理,得到历史目标视频拼接特征。
S306:调用归一化指数函数根据历史目标视频拼接特征预估每个实验指标的预测预估值,并以各个实验指标的预测预估值趋近于对应的实际预估值为训练目标对待训练的分流模型的参数进行调整,直至待训练的分流模型达到收敛,得到相应的分流模型。
在具体执行步骤S306的过程中,在得到历史目标视频拼接特征后,待训练的分流模型可以调用相应的归一化指数函数根据历史目标视频拼接特征预估每个实验指标的预测预估值,并根据每个实验指标的预测预估值和每个实验指标的实际预估值构建相应的损失函数,以便利用构建的损失函数对待训练的分流模型中的待训练的序列编码模块、待训练的隐藏层、待训练的特征拼接层和待训练的多层激活层的参数进行调整,直至待训练的分流模型达到收敛,得到相应的分流模型。其中,分流模型包括序列编码模块、隐藏层、特征拼接层和多层激活层。
在本申请实施例中,在预先训练好各个分流模型后,可以将各个分流模型存储值AB实验平台中,以便在获取到对应的用户数据和实验数据后,调用服务层加载预先存储的各个分流模型;针对每个分流模型而言,将用户数据和实验数据输入至分流模型中,使分流模型根据用户曝光数据生成一个一维的视频向量,并对用户数据中的用户基础数据和实验数据进行平滑处理,以便将视频向量和进行平滑处理后的用户基础数据和实验数据进行拼接,得到视频拼接向量,最后根据视频拼接向量确定每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对该分流模型的视频推荐结果的用户偏好得分。
可选的,通过分流模型根据用户数据和实验数据预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对分流模型的视频推荐结果的用户偏好得分的过程可以为:通过序列编码模块将每个曝光视频转化成多个视频特征向量,并根据每个曝光视频的各个视频特征向量生成一个一维的视频向量;其中,用户数据包括用户曝光数据和用户基础属性数据,用户曝光数据包括按照曝光时间排序的多个曝光视频;通过隐藏层对用户基础属性数据、上下文数据、实验效果统计数据和实验配置数据进行平滑处理,并通过特征拼接层将视频向量和进行平滑处理后的用户基础属性数据、上下文数据、实验效果统计数据和实验配置数据进行拼接,得到视频拼接特征;通过多层激活层对视频拼接特征进行处理,得到目标视频拼接特征,并根据目标视频拼接特征预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对分流模型的视频推荐结果的用户偏好得分。
可选的,通过序列编码模块将每个曝光视频转化成多个视频特征向量,并根据每个曝光视频的各个视频特征向量生成一个一维的视频向量的过程可以为:通过序列编码模块将每个曝光视频转换成多个视频特征向量,并对每个视频特征向量进行加权处理,得到每个曝光视频对应的多个目标视频特征向量;通过序列编码模块依次将除第一个曝光视频以外的曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,并利用激活单元对得到的处理结果进行激活得到激活数据,直至将最后一个曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,得到视频向量;其中,第一个曝光视频的激活数据是利用激活单元对第一个曝光视频的各个目标视频特征向量进行激活得到的。
在实际应用过程中,通过序列编码模块将每个曝光视频转换成每个实验指标对应的视频特征向量,并按照每个实验指标对应的权重对每个实验指标对应的视频特征向量进行加权计算,得到每个实验指标对应的目标视频特征向量;从第二个曝光视频开始,依次将曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,并通过序列编码模块的激活单元对得到的处理结果进行激活得到激活数据,如此循环处理,直至将最后一个曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,得到一个三维的视频向量,并将三维的视频向量进行降维处理,得到一个一维的视频向量;其中,第一个曝光视频的激活数据是序列编码模块利用对应的激活单元对第一个曝光视频的各个目标视频特征向量进行激活得到的。
通过隐藏层对用户基础属性数据、上下文数据、实验效果统计数据和实验配置数据进行平滑处理,并通过特征拼接层将视频向量和进行平滑处理后的用户基础属性数据、上下文数据、实验效果统计数据和实验配置数据进行拼接,得到视频拼接特征;通过述多层激活层对视频拼接特征进行处理,得到目标视频拼接特征,并调用分流模型的归一化指标很熟根据目标视频拼接特征预估每个实验指标的预估值,最后根据各个实验指标的预估值确定用户针对分流模型的视频推荐结果的用户偏好得分。
可选的,调用归一化指标函数根据目标视频拼接特征预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对分流模型的视频推荐结果的用户偏好得分的过程可以为:调用归一化指标函数根据目标视频拼接特征预估每个实验指标的预估值,并根据实验指标的预估值及其权重计算每个实验指标的偏好得分,根据各个实验指标的偏好得分计算用户针对分流模型的视频推荐结果的用户偏好得分。
在实际应用过程中,调用归一化指标函数根据目标视频拼接特征预估每个实验指标的预估值,并计算实验指标的预估值及其权重的乘积,得到每个实验指标的偏好得分,最后将各个实验指标的偏好得分进行加和运算,得到用户针对分流模型的视频推荐结果的用户偏好得分。其中,用户针对分流模型的视频推荐结果的用户偏好得分的计算过程如公式(1)所示。
(1)
其中,为用户针对分流模型A的视频推荐结果的用户偏好得分,i为实验指标,n
为各个实验指标的总数量,为分流模型A中的实验指标i的权重,为通过分流
模型A得到的实验指标i的预估值。例如,n等于3,即包括点击率、转化率和观看时长3个实验
指标,那么可以为分流模型A中的点击率的权重,可以为分流模型A中转化率
的权重,可以为分流模型A中的观看时长的权重。
需要说明的是,针对每个实验指标而言,该实验指标在每个分流模型中的权重可以相同,也可以不同。
还需要说明的是,分流模型的用户偏好得分可以表示分流模型在当前条件下用户的偏好程度。
S103:针对每个分流模型,统计分流模型的视频推荐结果的被选择次数,并根据被选择次数确定分流模型的模型胜率。
在具体执行步骤S103的过程中,可以预先设置相应的模型总交互次数,进而可以统计用户选择每个分流模型的视频推荐结果的次数,即统计每个分流模型的视频推荐结果的被选择次数,并将模型总交互次数除以每个分流模型的视频推荐结果的被选择次数,得到每个分流模型的模型胜率,其中,每个分流模型的模型胜率的计算方式如公式(2)所示。
(2)
其中,为分流模型A的模型胜率,为分流模型A的视频推荐结果的被选择次
数,N为预先设置的模型总交互次数。
需要说明的是,模型总交互次数可以包括每个实验指标下的交互总次数,例如,模型总交互次数可以包括点击总次数、转化总次数和观看总次数;分流模型的被选择次数可以包括分流模型的视频推荐结果被点击的次数、被转化的次数和被观看的次数。
还需要说明的是,分流模型的模型胜率可以表示分流模型在历史上总体的表现。
S104:根据每个分流模型的用户偏好得分和模型胜率,计算每个分流模型的视频推荐得分,并根据各个分流模型的视频推荐得分确定各个分流模型之间的分流比例。
在具体执行步骤S104的过程中,可以预先设置相应的用户偏好得分权重和模型胜率权重,在得到每个分流模型的用户偏好得分和模型胜率之后,针对每个分流模型而言,可以计算该分流模型的用户偏好得分与其用户偏好得分权重的乘积和模型胜率与其模型胜率权重的乘积,并将用户偏好得分与其用户偏好得分权重的乘积和模型胜率与其模型胜率权重的乘积进行加和运算,得到分流模型的视频推荐得分,最后根据各个分流模型的视频推荐得分确定各个分流模型之间的分流比例。其中,分流模型的视频推荐得分的计算方式如公式(3)所示。
(3)
其中,S为视频推荐得分,为用户偏好得分权重,为模型胜率权重,为用户
偏好得分,为模型胜率。
S105:按照分流比例向用户展示各个分流模型当前的视频推荐结果。
在具体执行步骤S105的过程中,在得到各个分流模型之间的分流比例后,可以根据分流比例分配各个分流模型的视频推荐结果的推荐结果占比,以便按照各个分流模型的推荐结果占比来向用户展示各个分流模型当前的视频推荐结果,同时还可以根据各个分流模型的推荐结果占比生成对应的可视化效果报表,并通过展示层提供的页面展示对应的可视化效果报表。
本申请实施例提供一种基于AB实验的视频推荐方法,可以预先利用历史用户数据和历史实验数据对各个待训练的分流模型进行训练,得到各个分流模型,以便在接收到用户发送的线上推荐请求时,基于该线上推荐请求获取该用户的用户数据和实验数据,通过每个分流模型根据用户数据和实验数据预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对每个分流模型的视频推荐结果的用户偏好得分,同时还可以计算每个分流模型的模型胜率,以便根据每个分流模型的用户偏好得分和模型胜率,计算每个分流模型的视频推荐得分,最后可以根据各个分流模型的视频推荐得分确定各个分流模型之间的分流比例,以根据得到的分流比例向用户展示各个分流模型当前的视频推荐结果。由此可见,本申请提供技术方案无需保证每个分流模型的用户分布均匀,也不用进行长期的实验效果观察统计,不仅可以缩短效果回收周期,避免效果存在波动,还能够避免不同分流模型的效果受到时间周期、用户人群和用户情趣变化等因素的影响。
基于上述本申请实施例提供的基于AB实验的视频推荐方法,相应的,本申请实施例还提供了一种基于AB实验的视频推荐系统,如图6所示,该基于AB实验的视频推荐系统,包括:
第一获取单元61,用于当接收到用户发送的线上推荐请求时,基于线上推荐请求获取用户的用户数据和实验数据;
用户偏好得分确定单元62,用于加载预训练的各个分流模型,并通过分流模型根据用户数据和实验数据预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对分流模型的视频推荐结果的用户偏好得分;其中,分流模型是训练单元利用历史用户数据和历史实验数据对待训练的分流模型进行训练得到;
模型胜率确定单元63,用于针对每个分流模型,统计分流模型的视频推荐结果的被选择次数,并根据被选择次数确定分流模型的模型胜率;
分流比例确定单元64,用于根据每个分流模型的用户偏好得分和模型胜率,计算每个分流模型的视频推荐得分,并根据各个分流模型的视频推荐得分确定各个分流模型之间的分流比例;
视频推荐单元65,用于按照分流比例向用户展示各个分流模型当前的视频推荐结果。
上述本申请实施例公开的基于AB实验的视频推荐系统中各个单元具体的原理和执行过程,与上述本申请实施例公开的基于AB实验的视频推荐方法相同,可参见上述本申请实施例公开的基于AB实验的视频推荐方法中相应的部分,这里不再进行赘述。
本申请实施例提供一种基于AB实验的视频推荐系统,可以预先利用历史用户数据和历史实验数据对各个待训练的分流模型进行训练,得到各个分流模型,以便在接收到用户发送的线上推荐请求时,基于该线上推荐请求获取该用户的用户数据和实验数据,通过每个分流模型根据用户数据和实验数据预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对每个分流模型的视频推荐结果的用户偏好得分,同时还可以计算每个分流模型的模型胜率,以便根据每个分流模型的用户偏好得分和模型胜率,计算每个分流模型的视频推荐得分,最后可以根据各个分流模型的视频推荐得分确定各个分流模型之间的分流比例,以根据得到的分流比例向用户展示各个分流模型当前的视频推荐结果。由此可见,本申请提供技术方案无需保证每个分流模型的用户分布均匀,也不用进行长期的实验效果观察统计,不仅可以缩短效果回收周期,避免效果存在波动,还能够避免不同分流模型的效果受到时间周期、用户人群和用户情趣变化等因素的影响。
可选的,用户偏好得分确定单元,包括:
第一输入单元,用于加载预训练的各个分流模型,并将用户数据和实验数据输入至每个分流模型;其中,分流模型包括序列编码模块、隐藏层、特征拼接层和多层激活层;
视频向量生成单元,用于通过序列编码模块将每个曝光视频转化成多个视频特征向量,并根据每个曝光视频的各个视频特征向量生成一个一维的视频向量;其中,用户数据包括用户曝光数据和用户基础属性数据,用户曝光数据包括按照曝光时间排序的多个曝光视频;
第一特征拼接单元,用于通过隐藏层对用户基础属性数据、上下文数据和实验效果统计数据进行平滑处理,并通过特征拼接层将视频向量和进行平滑处理后的用户基础属性数据、上下文数据和实验效果统计数据进行拼接,得到视频拼接特征;
第二处理单元,用于通过多层激活层对视频拼接特征进行处理,得到目标视频拼接特征;
预估单元,用于调用归一化指标函数根据目标视频拼接特征预估每个实验指标的预估值,并根据各个实验指标的预估值确定用户针对分流模型的视频推荐结果的用户偏好得分。
可选的,视频向量生成单元,包括:
加权处理单元,用于通过序列编码模块将每个曝光视频转换成多个视频特征向量,并对每个视频特征向量进行加权处理,得到每个曝光视频对应的多个目标视频特征向量;
视频向量生成子单元,用于通过序列编码模块依次将除第一个曝光视频以外的曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,并利用激活单元对得到的处理结果进行激活得到激活数据,直至将最后一个曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,得到视频向量;其中,第一个曝光视频的激活数据是利用激活单元对第一个曝光视频的各个目标视频特征向量进行激活得到的。
可选的,预估单元,包括:
预估子单元,用于调用归一化指标函数根据目标视频拼接特征预估每个实验指标的预估值,并根据实验指标的预估值及其权重计算每个实验指标的偏好得分,根据各个实验指标的偏好得分计算用户针对分流模型的视频推荐结果的用户偏好得分。
可选的,训练单元,包括:
第二获取单元,用于获取历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值;
第二输入单元,用于将历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值输入每个待训练的分流模型;
历史视频向量生成单元,用于通过待训练的序列编码模块根据用户数据的用户曝光数据生成一个一维的历史视频向量;
第二特征拼接单元,用于通过待训练的隐藏层对历史用户数据中的历史用户基础属性数据和历史实验数据进行平滑处理,并通过待训练的特征拼接层将历史视频向量和进行平滑处理后的历史用户基础属性数据和历史实验数据进行拼接,得到历史视频拼接特征;
第二特征拼接单元,用于通过待训练的多层激活层对历史视频拼接特征进行处理,得到历史目标视频拼接特征;
训练子单元,用于调用归一化指数函数根据历史目标视频拼接特征预估每个实验指标的预测预估值,并以各个实验指标的预测预估值趋近于对应的实际预估值为训练目标对待训练的分流模型的参数进行调整,直至待训练的分流模型达到收敛,得到相应的分流模型。
本申请还提供了一种存储介质,该存储介质内存储有程序指令,该程序指令被处理器加载并执行时实现上述任意一种基于AB实验的视频推荐方法实施例。
本申请还提供了一种电子设备,如图7所示,该电子设备包括处理器701和存储器702,处理器和存储器通过通信总线相连;所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现上述任意一种基于AB实验的视频推荐方法。
本申请的处理器可以是终端的CPU,或者,是终端内集成的MCU,或者,还可以是CPU和MCU的结合。而且,处理器中包含内核,由内核取存储器中调取相应的程序,内核可以设置一个或以上。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于AB实验的视频推荐方法,其特征在于,所述方法包括:
当接收到用户发送的线上推荐请求时,基于所述线上推荐请求获取所述用户的用户数据和实验数据;
加载预训练的各个分流模型,并通过所述分流模型根据所述用户数据和所述实验数据预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分;其中,所述分流模型是利用历史用户数据和历史实验数据对待训练的分流模型进行训练得到;
针对每个所述分流模型,统计所述分流模型的视频推荐结果的被选择次数,并根据所述被选择次数确定所述分流模型的模型胜率;
根据每个所述分流模型的用户偏好得分和模型胜率,计算每个所述分流模型的视频推荐得分,并根据各个所述分流模型的视频推荐得分确定各个所述分流模型之间的分流比例;
按照所述分流比例向所述用户展示各个所述分流模型当前的视频推荐结果。
2.根据权利要求1所述的方法,其特征在于,所述加载预训练的各个分流模型,并通过所述分流模型根据所述用户数据和所述实验数据预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分,包括:
加载预训练的各个分流模型,并将所述用户数据和所述实验数据输入至每个所述分流模型;其中,所述分流模型包括序列编码模块、隐藏层、特征拼接层和多层激活层;
通过所述序列编码模块将每个曝光视频转化成多个视频特征向量,并根据每个所述曝光视频的各个视频特征向量生成一个一维的视频向量;其中,所述用户数据包括用户曝光数据和用户基础属性数据,所述用户曝光数据包括按照曝光时间排序的多个曝光视频;
通过所述隐藏层对所述用户基础属性数据、上下文数据和实验效果统计数据进行平滑处理,并通过所述特征拼接层将所述视频向量和进行平滑处理后的用户基础属性数据、上下文数据和实验效果统计数据进行拼接,得到视频拼接特征;
通过所述多层激活层对所述视频拼接特征进行处理,得到目标视频拼接特征;
调用归一化指标函数根据所述目标视频拼接特征预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分。
3.根据权利要求2所述的方法,其特征在于,所述通过所述序列编码模块将每个曝光视频转化成多个视频特征向量,并根据每个所述曝光视频的各个视频特征向量生成一个一维的视频向量,包括:
通过所述序列编码模块将每个所述曝光视频转换成多个视频特征向量,并对每个所述视频特征向量进行加权处理,得到每个曝光视频对应的多个目标视频特征向量;
通过所述序列编码模块依次将除第一个曝光视频以外的曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,并利用激活单元对得到的处理结果进行激活得到激活数据,直至将最后一个曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,得到视频向量;其中,第一个曝光视频的激活数据是利用所述激活单元对第一个曝光视频的各个目标视频特征向量进行激活得到的。
4.根据权利要求2所述的方法,其特征在于,所述调用归一化指标函数根据所述目标视频拼接特征预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分,包括:
调用归一化指标函数根据所述目标视频拼接特征预估每个实验指标的预估值,并根据实验指标的预估值及其权重计算每个实验指标的偏好得分,根据各个实验指标的偏好得分计算用户针对所述分流模型的视频推荐结果的用户偏好得分。
5.根据权利要求1所述的方法,其特征在于,所述利用历史用户数据和历史实验数据对训练的分流模型进行训练,得到所述分流模型,包括:
获取历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值;
将历史用户数据、历史实验数据和历史用户针对每个待训练的分流模型的视频推荐结果的各个实验指标的实际预估值输入每个待训练的分流模型;
通过所述待训练的序列编码模块根据所述用户数据的用户曝光数据生成一个一维的历史视频向量;
通过所述待训练的隐藏层对所述历史用户数据中的历史用户基础属性数据和所述历史实验数据进行平滑处理,并通过所述待训练的特征拼接层将所述历史视频向量和进行平滑处理后的历史用户基础属性数据和历史实验数据进行拼接,得到历史视频拼接特征;
通过所述待训练的多层激活层对所述历史视频拼接特征进行处理,得到历史目标视频拼接特征;
调用归一化指数函数根据所述历史目标视频拼接特征预估每个实验指标的预测预估值,并以各个实验指标的预测预估值趋近于对应的实际预估值为训练目标对所述待训练的分流模型的参数进行调整,直至所述待训练的分流模型达到收敛,得到相应的分流模型。
6.一种基于AB实验的视频推荐系统,其特征在于,所述系统包括:
第一获取单元,用于当接收到用户发送的线上推荐请求时,基于所述线上推荐请求获取所述用户的用户数据和实验数据;
用户偏好得分确定单元,用于加载预训练的各个分流模型,并通过所述分流模型根据所述用户数据和所述实验数据预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分;其中,所述分流模型是训练单元利用历史用户数据和历史实验数据对待训练的分流模型进行训练得到;
模型胜率确定单元,用于针对每个所述分流模型,统计所述分流模型的视频推荐结果的被选择次数,并根据所述被选择次数确定所述分流模型的模型胜率;
分流比例确定单元,用于根据每个所述分流模型的用户偏好得分和模型胜率,计算每个所述分流模型的视频推荐得分,并根据各个所述分流模型的视频推荐得分确定各个所述分流模型之间的分流比例;
视频推荐单元,用于按照所述分流比例向所述用户展示各个所述分流模型当前的视频推荐结果。
7.根据权利要求6所述的系统,其特征在于,所述用户偏好得分确定单元,包括:
第一输入单元,用于加载预训练的各个分流模型,并将所述用户数据和所述实验数据输入至每个所述分流模型;其中,所述分流模型包括序列编码模块、隐藏层、特征拼接层和多层激活层;
视频向量生成单元,用于通过所述序列编码模块将每个曝光视频转化成多个视频特征向量,并根据每个所述曝光视频的各个视频特征向量生成一个一维的视频向量;其中,所述用户数据包括用户曝光数据和用户基础属性数据,所述用户曝光数据包括按照曝光时间排序的多个曝光视频;
第一特征拼接单元,用于通过所述隐藏层对所述用户基础属性数据、上下文数据和实验效果统计数据进行平滑处理,并通过所述特征拼接层将所述视频向量和进行平滑处理后的用户基础属性数据、上下文数据和实验效果统计数据进行拼接,得到视频拼接特征;
第二处理单元,用于通过所述多层激活层对所述视频拼接特征进行处理,得到目标视频拼接特征;
预估单元,用于调用归一化指标函数根据所述目标视频拼接特征预估每个实验指标的预估值,并根据各个所述实验指标的预估值确定所述用户针对所述分流模型的视频推荐结果的用户偏好得分。
8.根据权利要求7所述的系统,其特征在于,所述视频向量生成单元,包括:
加权处理单元,用于通过所述序列编码模块将每个所述曝光视频转换成多个视频特征向量,并对每个所述视频特征向量进行加权处理,得到每个曝光视频对应的多个目标视频特征向量;
视频向量生成子单元,用于通过所述序列编码模块依次将除第一个曝光视频以外的曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,并利用激活单元对得到的处理结果进行激活得到激活数据,直至将最后一个曝光视频的各个目标视频特征向量与其上一个曝光视频的激活数据进行pooling处理,得到视频向量;其中,第一个曝光视频的激活数据是利用所述激活单元对第一个曝光视频的各个目标视频特征向量进行激活得到的。
9.一种电子设备,其特征在于,包括:处理器以及存储器,所述处理器以及存储器通过通信总线相连;其中,所述处理器,用于调用并执行所述存储器中存储的程序;所述存储器,用于存储程序,所述程序用于实现如权利要求1-5任一项所述的基于AB实验的视频推荐方法。
10.一种存储介质,其特征在于,所述存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1-5任一项所述的基于AB实验的视频推荐方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202510279065.2A CN120144822A (zh) | 2025-03-10 | 2025-03-10 | 基于ab实验的视频推荐方法、系统、电子设备及存储介质 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202510279065.2A CN120144822A (zh) | 2025-03-10 | 2025-03-10 | 基于ab实验的视频推荐方法、系统、电子设备及存储介质 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN120144822A true CN120144822A (zh) | 2025-06-13 |
Family
ID=95960497
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202510279065.2A Pending CN120144822A (zh) | 2025-03-10 | 2025-03-10 | 基于ab实验的视频推荐方法、系统、电子设备及存储介质 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN120144822A (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN120343362A (zh) * | 2025-06-23 | 2025-07-18 | 杭州物我无尽信息科技有限公司 | 一种算法信息可视化交互方法及系统 |
-
2025
- 2025-03-10 CN CN202510279065.2A patent/CN120144822A/zh active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN120343362A (zh) * | 2025-06-23 | 2025-07-18 | 杭州物我无尽信息科技有限公司 | 一种算法信息可视化交互方法及系统 |
| CN120343362B (zh) * | 2025-06-23 | 2025-09-05 | 杭州物我无尽信息科技有限公司 | 一种算法信息可视化交互方法及系统 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7443486B2 (ja) | コンテンツアイテムの推奨 | |
| CN111898578B (zh) | 人群密度的获取方法、装置、电子设备 | |
| CN108319974B (zh) | 数据处理方法、装置、存储介质和电子装置 | |
| JP2021533474A (ja) | ノード分類方法、モデル訓練方法並びに、その装置、機器及びコンピュータプログラム | |
| WO2020094060A1 (zh) | 推荐方法及装置 | |
| CN109902708A (zh) | 一种推荐模型训练方法及相关装置 | |
| CN120144822A (zh) | 基于ab实验的视频推荐方法、系统、电子设备及存储介质 | |
| CN106228386A (zh) | 一种信息推送方法及装置 | |
| CN110008397B (zh) | 一种推荐模型训练方法及装置 | |
| US11514368B2 (en) | Methods, apparatuses, and computing devices for trainings of learning models | |
| CN108322317A (zh) | 一种账号识别关联方法及服务器 | |
| CN113535991B (zh) | 一种多媒体资源推荐方法、装置、电子设备及存储介质 | |
| CN109558514A (zh) | 视频推荐方法、其装置、信息处理设备及存储介质 | |
| CN112100221A (zh) | 一种资讯推荐方法、装置、推荐服务器及存储介质 | |
| CN113962965A (zh) | 图像质量评价方法、装置、设备以及存储介质 | |
| CN110889759A (zh) | 信用数据的确定方法、装置及存储介质 | |
| CN113362852B (zh) | 一种用户属性识别方法和装置 | |
| CN108595526A (zh) | 资源推荐方法及装置 | |
| CN111770353A (zh) | 一种直播监控方法、装置、电子设备及存储介质 | |
| CN113222073A (zh) | 训练迁移学习模型和推荐模型的方法及装置 | |
| CN113850669A (zh) | 用户分群方法、装置、计算机设备及计算机可读存储介质 | |
| US20160132771A1 (en) | Application Complexity Computation | |
| CN116861092A (zh) | 一种基于深度学习模型的推荐方法、装置和设备 | |
| CN112817563B (zh) | 目标属性配置信息确定方法、计算机设备和存储介质 | |
| US11179631B2 (en) | Providing video game content to an online connected game |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination |