乐鱼体育官方网站基于用户举止的数据合系门径与流程
时间:2024-03-06浏览次数:
 本创造涉及盘算推算机范畴,越发涉及一种数据合系本事,简直来说便是一种基于用户作为的数据合系本事。  跟着电子购物平台及其联系新闻手艺的飞速繁荣,电子搜集购物已成为人们生存中不行或缺的构成片面。然而搜集中新闻资源的数目大大胜过了人们的管制才能,“搜集新闻过载”题目日趋紧张。因而,新兴电子购物搜集正在方便人们普通生存的同时,也对现有新闻检索、天性化引荐办事、精准营销等数据合系题目带来了强壮的机会和

  本创造涉及盘算推算机范畴,越发涉及一种数据合系本事,简直来说便是一种基于用户作为的数据合系本事。

  跟着电子购物平台及其联系新闻手艺的飞速繁荣,电子搜集购物已成为人们生存中不行或缺的构成片面。然而搜集中新闻资源的数目大大胜过了人们的管制才能,“搜集新闻过载”题目日趋紧张。因而,新兴电子购物搜集正在方便人们普通生存的同时,也对现有新闻检索、天性化引荐办事、精准营销等数据合系题目带来了强壮的机会和寻事。因而,为知足用户越来越高的新闻办事央求,向用户精准推送感有趣数据项方针数据合系手艺应运而生,并惹起了邦外里学者和用户的寻常合怀。然而,现罕有据合系本事存正在数据稀少、数据合系冷启动、精准度不上等缺陷。

  现有手艺中,可将数据合系本事归结成三个紧要种别:基于实质的数据合系本事、协同过滤数据合系本事和混淆数据合系本事。个中,基于实质的数据合系本事从实质角度开采用户新闻需求与数据对象的合系,通太甚量用户模子与数据项模子的好似性来告竣对备选数据项的合系预测;但因为其没有饱满行使用户群体学问,导致其合系的数据项目与用户模子耦合渡过于周密,无法发明用户的潜正在新闻需求,很难告竣具有必然联念功效的数据合系办事。协同过滤数据合系本事的操纵前景则特别寻常,其基于群体学问举行数据合系,即有趣和偏好好似的用户之间可能共享各自的新闻体验,通过发明与用户有趣好似的邻人用户,并将邻人用户感有趣的数据项与主意用户举行合系;但实质操纵中,协同过滤数据合系本事也存正在着少许其难以制胜的题目或缺陷,比如:当用户无任何数据合系史书,该模子则无法对该新用户的有趣偏幸举行筑模;与此相对应的便是新数据项题目,当崭露新的数据项时,很少乃至没有效户与其产生过合系,进而导致合系算法无法告竣好似度盘算推算和合系度预测。如上所述,基于实质的数据合系本事和协同过滤数据合系本事都是通过简单的、各纷歧样的合系政策来告竣新闻与用户的合系办事,其优缺欠各有差别。基于此,本范畴手艺职员提出并试验将上述两种合系本事通过差别时势举行组合,进而也就酿成了基于众种合系政策和机制的混淆数据合系本事,然而试验阐明混淆数据合系本事仍存正在数据稀少、数据合系冷启动、精准度不上等不敷。

  因而,本范畴手艺职员亟待研发出一种可能适宜于新用户、新数据项,配合精准度高,而且可能发明用户潜正在新闻需求的数据合系本事。

  有鉴于此,本创造要处置的手艺题目正在于供给一种基于用户作为的数据合系本事及装配,处置了现罕有据合系本事存正在数据稀少、数据合系冷启动、配合精准度不上等题目。

  为体会决上述手艺题目,本创造的简直履行格式供给一种基于用户作为的数据合系本事,包罗:获取网站上的用户根本新闻、用户史书作为数据聚积和待合系数据聚积;依照所述用户根本新闻和所述用户史书作为数据聚积修筑用户间联系机合图;依照所述用户间联系机合图怀抱用户正在差别核心下的巨头度;将所述巨头度与所述待合系数据聚积举行协调管制得到数据干系结果。

  依照本创造的上述简直履行格式可知,基于用户作为的数据合系本事起码具有以下有益成效或特征:深化理解用户的史书作为数据,修筑用户有趣画像模子;通过对众个用户间差别核心下的合系度理解,修筑可精准描摹用户间联系谱系机合的面向核心的加权搜集拓扑机合;集合加权搜集拓扑机合与用户间史书作为数据的合系性,提出Urank算法,用以盘算推算用户正在众个差别核心下的巨头度与影响力,进而提拔基于用户作为的数据合系精准度,可能适宜于新用户、新数据项,而且可能发明用户的潜正在新闻需求,抬高用户体验度。

  应体会的是,上述平常描摹及以下简直履行格式仅为示例性及阐释性的,其并不行节制本创造所欲办法的周围。

  下面的所附附图是本创造的仿单的一片面,其绘示了本创造的示例履行例,所附附图与仿单的描摹沿途用来解说本创造的道理。

  图1为本创造简直履行格式供给的一种基于用户作为的数据合系本事的履行例一的流程图;

  图2为本创造简直履行格式供给的一种基于用户作为的数据合系本事的履行例二的流程图;

  图3为本创造简直履行格式供给的一种基于用户作为的数据合系本事的履行例三的流程图;

  图4为本创造简直履行格式供给的一种基于用户作为的数据合系体系的示意框图;

  图5为本创造简直履行格式供给的一种简直用户间面向差别核心维度的合系度评估图模子;

  图6为本创造简直履行格式供给的一种面向差别核心维度的用户影响力盘算推算示图谋。

  为使本创造履行例的方针、手艺计划和益处特别真切领略,下面将以附图及精细阐述真切解说本创造所揭示实质的精神,任何所属手艺范畴手艺职员正在体会本创造实质的履行例后,当可由本创造实质所教示的手艺,加以蜕化及装扮,其并不摆脱本创造实质的精神与周围。

  本创造的示意性履行例及其解说用于证明本创造,但并不成动对本创造的限度。其余,正在附图及履行格式中所应用一样或犹如标号的元件/构件是用来代外一样或犹如片面。

  合于本文中所应用的“第一”、“第二”、…等,并非异常指称秩序或顺位的兴味,也非用以限度本创造,其仅为了区别以一样手艺用语描摹的元件或操作。

  合于本文中所应用的宗旨用语,比如:上、下、左、右、前或后等,仅是参考附图的宗旨。因而,应用的宗旨用语是用来解说并非用来节制本创作。

  合于本文中所应用的“包括”、“包罗”、“具有”、“含有”等等,均为盛开性的用语,即意指包括但不限于。

  合于本文中所应用的用语“大致”、“约”等,用以装扮任何可能微蜕化的数目或差错,但这些微蜕化或差错并不会蜕化其本色。平常而言,此类用语所装扮的微蜕化或差错的周围正在片面履行例中可为20%,正在片面履行例中可为10%,正在片面履行例中可为5%或是其他数值。本范畴手艺职员该当体会,前述提及的数值可依实质需求而调治,并不以此为限。

  某些用以描摹本申请的用词将于下或正在此仿单的别处争论,以供给本范畴手艺职员正在相合本申请的描摹上特别的启发。

  图1为本创造简直履行格式供给的一种基于用户作为的数据合系本事的履行例一的流程图,如图1所示,行使网站上的用户根本新闻和用户史书作为数据聚积修筑用户间联系机合图,再依照用户间联系机合图怀抱用户正在差别核心下的巨头度,从而将巨头度与待合系数据聚积举行协调管制得到数据干系结果。

  环节101:获取网站上的用户根本新闻、用户史书作为数据聚积和待合系数据聚积。个中,用户根本新闻包罗:春秋、性别、职业、所正在都邑、有趣喜欢等;用户史书作为数据聚积包罗用户史书添置作为、用户电子商务网站浏览与评论作为等;待合系数据聚积为电子商务网站商品集(或电子商务网站商品子集)。

  环节102:依照所述用户根本新闻和所述用户史书作为数据聚积修筑用户间联系机合图。用户间联系机合图为面向核心维度的合系度评估图模子。基于所修筑的用户间联系机合图,可能有用盘算推算客户差别核心维度下的巨头度,以提拔数据合系成效。

  环节103:依照所述用户间联系机合图怀抱用户正在差别核心下的巨头度。行使URank算法依照用户间联系机合图怀抱用户正在差别核心下的巨头度。

  环节104:将所述巨头度与所述待合系数据聚积举行协调管制得到数据干系结果。

  参睹图1,深化理解用户的史书作为数据,修筑用户有趣画像模子;通过对众个用户间差别核心下的合系度理解,修筑可精准描摹用户间联系谱系机合的面向核心的加权搜集拓扑机合;集合加权搜集拓扑机合与用户间史书作为数据的合系性,提出Urank算法,用以盘算推算用户正在众个差别核心下的巨头度与影响力,进而提拔基于用户作为的数据合系精准度,可能适宜于新用户、新数据项,而且可能发明用户的潜正在新闻需求,抬高用户体验度。

  图2为本创造简直履行格式供给的一种基于用户作为的数据合系本事的履行例二的流程图,如图2所示,依照用户根本新闻和用户史书作为数据聚积举行用户有趣画像。用户有趣画像最终用于数据合系度盘算推算模块。

  环节101-1:依照所述用户根本新闻和所述用户史书作为数据聚积举行用户有趣画像。

  参睹图2,用户史书作为数据聚积较好地折射出用户的有趣喜欢,用户史书作为数据聚积中的某些数据也极好地反响了用户的片面偏好和侧中心,再集合用户根本新闻和待合系数据聚积举行用户有趣画像,从而可能精准响应用户的有趣喜欢。

  图3为本创造简直履行格式供给的一种基于用户作为的数据合系本事的履行例三的流程图,如图3所示,依照用户根本新闻、用户史书作为数据聚积和待合系数据聚积举行用户有趣画像;依照用户根本新闻和用户史书作为数据聚积修筑用户间联系机合图;依照用户间联系机合图怀抱用户正在差别核心下的巨头度。

  环节101-11:依照所述用户根本新闻中的简直用户uk确定该简直用户uk对应的史书作为数据聚积V。

  环节101-12:盘算推算所述待合系数据聚积中的待合系数据项vh与史书作为数据聚积V之间的好似度。

  环节101-13:依照所述好似度得到简直用户uk看待合系数据项vh的有趣度I(vh,uk)。

  个中,t为某一简直好似度盘算推算维度;T为好似度盘算推算维度总数;wt为维度权重因子;vo为用户史书作为数据项;μt(vo,uk)为简直用户uk对其史书作为数据项vo的有趣偏好;St(vh,vo)为待合系数据项vh与用户史书作为数据项vo正在好似度盘算推算维度t下的好似性。

  环节1021:依照所述用户根本新闻获取简直用户ui和简直用户uj之间的根本新闻好似度S(ij)。

  环节1022:依照所述根本新闻好似度S(ij)获取简直用户ui和简直用户uj正在特定核心维度Al下的合系度Tl(ij)。

  环节1023:获取简直用户ui的史书作为数据聚积和简直用户uj的史书作为数据聚积正在特定核心维度Al下的合系周密水准

  环节1024:依照所述合系度Tl(ij)和所述合系周密水准修筑用户间联系机合图。

  个中,为对应根本新闻项的好似度,P为片面根本新闻的条款数;假设片面根本新闻条款中的第p条属性是离散型的(如,性别等),当且仅当简直用户ui和简直用户uj具有一样的属性值时,将设定为1,不然将树立成为0;看待一连型变量(如,春秋、身上等),的取值如下:

  环节1032:对每个核心维度下的加权搜集模子运转URank算法,盘算推算该核心维度下用户的巨头度。

  个中,PlN为模范化的迁徙概率矩阵;β为阻尼因数,用于保障撒布概率的坚固性;El为匀称隐形传态矢量。

  个中,为从简直用户ui随机冲浪到简直用户uj的迁徙概率;为从简直用户ui随机冲浪到其它简直用户的迁徙概率之和,其值为1;k为用户总数。

  个中,udij用于标识数据项dj是否是简直用户ui的史书作为数据,当且仅当数据项dj为简直用户ui的史书作为数据时,udij=1,不然udij=0;Tl(ij)为简直用户ui和简直用户uj正在特定核心维度Al下的合系度;udik用于标识数据项dk是否是简直用户ui的史书作为数据,当且仅当数据项dk为简直用户ui的史书作为数据时,udik=1,不然udik=0。

  本创造的简直履行例中,所述数据干系结果R(vh,uk)的简直盘算推算公式为:

  个中,μ(vh,Al)为指示变量,用以阐明待合系数据项vh是否属于特定核心维度Al;URtl为简直用户ut(t≠k)正在待合系数据项vh所属核心维度Al下的巨头度;ξ为权重因子;I(vh,ut)为简直用户ut(t≠k)看待合系数据项vh的嗜好水准;Tl(tk)为主意用户uk与简直用户ut(t≠k)正在待合系数据项vh所属核心维度Al下的合系度。

  本创造通过深化理解用户的史书作为数据,修筑用户有趣画像模子;通过对众个用户间差别核心维度下的合系度理解,修筑可精准描摹用户间联系谱系机合的面向核心的加权搜集机合;集合拓扑搜集机合与用户间史书作为数据的合系性,提出URank算法,用以盘算推算用户正在众个差别核心维度下的巨头度与影响力,进而提拔基于用户作为的数据合系质地。

  数据合系体系紧要由三片面构成:新闻获取模块1、体系管制模块2和数据干系结果输出模块3,上述模块依次衔尾,图4为本创造简直履行格式供给的一种基于用户作为的数据合系体系的示意框图,图4为各模块间数据流向图,个中:

  新闻获取模块1用于获取用户片面根本新闻、用户史书作为数据、待合系数据集,以上新闻、数据紧要由平台所供给,如电子商务网站平台等。个中片面根本新闻紧要包罗:春秋、性别、职业、所正在都邑、有趣喜欢等;用户史书作为数据则包罗用户的史书添置作为、用户电子商务网站浏览与评论作为等;而待合系数据集则为电子商务网站商品集(或其子集)。

  体系管制模块2基于体系数据输入(用户片面根本新闻、用户作为史书数据)举行用户有趣画像,并修筑用户间联系谱系机合,基于所修筑的用户间联系谱系机合有用怀抱用户差别核心维度下的巨头度与影响力。

  数据干系结果输出模块3有用协调体系管制与待合系数据集,并盘算推算输出数据干系结果。

  环节1:新闻获取模块1获取用户片面根本新闻、用户史书作为数据、待合系数据集;

  环节2:体系管制模块2基于用户片面根本新闻、用户作为史书数据举行用户有趣画像;

  环节3:体系管制模块2基于用户片面根本新闻、用户作为史书数据修筑用户间联系谱系机合;

  环节4:体系管制模块2基于所修筑的用户间联系谱系机合怀抱用户差别核心维度下的巨头度与影响力;

  环节5:数据干系结果输出模块3将用户差别核心维度下的巨头度与影响力盘算推算结果与待合系数据集举行协调,并盘算推算输出数据干系结果。

  下面临该数据合系本事紧要构成片面用户有趣画像盘算推算模子、用户间差别核心维度下的合系度盘算推算图模子、用户正在差别核心维度下的巨头度与影响力盘算推算算法和数据合系度盘算推算模块区分加以阐扬。

  用户的史书作为正在某种水准上较好地折射出了用户的有趣喜欢,而且用户史书作为中的某些数据也极好地反响了用户的片面偏好和侧中心,况且这些数据具有如下共性:与该用户的其他史书作为数据极其好似或者联系,也便是所说的样板性史书作为数据。

  给定某个简直用户uk及其史书作为数据聚积V={v1,v2,...,vH},看待某项待合系数据vh而言,可能依照其与用户史书作为数据聚积V的好似性推导出用户uk对该项数据的偏重水准,也便是用户uk看待合系数据项vh的偏好水准。简言之,待合系数据项vh与用户史书作为数据聚积V越好似,解说数据项vh正在数据聚积V中越处于“重心”身分,越能显示用户uk的“重心”有趣,用户uk对其的偏好度越强。为此,本创造将用户uk看待合系数据项vh的有趣度I(vh,uk)量化为:

  个中,t为好似性盘算推算维度;wt为维度权重因子;vo为用户史书作为数据项;

  μt(vo,uk)为用户uk对其史书作为数据项vo的有趣偏好;St(vh,vo)为待合系数据项vh与用户史书作为数据项vo正在量度维度t下的好似性。

  为了确切盘算推算差别用户之间正在差别核心维度下的合系度,即修筑客户间联系谱系机合,本创造修筑了面向核心维度的合系度评估图模子,图5为本创造简直履行格式供给的一种简直用户间面向差别核心维度的合系度评估图模子,如图5所示。其修筑本原有如下两点:

  1.看待用户ui和uj而言,二者片面根本新闻的好似性S(ij)从某种事理上决议着二者正在某一特定核心维度Al下的合系度,记为Tl(ij);

  2.与此同时,用户ui和uj正在某一特定核心维度Al下的史书作为数据合系周密水准正在某种水准上也响应了二者正在该核心维度下的合系度。

  为抬高该图模子盘算推算确实切性,本创造为每个变量引入辅助变量并对子系变量做如下解说:

  S(ij)为用户ui和uj之间的片面根本新闻好似性向量,且P为片面根本新闻的条款数。假设片面根本新闻条款中的第p条属性是离散型的,那么本创造将设定为1,当且仅当用户ui和uj具有一样的属性值,不然将其树立成0。看待一连性变量,的取值管制如下:

  个中,和区分是用户ui和uj正在属性p上的取值,K为用户总数;Tl(ij)是指用户ui和uj正在特定核心维度Al上的合系度;是指用户ui和uj史书作为数据正在特定核心维度Al下的合系周密水准。

  用户间面向差别核心维度的合系度评估图模子,通过对前提依赖举行筑模,映现变量间的因果依存联系,基于这种依存联系,对其纠合概率散布举行如下阐明:

  为了有用避免过拟合题目,本创造应用L2准则对参数wl、αl和βl举行正则化,并将其视为高斯先验模子:

  因为差别核心维度下的纠合概率散布是彼此独立刻,本创造仅给出第l种核心维度下的对数似然函数:

  对数似然函数L是凹函数,本创造采用梯度增量的本事区分对参数wl、αl、βl和变量Tl(ij)举行优化,其坐标宗旨梯度区分为:

  采用坐标上升优化计划对wl、αl、βl和Tl(ij)行使牛顿迭代法举行更新直至收敛:

  本创造归纳行使用户的片面根本新闻、史书作为数据等,深化钻研用户间的差别核心维度下的合系度,基于其上,融入拓扑搜集机合,提出了URank算法用以盘算推算用户正在差别核心维度下的巨头度与影响力。图6为本创造简直履行格式供给的一种面向差别核心维度的用户影响力盘算推算示图谋,如图6所示,用户正在差别核心维度下的巨头度与影响力的盘算推算经过紧要有如下几个环节:

  2.其次,抽取出各个核心维度下的加权搜集模子。正在核心维度Al所对应的加权搜集Gl中,节点显露与核心Al联系的用户,边的权重标示核心维度Al下用户间的合系度。

  3.对每个核心维度下的加权搜集Gl运转URank算法,盘算推算该核心搜集下用户的巨头度与影响力。

  界说1.面向核心的加权搜集看待给定的核心维度Al和初始的搜集机合G,咱们将搜集Gl称为面向核心Al的加权搜集,当且仅当Gl知足如下两个限度前提:

  (2)看待苟且两个节点用户i和j,假设他们之间的面向核心维度Al的合系度Tl(ij)大于零,那么正在搜集Gl中节点ui和uj之间存正在衔尾边,而且边的权值等于Tl(ij)。

  正在随机冲浪经过(Random Surfer Process)中,正在特定核心维度Al下,由节点ui到uj的迁徙概率的界说如下:

  界说2.给定某一简直的核心维度Al及与之对应的面向核心的搜集Gl,迁徙矩阵Pl中的每一个元素也便是说由节点ui随机冲浪到节点uj的迁徙概率的界说如下:

  个中,udij=1当且仅当数据项dj是简直用户ui的史书作为数据,不然将其树立成为0。

  迁徙概率紧要由用户ui和uj之间的两个要素所决议:第一个要素是用户uj所合系的数据项数。uj所合系的数据项越众,那么ui所阅读的数据项中源于uj的片面所占的比例就越高。因而,用户ui将从用户uj收受更众的新闻,而且更能够受到用户uj的影响;第二个要素便是用户ui和uj正在特定核心维度Al下的合系度Tl(ij)。Tl(ij)的值越大,解说用户ui和uj正在核心维度Al下的合系性越强。因而,可能以为用户ui和uj正在这一范畴有着更好似的有趣偏好乐鱼体育官方网站,而且相互彼此影响。值得提神的是:

  基于上述所界说的迁徙概率,本创造提出了面向特定核心的UserRank算法以开采用户正在差别核心维度下的巨头度与影响力。

  界说3.将某一简直核心维度Al上的URank记为URl,其迭代求解公式如下:

  个中PlN为上述界说的模范化的迁徙概率矩阵,β为阻尼因数(Damping Factor),用于保障撒布概率的坚固性,El为匀称隐形传态矢量(Uniform Teleportation Vector0)。基于上述本事,本创造区分求解每个用户正在差别核心维度下的巨头性与影响力,并采用K×L矩阵UR来显露,个中K为用户总数,L为核心的维度数,URil为用户ui正在核心维度Al下的巨头度与影响力。

  1.用户ut(t≠k)对数据项vh的嗜好水准,由“用户有趣偏盘算推算模子”求得,即I(vh,ut);

  2.主意用户uk与用户ut(t≠k)正在数据项vh所属核心维度Al下的合系度Tl(tk);

  3.用户ut(t≠k)正在数据项vh所属核心维度Al下的巨头度与影响力URtl。

  个中,μ(vh,Al)为指示变量,用以阐明数据项vh是否属于特定核心维度Al。

  上述的本创造履行例可正在各类硬件、软件编码或两者组合中举行履行。比如,本创造的履行例也可为正在数据信号管制器(Digital Signal Processor,DSP)中履行上述本事的步骤代码。本创造也可涉及盘算推算机管制器、数字信号管制器、微管制器或现场可编程门阵列(Field Programmable Gate Array,FPGA)履行的众种功效。可依照本创造筑设上述管制器履行特定职业,其通过履行界说了本创造揭示的特定本事的机械可读软件代码或固件代码来告终。可将软件代码或固件代码繁荣为差别的步骤发言与差别的体例或时势。也可为差别的主意平台编译软件代码。然而,依照本创造履行职业的软件代码与其他类型筑设代码的差别代码样式、类型与发言不摆脱本创造的精神与周围。

  以上所述仅为本发昭示意性的简直履行格式,正在不摆脱本创造的构想和准则的条件下,任何本范畴的手艺职员所做出的等同蜕化与删改,均应属于本创造珍惜的周围。

  1.盘算推算机视觉 2.无线.盘算推算机仿线.搜集安静;物联网安静 、大数据安静 2.安静态势感知、舆情理解和把握 3.区块链及操纵

  一种基于用户作为数据和潜正在用户影响力理解的正在线广告推送本事及其推送评估本事

Copyright 2012-2023 leyu·乐鱼(中国)体育官方网站 版权所有 HTML地图 XML地图--备案号:豫ICP备20000747号  备案号:豫ICP备20000747号  
地址:河南省郑州市金水区丰庆路126号3号楼24层2401号  邮箱:19659724@qq.com  电话:13938535296