行业新闻

[宁波网站建设]电子商务网站的反作弊系统设计评论

发布时间:2019-05-25 00:30:28

  随着网络购物习惯的发展,网络营销中作弊的需求也随之出现。对常见的作弊方法和作弊通道进行详细分析之后,提出了一种解决方案。个系统设计分为四个模块:日志采集,离线反作弊,实时反作弊和制裁中心,用于日志采集,Hadoop平台存储和计算Esper复杂事件流日志和引擎,用于实时反作弊计算。Groovy作为惩罚规则引擎,为C2C电子商务网站提供了一个反作弊系统的例子。布式计算按键,防作弊,复杂事件处理,防作弊系统和短demande.En分析的业务场景的话,防作弊系统的重点是识别,预防,控制和改善了平台的作弊行为。
  体完整性,向用户推荐更好的卖家和产品,并增强用户的在线购物体验。C2C平台创意常见的欺骗很简单,它涉及增加商家的流量。般来说,我们将从以下几个方面入手:在平台中搜索:通过在短期内作弊来提高搜索排名[1]。常的方法是增加公司和关键字的相关性。家评估:商家评级对搜索结果的影响也非常重要,通常是通过模拟真实用户的在线购买,通过大量流量来购买商品,增加交易数量,以及评估[1]。意攻击:有很多方法可以攻击,例如故意审议并对商家进行差评,降低他们在搜索结果中的排名。如,还有某些关键字的竞价广告,恶意点击。外,它会故意欺骗竞争对手,例如清除竞争对手的点击,故意使用非常明显的方法让竞争对手受到惩罚。作弊系统的目的是在大量用户交易中检测这种违规并施加相应的处罚。
  诈的方法和方法目前,C2C电子商务平台使用两种主要类型的欺诈方法,例如手工劳动和机器人。工劳动的缺点涉及手动点击或导航商家以模拟人的购买历史。检查交易数据也不例外,看起来像普通用户。此,宁波网站建设反欺诈系统是一项重大挑战。
  手工劳动,高成本和减少手工劳动不同,机器人作弊的特点是低成本和高成本。多时候,您必须使用此方法来生成大量事务。骗机器人常常是模拟大量的谁使用大量马甲账号躲人几台机器的réelles.Bien听说地址,很多网络机器人造成虚假点击是机器人,但一般来说,他们不模拟交易,只是浏览网页。
  些机器人也不同机器上传播病毒,再飞代表实际的用户点击,虽然这是比较难以察觉,但它通常无法模拟实际的交易,可以模拟点击。且由于它是一个机器人,它在很大程度上受到控制并且可以被检测到。测作弊的方法通常分为两种方法:实时和离线,分析和发现异常的日志数据。时防作弊系统主要针对明显的作弊方法,其特征在于,作弊方法比较粗糙,这种类型的作弊不足往往是一个显著量,它可以很容易产生异常流量和短暂的点击。释遵循某些规则来发现异常更容易。线反作弊系统通常用于更复杂的场景,例如,每天几次点击很少。果你只查看某一天的数据,似乎没有任何异常。常需要分析和处理所有过去的流量日志以找出问题。大多数情况下,有必要通过对大量日志执行数据挖掘操​​作来检测作弊行为。线系统主要为算法中的员工提供一个平台来关注算法,预先计算,收集使用过的数据并方便访问。数据处理工具[2]。作弊系统的整个反作弊系统分为四个模块的通用设计:收集和存储模块报纸,防骗下线模块,防作弊模块实时和处罚中心模块。系统的数据源,负责收集和存储模块的报纸,这是由的反作弊模块离线和反作弊模块实时的规则判断,然后与处罚中心接受治疗。志采集存储模块的设计如图1所示。个日志采集过程主要有以下几种:用户进入网站生成各种浏览行为和前端服务器将数据发送到日志收集服务器。旦数据被日志收集服务器收集,它就存储在日志存储平台中以进一步处理该作业。志收集服务器的主要功能是日志收集,进程日志转换格式和有价值数据平台的存储。先,由于访问量很大,将所有日志数据传输到服务器是不合适的。
  志收集服务器必须是分布式体系结构。于越来越多的用户日志,它必须考虑将来的水平可伸缩性。
  计算机添加到群集会线性增加群集的处理能力。事考虑更好的负载平衡,不会让一台机器加载一个较高的位置,就必须匹配单个节点崩溃,当集群中的一个或多个机器出现问题,也不会影响群集功能仅临时增加计算机上的平均负载,并且计算机可以在重新启动计算机后自动加入群集以处理新日志。于日志存储平台每天生成的数据量非常大,并且随着数据存储平台的增长,无需临时优化存储设备:可以支持的完整解决方案未来相当多的报纸。Hadoop是无疑是首选:在HDFS存储平台可以完美解决存储和访问大型数据的问题,而HDFS备份策略有助于确保记录的数据将是没有丢失,这将影响后续治疗[3]。作弊离线模块设计如图2所示,主要的离线反作弊处理流程如下:原始日志采集后,日志被处理并存储在离线存储中。据,然后通过同步过程将数据同步到mysql,然后由算法人员开发。据挖掘操​​作检测违规操作通知惩罚中心的处理。择HDFS作为存储平台时需要考虑的另一个重要因素是Hadoop的高吞吐量数据处理能力。要是MapReduce工作,它是一个带HDFS的分布式编程框架,相当于每个Hadoop节点的计算资源。是,Mapreduce是一个低级编程框架,因为每个任务都需要大量的时间和人力,而且开发速度不足以满足不断变化的预处理需求。以,除非你是不是负责表达困难,处理MapReduce的直接写入,多数选择使用蜂巢,它是数据存储的所有基于HDFS,你可以直接导入Hive中的文件系统数据。关键的是,它提供了HiveSql语言语法类似于传统的SQL,即转换HiveSql直接进入MapReduce工作来处理数据的底层处理,从而节省了大量的时间进行开发工作mapreduce,它允许开发人员轻松创建mapreduce作业并编写Sql。[4]你可以看到hive提供了许多调用接口,通常是通过命令行界面(CLI),它可以很容易地集成到shell,python,perl和其他脚本中。

电子商务网站的反作弊系统设计评论_no.206

  了使用配置单元来存储和处理数据之外,还必须开发一个配送中心来安排配置单元的执行和处理,以及一些容错机制,例如重放失败的任务,邮件监控等,以及调度同步作业,以便在数据生成后使数据与数据同步。数据库中。计一个实时的防作弊模块实时反作弊过程比较简单:额叶系统中的数据返回到日志服务器,那么反作弊实时中心订阅服务器日志记录。到数据后,违规行为将返回惩罚中心。疗。
  罚中心存储模块的设计如图3所示。惩罚中心收到惩罚数据时,它不会立即处理它,或者必须通过一个规则来确定它是否应该被管理。一般情况下,各种防作弊分配对应的处罚不同的方法:例如,当用户发表评论抄袭或灌溉,注释,这部分是毫无价值的,但用户的分数是真实的和治疗评论没有显示,但在计算商店。评估期间,用户的评估将始终包含在计算中。旦捕获了已捕获的虚构和虚假交易的其他评估,该记录将被标记为无效,并且不会包括在计算中。对不同作业触发的违规操作将具有不同的处理方法。时,由同一工作捕获的不同用户具有不同的治疗方法。最终处罚中,将根据用户的属性判断用户:例如,非常早注册或具有非常高级别和交易号的用户将不会受到惩罚。户的各种属性存储在预先与处理模块计算的大表中,并且算法人员还可以不时地添加新参数。表达式专门确定哪些参数将不断更改,这需要一个可以轻松配置和修改的动态规则引擎来判断。Groovy是一个动态语言脚本,用作执行满足您需求的动态表达式的规则引擎。是Java虚拟机的替代语言(替代意味着您可以在Java平台上使用Groovy进行Java编程),就像使用Java代码一样。种语言特别适合与Spring的动态语言支持一起使用。于Java的集成,这有助于与Groovy和Java代码的互操作性。Groovy和Java在编程方面运行良好。此规则引擎决定用Groovy实现它。

电子商务网站的反作弊系统设计评论_no.343

  
  结与展望本文档介绍了C2C电子商务网站反作弊系统的分析设计,实施过程和技术要点。系统主要采用Java和Python语言,包括基于Java虚拟机(JVM)的动态Groovy的脚本语言,使用CentOS的操作系统,主要是基于Hadoop的平台和能力HDFS海量存储和Hive和Map / Reduce。于存储和处理数据的高性能处理能力。Esper引擎用于处理实时处理需求。据库库使用Mysql。文提出了一种基于反诈骗网站的C2C电子商务系统的具体实施过程中,通过相关知识的应用,如文件存储分布式系统HDFS,分布式计算结构图/减少,处理CEP复杂时间流和Esper引擎。
  本文转载自
  宁波网站建设 https://www.leseo.net
  补充词条:宁波seo网站优化  宁波网站排名优化  宁波网站seo优化  宁波网络seo公司  宁波seo优化公司