当前位置:主页 > 云通信 > 正文

CDN_邯郸建设局网站_优惠券

时间:2021-05-04 16:14 来源:埃里克云 编辑:埃里克云

核心提示

您好, 欢迎使用HANA ML Python API进行序列模式挖掘aka(SPM)方法。我在上一篇博文中解释了前四种关联分析方法。 注意:确保您的带有HANA ML的Python环境已启动并运行,如果没有,请按...

您好,

欢迎使用HANA ML Python API进行序列模式挖掘aka(SPM)方法。我在上一篇博文中解释了前四种关联分析方法。

注意:确保您的带有HANA ML的Python环境已启动并运行,如果没有,请按照前面博客中提到的步骤操作。

序列模式挖掘算法(SPM)在序列数据库中搜索频繁模式。序列数据库由有序元素或事件组成。例如,顾客首先购买面包,然后是鸡蛋和奶酪,然后是牛奶。这形成了一个由三个有序事件组成的序列。如果一个事件或后续事件的支持度(即包含该事件或子序列的序列数)大于某个值,则我们认为该事件或后续事件是频繁的。此算法在满足用户定义的最小支持度的输入序列中查找模式。

在开始实践之前了解序列模式挖掘:

在所有其他事务中查找具有特定序列的所有项目子集:e、 g{打板球->高心电图->出汗}。在事务数据库中查找将一组项目的顺序与另一组项目的顺序相关联的所有规则:e、 72%的用户在进行网络搜索时会长时间盯着对方看在广告之后,点击添加成功。

前提条件:

输入数据不包含空值。每个事务中没有重复项

让我们开始:

导入包

设置连接

在我们的示例中,数据从csv文件"APRIORI\u item"加载到HANA中名为"PAL\u APRIORI\u TRANS\u TBL"的表中_数据.csv". 为此,将创建到HANA的连接,然后将其传递给数据加载器。要创建这样的连接,需要一个配置文件config/e2数据.ini用于控制连接参数。配置文件中的示例部分如下所示,其中包括HANA url、端口、用户和密码信息。

*************************

[HANA]url=主机urluser=用户名passwd=用户密码port=3xx15

****************************

在一个配置文件中维护登录信息并将其准备好放在根文件夹中

如果连接成功–"True"

我们将分析存储数据以进行频繁模式挖掘,这是SAP帮助网页上提供的示例数据

属性信息:

检查表是否已经存在存在于您的模式选择*从PAL\U SPM\U DATA\U TBL

的功能DataSets.load\u spm\u数据()用于决定从头开始加载或重新加载数据。如果是第一次加载数据,返回消息示例如下:

错误:hana\u ml.dataframe:无法获取当前数据帧的行计数,(259,'无效表名:找不到表/视图

PAL\u SPM\u DATA\u TBL in schema DM\u PAL:line 1 col 37(位置36)')模式DM\u PAL中不存在Table PAL\u SPM\u DATA\u TBL

正在模式DM\u PAL中创建Table PAL\u SPM\u DATA\u TBL…。删除不成功

创建表DM_PAL.PAL\u SPM\u数据\u TBL

数据负载:100%

如果数据已经加载到HANA中:

重新执行下面的命令并检查它返回的消息

显示数据帧记录

数据操作:

使用以下几个操作获得数据集的细节,您可以通过应用更多功能可获得更多信息。

获取所有CUSTID='A'

获取所有事务id=1的客户

获取所有客户和事务id='Apple'

GroupBy ITEMS

GroupBy CUSTID

GroupBy TRANSID

导入matplotlib库以显示具有最流行项的绘图在我们的数据集中

plot中最受欢迎的项目是Apple&Blueberry,如果我们试图找到两者的交易计数:

Apple计数-测向滤波器("ITEMS='苹果').head(100).count()=10

蓝莓计数-测向滤波器("ITEMS=‘Blueberry’).head(100).count()=10

方法

拟合(data,customer=None,事务=无,项目=无,项目\u限制=无,最小\u差距=无)

从输入序列模式挖掘数据。执行方法

使用数据集训练模型。

收集结果

结果分析:

Apple支持的项目集1.0表示该项目在所有事务中的频率,最频繁的项目–置信度和提升为0对于所有声明没有前因后果的单项考虑(苹果,蓝莓):支持率是.88(这些项目的频率是88%),信心是88%,这意味着如果有人购买苹果,那么88%的机会,他们也会在他们的桶蓝莓,电梯是.89接近1表示购买项目之间的高度关联。结果显示大多数项目都有支持,信心和提升超过70%表示挖掘高频率的项目,可以认为是强关联规则。

  • 企业网站_新白娘子传奇百度云_折扣 企业网站_新白娘子传奇百度云_折扣

    你好,社区, BSI TaxFactory和TaxFactory SaaS发布版本11.0可用。 在我们的合作伙伴BSI将其产品/产品BSI TaxFactory 10.0的维护延长至2021年4月30日之后。SAP还决定在2021年4月30日之前为BSI TaxFactor...

  • 消息队列_华云服务器_限量秒杀 消息队列_华云服务器_限量秒杀

    啊。我已经很久没在这里写博客了-对不起? 但这是一个很好的机会让我重新上马,这是我与SAP TechEd Barcelona的SAP社区负责人Craig Cmehil的"无采访视图"(无采访视图就像一次真正的采访...

  • <strong>域名备案_查看数据库密码_怎么样</strong> 域名备案_查看数据库密码_怎么样

    在本文中,我们将看到如何在sapcloudfoundry环境中为Spring启动应用程序配置OAuth2授权。但是在这样做之前,让我们先熟悉一下这个实现中涉及的几个重要概念。 简介 OAuth2–是一个授权框...

  • <strong>MySQL数据库_网站cdn_多少钱</strong> MySQL数据库_网站cdn_多少钱

    您已经听说了SAP Graph在SAP TechEd Las Vegas 2019发布的消息。微软Graph也非常棒,非常相似(哲学上+技术上),它不仅非常有用,而且我会给你一个微软Graph的工作示例/教程,让你了解它,...

  • 京东云_网站建设中页面_学生机 京东云_网站建设中页面_学生机

    在可预见的未来,向S/4HANA过渡的公司特定规划已将每个SAP客户列入其议程。S/4HANA实施项目越来越近了,因此也有一个问题:在技术和开发层面必须做哪些准备?正是这个主题是"S/4H...

  • <strong>天翼云_网站服务器失去响应怎么回事_代</strong> 天翼云_网站服务器失去响应怎么回事_代

    大家好, 欢迎来到一个关于用户浏览器没有启用JavaScript的用户体验主题的简短博客。 考虑到1%的设计理念,如果我们考虑那些禁用或不可用JavaScript的浏览器的用户(出于"天知道为什...

  • <strong>对象存储_网站建设外贸_速度快</strong> 对象存储_网站建设外贸_速度快

    在本文中,我将展示如何通过负载平衡器为我们的生产数据库构建一个具有高可用性的HANA驾驶舱。我建议您开始阅读SAP指南HowTo:High Availability for SAP HANA cockpit using SAP HANA system replicat...

  • <strong>中间件_重庆网站建设策划_促销</strong> 中间件_重庆网站建设策划_促销

    SAP Customer Data Cloud在9月份推出了许多功能。如果你错过了这些,下面是我们9月份发布的几个亮点。 与苹果公司登录:苹果公司已经发布了使用苹果ID登录应用程序的选项。他们甚至规...

  • 消息队列_马云御任阿里巴巴_年度促销 消息队列_马云御任阿里巴巴_年度促销

    本周在拉斯维加斯TechEd看到的创新给我留下了非常深刻的印象。今年似乎出现了比过去更多的业务倾斜。主要的宣布是我们可以通过业务技术平台扩展SAP应用程序 HANA云服务(HCS)是业...