当前位置:主页 > 云数据库 > 正文

自助建站系统_人工智能语音系统

时间:2020-11-02 16:05 来源:埃里克云 编辑:埃里克云

核心提示

雪花JSON支持2016年4月1日作者:萨奇布·穆斯塔法工程、雪花科技希望你有机会阅读我们之前的十大帖子。正如承诺的那样,我们继续本系列文章,深入探讨雪花的另一个最酷的特性:...

雪花JSON支持

雪花JSON支持2016年4月1日作者:萨奇布·穆斯塔法工程、雪花科技希望你有机会阅读我们之前的十大帖子。正如承诺的那样,我们继续本系列文章,深入探讨雪花的另一个最酷的特性:JSON支持。#6 JSON支持雪花本周让Strata Hadoop员工兴奋的事情之一是我们对JSON支持和其他半结构化数据类型的支持。对于传统的数据仓库用户来说,大数据的世界可能具有挑战性。我们习惯于使用SQL查询数据,习惯于有一个定义良好的数据模型,并且知道源模式和目标模式是什么样子的。我们需要一种更简单的方法来轻松处理使用JSON文档等半结构化数据所带来的灵活模式。尽管他们做了很多努力,但遗留数据仓库系统并没有为JSON数据提供广泛的支持,大数据系统需要学习新的广泛的编程技能。当我们的创始人白手起家为云构建数据仓库时,他们想要一个解决方案,可以将所有数据组合在一个地方,而不需要使用多个平台或编程范例。因此,将结构化和半结构化结合在一个地方,并通过标准的ansisql提供,这是雪花服务的一个强大功能,并被我们的客户广泛使用。Snowflake的功能是简化对JSON数据的访问,并提供将其与结构化数据相结合的功能!使用Snowflake,您可以学习使用SQL查询JSON数据,并轻松地将其连接到关系表中的传统表格数据。我们的创新方法允许用户使用一种新的数据类型(变量)将JSON文档存储在关系表中,该数据类型在后台自动优化为MPP和列式访问。这是消除大数据世界和关系世界之间的差距并简化用户访问的一个很好的方法。大多数遗留数据库(带有它们的遗留代码库)不能有效地做到这一点。一些遗留数据仓库提供者根本不支持JSON数据,您可能需要获取和管理一个单独的大数据系统。另一些可能需要对数据进行某种预处理,例如转换为简化的CSV类型的数据。这可能使接收数据更容易,但需要时间和资源。而且,这也限制了将灵活的模式数据类型带来的潜在更改轻松地纳入关系数据模型的能力。此外,JSON数据可能存储在文本字段中,而不是优化的数据类型,这在查询执行速度和数据存储方面有其成本。雪花使半结构化数据在数据仓库服务中无缝可用。数据可以直接摄取到雪花表中,然后可以轻松地进行查询。对入站JSON模式的任何更改都会自动适应,不会影响现有查询。示例代码在这个场景中,我们将使用雪花SQL扩展查询半结构化数据,并使用创新的数据类型(变量)将数据连接到其他纯关系表。我们将把Twitter数据(JSON数据)与关系表中的产品数据结合起来。存储Twitter JSON数据的主表,twitter.data.tweets,有两个列:tweet和created\u at。Tweet列被定义为一个变量类型并保存来自Twitter提要的JSON,而created_at是一个关系列,数据类型为TIMESTAMP_NTZ(NTZ=no time zone)。下面是一个示例,显示了一个带有JSON扩展的相当简单的SQL查询。在这个查询中,我们将一些Twitter数据与关系表中的产品数据相关联,以便获得包含与特定产品相关的标签的tweet的计数:选择提取('day',created_at)janday,count(*)cnt从twitter.data.tweetst,--在每个实体的标签上发布一条tweet横向展平(输入=>t.tweet,'实体.标签')标签,(选择不同的ph_标签从sales.public.producthashtags,销售.public.product其中p嫒name='Blue Sky'和p_productkey=ph_productkey)p哪里标签值:text::string=p.ph_哈希标记并在>='2014-01-01 00:00:00'创建并在>='2014-02-01 00:00:00'创建按1分组按1排序下面的代码部分将JSON字符串中的元素透视到一组行中,以便我们可以执行传统的联接:--在每个实体的标签上发布一条tweet横向展平(输入=>t.tweet,'实体.标签')标签,具体来说,它在entities元素中拉出一个hastags嵌套数组。然后在谓词中,我们将Tweet字符串中的hashtag值连接到Product表中的hashtag列(别名为"p"):哪里标签值:text::string=p.ph_哈希标记在本例中,"tags"等于flant函数创建的虚拟表别名,关键字"value"表示需要该行的内容。规范的其余部分指出,我们希望将文本数据转换为字符串,以便它与p.ph_hastag列的数据类型相匹配然后,谓词的最后一部分是使用TWEETS表中的date列对日期范围进行常规筛选:并在>='2014-01-01 00:00:00'创建并在>='2014-02-01 00:00:00'创建现在你就知道了,在云端的关系数据仓库中,使用SQL将半结构化数据与传统结构化数据相结合。不需要大数据系统。不错!但这只是一种风格,说明了如何利用Snowflake轻松地从JSON数据中获取价值。在一篇简单的博客文章中,有很多方法是我们无法涵盖的(例如,在JSON上构建关系视图)。想知道更多吗?本周,我们将在Stratar Hadoop World(圣何塞)举办的Strata Hadoop World(圣何塞)上向我们提供演示或查看Celtra Mobile的Grega Kaspret(@gregakespret)的演示,讨论如何使用Snowflake简化JSON数据管道雪花计算的所有动作的更新。肯特·格拉齐亚诺和萨奇布·穆斯塔法附加链接JSON定义如何将JSON转换为SQL就像你读的?通过喜欢和分享来表达你的感激之情!Facebook推特LinkedIn

  • 大数据和云计算_分布式_大数据趋势 大数据和云计算_分布式_大数据趋势

    华盛顿州贝尔维尤,2018年9月13日消息——身份即服务(IDAS)的全球领导者Auth0今天宣布,它已被福布斯与Bessemer Venture Partners和Salesforce Ventures联合发布的《福布斯2018云100》(Forbes 20...

  • VPN 网关_海外_人工智能有前景吗 VPN 网关_海外_人工智能有前景吗

    8月21日,Facebook删除了600多个源自伊朗的账户、页面和群组。这些帐户在传播政治造谣,主要针对拉丁美洲和中东的用户。网络安全公司fireye最初向Facebook透露了一个名为"自由前线新闻...

  • cdn许可证代办_美国_哪家的云服务器安全 cdn许可证代办_美国_哪家的云服务器安全

    在2016年美国总统大选之前,据称俄罗斯黑客攻击希拉里·克林顿竞选团队和民主党全国委员会(Democratic National Committee),利用鱼叉钓鱼手段诱骗用户向欺诈网站提供用户名和密码。随...

  • 云储存服务_便宜的_怎样购买云主机 云储存服务_便宜的_怎样购买云主机

    Storybook是一个UI组件的开发环境。它允许我们浏览组件库,查看组件的不同状态,并交互式地开发和测试它们。Storybook运行在我们的应用程序之外;因此,我们可以独立地开发UI组件,...

  • 云存储多少钱一个月_如何选择_物联网的 云存储多少钱一个月_如何选择_物联网的

    在本文中,您将学习如何使用哈皮.js以及节点.js,同时使用Redis作为持久层。由于没有安全层就不可能发布API,因此您还将学习如何使用Auth0保护应用程序。如果需要,您可以在GitHub存...

  • <strong>cdn网站_哪个_云计算平台系统</strong> cdn网站_哪个_云计算平台系统

    当我还是个孩子的时候,我练习了8年的童子军,我学到了很多优秀的价值观,我的童子军经历帮助塑造了我的性格,使我成为一个更好的程序员。让我告诉你为什么。作为一名童子军...

  • 云计算数据中心_购买_人工智能发布会 云计算数据中心_购买_人工智能发布会

    在Auth0,我们都是关于开源的。作为一个企业,我们积极致力于开源并从中受益,在多个项目中拥有超过25000个明星。我们的社区通过直接获得建议和支持来支持这项计划,无论开发人...

  • 服务器采购_如何使用_物联网智能家居技 服务器采购_如何使用_物联网智能家居技

    Auth0将不同的数据存储用于不同的目的。我们有大量的数据集,用于为客户提供各种各样的用例和特性。不幸的是,在数据泄露越来越普遍的时代,选择和使用数据存储的一个关键方面...

  • nas网络存储服务器_如何选择_工业物联网 nas网络存储服务器_如何选择_工业物联网

    在构建应用程序时,必须确保注册服务或产品的用户是真实用户。通过使用Auth0,电子邮件验证服务是开箱即用的;然而,如果验证电子邮件根本不必发送,那岂不是更好?通过使用...