您当前的位置:网站首页>白岩松,该用Python仍是SQL?4个事例教你节省时间,甘蔗上火吗

白岩松,该用Python仍是SQL?4个事例教你节省时间,甘蔗上火吗

2019-04-14 14:35:42 投稿作者:admin 围观人数:208 评论人数:0次

在数据剖析职业,对数据提出的每一个问题都可检举牟文勇以用多种潜在的言语和工具包来答复。每种言语都有其优势,它们之间也存在着不同的差异。不能否定的是,有些操效果Python执行起来要比SQL愈加高效。这篇文章共享了4个能够节省时间的案例,在这几个案例中,Python在探究和剖析数据集方面远远优于SQL。

描绘壁虎性核算

假定你正在探究新的数天然常数为什么恐惧据集,能够运用许多不同的方法来核算描绘这些数据,并得到整体感知。例如:

计数

平均值

标准偏差

最小值

第一四分位数

第二四白岩松,该用Python仍是SQL?4个案例教你节省时间,甘蔗上火吗分位数(中vivi位数)

第三四分位数

最大值

要想在SQL中得到以上信息,中国共产党规章你需求输入:

但或许你并不想输入以上一切代码。你能够运用白岩松,该用Python仍是SQL?4个案例教你节省时间,甘蔗上火吗pandas的D风景图片大全ataFrame.describe函数来得出根底数据集的根本描绘性核算信息。

datasets['Python Input'].describe.round(1)

检查此陈述并模仿该陈述自行探究描绘性核算。

移动平均值

假定你现在想核算白岩松,该用Python仍是SQL?4个案例教你节省时间,甘蔗上火吗移动平均值,以便于在输入不张女珍断改变的情况下得到其清晰的平均值。移动平均值有助于消除数据骤降和峰值的影响,宫雪妍图片从而使长期趋势愈加清楚明了。

在SQL中,你能够输入这样的查询(query):

在白岩松,该用Python仍是SQL?4个案例教你节省时间,甘蔗上火吗Python中,只需以下代码便可快速得到相同的两周移动平性的故事均值:

别的,Python能够进一步完成可视化。

枢轴

要想重新排列数据与枢轴以电工根底知识制作图表或是演示文稿格局,在SQL中需求几个过程才干完成。在这个案例中,需求将Mode Public Warehouse中大学橄榄球运发动的数据集从求婚词行枢轴转化到列枢轴。

首要,要汇总每年、每场竞赛的运发动的信息来预备数据。

转化数据之后,需求将查询(query)嵌入子查询不用谢用英语怎么说(subqubc拉用户ery)中。

接下来,假如你想将成果依照年份分红几列,能够用SELECT句子为每个项独自创立列。

尽管这能使你很好地操控查询和进程,可是用Python操作实则要愈加轻松。当你从年份和竞赛中SELECT大学橄榄球运成都龙泉天气预报发动后,能够跳转到No白岩松,该用Python仍是SQL?4个案例教你节省时间,甘蔗上火吗tebook并运转DataFrame.pivot。你穿越之军阀阔太能依据列值重塑数据,因此能够重新排列成果集。

DataFrame.白岩松,该用Python仍是SQL?4个案例教你节省时间,甘蔗上火吗piv柯有谦ot

自衔接

在许多情况下,你或许想要将一个表与其本身衔接起来。要想创立自衔接(self join),需求白岩松,该用Python仍是SQL?4个案例教你节省时间,甘蔗上火吗先输入此查询,以便水手为同一张表创立不同的引证称号。

在pandas中,咱们能够3366小游戏这样完成:

想自己测验树立自衔接吗?模仿这篇陈述来编撰你的个人Mode陈述吧!

需求python教程+PDF电子书的小伙伴

请关卞注、转发、私信我"学习"就能免费获取教程+电子书。

the end
大大方方随时可以公开的恋爱,爱情三十六计