经常看「 数据管道」的朋友应该知道近2个月几乎没有写原创,大部分是转载,发文时间也没个定数,而且有时候还不发文,以前每周末记录的仪式感也没了。
为什么?
公众号于我初心是记录与输出而后逼着自己输入,但当广告主一再的问是否可以合作,我还是会心动,虽然从没接过一次广告,但我也会同意加好友然后把广告推给一些朋友去接,心里的小九九无非就是等我想变现的时候,不差资源。
这样的我不是我想要的,会让我变得很着急,走的太快而迷失自己,我该停下想想了。
好的,我也不知道写了些啥,还是写点对大家有作用的东西吧。这两天私信讨论问题的朋友挺多的,我也都回复了,响应其中一个读者的朋友的要求。
“请问有sql或者数据分析的面试题吗?”
说实话,我真没刷过题,上上周群里有朋友问了一道sql题,那种难度级别已经够你面任何一家公司了。所以,没做出来也很正常,我之所以会做也只是因为用的多而已。再套路一点的问题无非就是,"为什么hive select count distinct 查询的reduce一直卡在99%,这可能是什么原因导致的,你有什么解决方法"。
这里强调一下,不是说你做出来了这些题,sql很熟练大厂就会要你,今年的分析师岗位不太好找,如果你还是一直在努力爬虫、熟练Python、为了分析而分析的阶段,建议去找爬虫工程师或者Python开发,不会有一家大厂要你做分析师的。
因为,你一开始就错了,Python是Python,分析是分析,请真的不要把Python和数据分析画上等号。对分析师来说,熟知业务的重要性远比你会一两个工具重要,而论重要性,sql的重要性比Python重要的多(这里不是让你不去学Python哈,宝器每天也还是要写写Python的)。再配一张有趣的图:
很多在学校的朋友会觉得算法工程师巨厉害,上手就是达模型,这么说吧,差不多算法工程师的实习工作大部分时间就是写sql(CV那一块的不太了解,如果说错了,还请不要diss)。为什么要你写sql,因为你连特征工程都做不好,就别扯回归、分类这些东西了。
就好像做推荐的朋友第一步需要把用户画像建好,而画像核心就是各类分层标签,埋点上报再到数仓的数据是明细表,明细表的数据不会给你做好这些标签的,所以第一步你就是需要用sql把各类标签表做出来,而后在定用户画像。
好了,言归正传。今天做了一下sql zoo上面的题,还算有趣的一个做题网站。大致几部分内容:基础、关联子查询、聚合函数、JOIN等等,不算太难。
比较有趣的是,每次你提交代码对了会给你一个笑脸,如下:
每做完一个章节的题,还附带一个选择题小测验,不错的一个功能~
附上网址,点阅读原文也可访问:
https://sqlzoo.net/
另外,已将全部章节的可以运行成功的答案记录下来,篇幅太大,不全部展示了,一会丢到群里:
总结:
本文不知道写了些什么,希望对你有点帮助。
以上是内存溢出为你收集整理的做了点SQL题。全部内容,希望文章能够帮你解决做了点SQL题。所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)