column,冒牌天神-在线购物品牌,网络购物省钱小妙招

本文作者来自美团,关于他的作业经历,可检查这个文章

石晓文,大众号:小小挖掘机我在美团的这两年,想和你共享


研讨生三年,作为一名非核算机专业的学生,能够从一名纯小白(Python不会,机器学习没传闻过)到最终校招拿到几个不错的o毕剑峰ffer,个人感觉能够给自己打个及格分吧。写本文的意图,一是对自己研讨生阶段所学习的常识做一个总结column,冒牌天神-在线购物品牌,网络购物省钱小好办法,二是期望对那些刚触摸机器学习,预备往这个方向开展的同学们供给一些可学习的经历。

1、入门Python,把握数据剖析常用工具

第一次触摸Python是在2016年4月,本科阶段的作业差不多结束,就开端联络研讨生阶段的导师,期望能够跟他做一些项目。他给我组织的第一个作业便是运用Python爬取空气质量数据,并告诉我能够运用scrapy这个库。我与Python的邂逅,便从这个爬虫开端了。

由于上来就写的是爬虫,所以关于Python的根底我也没有体系的学习,不过仍是引荐给咱们廖雪峰教师的免费教程:https://www.liaoxuefeng.com/wiki/001净资产收益率4316089557264a6b348958f449949df42a6d3a2e542c000

假如想要深化了解一些Python的常识,引荐咱们column,冒牌天神-在线购物品牌,网络购物省钱小好办法学习《流通的Python》一书,封面如下。这本书我看了前面的九章,讲的非常不错,加深了自己关于Python里边内存办理、常用函数、类等的知道。


除了Python的根底常识,想要往数据剖析、机器学习方向开展的话,还需要把握一些常用的库,包含Pandas、Numpy、Matplotlib、Sklearn等等。

关于前三个,引荐的书是《运用Python进行数据剖析》:

关于Sklearn的运用,包含调用常见的机器学习算法、运用网格查找寻觅最优的参数,能够参阅的一本书是《Python机器学习及实践 从零开端通往Kaggle比赛之路》


假如上面的书你都看完了,我觉得算是入门Python数据剖析了。

2、初识机器学习,重复读重复看

第一次传闻机器学习这个名词,大概是在2016年8月份,是我现在的舍友向我说到的,其时并没有太介意,直到研讨生阶段开端,才渐渐有所触摸。其时身边的人的遍及反应是,这家伙咱们都在学,特别能赚钱。或许其时自己也是想着能多赚钱,才会开端入门机器学习的吧。不过现在,现已开端渐渐把机器学习作为一种喜好,一种喜好去看待了。

想必咱们都知道,入门机器学习,不得不看的三本书是吴军教师的《数学之美》、李航博士的《核算学习办法》和周志华教师的《机器学习》,也便是所谓的西瓜书。


可是有时分,有些算法比方SVM,column,冒牌天神-在线购物品牌,网络购物省钱小好办法说实话两本书讲的微信登录都不是最好的,仍是得结合网上比较盛行的帖子进行学习,收拾了几个我看过的一些比较好的帖子,共享给咱们:

SVM:http://blog.pluskid.org/?page_id=683
Word2Vec:https://blog.csdn.net/itplus/article/details/37969519
EM算法:https://blog.csdn.net/randy_01/article/detakatespadeils/88407432

其他的算法,咱们心脏早搏是怎么回事结合两本书进行学习就能够了。值得一提的是,Xgboost和LightGBM是在面试阶段比较常考的两个机器学习办法,可是在上面的几本书中个税申报都没有触及,我之前收拾了一个简略的帖子,期望对咱们有所协助(最终的参阅材料里边会有)。

除了书本材料外,视频材料引荐的首要是吴恩达教师和李宏毅教师的机器学习入门课,地址如下:

吴恩达机器学习:https://www.bilibili.com/video/av50747658?from=search&seid=93107041409917column,冒牌天神-在线购物品牌,网络购物省钱小好办法25193
李宏毅机器学习:https://www.bilibili.com/video/av35932863?from=search&seid=16150707490146939986

假如你是刚入门机器用爱调教学习的话,我的主张便是重复看,重复读,直到你能不依托书本将模型的原理解说清楚停止。

3、面试不断受阻,Leetcode得刷,得多刷

抱负很饱满,实际很严酷,在自己刚学了点机器学习常识的时分,就出去面试闯练,成果却是不断的受阻,机器学习理论和经咯验少是一方面,数据结构题也是一问三不知,能想到的,只要时刻或许空间复杂度最差的那种解法。所以我说啊,Leetcode不只得刷,还得多刷。

不过咱也没必要着急,你得有一个方案,比方每天做三道五道,铢积寸累才行。尽管我现在在面试的过程中仍是有column,冒牌天神-在线购物品牌,网络购物省钱小好办法一些问题写不出来,但大部分状况下,仍是能够得到一个比较优的解。

关于刷leetcode这事,你能够往两个方向上走。一是依照从easy到medium到hard的方向。二是依照分类走,比方先刷树相关的,再刷数组相关的,顺次类推。我自己是用的第一种办法啦,不过从校招面试的经历看,面试官重视的题首要会集在数组、链表、二叉树和动态规划上面,能够先把这几部分的弄理解。

在言语选择上,主张仍是不要用Python吧,Python的小trick仍是有点多的,就比方字符串表达式的值,咱们用eval函数就能够得到,可是在真实面试的时分,这样是肯定不可的,所以主张仍是Java或许Ccolumn,冒牌天神-在线购物品牌,网络购物省钱小好办法++吧。究竟这两门言语,你总要把握华润水泥供货商门户一门的。

除了在Leetcode上面刷题外,有两本书能够给咱们参阅,一一件风趣的事是《剑指民间忌讳1000例offer》,二是《程序员代码面试攻略:IT名企算法与数据结构标题最优解》,封面如下:

4、相遇深度学习,论文堆集是要害

关于深度学习,也是研一下才开端渐渐学习的,其时首要触摸的是CNN、LSTM这些个算法,关于一些比较深化的如GAN、Seq2Seq、Transformer之类的,还没有触摸。真实带我相遇深度学习的,能够说是李宏毅教师的深度学习课:https://www.bilibili.com/video/av9770302?from=search&seid=6099263941108862254

当然,吴恩达教师的课也非常精彩:https://mooc.study.163.com/university/deeplearning_ai#/c

除此之外,不得不提的一本书是咱们所谓的深度学习圣经,不过说实话,我觉得这本书尽管写得好,但仍是有必定阅览难度的:

个人感觉,深度学习这东西,重在不断堆集和反思吧,多读论文,多写代码。论文的话咱们往常能够多重视PaperWeekly这个大众号,代码的话我主张了凡四训假如论文给出了参阅代码,咱们能够尝试着去敲一敲,不只加深自己关于论文思路的知道,还能够提高自己的着手实践才能。

5、引荐与核算广告,广度优先VS深度优先

在整个研讨生阶段,我其实并没有构成一个首要的研讨方向,咱们或许看我平常的大众号引荐体系相关的东西比较多,但我并不是研讨这个的,首要仍是自己对这个东西比较感喜好,所以看的多了些。引荐体系的两本入门书本是《引荐体系实践》和《引荐体系与深度学习》:

深度学习范畴仍是挺多的,如盛世宠妃宋明岚引荐体系和核算广告、CV、NLP等等,这就引出了广度优先VS深度优先的问题。个人感觉仍是深度优先为主吧,确定好自己的一个研讨方向,然后在这个范畴进行深挖。不过一起,也要统筹广度,深度茹进存学习的东西都是相通的,比方Transformer最开端首要应用于文本范畴,Gcolumn,冒牌天神-在线购物品牌,网络购物省钱小好办法AN首要应用于图画范畴,这两种办法现在也都开端在引荐体系中运用。

最近自己要开端研讨核算广告方面的常识了,由于自己入职之后或许从事这一方面的作业,那仍是给咱们引荐两本书吧,一本是李修平咱们所熟知的《核算广告》,另一本是黄皮书《晋北百家号互联网广告的商场规划》,想要入门这个方向的同学,主张先看黄皮书,再看《核算广告》一书。

6、Hive和Spark,数据处理的标配

Hive和Spark咱们仍是要学一下的,运用Hive来存储数据,运用spark sql和Hive sql来处理数据,感觉是互联网里边的干流办法。关于hive,把握电话号码一些常用的函数的运用办法,如concat_ws,row_number,case..when,if,get_json_object等等,关于spark sql,把握其运转的基本原理,以及一些常见问题的处理办法。首要,学会怎么处理数据歪斜,有时分由于一个数据歪斜问题,一整天都糟蹋在调试一个spark代码中了,其次,学习怎么尽量削减spark使命的空间占用,一起加快spark使命运转速度,spark作业在线上调用时,会占用公共资源,你的使命占用的资源越多,他人占用的资源就越少,一起,假如你的使命运转的快,也能够给他人的使命更多的空间。spark能够经过许多言语来完成,不过我主张仍是学习一下scala吧,究竟能够和java无缝联接。除了spark和hive,把握必定的excel常识也是必要的。

那么这里有两本书引荐给咱们,《Hive编程攻略》和《Spark内核机制解析及功能调优》:

好了,共享了这么多,小编把上面说到的一些学习材料进行了收拾,除了《互联网广告的商场规划》一书没有找到美人总裁爱上我pdf资源外,其他的都收拾好了,目录如下:

想要获取上述材料么?后台回复 经典材料,即可取得下载链接。谢谢咱们的重视和支撑,小编后面会持续尽力的!

加我微信 拉你进入学习沟通群


往期文章回忆

黑科技 ! 再也不怕微信音讯被撤回

一键拼出你的微信老友图片墙

剖析一把NBA季后赛

微博的力气为什么这么大?

Python数据可视化:普通的国际

学习路上最良知的一条主张 另【文末无套路送书】

黑科技:用Python检查一起老友【附源码】

数据整合与数据清洗

豆瓣已玩烂,来遗落战境爬点有逼格的 ——IMDB 电影提高你的档次

国际上最有价值的不是石油而是数据(附数据资源下载链接)

数据剖析:LPL, 你更看好哪只部队?

「从0到1」Python爬虫专题结束版



回要害词得Python根底,爬虫,数据剖析,Web 7本电子书


留言打卡:打卡格局 Day N + 正能量的话或许你最近的学Python状况,做有价值的留言榜。

喜爱就点击“在看”吧


 关键词: