关于我

我叫唐松,在广西桂林长大。高考获得58万港币全额奖学金,入读香港中文大学商学院,主修金融和计量营销。一切似乎过得顺风顺水,但是大学四年却是我痛苦的回忆,因为金融并不是我喜欢的方向,尝试各种专业课程无果。直到大四,和教授做数据分析项目,才渐渐发现自己的兴趣。从数据中发掘有用的信息,就像侦探一样,很有意思。同时,上了两门编程课,很轻松地拿到了好成绩。就这样发现了自己的擅长项和兴趣,但是已经临近毕业。

当时大数据的概念不火,市面上没有相应的岗位,加上自己实力不够,找工作不太理想。幸好毕业后能够跟随刘建南教授,他带着我一起推动大数据在大中华的发展和落地,在大中华地区和 IBM 合作大数据 A100计划,为多家世界五百强公司提供了数据挖掘和商业化落地的服务。这两年做了大概10个项目,包括美的,平安科技,中信银行等等。在这两年中,自学了 Python 和网络爬虫,以及其他数据挖掘工具。

工作两年,一直心想着去美国学习真正的数据科学,2016年9月便毅然辞去工作,准备各种考试。幸而拿到了康奈尔大学 – 信息科学硕士的offer。申请完之后几个月没什么事,于是完成了这本《Python网络爬虫 – 从入门到实践》,由机器工业出版社出版。想必这也是大家认识我的源头。

在美国的学习生活很辛苦,但是收获很大。在技术上学过机器学习,文本挖掘等课程,在商业应用上学习了几门MBA课程,和小伙伴们一起做项目打Kaggle比赛。

想回国折腾折腾,所以就回国了,现在在腾讯做数据分析。

《Python网络爬虫 – 从入门到实践》第一版的很多案例和代码已经没法使用了,于是进行了更新,并加入了Scrapy部分。现在已经出版了第二版。