编者按:同文章作者一样许多人对数据科学抱有许多期待或疑问。作者从自身经历的角度,给出了一个初入职场的数据科学家的感悟。本文作者Abhishek Parbhakar,原文标题A year as a Data Scientist right after college: An honest review。
我在学校的时候就很喜欢数学并学会了基础的编程。后来,我在印度理工学院孟买分校(IIT Bombay)学习电气工程,并与哈佛大学教授一起工作近一年,拿到科学计算硕士学位。毕业后,我进入了一家专注于AI的咨询公司,为印度和欧洲的客户做数据科学的项目。
1. 数据科学是很有趣的,如果……
数据科学是一个能让你把所有炫酷的事情放在一块做的稀有工作,它包括了数学、编码和研究。这是一份早上读论文,下午写算法,晚上编代码的工作。这真的很有趣!几天前,当我访问母校时,一位大三学生问我:我如何描述我的工作?我脱口而出:
就像有人付钱让你做作业一样!
但问题是:你只能做“某一些”数学运算、编码和研究。你不能不做其中规定的任何部分,也无法在已给领域中深入。在某些情况下,你也许可以不用读任何研究论文,就能直接使用代码库并开始编码。由于时间有限,你唯一有机会深入研究的部分就是数据准备(以及要进行的演示,如果有的话)。
如果你是一个热爱编码并非常想做这个工作的人,这中间的数学运算则会让你发疯。你没有机会去展示你忍者般的编码技能。从编码爱好者变成数据科学家后,你只有两个选择:让数学蹂躏你,或者你征服它。如果你是一个喜欢解决复杂问题的数学爱好者,那么数据的准备和单调的编程又会让你觉得乏味至极。一个形象的比喻是:
想象一下,如果有人给你一个订书机,让你去整理并装订一屋子的纸质文件,感觉如何?这就是数据清理过程的感觉。

有时你可能会想,如果有人做数据准备的工作,而你只要根据其建立模型就好了。但不幸或者说幸运的是,这从来不会发生。
也许有人会说,这些你不喜欢的事情只占据你所有工作中的一小部分,但事实是,它对于你的整个工作有着远超于其自身比例的影响(参考帕累托定律)。
要想在数据科学领域坚持做下去,就要努力在编码和数学/研究之间达到适当的平衡。最重要的是,要享受工作中的不同方面,并同时保持对结果的关注。
同样,数据科学作为一个正在不断进化发展的领域,它没有任何明确的成功指南。这就需要大量辛苦的工作,不断的学习,以及最重要的——忘却(因为你不知道什么时候“最好的”就变成了“还可以”)。
总结一下:
优点:数据科学让你同时处理许多有意思的事:编码、运算、研究,有时还包括演示。
缺点:数据科学可能不会让你在其任何一个方面做得太深。

2. 数据科学说是“科学”其实更“商业”
行业里的数据科学家跟在欧洲粒子物理研究所或者印度空间研究组织工作的科学家不一样。数据科学家“真正”在做的是把科学的工具应用到商业里,,并为其创造价值。数据科学家的工作不是简单的找到最优解决方法,而是找到一个易于向客户解释并可销售的方案。
在数据科学中,当遇到竞争假设时,商业逻辑通常胜过科学逻辑。
了解人工智能,尤其是熟知其子领域机器学习这块你就可以开始数据科学的工作,但这还不够。
要想在数据科学项目中有所作为,“科学”是不充分条件,你还需要知道经济和市场,以让你的工作具有商业价值。
3. 数据科学的工作是有影响力的,但其实跟其他工作一样
作为一个数据科学家你“很可能”创造巨大的“影响”,但作为一个老师、一个软件工程师、一个记者或者销售员同样可能创造巨大影响。
数据科学正在改变着我们的世界,这无可厚非。但作为一个数据科学家,你能够发挥关键作用的领域是有限的。那种认为数据科学是“改变”网络世界的神秘力量的想法并不完全正确。
此外,“影响”这个词是非常主观的,对于其界定也有许多方面,如:
它有/创造了多少货币价值;
谁是最大的受益者;
你的在其中的角色有多独特和重要;
它在多大程度上是可自我延续的。
你想要什么样的“影响”,而公司给你提供的机会能创造什么样的“影响”,这可能会有很大不同。
如果你是一个聪明且有野心的人,想要在数据科学领域做出“影响”,那么确保你是“合适”这个领域的人,并且你所指的影响与公司能提供给你的机会一致。

4. 当下的经济决定了数据科学
如今数据科学家是一个“抢手”的工作,以致许多招聘者经常联系你,问你是否考虑换公司的情况也不少见。数据科学家在公司里很受尊重而且薪资不菲。
如果你的首要动机是钱的话,我建议你不必做一个数据科学家。
如果你做数据科学只是为了钱,那么我想提醒你,同样的经济规则早晚会让这样的高收入消失。只有你对这个领域的兴趣能够让你持续做下去。
5. 数据科学家的经验是你的垫脚石
数据科学家的工作能帮助你在这个数据驱动的世界里打下坚实基础,并可以更切实地评估AI相关技术的局限性及其功能。
即便你选择离开现有的工作,作为一个数据科学家的经验对你的未来是非常有益的。比如在:
学术研究上(作为硕士/博士/博士后/独立研究者):数据科学家通常花费大量的时间在做实验、读科学文献和与他们的同事讨论想法上。所有这些工作对于做学术研究来说都是非常可贵的。
(编辑:PHP编程网 - 钦州站长网)
【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!