博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
发现超能力:这些数据科学技能助你更高效专业
阅读量:2108 次
发布时间:2019-04-29

本文共 2184 字,大约阅读时间需要 7 分钟。

全文共2310字,预计学习时长6分钟

图源:unsplash

 

学习数据科学需要软硬兼备。你既要学习统计、编程和机器学习这样的硬技能。但完成整套训练,还需要掌握更广泛的软技能,来充分发挥自身能力,成为一个高效且成功的专业数据科学家。

 

大部分数据科学的学术培训项目都只专注于硬技能传授,无视行业数据、市场趋势和高层商业领袖反复强调软技能是职场成功的关键因素。本文将就数据科学实践中取得成功所必需的硬技能和软技能进行探讨。

 

硬技能‍

 

1.数学与统计技能

 

数学技能在数据科学和机器学习中至关重要。欲了解更多数据科学和机器学习所需的基本数学技能的信息,请参阅本文:数据科学中需要多少数学知识?(https://medium.com/towards-artificial-intelligence/how-much-math-do-i-need-in-data-science-d05d83f8cb19)

 

2.基本的编程技巧

 

编程技能对于数据科学更是不可或缺的技能。由于Python和R语言是数据科学中最流行的两种编程语言,因此掌握这两种语言的基本知识很重要。

 

欲了解更多有关数据科学所需的基本编程技能的信息,请参见本文:在数据科学中我需要多少编程知识?(https://medium.com/towards-artificial-intelligence/how-much-programming-do-i-need-in-data-science-64356fdb9ef2)

 

3.数据整理和预处理技巧

 

数据是数据科学中任何分析方法的关键,无论是推理分析、预测性分析还是描述性分析。模型的预测能力取决于用于构建模型的数据质量。数据以不同的形式出现,例如文本,表格,图像,语音或视频。通常必须对用于分析的数据进行挖掘、处理和转换,以使其形成适合进一步分析的形式。

 

· 数据整理

 

数据整理的过程对于任何数据科学家来说都是关键一步。在数据科学项目中很难轻易获取数据进行分析,数据更有可能位于文件、数据库中,或者需要从网页、推文或PDF等文档中提取。了解如何处理和清理数据将使你能够从数据中获得隐藏的关键信息。

 

· 数据预处理

 

关于数据预处理的知识非常重要,其中包括以下主题:

 

· 处理丢失的数据

· 数据估算

· 处理分类数据

· 为分类问题编码类标签

· 特征变换和降维技术,例如主成分分析(PCA)和线性判别分析(LDA)。

 

图源:unsplash

4.数据可视化技巧

 

你需要了解良好的数据可视化的基本构成,可以使用多个数据可视化程序包,例如matplotlib,seaborn和ggplot2。

 

 

数据可视化项目的典型工作流程。| 图源:Benjamin O. Tayo

 

5.基本机器学习技能

 

机器学习是数据科学的一个重要分支。理解机器学习框架很重要:问题框架、数据分析、模型构建、测试与评估以及模型应用。

 

机器学习项目的典型工作流程。| 图源:

 

6.从数据科学项目实践获取实用技能

 

仅仅从课程中学习技能并不能保证你成为数据科学家。一个合格的数据科学家必须自己成功完成过一个实际的数据科学项目,包括数据科学和机器学习过程的每个阶段,如问题框架、数据采集和分析、模型构建、模型测试、模型评估和模型部署。现实世界中的数据科学项目可以在这些地方找到:

 

· Kaggle比赛

· 实习

· 访谈

 

软技能

 

1.沟通技巧

 

数据科学家需要具备与团队的其他成员或组织中的业务管理员交流的能力。向根本不了解数据科学技术概念的人们传达和展示非常技术性的信息时,良好的沟通技巧将发挥关键作用。良好的沟通能力将有助于与数据分析师、数据工程师和现场工程师等其他团队成员形成团结统一的氛围。

 

2.成为终身学习者

 

数据科学是一个不断发展的领域,因此随时请做好接受和学习新技术的准备。紧跟该领域发展步伐,你可以与其他数据科学家建立信息网络。还需要关注某些促进信息网络的平台,包括LinkedIn,GitHub和Medium(面向数据科学和面向AI的版本),这些平台对于获取该领域最新动态信息非常有用。

 

3.团队合作精神

 

数据科学家脱离不了团队,你将在一个有数据分析师、工程师、管理员的团队中工作,因此需要良好的沟通技巧,同时也需要做一个好的倾听者,尤其是在项目开发的早期阶段,你要依靠工程师或其他人员来设计构筑一个好的数据科学项目。

 

成为一个好的团队合作者,可以帮助你在商业环境中健康发展,并与团队中的其他成员以及管理者保持良好的关系。

 

图源:unsplash

4.商业敏锐度

 

商业敏锐度是实际应用中必不可少的一项重要技能。从模型中得出具备现实意义的能力被称为商业敏锐度,该能力有助于做出重要且节省成本的数据驱动型决策。

 

5.遵守数据科学道德原则

 

了解项目含义,对自己诚实,避免操纵数据或使用有意产生结果偏差的方法。从数据收集到分析,再到模型构建、分析、测试和应用,在所有阶段中都需要遵守道德规范。避免出于误导或操纵观众的目的捏造结果,解释数据科学项目的结果时也要遵守道德原则。

 

硬技能已经得到了学习者足够多的关注,别忘了软技能对于在现实世界中取得成功也至关重要。

一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

转载地址:http://fruef.baihongyu.com/

你可能感兴趣的文章
Leetcode C++ 《第175场周赛-2 》5333.制造字母异位词的最小步骤数
查看>>
Leetcode C++ 《第175场周赛-3》1348. 推文计数
查看>>
Leetcode C++《热题 Hot 100-44》102.二叉树的层次遍历
查看>>
Leetcode C++《热题 Hot 100-45》338.比特位计数
查看>>
读书摘要系列之《kubernetes权威指南·第四版》第一章:kubernetes入门
查看>>
Leetcode C++《热题 Hot 100-46》739.每日温度
查看>>
Leetcode C++《热题 Hot 100-47》236.二叉树的最近公共祖先
查看>>
Leetcode C++《热题 Hot 100-48》406.根据身高重建队列
查看>>
《kubernetes权威指南·第四版》第二章:kubernetes安装配置指南
查看>>
Leetcode C++《热题 Hot 100-49》399.除法求值
查看>>
Leetcode C++《热题 Hot 100-51》152. 乘积最大子序列
查看>>
[Kick Start 2020] Round A 1.Allocation
查看>>
Leetcode C++ 《第181场周赛-1》 5364. 按既定顺序创建目标数组
查看>>
Leetcode C++ 《第181场周赛-2》 1390. 四因数
查看>>
阿里云《云原生》公开课笔记 第一章 云原生启蒙
查看>>
阿里云《云原生》公开课笔记 第二章 容器基本概念
查看>>
阿里云《云原生》公开课笔记 第三章 kubernetes核心概念
查看>>
阿里云《云原生》公开课笔记 第四章 理解Pod和容器设计模式
查看>>
阿里云《云原生》公开课笔记 第五章 应用编排与管理
查看>>
阿里云《云原生》公开课笔记 第六章 应用编排与管理:Deployment
查看>>