Python开发领域流传着一句话:“人生苦短,我用Python”,很多人还把它印在了衣服上。某种程度上,这也表明了Python的功能强大与简洁。
这可不是一句戏言,先来看一组统计数据,在著名的程序员问答社区Stack Overflow 2019年的开发者年度调查报告中,Python成为增长最快的开发语言,仅次于Rust语言,并成为最受喜爱的语言之一,如图2.2所示。
不仅程序员对Python钟爱有加,Python也是数据科学家的标配语言。在著名的数据科学竞赛网站Kaggle(www.kaggle.com)2018年对数据科学家使用何种语言的调查中,Python也是拔得头筹。
毋庸置疑,Python的流行也有其原因。
(1)快速开发。除了Python语言自身的设计哲学以外,用户还有丰富的Python三方库可以使用,如在数据科学中常用的用于数值处理和科学计算的NumPy、SciPy;用于数据处理的Pandas;用于数据可视化的Matplotlib;用于机器学习的Scikit-learn等。这些库提供了大量的基础实现,数据分析人员在编码的过程中,可以方便地使用这些库,从而避免了大量代码编写过程。
(2)代码简洁,容易理解。以机器学习为例,利用传统的Java和Python完成同一个算法实现时,Python的实现代码量明显少于Java。程序代码量的下降意味着开发周期的缩短,这在一定程度上减轻了程序员的开发负担。程序员可以利用节省的时间做更多有意义的事情,如算法设计。
(3)语言生态健全。Python语言目前在Web开发、大数据开发、人工智能开发、后端服务开发和嵌入式开发等领域都有广泛的应用,成熟案例非常多,所以采用Python完成代码实现的时候往往具有较小的风险。
伴随着大数据和人工智能的发展,Python语言的上升趋势非常明显,相信未来Python语言在人工智能、物联网会有更加广泛的应用。从这个角度来看,利用Python进行数据分析也是一个绝佳选择。