其他
盘点数据科学最流行的29个Python库
导读:我们都着眼于如何使用现有的库来避免重复工作,从而使程序开发工作事半功倍。通常,开发大量原始代码是一个费时费力的工作,为了避免这种情况,我们会尽可能多地使用库中已有的类来创建对象,通常仅需要一行代码。因此,库能够帮助我们使用适量的代码执行重要的任务。
本文介绍数据科学中会经常使用多种Python标准库、数据科学库和第三方库。
16 / 29
collections:建立在列表、元组、字典和集合基础上的加强版数据结构。 csv:处理用逗号分隔值的文件。 datetime, time:日期和时间操作。 decimal:定点或浮点运算,包括货币计算。 doctest:通过验证测试或嵌入在docstring中的预期结果进行简单的单元测试。 json:处理用于Web服务和NoSQL文档数据库的JSON(JavaScript Object Notation)数据。 math:常见的数学常量和运算。 os:与操作系统进行交互。 queue:一种先进先出的数据结构。 random:伪随机数操作。 re:用于模式匹配的正则表达式。 sqlite3:SQLite关系数据库访问。 statistics:数理统计函数,如均值、中值、众数和方差等。 string:字符串操作。 sys:—命令行参数处理,如标准输入流、输出流和错误流。 timeit:性能分析。
3 / 29
NumPy(Numerical Python):Python没有内置的数组数据结构。它提供的列表类型虽然使用起来更方便,但是处理速度较慢。NumPy提供了高性能的ndarray数据结构来表示列表和矩阵,同时还提供了处理这些数据结构的操作。详细教程请戳👉高能!8段代码演示Numpy数据运算的神操作 SciPy(Scientific Python):SciPy基于NumPy开发,增加了用于科学处理的程序,例如积分、微分方程、额外的矩阵处理等。scipy.org负责管理SciPy和NumPy。详细教程请戳👉3段极简代码带你入门Python科学计算库SciPy StatsModels:为统计模型评估、统计测试和统计数据研究提供支持。
1 / 29
pandas:一个非常流行的数据处理库。pandas充分利用了NumPy的ndarray类型,它的两个关键数据结构是Series(一维)和DataFrame(二维)。详细教程请戳👉Pandas最详细教程来了!
2 / 29
Matplotlib:可高度定制的可视化和绘图库。Matplotlib可以绘制正规图、散点图、柱状图、等高线图、饼图、矢量场图、网格图、极坐标图、3D图以及添加文字说明等。详细教程请戳👉Python实操:手把手教你用Matplotlib把数据画出来 Seaborn:基于Matplotlib构建的更高级别的可视化库。与Matplotlib相比,Seaborn改进了外观,增加了可视化的方法,并且可以使用更少的代码创建可视化。详细教程请戳👉数据可视化干货:使用pandas和seaborn制作炫酷图表(附代码)
4 / 29
scikit-learn:一个顶级的机器学习库。机器学习是AI的一个子集,深度学习则是机器学习的一个子集,专注于神经网络。 Keras:最易于使用的深度学习库之一。Keras运行在TensorFlow(谷歌)、CNTK(微软的深度学习认知工具包)或Theano(蒙特利尔大学)之上。 TensorFlow:由谷歌开发,是使用最广泛的深度学习库。TensorFlow与GPU(图形处理单元)或谷歌的定制TPU(Tensor处理单元)配合使用可以获得最佳的性能。TensorFlow在人工智能和大数据分析中有非常重要的地位,因为人工智能和大数据对数据处理的需求非常巨大。本书使用TensorFlow内置的Keras版本。详细教程请戳👉TensorFlow是什么?怎么用?终于有人讲明白了 OpenAI Gym:用于开发、测试和比较强化学习算法的库和开发环境。
3 / 29
NLTK(Natural Language Toolkit):用于完成自然语言处理(NLP)任务。 TextBlob:一个面向对象的NLP文本处理库,基于NLTK和模式NLP库构建,简化了许多NLP任务。 Gensim:功能与NLTK类似。通常用于为文档合集构建索引,然后确定另一个文档与索引中每个文档的相似程度。
本文摘编自《Python程序设计:人工智能案例实践》,经出版方授权发布。
转载请联系微信:DoctorData
推荐语:极简入门Python和AI,读这一本就够了!538个实例帮你掌握交互式IPython解释器和JupyterNotebook并应用Python实践人工智能项目。
更多精彩👇
在公众号对话框输入以下关键词查看更多优质内容!
PPT | 读书 | 书单 | 硬核 | 干货 | 讲明白 | 神操作大数据 | 云计算 | 数据库 | Python | 爬虫 | 可视化AI | 人工智能 | 机器学习 | 深度学习 | NLP5G | 中台 | 用户画像 | 1024 | 数学 | 算法 | 数字孪生
据统计,99%的大咖都关注了这个公众号👇