python的一些乱七八糟
本文不涉及python较基础的print、input、if、for等语法,只记录一些日常用到的函数和参数。
1. python 库
1.1 shutil库
2. python 函数的用法
2.1 绘图相关参数
2.1.1 cmap函数
这个函数中可选的cmap参数包括: 例:
cmap='seismic'
'seismic'
: 红-白-蓝配色,用于表示正负值之间的差异。'jet'
: 黑-蓝-青-黄-红配色,用于表示连续变化的数据。'coolwarm'
: 深蓝-白-红配色,用于表示正负值之间的差异。'viridis'
: 从深绿到黄绿到黄的单调配色,用于表示连续变化的数据。 用于绘制场增强图。'plasma'
: 紫-粉红-橙-黄单调配色,用于表示连续变化的数据。'magma'
: 一种从黑色到红色的颜色映射。'inferno'
: 一种从黑色到黄色的颜色映射。'cool'
: 一种从青色到绿色的颜色映射。'hot'
: 一种从黑色到红色的颜色映射。'RdBu_r'
: 它将数据值映射到红色和蓝色之间的颜色。其中,RdBu
代表红色和蓝色的混合,_r
表示颜色映射是反转的,即高值对应的颜色是蓝色,低值对应的颜色是红色。高值:深蓝色 中等值:白色 低值:深红色
除了上面列出的常用的颜色映射外,还有许多其他的颜色映射可供选择。在选择颜色映射时,需要根据数据类型和分布特性进行评估,并根据需要调整对比度、亮度、饱和度等参数,以便最大程度地突出数据的特征。
3. Python numpy,scipy,pandas这些库的区别是什么?
Numpy是以矩阵为基础的数学计算模块,纯数学。
Scipy基于Numpy,科学计算库,有一些高阶抽象和物理模型。比方说做个傅立叶变换,这是纯数学的,用Numpy;做个滤波器,这属于信号处理模型了,在Scipy里找。
Pandas提供了一套名为DataFrame的数据结构,比较契合统计分析中的表结构,并且提供了计算接口,可用Numpy或其它方式进行计算。
打个比方,pandas类似Excel软件,scipy就像Excel里的函数算法包,numpy则好比构建Excel逻辑的底层语句。
所以说pandas擅长数据处理,scipy精通数学计算,numpy是构建pandas、scipy的基础库。
我们知道numpy通过N维数组来实现快速的数据计算和处理,它也是Python众多数据科学库的依赖,其中就包括pandas、scipy。而numpy本身不依赖于任何其他Python软件包,只依赖于加速的线性代数库,通常为 Intel MKL或 OpenBLAS。
pandas是python数据处理的核心库,它基于数组形式提供了极其丰富的数据操作,对比excel有过之而无不及。它可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征,广泛应用在学术、金融、统计学等各个数据分析领域。
一般来说,学python数据分析只需要学透pandas就够了,辅助加一些numpy、scipy、matplotlib等库。
scipy 是一个用于数学、科学、工程领域的常用软件包,可以处理最优化、线性代数、积分、插值、拟合、特殊函数、快速傅里叶变换、信号处理、图像处理、常微分方程求解器等。 。
其包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。
scipy中主要的计算模块:
scipy.integrate:数值积分例程和微分方程求解器 scipy.linalg:扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能 scipy.optimize:函数优化器(最小化器)以及跟查找算法 scipy.signal:信号处理工具 scipy.sparse:稀疏矩阵和系数线性系统求解器 scipy.special:SPECFUN(这是一个实现了许多常用数学函数(如伽马函数)的Fortran库)的包装器 scipy.stats:标准连续和离散概率分布、各种统计检验方法,以及更好的描述统计法 scipy.weave:利用内联C++代码加速数组计算的工具
综上所述,pandas和scipy是建立在numpy数组基础之上的数据工具,三者的协同工作可以高效解决很多问题,在金融、财务、天文、生物、气象和气候、材料等多个领域得到了广泛应用。
推荐几本不错的Python数据分析书