在日常生活中时长面临操作大量Excel文件的情况, 如何有效的利用Python脚本来实现复杂的操作呢? 本文旨在介绍python中操作Excel文件的几个包: xlrd(读), xlwt(写), openpyxl(读,写), 以及pandas.

注意: 利用xlrd和xlwt操作Excel时, 只有读和写, 没有修改这一选项, 如果想要修改某个单元格, 需要将原有数据读出, 修改过后, 重新写入新的Excel文件.

xlrd 适用于任何版本的Excel文件, Python 2.7, 3.4+.

xlwt 适用于 MS Excel 97/2000/XP/2003 XLS files, Python 2.6, 2.7, 3.3+ (xlwt无法将文件保存为.xlsx文件, 且不能写入超过65535行,256列的数据).

openpyxl 适用于Excel 2010 xlsx/xlsm/xltx/xltm, Python >=3.6.

pandas 是进行数据分析和处理的常用包, 处理Excel只是其功能的很小一部分. 在利用其处理Excel时, 其依赖xlrd包, 需要安装xlrd后, 方可利用pandas 处理Excel. pandas读取Excel并处理的本质是将Excel数据读至DataFrame 进行操作, 本文所涉及的均是DataFrame 的常用操作.

阅读全文 »

在日常工作中, 我们有时需要处理大量文件以及文件夹, 本文介绍python中操作文件(夹)的模块osshutil 以及查看文件状态的模块stat.

注意: os模块中也有stat函数, 使用方法为os.stat(path, *, dir_fd=None, follow_symlinks=True), 模块stat为实现os.stat()的底层模块, 可以直接调用该模块查看文件详细信息, 也可以使用os.stat查看文件信息.

阅读全文 »

信息社会, 我们在日常生活中一直谈论信息, 但是信息这个概念有些抽象. 有时候说信息多, 或者信息少, 但是很难说清楚到底是多少. 比如一本50多万字的中文书<史记>到底有多少信息量, 很难进行定量的表示. 直到1948年, 香农(Claude Shannon)提出了信息熵的概念, 才解决了信息度量问题.

阅读全文 »

Anaconda

Anaconda就是可以便捷获取包且对包能够进行管理, 同时对环境可以统一管理的发行版本. Anaconda包含了conda, Python在内的超过180个科学包及其依赖项. 而且其可以对不同的Python环境进行隔离, 举个例子, 如果需要同时创建python2.7 和python3.5的环境, 我们有两种方式, 一种是使用virtualenv(虚拟环境)来创建, 另外一种方式是使用anaconda 创建.

阅读全文 »

lambda 匿名函数

lambda也被称为匿名函数, 既没有确定的函数名称. 在有些时候, 不需要显示定义函数, 直接传入具体的操作则可以使用lambda更方便.

lambda 语法

lambda argument_list : expression #argument_list为参数列表, 其有多种形式, expression则为表达式, 表示我们需要执行的操作

lambda x,y: x+y #该语句表示输入两个参数x,y, 并返回x+y的值

常用情形

阅读全文 »

max

max(a, axis=None, out=None, keepdims=np._NoValue)
Return the maximum of an array or maximum along an axis.
返回array的最大值或者沿axis轴的最大值

阅读全文 »

R2017b之前的版本支持py2.7-py3.5,R2017b以及之后可支持py3.6

安装MATLAB

切换目录至 MATLAB\R2018b\extern\engines\python,执行命令

1
2
3
4
#非默认目录下安装,并把安装信息存至D:\MatlabForPython\files.txt
python setup.py build --build-base="D:\MatlabForPython" install --record D:\MatlabForPython\files.txt
#默认目录下安装
python setup.py install
阅读全文 »
0%