如何快速学会ython处理数据(字走心总结)

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

以下文章来源于一个数据人的自留地 ,作者大师兄

大家好,我是大师兄。

很多同学抱怨自己很想学好Python,但学了好久,书也买不少,视频课程也看了不少,但是总是学了一段时间,感觉还是没什么收获,碰到问题没思路,有思路写不出多少行代码,遇到报错时也不知道怎么处理。

从入门到放弃,这是很多学习python的同学常常挂在嘴边上的口头禅。今天我分享一些自己学习Python的心得,并用一个案例来说明python解决问题的基本思路和框架。

听到别人说Python很牛很厉害,也想跟着学,这样的人肯定是学不好python的。没有明确的需求和动力,就会导致你学python两天打鱼三天晒网,没有恒心也没有决心。

假如你有明确的需求,比如:

当你面对这样一些需求时,你还无法求助他人帮忙时,这个时候,你就必须学习Python来帮你处理了。

Python的学习方向有很多,比如:

我是日常用Python主要做数据处理和数据分析工作,所以我选择的是数据处理和数据分析方向,其他Python功能接触的比较少。

不管你选择了什么方向,Python的基本语法是必须掌握的。对于没有编程经验的人,Python是一门非常适合入门的编程语言,因为它是高度封装的,不需要对于底层特别了解,也能够很好学习使用。python语法非常简单,代码可读性高,对于零基础的人来说更容易接受和使用。

利用Python做数据处理,线性代数和统计学这两门基本理论知识还是要会点,线性代数你至少得需要知道矩阵和矩阵运算规则,统计学你至少要知道描述性统计。

常用的Python数据处理模块有Pandas和Numpy这两个,这是必须要掌握的,另外,Matplotlib模块是数据可视化模块,也是必须会的。

数据导入、清洗和准备、规整、分组等操作,都是数据处理中常用的方法,平常对比Excel数据操作,Python都可以实现,而且一行简单的代码,就可以操作比较复杂的数据处理方法。

重要的事情说三遍,多练!多练!多练!

Python和数据分析都是实践学科,光学理论,不练习,是不会有任何收获的,学完之后不练就忘掉了。最好的方式,就是先掌握一点基础语法,然后把Python融合到工作中,解决日常工作中碰到的问题。在解决问题的时候,你会碰到各种问题,可以去"百度"寻找答案。最后,要定期总结和输出。

特别提示,假如你没有基础或者基础薄弱的话,建议工作期间不要尝试用Python解决复杂的问题,这是一个很浪费时间的事情,中间各种问题,会让你崩溃。最终Python没学好,还耽误了工作。所以,要利用工作之余的时间,把python基础打扎实。

首先,需要安装python,我要推荐Anaconda3,从事数据分析的伙伴们,严重推荐此软件!

Anaconda降低了数据分析初学者的学习门槛,因为这个软件自带了python中大概有1000多个数据科学包,让你无需单独学习每个库的安装方法。另外,还自带了Jupter notebook代码编译器。现在,Anaconda和Jupyter notebook已成为数据分析的标准环境。

具体的安装方法参考如下链接:

安装完成后,打开Jupter Notebook,就可以在上面输入代码。

现在工作中面临一个批量化文件处理的问题:就是要把每个二级文件下csv文件合并到一个数据表里,同时要在最终的数据表里增加两列,一列是一级文件目录名称,另一列是二级文件目录名称。

当工作中,碰到这样的问题时,我用最笨拙的方法——人工,一个一个文件整理,但是效率比较低,可能需要一个人一天的工作量。当然,我也可以寻找技术的帮忙,找一个Java工程师,这个问题也很容易解决,但麻烦别人一次,没问题。以后碰到类似的问题,总是麻烦,就不好了。假如自己掌握了Python,这个问题就变得很简单了。

其实这个问题,对于一个专业的Python程序员来说,是一个再简单不过的问题。但是对于一个初学者来说,要解决这个问题,恐怕需要费一点时间和脑力。

编程之前,我是如何思考的:

1、首先,要读取文件名称,需要引入OS模块下的listdir函数

2、其次,遍历所有一级、二级、三级文件名称,需要用到for循环和循环嵌套

3、然后,读取文件下csv表,需要用到pandas模块下的read_csv函数

4、最后,整理合并后的所有表,需要用到DataFrame的操作方法

实现代码如下:

这段代码虽然简单,但基本攘括了Python的大部分基本语法,接下来我带大家一一解剖下这些基本语法。

下面程序使用导入整个模块的最简单语法来导入指定模块:

使用Python进行编程时,有些功能没必须自己实现,可以借助Python现有的标准库或者其他人提供的第三方库。像OS和pandas,都是标准库,导入后,就可以在程序中使用其模块内的函数,使用时必须添加模块名作为前缀。

假如模块名长,就可以取别名,比如pandas模块,取别名为pd。像os模块,由于比较简短,就没有取别名。别名的作用,就是调用该模块下的函数时,减少代码的复杂度。

数据的导入是数据处理和分析的第一步,日常我使用的比较多的是利用pandas进行数据输入和输出,尽管其他库中也有许多工具可帮助我们读取和写入各种格式的数据。

将表格型数据读取为DataFrame对象是pandas的重要特性

当然,数据的输入,也有与数据库交互读取数据,也有与WEB API交互读取数据,这个是属于进阶的内容,后期带大家学习。

变量是Python语言中一个非常重要的概念,其作用就是为Python程序中的某个值起一个名字。类似于"张三"、"李四"一样的名字。在Python语言中,声明变量的同时需要为其赋值,毕竟不代表任何值的变量毫无意义。

声明变量非常简单,语法结构:等号(=)左侧是变量名,右侧是变量值,Python编译器会自动识别变量的数据类型。

说到变量,就不得不谈Python的基本数据类型,Python有6个标准的数据类型:

学习Python,掌握其基本数据类型,特别重要!重要!重要!详细的介绍,见:

我们所见到的程序,有很多程序都是按照顺序从上到下执行它们。如果你想要改变语句流的执行顺序,也就是说你想让程序做一些决定,根据不同的情况做不同的事情。这个时候,就需要通过控制流语句来实现。

在Python中有三种控制流语句——if、for和while。详细的知识点,见如下:

if语法讲解

while语法讲解

for语法讲解

嵌套for语法讲解

本次实例中,需要读取一级文件目录名称、二级文件目录名称、三级csv文件目录名称,并逐个遍历它,于是选择了for循环。for循环就是个迭代器,当我们在使用for循环时,即重复运行一个代码块,或者不断迭代容器对象中的元素,比如一些序列对象,列表,字典,元组,甚至文件等,而for循环的本质取出可迭代对象中的迭代器然后对迭代器不断的操作。

函数是组织好的,可重复使用的,用来实现单一、或者相关功能的代码段。

函数能提高程序的模块性,和代码的重复利用率。Python提供了许多标准模块的内建函数,比如os模块下的listdir函数,用来读取文件的名称,pandas模块下的read_csv函数,用来读取csv文件的数据。当然,也可以自己创建函数,也就是所谓的自定义函数,下一节详细讲。

我们可以自定义一个自己想要的功能函数,通常遵循以下规则:

定义一个函数只给了函数一个名称,指定了函数里包含的参数和代码结构。这个函数的基本机构完成以后,你就可以通过调用该函数来实现你想要的返回结果。

Lambda是一个表达式,定义了一个匿名函数,代码x为入口参数,x[0:7]为函数体。非常容易理解,在这里lambda简化了函数定义的书写形式。使得代码更为简洁,更为直观易理解。

但是lambda函数,在Python社区是一个存在争议的函数,支持方认为,Lambda函数的使用,使得代码更加紧凑。反对法认为该函数用多了反而看起来不那么清晰。

在用pandas做数据处理的时候,个人习惯,apply+lambda配合使用,可以对dataframe数据集中的列做很多很多事情。

DataFrame是一种表格型数据结构,在概念上,它跟关系型数据库的一张表,Excel里的数据表一样。

创建一个DataFrame

日常数据处理的过程中,通常是通过读取文件生成DataFrame,最常用的是read_csv,read_table方法。下面是最简单的读取文件语句,该方法中有很多重要的参数,在导入文件时候,通过这些参数,可以控制导入数据的格式和数量。其他创建DataFrame的方式也有很多,比如我经常会从SQL SERVER读取数据来生成。这里就不详细介绍。

DataFrame索引、切片

我们可以根据列名来选取一列,返回一个Series,同时也可以对这一列的数据进行操作。

最后,我说下Python与Excel之间的关系,为什么要拿这两个工具比较,因为很人觉得:

从根本上来说,Python和excel都可以作为数据处理和分析以及展现的工具,工具本身没有好与坏,关键在于使用者的业务场景以及使用自身对工具的掌握程度。当两种工具都能达到使用者业务场景想要的效果时,使用者会更倾向于使用自己熟练或者更易于实现的工具高效地解决实际问题。

所以说,日常大部分与数据相关的工作中,少量数据的处理和分析,excel都足以胜任,除非遇到大样本数据导致excel无法处理或者计算很慢时,这时候python的优势才会体现出来。

除此之外,如果使用者的业务场景是报表呈现时,excel做出来的结果直接就是可以交付的结果。

当然,当面临大量需要重复处理的文件或者经常要做的数据工作,这个时候,如果自动化,会大大提高工作效率,这个时候,python的优势也很明显。

THE END
0.Python学习实践经验与心得python实训总结及体会Python 学习实践经验与心得 一、基础语法入门:搭建编程思维框架​ 【章节标题】Python基础语法​ 在学习 Python 的初始阶段,掌握基础语法是重中之重。基础语法就像是建造高楼的基石,只有扎实掌握,才能在后续的学习中稳步前行。 # 变量定义与使用 name = "小明"jvzquC41dnuh0lxfp0tfv8ycp2=139<1ctzjeuj1fgzbkux136>98<;4:
1.Python课实训报告心得体会python实训总结在信息技术日新月异的今天,Python作为一门强大且易于上手的编程语言,受到了广泛的关注和喜爱。本学期,我参加了Python课程的实训,通过一系列的实践操作,我对Python有了更深刻的理解和认识。以下是我对这次实训的心得体会。 一、实训初期的迷茫与探索 在实训初期,我面临着诸多挑战。Python的语法虽然简洁明了,但对于我jvzquC41dnuh0lxfp0tfv87623e97B<:5780c{ykenk0fnyckny03=5786837
2.Python教学心得(通用5篇)Python教学心得(通用5篇) Python教学心得 篇1 最近这段时间我们学习了很多内容,增长了很多关于Python的知识,万事万物是相通的,正如学习新的知识就像吃饭一样。 吃多了就会消化不良,反映到学习上也是一样,不知各位最近的感觉怎样,反正学记是需要一些时间好好消化,掌握到手中,为下一步的知识补齐缺口。 jvzquC41yy}/fr~khctxgw3eqo5gcw|gp1~vgnzkpjfvrmwk1>3;;9240nuou
3.python实训总结和体会python实训总结和体会 总结是把一定阶段内的有关情况分析研究,做出有指导性结论的书面材料,它可以帮助我们总结以往思想,发扬成绩,因此好好准备一份总结吧。那么总结有什么格式呢?下面是小编整理的python实训总结和体会,欢迎阅读,希望大家能够喜欢。 python实训总结和体会 jvzquC41o0xvk€jp0eun1€ttf1vzvqtpujoywwqpipjgqjvkj{j0qyon
4.初学python的体会心得初学python的体会心得 当我们对人生或者事物有了新的思考时,马上将其记录下来,这样我们可以养成良好的总结方法。那么如何写心得体会才能更有感染力呢?下面是小编为大家收集的初学python的体会心得,欢迎大家借鉴与参考,希望对大家有所帮助。 初学python的体会心得1 jvzq<84yyy4vpsx0eqs0uqnlkctykwig17;74@620jznn
5.大学生python实训心得体会【大学生python实训心得体会】大学生Python实训心得体会Python作为一门高级编程语言,越来越受到大学生们的关注和喜爱,而Python实训也成为了大学生们提高编程能力的重要途径之一。在Python实训中,我深刻体会到了学习jvzq<84yyy4nqknngvxbkw3qti5bdxzv1DHT1;:4:46/j}rn
6.python爬虫实训心得体会.pdfpython爬虫实训心得体会.pdf,python爬实训得体会 -python爬学习得 爬新枚,因为作原因需要学习相关的东西。发表下这段时间学习的得,有说得不对的地欢迎指指点点。 .什么是爬 在学习爬之前只对爬有个概念性的认识。通过向服务器发送请求获取服务器传回信息,再根据其提取所jvzquC41o0hpqt63:0ipo8mvon532;712;881A5462673:92267547xjvo
7.python数据分析报告范文,python数据分析心得体会文章浏览阅读813次。这篇文章主要介绍了python数据分析报告心得体会,具有一定借鉴价值,需要的朋友可以参考下。识运用于实践中的好机会,原先,学的时候感叹学的资料太难懂,此。首先,它锻炼了我做项目的本事,提高了独立思考问题、自我动手操。作的本事,在工作的过程中jvzquC41dnuh0lxfp0tfv87623e96>5623?0c{ykenk0fnyckny03<>4;6:3:
8.Python学习心得体会,学习技巧总结python总结心得体会Python学习心得体会,学习技巧总结 首先最开始,我们要明确一点,学习编程不是一日之功,需要每天投入时间学习,也不可纸上谈兵,需要自己亲自操作,不动手就不会发现问题,动了手印象才会深刻,记得更靠。 接下来我就稍微总结一下,我在学习中遇到的问题和一些心得体会。jvzquC41dnuh0lxfp0tfv87623e97@895:80c{ykenk0fnyckny03=6584>35
9.做python的心得体会实训python的心得体会实训python的心得 光阴似剑,转眼间, 一个月的实习就这样结束了,至于我总体的感觉只能用八个字来概括“虽然辛苦,但很充实”。 在这一个月里,我学到了很多有用的知识,我也深深地体会到工人们的辛苦和伟大,钳工实习是我们机电系的一个课程,也许我们以后不会真正的从事工业生产,但这一个月给我留下的宝贵经验是jvzquC41dnuh0lxfp0tfv8|gkzooa<>:727648ftvkimg8igvcomu8633985:>5
10.PYTHON实训总结及体会500字,PYTHON实训总结思考建议文章浏览阅读2k次。本文分享了作者对Python实训的心得体会,强调了理论知识的重要性,尤其是在做测试技术实验时,必须掌握基础知识,如电桥接法。作者提倡亲自动手实践,注重每个步骤和细节,以提升学习效率。jvzquC41dnuh0lxfp0tfv8fs::821jwvkerf1mjvckrt1:88;7=29=
11.python学习收获和总结大学生python心得体会python学习收获和总结 作为一名从未接触过变成累的大一的学生,在第一学期接触并逐渐掌握了一点点技能的python语言,在学习的过程中有过迷茫和不知所措,但都及时的向老师寻求了帮助,老师的教学态度也让我有了更多想了解Python语言的想法,学习编程语言让我有了更强的逻辑理解能力和独立思考的意识,更多是与团队合作的jvzquC41dnuh0lxfp0tfv87623e9;A8365<0c{ykenk0fnyckny03=9822<89