Python的函数(内置函数和我们自己编写的自定义函数)是处理数据的关键工具。但是他们对数据的处理可能会有些混乱,如果我们不知道发生了什么,可能会导致分析中的严重错误。
在python函数控制列表和词典中,我们将仔细研究Python在函数内部进行操作时如何对待不同的数据类型,并学习如何确保仅在需要更改数据时才更改数据。
功能中的内存隔离
要了解Python如何处理函数内部的全局变量,让我们做一些实验。我们将创建两个全局变量number_1和number_2,并将它们分配给整数5and 10。然后,我们将这些全局变量用作执行一些简单数学运算的函数中的参数。我们还将变量名用作函数的参数名。然后,我们将查看函数内部的所有变量用法是否已影响这些变量的全局值。
正如我们可以看到上面的功能工作正常,以及全球变量的值number_1,并number_2没有不改变,即使我们用它们作为参数,并在我们的函数的参数名称。这是因为Python将函数的变量存储在与全局变量不同的内存位置中。它们是孤立的。因此,变量number_1在全局范围内可以具有一个值(5),而在函数内部则可以具有不同的值(50),在此将其隔离。
列表和词典呢?
清单
我们已经看到,对number_1函数内部的上述变量执行的操作不会影响其全局值。但是number_1是一个整数,这是一个非常基本的数据类型。如果我们尝试使用不同的数据类型(例如列表)进行相同的实验,会发生什么?在下面,我们将创建一个名为的函数duplicate_last(),该函数将在我们将其作为参数传递的任何列表中复制最终条目。
如我们所见,即使仅在函数中更改了全局值,此处的全局值也initial_list 已更新!
辞典
现在,让我们编写一个将字典作为参数的函数,以查看在函数内部对全局字典变量进行修改时是否也会对其进行修改。
为了使这一点更加现实,我们将使用Python基础知识课程中AppleStore.csv使用的数据集中的数据(可在此处下载数据)。
在下面的代码段中,我们从一个字典开始,该字典包含数据集中每个年龄等级的应用程序数量的计数(因此,有4,433个应用程序的等级为“ 4 +”,987个应用程序的等级为“ 9+”,等等。) 。假设我们要为每个年龄等级计算一个百分比,这样我们就可以了解到哪个年龄等级在App Store中最常见。
为此,我们将编写一个名为的函数make_percentages(),该函数将字典作为参数并将计数转换为百分比。我们需要从零开始计数,然后对字典中的每个值进行迭代,然后将它们添加到计数中,以便获得评分的总数。然后,我们将再次遍历字典,并对每个值进行一些数学运算以计算百分比。
在查看输出之前,让我们快速回顾一下上面发生的事情。在将应用程序年龄分级的字典分配给变量后content_ratings,我们创建了一个名为的新函数make_percentages(),该函数带有一个参数:a_dictionary。
为了图什么应用程序的比例下降到每一个年龄分级,我们需要知道应用程序的总数,所以我们先设置一个所谓的新的变量total,以0通过在每个键,然后循环a_dictionary,将它添加到total。
一旦完成,我们要做的就是a_dictionary再次循环遍历,将每个条目除以总数,然后将结果乘以100。这将为我们提供带有百分比的字典。
但是,当我们使用global content_ratings作为该新函数的参数时会发生什么呢?
就像我们在列表中看到的一样content_ratings,即使仅在make_percentages()我们创建的函数内部对其进行了修改,我们的全局变量也已更改。
那么,这里到底发生了什么?我们碰到了可变和不可变数据类型之间的差异。
可变和不可变数据类型
在Python中,数据类型可以是可变的(可变的)或不可变的(不变的)。尽管我们在Python入门中使用的大多数数据类型都是不可变的(包括整数,浮点数,字符串,布尔值和元组),但列表和字典却是可变的。这意味着全局列表或字典即使在函数内部使用时也可以更改,就像我们在上面的示例中看到的那样。
要了解可变(可变)和不可变(不变)之间的区别,研究一下Python如何实际处理这些变量是有帮助的。
让我们开始考虑一个简单的变量赋值:
变量名的a作用类似于指向的指针5,它可以帮助我们5在需要时进行检索。
5是整数,整数是不可变的数据类型。如果数据类型是不可变的,则意味着它一旦创建便无法更新。如果这样做a += 1,我们实际上5并没有更新到6。在下面的动画中,我们可以看到:
1)a最初指向5。
2)a += 1运行,并将指针从5移到6,实际上并没有改变number 5。
列表和字典等可变数据类型的行为有所不同。它们可以被更新。因此,例如,让我们列出一个非常简单的列表:
如果将a附加3到此列表的末尾,我们不仅会指向list_1其他列表,还会直接更新现有列表:
即使我们创建了多个列表变量,只要它们指向同一个列表,更改该列表时它们也会全部更新,如下面的代码所示:
这是上面代码中实际发生的动画的可视化:
这解释了为什么在我们较早地尝试使用列表和字典时更改了全局变量的原因。由于列表和字典是可变的,因此更改它们(即使在函数内部)也将更改列表或字典本身,而对于不可变的数据类型则不是这种情况。
保持可变数据类型不变
一般来说,我们不希望函数更改全局变量,即使它们包含诸如列表或字典之类的可变数据类型也是如此。那是因为在更复杂的分析和程序中,我们可能经常使用许多不同的功能。如果所有人都在更改他们正在处理的列表和词典,则很难跟踪正在更改的内容。
值得庆幸的是,有一个简单的方法可以解决此问题:我们可以使用内置的Python方法来复制列表或字典.copy()。
如果您尚未了解方法,请不要担心。它们在我们的Python中级课程中已涉及到,但是对于本教程而言,您需要知道的是它的.copy()工作方式如下.append():
让我们再来看一下我们为列表编写的函数,并对其进行更新,以使函数内部发生的变化不会改变initial_list。我们需要做的就是将传递给函数的参数从initial_list更改为initial_list.copy()
如我们所见,这解决了我们的问题。原因如下:using .copy()创建列表的单独副本,因此指向initial_list自身的a_list是新副本,而不是指向自身initial_list。a_list之后,对该单独的列表(而不是列表initial_list本身)进行的任何更改,因此的全局值initial_list不变。
但是,该解决方案仍然不是完美的,因为.copy()每次传递参数给函数时,我们都必须记住要添加,否则就有可能意外更改的全局值initial_list。如果我们不想为此担心,我们实际上可以在函数内部创建该列表副本:
通过这种方法,我们可以像initial_list函数一样安全地传递一个可变的全局变量,并且不会更改全局值,因为函数本身会创建一个副本,然后对该副本执行其操作。
该.copy()方法也适用于词典。与列表一样,我们可以简单地添加.copy()参数到传递函数的位置,以创建一个副本,该副本将用于该函数,而无需更改原始变量:
但是,再次使用该方法意味着我们需要记住.copy() 每次将字典传递给make_percentages()函数时都要添加。如果我们要经常使用此函数,则最好将复制实现到函数本身中,这样就不必记住这样做了。
在下面,我们将.copy()在函数本身内部使用。这将确保我们可以在不更改作为参数传递给它的全局变量的情况下使用它,并且无需记住要.copy()为传递的每个参数添加参数。
如我们所见,修改函数以创建字典的副本,然后仅在该副本中将计数更改为百分比已使我们能够执行所需的操作,而无需实际更改content_ratings。
结论
在python函数控制列表和词典中,我们研究了可变数据类型和可变数据类型之间的区别,可变数据类型可以更改,可变数据类型不能更改。我们了解了如何使用该方法.copy()制作可变数据类型(如列表和字典)的副本,以便我们可以在不更改其全局值的情况下在函数中使用它们。