Python 语言基础¶

如何高效地学习编程语言

当我们在说学习一门新的编程语言的时候，我们到底在说什么？

C++, Java, Python, JavaScript, Typescript...

一门又一门的编程语言同中有异，异中有同。虽说“实现目的”是我们学习新的编程语言的直接驱动力，可如何高效地掌握一门编程语言，使其为我所用，是个值得我们思考的问题。

我们尝试用过往的经验来对这个问题给出某种意义上的解答。也许你已经修过了《程序设计基础》或是《计算机程序设计基础》等等课程，我们不妨回忆在入门第一门编程语言时的流程。

我们先介绍了一些最简单的数据类型，然后引入了一些加加减减的操作符。然后，我们学习了基本的程序流程控制语句，如顺序语句、条件语句和循环语句，以掌握程序执行的具体流程。然后，我们学习了一些较为方便的数据组织方式，如 C++ 中的数组、结构体、STL 等等，进而用面向对象的思维来思考问题。此外，我们还要了解使用这门编程语言所具有的独特的优势，比如一门编程语言的语法糖，或是使用这门语言能让我们极为便利地完成什么功能。

因此，我们在学习一门新的编程语言时，不妨就仿照着这个思路，将学到的内容按照上述主题进行归类整理。

什么是语法糖？

语法糖（英语：Syntactic sugar）是由英国计算机科学家彼得·兰丁发明的一个术语，指计算机语言中添加的某种语法，这种语法对语言的功能没有影响，但是更方便程序员使用。语法糖让程序更加简洁，有更高的可读性。

Excerpted from Wikipedia.

Checkpoint!

我们推荐初学 Python 的读者按顺序阅读本文档。文档中有若干 Checkpoint，每个 Checkpoint 都是一个简单的 Python 编程任务，可以快速检验你是否理解了文档讲解的知识。

前置知识¶

基本的代数思维
一定的逻辑能力
先修程序设计课程的程序逻辑，对数据组织形式的一定理解和一定的面向对象思想

Python 可以用来做什么¶

开发网页前端与后端
在数据统计与分析中极具优势
在机器学习领域有极为重要的作用
胶水型语言，简洁灵活
~~拯救你的大一小学期~~

安装、运行与 Hello World¶

Python 的安装¶

Python 版本的选择

Python 现在的主流版本是 Python3，目前的最新版本是 3.10，官方会对该版本进行 Bug 修复，而较为稳定的版本是 3.9 与 3.8，针对其仅会推出安全性相关的修复。

目前在网络上找到的很多教程都还是 Python2 风格的，而 Python 官方在 2020/1/1 已经停止了对 Python2 的官方支持。因此，尽快升级并熟悉 Python3 的语法，是很有必要的。

编译型语言与解释型语言

我们已经熟悉的 C++ 是一种编译型语言。对于编译型语言，开发完成以后需要将所有的源代码都转换成可执行程序，而这种转换一般是不能跨平台的。也就是说，我们要针对不同的平台生成不同的可执行文件。

而我们将要介绍的 Python 是一种解释型语言。每次执行程序都需要一边转换一边执行，用到哪些源代码就将哪些源代码转换成机器码，用不到的不进行任何处理。每次执行程序时可能使用不同的功能，这个时候需要转换的源代码也不一样。相比于编译型语言，解释型语言几乎都能跨平台，“一次编写，到处运行”是真实存在的。也就是说，可以轻松实现在 Windows 上编写 Python 源代码，然后丢到 Linux 上去运行，只要双方配置了相同的解释器环境即可。

参考自 http://c.biancheng.net/view/4136.html.

针对 Windows 用户，请访问 https://www.python.org/downloads/windows/。针对 macOS 用户，请访问 https://www.python.org/downloads/macos/。下载对应的包然后安装即可。

在安装时记得勾选 Add To Path，将安装路径保存为系统环境变量。

什么是环境变量？

可参考 https://zhuanlan.zhihu.com/p/82011100，在了解环境变量的基本概念后，如果你忘记了在安装时将 Python 所在路径添加到环境变量中，可以自行尝试将其添加入 Path。

线上平台运行¶

如果安装暂时有困难，可以先前往类似 programiz 或 w3cschool 的线上平台进行一些编程语法的实验。

交互式窗口与脚本文件¶

基于解释型语言的特点，Python 代码可以分为交互式窗口和脚本文件两种执行方式。

交互式窗口：如在命令行输入 python，即可进入交互式窗口，此时如同“问答”一般，输入一行代码后，Python 立刻执行该行代码并给出返回值。退出界面的方法是按 Ctrl+D 或者执行 exit()（Windows 用户请使用 Ctrl+Z）。
脚本：经典运行方法 python <your file>，Python 会将整个脚本按照语句的顺序依次从头到尾执行。

交互式窗口的例子

脚本文件的例子

对于各种工程项目来说，我们自然是选择用脚本文件来存储代码，方便我们进行每一次调用。而针对初学者来说，我们大可尝试用交互式窗口来入门。后续附代码的部分，如果出现了顶格 >>> 的情况，则暗示这是一个交互式窗口，有 >>> 的是代码，其他的是执行代码的输出。

Hello world¶

[Checkpoint Python-01] Hello World

好，现在你已经理解了 Python 程序是如何运行的 —— 试试看！

请尝试在控制台使用交互式窗口方式，使程序输出欢迎信息。如 "Hello, c7w!"。
请尝试编写脚本文件使其能正确输出 1. 中的欢迎信息。并思考，C++ 中你是怎样实现对于不同的用户，可以呈现不同的欢迎信息的呢？

提示：

你可以通过仔细观察上面的图片来解决问题
接下来我们将讲解变量的定义与程序的输入输出

变量类型与运算¶

与 C 和 C++ 大致相同，一些需要特别注意之处或有区别之处用加粗表示。

基本变量类型¶

int。变长整数，默认是 4 字节，有需要时自动增长。注意整除运算符是 //，而普通除法 / 会得到 float 类型（注意与 C 系语言区分）。除了十进制外，还支持十六进制、八进制、二进制的表示。
float。8 字节浮点数，相当于 C 系语言的 double。
bool。即众所周知的 True 与 False，注意首字母大写，用作数值计算时与 C 系语言一样分别视作 1 与 0。
string。字符串是以单引号 ' 或双引号 " 括起来的任意文本，比如 'abc'、"xyz"。
NoneType。即 None、空值。后面会介绍到用处，常用于返回值、特判。

>>> a = 124
>>> print(a)
124
>>> a = 'c7w'
>>> print(a)
c7w
>>> a = None
>>> print(a)
None
>>> if a:
...     print (a) # Here a == None, do not print
...
>>> a = 'c7w'
>>> if a:
...     print (a) # Here a == 'c7w', do print
...
c7w

Python 是一种动态类型语言

我们尝试与熟悉的 C++ 语言对比，解释静态类型语言与动态类型语言的区别。

静态类型语言中，每个变量都有确定的数据类型。变量的类型在编译期就被完全确定，且此后变量的类型无法改变。

与其相对应的是动态类型语言：变量并没有确定的数据类型，这意味着变量的类型可以在运行期改变。

比如，在 C++ 中：

int c = 1;
char m = 'x';
std::string a = "";

我们不能尝试使用 a = 1，因为我们已经规定了 a 是 std::string 类型。

而在 Python 中，我们可以尝试：

a = 123
a = 100.0
a = "string"
a = [1,2,3] # List, would be explained later

我们并没有对变量 a 进行过声明，而可以直接使用，并且在使用过程中可以随意地变换其类型。

Reference: https://blog.csdn.net/alashan007/article/details/100742591.

Python 是一种强类型语言

注意区分“强/弱类型”与“静态/动态类型”，这是一对相互正交的概念。

强类型指值拥有确定的类型且不可（隐式地）相互转换，弱类型则指不同类型的值之间可以隐式转换。

类型系统的强/弱并不像动态/静态那样有明显的界限。一般认为，JavaScript、Visual Basic 等是典型的弱类型语言，允许一部分隐式转换的 C 和 C++ 也被认为是弱类型语言，而 Java、C#、Python 等则是典型的强类型语言。

例如，在 JavaScript 中：

var a = "5";
var b = 4;
var c = [3];
var d = null;
console.log(a - b + c - d);
// Output:
// 13

可以看到即使这些变量的类型完全不同，它们也能进行运算并产出不太符合直觉的结果。

而在 Python 中：

a = "5"
b = 4
print(a + b)
# Output:
# Traceback (most recent call last):
# File "<stdin>", line 1, in <module>
# TypeError: can only concatenate str (not "int") to str
print(a + str(b))
# Output:
# 54

可见将不同类型的值直接进行运算会导致错误，必须先将其中的一些值显式转换为正确类型的值。

输入¶

Python 语言之中，我们可以使用 input() 函数来获取用户的输入。

a = input("请输入你的年龄")

这样做可以获取用户的输入，并将其赋值给变量 a，但默认会将你的输入当作字符串类型。如果你想要得到数字的话，需要用到一层类型转换：

a = int(input("请输入你的年龄"))

这样就可以将输入转化为 int 类型。当你的输入字符无法转化为 int 时，会抛出 ValureError 异常。

运算符¶

下列是 Python 语言之中的合法运算符，其含义与 C/C++ 语言基本一致。其后列出了相应的重载函数，这些重载函数的用法在后续的面向对象章节之中再详细介绍。

算术运算符

加法运算符 +：__add__
减法运算符 -：__sub__
乘法运算符 *：__mul__
真除运算符 /：__trudiv__
整除运算符 //：__floordiv__
模运算符 %：__mod__
幂运算符 **：__pow__

比较运算符

小于运算符 <：__lt__
小于等于运算符 <=：__le__
大于运算符 >：__gt__
大于等于运算符 >=：__ge__
相等运算符 ==：__eq__
不等运算符 !=：__ne__

位运算符

按位与运算符 &：__and__
按位或运算符 |：__or__
按位异或运算符 ^：__xor__
按位取反运算符 ~：__invert__
左移运算符 <<：__lshift__
右移运算符 >>：__rshift__

逻辑运算符

逻辑与运算符 and
逻辑或运算符 or
逻辑非运算符 not

注意，对于 and 或 or，得到的结果不会直接转换为 bool，而是能够得出结果的最后一个变量。

注意，混用 and、or 时需要考虑 and 的优先级更高，为了代码的可读性建议不要混用，或者显式地加上小括号。

三目运算符

三目运算符 a if condition else b

如 abs_x = x if x >= 0 else -x。

其它运算符

包含运算符 in，用于判定某个变量是否包含于容器中
不包含运算符 not in
同地址运算符 is，用于判定两个变量的地址是否相同
不同地址运算符 is not

is运算符与None的配合

按照上述定义，大家可能会把 is 理解为 C++ 中取地址再进行比较的操作，但在 Python 中其实际应用场景不止是这样。

在 Python 中，None 是一个内置的常量，表示值或对象的缺失。通常用来指示变量或对象没有值或尚未初始化。

None 经常用作函数的默认返回值，表示这些函数不返回任何有意义的值。其也可以指示变量或对象当前并未初始化。

由于其为一个内置的常量，所有值是None类型的变量都指向同一个地址。因此，当我要确认一个变量是否为 None 时，可以并且更加推荐使用 is 而非 == 运算符。

[Checkpoint Python-02] Operators

【精度测试】Python 的“高精度”体现在何处？尝试使用 Python 进行以下运算，并输出其结果。
1. $a = 10^{2000} - 1$
2. $a = 11451419198101919810114514 \times 11451419198101919810114514$
3. $a = 10^{-200} \times 10^{-400}$
【提示】程序中可以使用科学计数法表示：我们可以用 1e-5 来表示 $10^{-5}$ 。
请尝试解释以下表达式的输出结果。
1. 3 or 4
2. 3 and 4
3. 0 or 1 and 2
4. 0 and 1 or 2
5. 1 or 0 and 2

程序控制语句¶

顺序语句¶

代码块（英语：Code block）是个比较重要的层级概念，众所周知 Python 没有大括号进行显式地分块，因此它分块需要特别的手段：冒号配合缩进。

缩进有一套很完备的规则，推荐统一使用 Tab 或者四个空格作为一级，每当多一层层级嵌套时便会多一个 Tab 或者四个空格。而不要混用 Tab 和空格，不然会出现错误。

注释的写法：

单行注释。代码行以 # 开头
多行注释。使用三个单引号，或者三个双引号将其要注释的内容扩起来（后续我们会提到，这是多行字符串的处理方法）

条件语句¶

if-elif-else 条件判断结构：

age = 3
if age >= 18:
    print('adult')
elif age >= 6:
    print('teenager')
else:
    print('kid')

虽然 elif 使代码更加简洁，减少了很多不必要的缩进，但是我们仍然需要避免大量多层嵌套的情况，建议仍然使用函数代替嵌套内的代码，达到“转移矛盾”的效果。

事实上，任何一种语言的多层嵌套都需要缩进，无论如何总是会影响阅读、带来较大的心智负担，我们在实践的过程中要尽量避免这种情况。

循环语句¶

while 循环：

a = 1
while a <= 100:
    print(a)
    a += 1 # 注意没有 a++ 的写法

for 循环：

for i in range(0, 100): # range(0, 100) = [0, 1, 2, ..., 99]
    print(i)            # 本质上是在一个可迭代对象中遍历所有元素

同时，break 和 continue 这些语句在 Python 循环中也是可以正常使用的。

函数的写法¶

定义函数的写法：

def my_abs(x):
    if x >= 0:
        return x
    else:
        return -x

注意第一行固定格式 def <func_name>(params, ...):，其他和 C/C++ 差别不大。作为动态类型语言，函数返回类型不固定，可以有多个 return 以在不同情况下返回不同内容，或者没有 return（等价于 return None）。

如果要定义一个空的函数，可以使用：

def Fl0at9973_do_nothing():
    pass

也可以在函数定义行末尾添加上它的返回值，但这不会对代码运行造成任何影响与限制，只是给程序员自己看的而已。

def shell_string() -> str:
    ret = 3
    return ret # No Error

函数的参数¶

Python 函数的参数传递非常灵活，其支持四类参数：位置参数，关键字参数，默认参数和可变参数。

位置参数位置参数就是按照定义时的顺序传入函数，比如：
1 2
def greet(name, message): print(f"{message}, {name}!")
关键字参数关键字参数允许传入的参数名任意指定，不按照函数定义时的参数顺序传参：
1 2 3
# 依然是上文的函数 greet(message="Hello", name="Kid") # 输出：Hello, Kid!

默认参数默认参数就是当函数调用时没有传入参数时，使用默认参数的值。

def greet(name, message="Hello"):
    print(f"{message}, {name}!")

greet("Alice")  # 输出 "Hello, Alice!"
greet("Bob", "Hi")  # 输出 "Hi, Bob!"

可变参数在Python中，可变参数有两种：*args 与 **kwargs 。我们先来看前者:

*args 表示任意多个位置参数，它是一个元组类型（元组在后文会介绍）。

def add(*args):
    res = 0
    for num in args:
        res += num
    return res

print(add(1, 2, 3))  # 输出 6 
print(add(1, 2, 3, 4, 5))  # 输出 15

**kwargs 表示任意多个关键字参数，它是一个字典类型（字典在后文会介绍），不过在传入时我们并不需要显式地写成字典。

def greet(**kwargs):
   for key, value in kwargs.items(): 
       print(f"{key}: {value}")

greet(name="Alice", message="Hello")  # 输出 "name: Alice" 和 "message: Hello"

greet(name="Bob", age=30, city="New York")  # 输出 "name: Bob"、"age: 30" 和 "city: New York"

[Checkpoint Python-03] Runtime logic

请定义一个函数 fib，接受一个整型变量 n 作为输入，返回斐波那契数列的第 n 项。

请给出问题解法的递归版本与迭代版本。

数据及其组织形式¶

再谈字符串¶

什么是 Unicode

最早只有 127 个字符被编码到计算机里，也就是大小写英文字母、数字和一些符号，这个编码表被称为 ASCII 编码，比如大写字母 A 的编码是 65，小写字母 z 的编码是 122。

但是要处理中文显然一个字节是不够的，至少需要两个字节，而且还不能和 ASCII 编码冲突。所以，中国制定了 GB2312 编码，用来把中文编进去。

你可以想得到的是，全世界有上百种语言。日本把日文编到 Shift_JIS 里，韩国把韩文编到 Euc-kr 里，各国有各国的标准，就会不可避免地出现冲突，结果就是，在多语言混合的文本中，显示出来会有乱码。

因此，Unicode 字符集应运而生。Unicode 把所有语言都统一到一套编码里，这样就不会再有乱码问题了。

新的问题又出现了：如果统一成 Unicode 编码，乱码问题从此消失了。但是，如果你写的文本基本上全部是英文的话，用 Unicode 编码比 ASCII 编码需要多一倍的存储空间，在存储和传输上就十分不划算。

所以，本着节约的精神，又出现了把 Unicode 编码转化为“可变长编码”的 UTF-8 编码。UTF-8 编码把一个 Unicode 字符根据不同的数字大小编码成 1-6 个字节，常用的英文字母被编码成 1 个字节，汉字通常是 3 个字节，只有很生僻的字符才会被编码成 4-6 个字节。如果你要传输的文本包含大量英文字符，用 UTF-8 编码就能节省空间。

单个元素是 Unicode 字符。在最新的 Python 3 版本中，字符串是以 Unicode 编码的。也就是说，Python 的字符串支持多语言。

>>> a = "你好世界"
>>> a[0] # 取 a 的第 0 个元素
'你'
>>> a[1]
'好'
>>> a[2]
'世'
>>> a[3]
'界'

字符转义。如果字符串内部既包含 ' 又包含 " 怎么办？可以用转义字符 \ 来标识，比如：

'I\'m \"OK\"!'

多行字符串。如果字符串内部有很多换行，用 \n 写在一行里不好阅读。为了简化，Python 允许用 '''...''' 的格式表示多行内容。当然，这也是一种撰写代码注释的方式。

>>> print('''line1
... line2
... line3''')
line1
line2
line3

格式化字符串。使用 fstring，其在形式上是以 f 或 F 修饰符为修饰前缀的字符串（即 f'xxx' 或 F'xxx'），以大括号 {} 标明被替换的字段。fstring 在本质上并不是字符串常量，而是一个在运行时运算求值的表达式。

>>> r = 2.5
>>> s = 3.14 * r ** 2
>>> print(f'The area of a circle with radius {r} is {s:.2f}')
The area of a circle with radius 2.5 is 19.62

字符串运算

>>> a = 'Hello'
>>> a + a
'HelloHello'
>>> a * 10 # 重复输出
'HelloHelloHelloHelloHelloHelloHelloHelloHelloHello'
>>> a[1: 3] # 获取 index 在 [1, 3) 中的元素构成的字符串
'el'

常用特殊函数

strip() 去除前后的空字符

>>> a = '   <-backspace->   '
>>> a.strip()
'<-backspace->'

replace(str1, str2, num) 批量替换

>>> a = "我爱北京大学，北京大学是世一大，北京大学yyds"
>>> a.replace("北京大学", "清华大学")
'我爱清华大学，清华大学是世一大，清华大学yyds'

len(obj) 常用语获取字符串、字节串或容器的长度
chr(i) 将整型变量 i 转化为长度为 1 的字符串
ord(c) 获取（长度为 1 的）字符（串）的编号（Unicode）

字节串

bytes 是 Python 中的字节串，它表示最纯粹的“二进制”数据，非常像 C 中的 unsigned char * 、但是在显示上仅支持 ASCII 显示、用肉眼看会有些“不伦不类”。通常其值存在于数据的处理过程中。

bytes 的构造与字符串类似，但是要加一个 b 做前导：

print(b'123')
# Output: b'123' 

print(b'\1')
# Output: b'\x01' 

print(b'\x41')
# Output: b'A'

print(b'\x61\x62')
# Output: b'ab' 

print(len(b'\x61\x62'))
# Output: 2

其中 \x 表示将字符转义成对应的 ASCII 字符。

编码与解码¶

上文中已经陈述了一些常见的编码。由于 Python 胶水语言的特性，读者以后很有可能会遇到使用 Python 处理文件的需求，这时候字符的编码解码将是必须的话题，以下介绍一些使用 Python 自带的编码和解码器的例子：

In [1]: 'Hello world'.encode()
Out[1]: b'Hello world'

In [2]: b'Hello world'.decode() 
Out[2]: 'Hello world'

In [3]: '你好'.encode()
Out[3]: b'\xe4\xbd\xa0\xe5\xa5\xbd' 

In [4]: '你好'.encode('utf-8')
Out[4]: b'\xe4\xbd\xa0\xe5\xa5\xbd' 

In [5]: '你好'.encode('gbk')
Out[5]: b'\xc4\xe3\xba\xc3'

In [6]: b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('utf-8')   # 使⽤了正确的格式解码 
Out[6]: '你好'

In [7]: b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('gbk')   # 使⽤了错误的格式解码 
Out[7]: '浣犲ソ'

扩展数据类型¶

列表 list

Python 内置的一种数据类型是列表。list 是一种类似于向量的结构，可以随时添加和删除其中的元素。

>>> a = [2, 3] # Init a list

>>> Fl0at9973_blank = [] # Init a blank list
# alternatively, Fl0at9973_blank = list()

>>> a.append(4) # Append elements to list
>>> a
[2, 3, 4]

>>> b = ['a', 'c', 114514]
>>> b
['a', 'c', 114514]

>>> a + b # List "plus"
[2, 3, 4, 'a', 'c', 114514]

>>> a[0] = "c7w,yyds" # Change value of elements
>>> a
['c7w,yyds', 3, 4]

>>> a[-1] # Find the last element
4

>>> a.reverse() # Reverse the list
>>> a
[4, 3, 'c7w,yyds']

>>> p = [5, 4, 3, 2, 1]
>>> p.sort() # Sort the list
>>> p
[1, 2, 3, 4, 5]

元组 tuple

Python 的元组与列表类似，不同之处在于元组的元素不能修改。元组使用小括号，列表使用方括号。

元组创建很简单，只需要在括号中添加元素，并使用逗号隔开即可。

tup1 = () # 空元组
tup1 = (50, ) # 元组中只包含一个元素时，需要在元素后面添加逗号
tup1[0] = 20 # Error! Elements of tuple cannot be changed.

字典 dict

字典是另一种可变容器模型，且可存储任意类型对象，采用键值对存储方式。

字典的每个键值对用冒号 : 分割，每个键值对之间用逗号 , 分割，整个字典包括在花括号 {} 中。

>>> d = {'name': 'c7w', 'gender': 'M', 'id': 2020000000} # Init the dict
>>> d
{'name': 'c7w', 'gender': 'M', 'id': 2020000000}

>>> d['gender'] # Get the value of certain key
'M'

>>> d['department'] = 'CST' # New a key-value pair
>>> d
{'name': 'c7w', 'gender': 'M', 'id': 2020000000, 'department': 'CST'}

>>> d['girlfriend'] # Would raise KeyError if key not found
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
KeyError: 'girlfriend'

>>> d['id'] += 2 # Change value of certain key
>>> d
{'name': 'c7w', 'gender': 'M', 'id': 2020000002, 'department': 'CST'}

可以使用 in 关键字判断某个特定的 key 是否在字典中，也可以使用内置的 dictObj.get() 函数在 key 不存在时提供默认获取值。

集合 set

set 和 dict 类似，也是一组 key 的集合，但不存储 value。由于 key 不能重复，所以，在 set 中，没有重复的 key。

>>> myList = [1, 1, 1, 2, 3, 3, 3, 3, 4]
>>> s = set(myList)
>>> s
{1, 2, 3, 4}
>>> s = list(s)
>>> s
[1, 2, 3, 4]

面向对象语法

如果采用面向对象式的思维，我们将具有共同属性与方法的一组个体抽象成一个类，在 Python 中的表达方式为：

class Student(object):
    def __init__(self, name, score):
        self.name = name
        self.score = score

    def get_grade(self):
        if self.score >= 90:
            return 'A'
        elif self.score >= 60:
            return 'B'
        else:
            return 'C'

更多有关 Python 面向对象编程的知识请阅读：

文件读写¶

open() 函数

你必须先用 Python 内置的 open() 函数打开一个文件，创建一个 file 对象，相关的方法才可以调用它进行读写。

file object = open(file_name [, access_mode][, buffering])

其中常用的读取模式有 'r'（只读）、'w+'（清空并重写）、'a+'（追加写入）。

read() 函数

read() 方法从一个打开的文件中读取一个字符串。

# 打开一个文件
fo = open("foo.txt", "r")
str = fo.read()
print("读取的字符串是: ", str)
# 关闭打开的文件
fo.close()

write() 函数

write() 方法可将任何字符串写入一个打开的文件。需要重点注意的是，Python 字符串可以是二进制数据，而不是仅仅是文字。注意，write() 方法不会在字符串的结尾添加换行符即 '\n'。

# 打开一个文件
fo = open("foo.txt", "w")
fo.write("www.runoob.com!\nVery good site!\n")

# 关闭打开的文件
fo.close()

[Checkpoint Python-04] Numbers

【数据结构】
1. 分别找出 $1 \leq i \leq 1000000$ 内所有的是 $2, 3, 5$ 的倍数的数的对应的 list
2. 将这些列表连接起来
3. 将这些数去重
【文本写入】
1. 将 1. 中的答案，输出为 ans.txt

语法糖¶

Python 的一大特色在于其丰富的语法糖，这些语法糖让 Python 代码与其他语言相比展现出了完全不一样的风格，这个风格也称作 Pythonic。熟练运用这些语法糖，可以简化代码编写并提高代码可读性。

自动生成元组与解包¶

a = 1
b = 2
a, b = b, a # 自动生成了 Tuple 并交换次序，不需中间变量

多重比较¶

a = 30
if 20 <= a <= 40:
    print(a)

可迭代对象的切片¶

>>> a = list(range(0, 100))
>>> a
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

>>> a[10: 19] # [10, 19)
[10, 11, 12, 13, 14, 15, 16, 17, 18]
>>> a[-10: -2] # [-10, -2)
[90, 91, 92, 93, 94, 95, 96, 97]
>>> a[-1]
99

列表生成式¶

>>> L = [x * x for x in range(100) if x % 10 == 0]
>>> L
[0, 100, 400, 900, 1600, 2500, 3600, 4900, 6400, 8100]

包管理¶

多文件项目¶

在计算机程序的开发过程中，随着程序代码越写越多，在一个文件里代码就会越来越长，越来越不容易维护。

为了编写可维护的代码，我们把很多函数分组，分别放到不同的文件里，这样，每个文件包含的代码就相对较少，很多编程语言都采用这种组织代码的方式。在 Python 中，一个 .py 文件就称之为一个模块（英语：Module）。

请注意，每一个包目录下面都会有一个 __init__.py 的文件。这个文件是必须存在的，否则，Python 就把这个目录当成普通目录，而不是一个包。__init__.py 可以是空文件，也可以有 Python 代码，因为 __init__.py 本身就是一个模块。在下列文件树中它的模块名就是 mycompany。

mycompany
 ├─ web
 │  ├─ __init__.py
 │  ├─ utils.py
 │  └─ www.py
 ├─ __init__.py
 ├─ abc.py
 └─ utils.py

引入外部包¶

Python 为我们自带了很多内置模块，比如 os、datetime、re 等等，这里不在语言入门篇中赘述。当有运用的需求时，培养面向搜索引擎的问题解决能力是很重要的。

安装外部包¶

正是由于开源社区的存在，才使得 Python 能够如此便捷，如此强大。Python 为我们提供了极为方便的包管理器 pip，会在安装时附带。

Linux 用户可以使用 sudo apt update && sudo apt install pip3 来安装。

在 Python 中，安装第三方模块，是通过包管理工具 pip 完成的。例如，我们要安装一个第三方库 Pillow，其是一个高级的图像处理工具。我们就可以通过 pip install pillow 来安装。

此外，我们还可以使用 anaconda、virtualenv 等包来协助我们进行虚拟环境创建或者包管理，这里我们不再展开。

拓展学习¶

Python 的强大之处在于其丰富的第三方库，为了进一步学习、运用 Python 语言，我们推荐读者自行搜索下列第三方库的介绍、文档，并尝试在自己的程序中使用它们。有余力的读者甚至可以去阅读这些第三方库的源代码。

系统调用¶

os
sys

日常工具¶

re
datetime
math
random
json
sqlite3

图像处理¶

Pillow

网站开发¶

Django
Flask

数据收集¶

requests
beautifulsoup4

统计分析¶

Numpy
Matplotlib
pandas

机器学习¶

Tensorflow
Pytorch

资源链接¶

2020 暑培讲义 by rls
2021 暑培讲义 by ayf
2022 暑培讲义 by zcy
2023 暑培讲义 by lyf
Python Docs https://www.python.org/doc/
Runoob https://www.runoob.com/python3/python3-tutorial.html
廖雪峰 https://www.liaoxuefeng.com/wiki/1016959663602400/