大類的技術手記

for 迴圈的基本運作

為何會需要迴圈呢？

因為世上有許多相似甚至完全相同的事情，而我卻不想手動一一列舉，好比在螢幕上依序印出二十六個英文字母。如果仔細分析，便可發現在印出的過程中，除了字母本身不同外，其餘皆完全相同。但要我為每個字母都寫一遍「print」，不是太麻煩了嗎？

# 顯示所有英文字母
print "A"
print "B"
print "C"
...
print "Z"  # 重覆寫 26 遍 print 太麻煩！

此外，許多時候「需要重覆幾次」，得在實際運行時才知道。舉例來說，我需要從資料庫抓取所有使用者的名稱來顯示，但在撰寫程式碼時，我並不會預先知曉總共有幾位使用者，因此即使我真想手動輸入「print」也做不到。

這時 for 迴圈便可登場了！套用上例，我們可先將抓出來的使用者先存進 name_list 串列中，再由迴圈將所有名稱顯示一遍：

for name in name_list:
    print name

「for」和「in」是 Python 的關鍵字，兩者之間可以放置使用者自訂的變數，而「in」後則可接一個序列 (Sequence)，串列 (list)、字串 (str)、元組 (tuple) 等皆是序列的一種。

迴圈會依序從序列取得元素，並將元素指定給前面自訂的變數(此例為 name)，再執行迴圈裡的內容，直到序列每一元素都被取出過為止。

這裡插播一個 Python 的小用法，Python 可以用下面的方式指定變數：

item = ("小雞", 100)  # 這裡 item 會等於 ("小雞", 100)

# 也可以這麼做
(name, grade) = ("小雞", 100)  # 這裡 name 會等於「小雞」，grade 會等於「100」

# 括號本身也可以省略
name, grade = ("小雞", 100)  # 結果於上一句相同

這種用法在 for 迴圈指定變數時也適用，序列裡的元素也是可以被拆解並直接指定對應的變數，因此可以寫得像下面這樣：

grade_list = [("小雞", 100), ("兩大類", 0), ("小喵", 80), ("小蟲", 60)]
for item in grade_list:
    print item[0], item[1]

# 可以直接改寫
for (name, grade) in grade_list:
    print name, grade

# 或是這樣
for name, grade in grade_list:
    print name, grade

Note

想一想：這裡是使用元組拆解，那麼如果是串列可不可以呢？

很多讀者想必已經發現 python 的迴圈其實就是其他語言 foreach 的用法。與其他語言不同，其他語言的 for 使用邏輯通常是「找出序列所有可能的索引 (index)，再透過索引取得序列對應的資料」。碰到上面的情況，C++ 的使用者通常會這麼做：

for(int i = 0; i < name_list.size(); i++)
    std::cout << name_list[i] << std::endl;

如果要在 Python 模擬這個概念，就會像這樣：

for index in range(len(name_list)):
    print name_list[index]

Note

range 函式會依據參數回傳一個整數數列，假設輸入 10 便會回傳 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

明顯麻煩許多，顯然 Python 更希望我們以 foreach 的用法取代其他語言使用 for 的方式。

為何如此？

道理很簡單，比較兩種方式，可以發現 foreach 的用法明顯擁有更高的可讀性。在此例中，用變數 name 來表示名稱顯然比用 name_list[i] 還要直覺。更重要的是在大多數情況下，我們其實根本就不需要索引的資訊，何必多此一舉，先找到索引，然後才取得序列的元素內容呢？

話說回來，碰到需要索引資訊的情況又該如何？難道又得回到之前可讀性差的做法嗎？

不需要。

因為 Python 提供了 enumerate 函式，可以漂亮地解決該問題，此函式可以接受一個序列當參數，並回傳一個新序列，新序列的每一元素都是一個元組，包含了一個連續整數和原來的元素，就像下面這樣：

>>> name_list = ["小雞", "兩大類", "小喵", "小蟲"]
>>> enumerate(name_list)
[(0, "小雞"), (1, "兩大類"), (2, "小喵"), (3, "小蟲")]  # 實際上是一個 generator ，這只是為了方便解釋。

這樣我們就可以在保持可讀性的情況下解決問題：

for index, name in enumerate(name_list):
    print index, name

此外 Python 的 for 迴圈還有一個異於其他語言的特殊用法，那就是可以使用關鍵字「else」：

for name in name_list:
    print name
else:
    print "以上就是所有的名稱"

當序列所有的元素都被取出，進行完最後一次迴圈後，便會執行 else 裡的內容。舉例來說，上面例子的結果會顯示：

小雞
兩大類
小喵
小蟲
以上就是所有的名稱

或許你會好奇，既然最後才會執行，為何不直接放到迴圈外呢？

因為這還可以搭配關鍵字「break」使用，只要使用 break 中途跳出迴圈的話，就不會執行 else 的內容。

我們用「找質數」來舉例：

#找 0 ~ 100 所有的質數
for num in range(100):
    for i in range(2, num):
        if num % i == 0:
            break
    else:
        print num, "是一個質數"

Note

關鍵字 continue 不算是跳出迴圈，所以就算在最後一圈使用 continue，還是會執行 else 裡的內容。

嚴格說來，通常真要丟到迴圈外處理也不難。此例來說，由於 Python 在迴圈指定的變數(此例是 num)，在迴圈結束後還會保留，所以我一樣可以判斷迴圈是不是進行到最後一圈才結束：

for num in range(100):
    for i in range(2, num):
        if num % i == 0:
            break
    if i == num - 1:
        print num, "是一個質數"

我認為 else 最大的意義在於其擁有比較好的可讀性，可以輕易的展現 else 裡的內容和迴圈的關聯性。相對來說，上面的程式碼就比較難一眼看出 if 和前面迴圈的關係。

Note

不過這點可能見仁見智，對於其他語言轉過來的人而言，這種做法可能反而增加閱讀的困難，所以還是得看場合使用。

還有一點要注意－－在 Python 中並不是所有型態的序列都可以在 for 迴圈運行時新增或刪除元素，因為這個動作有潛在的風險，所以有些型態直接限制了這項操作。

怎麼說呢？

我們可以反過來看，像是串列准許你在迴圈中新增或刪除元素的類型，其使用上可能會有什麼問題。

簡單來說，你可以想像在迴圈運作時，會有一個計數器紀錄迴圈進行的圈數，每做一次迴圈，計數器就會加一。透過這個計數器，程式就會知道接下來要處理的是那一個變數。

這時我們在中途新增或刪除元素時，由於計數器的值沒有改變，那麼藉由「原來的計數器」取出「新的序列」的元素，自然就會出錯。比如說：

num_list = [1, 2, 3]
for num in num_list:
    print num
    num_list.remove(num)
print num_list

運行結果，你可能會以為是：

1
2
3
[]

但實際上會是：

1
3
[2]

當然，要處理這個問題也不困難，只要我們複製一份暫存的版本就行了：

num_list = [1, 2, 3]
for num in num_list[:]:
    print num
    num_list.remove(num)
print num_list

這樣一來，修改不會影響暫存的版本，自然就不會出錯了。

大類的技術手記

淺談 Python 的 for 迴圈

for 迴圈的基本運作

實作一個可以被當成序列的物件