機器學習實戰這本書是在python2.x的環境下寫的,而python3.x中好多函數和2.x中的名稱或使用方法都不一樣了,因此對原書中的內容需要校正,下面簡單的記錄一下學習過程中fix的部分
1、print 函數後面需要加括號(程式清單2-4開始出現print函數)
#2、raw_input改為input函數,在3.x中python使用input取代了raw_input函數(程式清單2-5)
3、reload(KNN)->import KNN)
4、程式清單3-6中
在python2.7中,找出key所對應的第一個元素為:firstStr = myTree.keys() [0],這在python3.4中運行會報錯:'dict_keys' object does not support indexing,這是因為python3改變了dict.keys,返回的是dict_keys對象,支持iterable 但不支持indexable,我們可以將其明確的轉換成list,則此項功能在python3中應這樣實現:
firstSides = list(myTree.keys()) firstStr = firstSides[0]#找到输入的第一个元素
5、程式清單3-9
pickle對資料進行持久化的時候是採用二進位的方式進行儲存和讀取的,所以寫入檔案的時候將
fw=open(filename,'w')---->fw=open(filename,'wb')
將檔案以二進位的形式打開,方便pickle的寫入
從檔案讀取資料的時候也要用二進位的方式讀取做以下修改
fr=open( filename)---->fr=open(filename,'rb')
#
6、程式清單4-5中
wordList=textParse(open('ch04/email/ham/%d.txt' % i).read())
這句話在運作的時候老是報編碼錯誤,結果是讀取的文件中有亂碼,刪除亂碼後問題解決
錯誤代碼如下:
UnicodeDecodeError: 'gbk' codec can't decode byte 0xae in position 199: illegal multibyte sequence
trainingSet=range(50);
del(trainingSet[randIndex])
由於range無法回傳List,不支援del操作,所以執行時出現下列錯誤:
TypeError: 'range' object doesn't support item deletion
可以修改程式碼:
trainingSet = list(range(50));
#to be continued……
以上是對python3.x的詳細介紹的詳細內容。更多資訊請關注PHP中文網其他相關文章!