texts = [[word for word in document.lower().split()] for document in documents]
我在网址我爱自然语言处理-如何计算两个文档的相似度(二)中看到下面一份代码。
对于>>> texts = [[word for word in document.lower().split()] for document in documents]的含义不是很理解。
>>>documents = ["Shipment of gold damaged in a fire",
... "Delivery of silver arrived in a silver truck",
... "Shipment of gold arrived in a truck"]
>>> texts = [[word for word in document.lower().split()] for document in documents]
>>> print texts
[['shipment', 'of', 'gold', 'damaged', 'in', 'a', 'fire'], ['delivery', 'of', 'silver', 'arrived', 'in', 'a', 'silver', 'truck'], ['shipment', 'of', 'gold', 'arrived', 'in', 'a', 'truck']]
对于一般的for var in list:这种形式,我是知道的。但是上面的那种二维数组,我就不是很理解为什么了。求助,帮忙分析一下
巴扎黑2017-04-18 10:23:13
這個語法叫 “List Comprehensions”
先將https://docs.python.org/2/tut...
文檔的例子過一遍,就會明白怎麼回事的。
ringa_lee2017-04-18 10:23:13
python中建立一個二維陣列的方法
例如建立一個3*3的陣列
方法1 直接定義
[py]matrix = [[0, 0, 0], [0, 0, 0], [0, 0, 0]][/py]
方法2 間接定義
matrix = [[0 for i in range(3)] for i in range(3)]
一種方法而已,.lower().split()是處理文件裡面的單詞,大寫邊小寫,分割開。