Heim > Fragen und Antworten > Hauptteil
texts = [[word for word in document.lower().split()] for document in documents]
我在网址我爱自然语言处理-如何计算两个文档的相似度(二)中看到下面一份代码。
对于>>> texts = [[word for word in document.lower().split()] for document in documents]的含义不是很理解。
>>>documents = ["Shipment of gold damaged in a fire",
... "Delivery of silver arrived in a silver truck",
... "Shipment of gold arrived in a truck"]
>>> texts = [[word for word in document.lower().split()] for document in documents]
>>> print texts
[['shipment', 'of', 'gold', 'damaged', 'in', 'a', 'fire'], ['delivery', 'of', 'silver', 'arrived', 'in', 'a', 'silver', 'truck'], ['shipment', 'of', 'gold', 'arrived', 'in', 'a', 'truck']]
对于一般的for var in list:这种形式,我是知道的。但是上面的那种二维数组,我就不是很理解为什么了。求助,帮忙分析一下
巴扎黑2017-04-18 10:23:13
这个语法叫 “List Comprehensions”
先将https://docs.python.org/2/tut...
文档的例子过一遍,就会明白怎么回事的。
ringa_lee2017-04-18 10:23:13
python中创建一个二维数组的方法
例如创建一个3*3的数组
方法1 直接定义
[py]matrix = [[0, 0, 0], [0, 0, 0], [0, 0, 0]][/py]
方法2 间接定义
matrix = [[0 for i in range(3)] for i in range(3)]
一种方法而已,.lower().split()是处理文件里面的单词,大写边小写,分割开。