recherche

Maison  >  Questions et réponses  >  le corps du texte

一个python的比较难的算法,有懂的人可以进来一下

我的需求:

结构数据是这样的:

要求按照这样的公式:
组合一: 时间词+地方词+动词+等级+名词+价格词;

比如

2016年深圳大鹏新区给健康全身检查要多少钱

就是按照这样的公式组合出来的关键词

那么有什么办法用最短的办法来实现,我下面是我的算法,用pandas的算法:

for times in df[df["时间词"].notnull()]["时间词"]:
    for area in df[df["地方词"].notnull()]["地方词"]:
        for dong in df[df["动词"].notnull()]["动词"]:
            for leave in df[df["等级"].notnull()]["等级"]:
                for name in df[df["名词"].notnull()]["名词"]:
                    for price in df[df["价格词"].notnull()]["价格词"]:
                        data =  (times+area+dong+leave+name+price)

但是这样的代码太不优雅,而且封装成函数太难~
我想要的效果是这样的:

比如:
我写一个公式

cols = ["时间词","地方词","动词","等级","名词","价格词"]
#或则是
cols = ["地方词","动词","等级","名词","价格词"]

然后把这个列表传入一个函数中,就可以得出我上面的效果~
这个要如何实现?


补充一下,如果看不懂提问的人可以这样理解这个题目
我有3个列表:

a = ["1","2","3","4","5"]
b = ["a","b","c"]
c = ["A","B"]

我要这样的组合: a中的每个元素和b,c中的每个元素都进行组合
这个一个很简单的多重循环就可以解决:

for A in a:
    for B in b:
        for C in c:
            print (A+B+C)

这当然很简单,但是假如我有10000个这样的列表要重组?
难不成要手工复制黏贴每个循环10000次?这显然不太现实

在python中有没有比较好的函数或是比较好的方法来实现这个东西?


改问题已经解决,要感谢Taku的解答.完全符合需求

附上我修改后的代码

import itertools

def zuhe(cols):
    b = pd.Series()
    for col in cols:
        b = b.append(pd.Series({col:list(df[df[col].notnull()][col])}))
    for x in itertools.product(*(b.values)):
        print (x)
        
zuhe(cols = ["时间词","地方词","动词"])

只需要传入需要组合的列表词,就可以得到结果!!

PHP中文网PHP中文网2817 Il y a quelques jours444

répondre à tous(5)je répondrai

  • 巴扎黑

    巴扎黑2017-04-18 09:07:34

    Essayez itertools

    import itertools
    for x in itertools.product([1,2,3,4],[2,3,4],[1,1,2,2,3,3]):
    print x

    Haha, c'est en fait un problème de trouver le produit cartésien
    Il faut apprendre à organiser les mots-clés et faire bon usage de la recherche

    répondre
    0
  • 高洛峰

    高洛峰2017-04-18 09:07:34

    Je vais jouer Réinventer la roue :

    Une version utilisant l'itération :

    def product(*iterables):
        START = 0
        END = 1
    
        se_idxs = [(0, len(iterable)) for iterable in iterables]
        curr_idxs = [0 for iterable in iterables]
    
        def next():
            curr_idxs[-1] += 1
            for k in reversed(range(len(iterables))):
                if curr_idxs[k]==se_idxs[k][END]:
                    if k==0:
                        return False
                    curr_idxs[k] = 0
                    curr_idxs[k-1] += 1
                else:
                    break
            return True
    
        while True:
            yield [iterable[idx] for idx, iterable in zip(curr_idxs, iterables)]
            if not next():
                return

    Une version récursive :

    def product_core(result, *iterables):
        if len(iterables)==0:
            yield result
        else:
            for item in iterables[0]:
                yield from product_core(result+[item], *iterables[1:])
    
    def product(*iterables):
        return product_core([], *iterables)

    Test :

    a = [1, 2, 3]
    b = [4, 5, 6]
    c = [7, 8, 9]
    
    for p in product(a, b, c):
        print(p)

    Résultat :

    [1, 4, 7]
    [1, 4, 8]
    [1, 4, 9]
    [1, 5, 7]
    [1, 5, 8]
    [1, 5, 9]
    [1, 6, 7]
    [1, 6, 8]
    [1, 6, 9]
    [2, 4, 7]
    [2, 4, 8]
    [2, 4, 9]
    [2, 5, 7]
    [2, 5, 8]
    ...

    La vie est courte, ne fais pas bêtement la même chose...


    Questions auxquelles j'ai répondu : Python-QA

    répondre
    0
  • 巴扎黑

    巴扎黑2017-04-18 09:07:34

    Semblable à 全排列生成算法
    Vous pouvez utiliser la récursivité ou la récursivité

    La récursivité est relativement simple à mettre en œuvre, mais la récursivité est un peu plus gênante

    répondre
    0
  • 天蓬老师

    天蓬老师2017-04-18 09:07:34

    La génération de liste est-elle possible ?

    >>> [m + n for m in 'ABC' for n in 'XYZ']
    ['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ']

    répondre
    0
  • 天蓬老师

    天蓬老师2017-04-18 09:07:34

    Il est en effet possible d'écrire de la récursion, mais ne savez-vous pas comment écrire une recherche en profondeur dfs ?

    répondre
    0
  • Annulerrépondre