Heim  >  Fragen und Antworten  >  Hauptteil

Python – Scrapy-XPath-Seitenanalyse kann nicht gefunden werden

Das Folgende ist der HTML-Code der Seitenkategorien

<p id="a144e40e-56c4-4984-b404-1a0230194b42" class="house-item clearfix house-item-curr">
                <p class="item-photo fl">
                    <a href="/zufang/shbs12427828.html" target="_blank">
                        <img class="lazy" src="//imgsh.centanet.com/ctpostimage/a4/d5/4e4da3a2496299b2b26243565af6_220x165.jpg" src="//imgsh.centanet.com/ctpostimage/a4/d5/4e4da3a2496299b2b26243565af6_220x165.jpg" alt="采菊苑租房2800元/月" title="采菊苑租房2800元/月" style="display: inline-block;"></a>
                </p>
                <p class="item-info fl">
                    <h4 class="house-title">
                        <a href="/zufang/shbs12427828.html" title="采菊苑,77平两房出租,毛坯3千,好谈价!" target="_blank" class="cBlueB">采菊苑,77平两房出租,毛坯3千,好谈价!</a>
                    </h4>
                    <p class="f14 f000 mb_10">
                        <a href="/xiaoqu/xq-pedpwawows/" class="f000 mr_10" target="_blank" title="采菊苑二手房">采菊苑</a><span class="f000 mr_10">2室2厅</span><span class="f000">77平</span>
                    </p>
                    <p class="f7b mb_10">
                        南北<em class="mrl_6">|</em>高层<em class="mrl_6">|</em>毛坯<em class="mrl_6">|</em>2008年<em class="mrl_6">|</em>整租
                    </p>
                    <p class="f7b mb_15">
                        宝山-顾村 菊联路68弄
                        <a style="cursor: pointer" href="javascript:void(0)" value="/page/v1/common/maputil.aspx?x=121.372168&amp;y=31.354713" class=" icons_map jsmapicon  "></a>
                        
                    </p>                    
                </p>
                 <p class="item-pricearea fr">
                    <p class="price-nub cRed">2800元/月</p>
                     <p class="f14 f000 mb_15 fsm">&nbsp;</p> 
                </p>
                <p class="clear"></p>
            </p>

Ich verwende xpath, um Text zu extrahieren. Mein Code ist

class itcast(scrapy.Spider):
    name = 'SH'
    allowd_domains = ["http://sh.centanet.com/"]
    start_urls = ["http://sh.centanet.com/zufang/p2/"]

    def parse(self,response):
        
        list = response.xpath("//p[@class='//p[@class='ouse-item clearfix house-item-curr']")
        
        for i in list:
            name = i.xpath("//a[@class='cBlueB'.text()]")
            print name[0]

Ich kann diese Kategorie finden
Der Fehler liegt in der Zeile für i in der Liste:
name =f.xpath(), der Text kann nicht extrahiert werden.
Der Ausführungscode kann nicht gefunden werden. Ich habe schon oft ähnliche Dinge versucht. Ich hoffe, Sie können sie beantworten.

PHP中文网PHP中文网2683 Tage vor1059

Antworte allen(2)Ich werde antworten

  • 代言

    代言2017-06-14 10:53:10

    def parse(response):
        list = response.xpath("//p[@class='house-item clearfix house-item-curr']")
    
        for i in list:
            name = i.xpath("//a[@class='cBlueB']")
            print name[0].text

    也许你是这个意思?

    Antwort
    0
  • 習慣沉默

    習慣沉默2017-06-14 10:53:10

    name = i.xpath("//a[@class='cBlueB'.text()]")这种写法是错误的,text怎么能放在[]里面呢

    Antwort
    0
  • StornierenAntwort