事先需要模拟登录,获取cookie等操作。
然后比如循环请求两个地址a和b:
http://xxxx.xxxx.com/purOrder/getOrderDetailInfo.action?billId=123456
http://xxxx.xxxx.com/purOrder/getOrderDetailInfo.action?billId=654321
假设a返回3条数据,b返回10条数据
现在问题是,用while循环去请求这两个地址,不管我怎么去刷新,还是请求了a后sleep30秒也好,得到的结果要么就是为空,要么就是a的3条数据,要么就是b的10条数据,总是不能得到a和b的总的数据。
ps:如果我在浏览器登录网站后,直接在浏览器输入a地址,然后输入b地址,数据都是可以获取到的
该怎么办呢?已经折腾好几天了。
把http头打印出来,分别是返回数据的和没有返回数据的
登录后把cookie存在cookie.txt里的,后面的post请求都是把这个文件传进去的,为什么这里cookie会变成这样呢?
这是登录后打印的http头信息
这是保存为cookie.txt的cookie信息
为情所困2017-05-16 13:05:31
때때로 컬 운영자는 부적절하게 사용하면 해결할 수 없는 문제가 많이 발생합니다. 이 상황에서 우리는 어떻게 해야 합니까? 문제를 해결하기 위해 바퀴를 찾아보세요! !
저번에 Douban에 포스팅할 때 우연히 /a/11...
을 사용했어요淡淡烟草味2017-05-16 13:05:31
구체적인 웹사이트 주소가 없고, 문제를 파악하기 어렵습니다. 로그인 쿠키가 잘못되었기 때문인 것으로 추측되며, A는 본인 확인 조건을 충족하지 않아 오직 확인할 수 있는 데이터만 반환합니다. 익명의 사용자가 볼 수 있습니다.
迷茫2017-05-16 13:05:31
루프할 필요가 없습니다. 페이지에서 직접 file_get_contents, 즉 각 항목을 개별적으로 요청하여 반환된 결과가 올바른지 확인하세요
黄舟2017-05-16 13:05:31
데이터를 반환하는 헤더와 그렇지 않은 헤더를 인쇄하세요.
로그인한 후 쿠키를 cookie.txt에 저장하면 이후 게시물 요청에서 모두 이 파일이 전달됩니다. 쿠키가 여기에 있는 이유는 무엇인가요? 이렇게 되면 어쩌지?