发现在linux中用wget获取的网页和在浏览器中(chrome)“另存为、全部,网页”两者的大小不一样。wget获取的网页明显要小,后来发现使用这个命令和“另存为、网页,仅html”所保存的网页一样。
我目前想要用程序或者命令(无论linux或者windows都可)取得“另存为、全部,网页”一样的内容,有什么方法呢?
回复讨论(解决方案)
这个网页另存为是浏览器功能, 它保存下来的文件实际上把里面的引用文件路径都修改了, 而且将这些资源文件全存起来了. 这是软件功能
这个网页另存为是浏览器功能, 它保存下来的文件实际上把里面的引用文件路径都修改了, 而且将这些资源文件全存起来了. 这是软件功能
---------------------------------------------------------------------------------------------------------
有没有可能有相对比较简单的方法实现类似功能?
如果模拟浏览器操作、保存的方法来实现第一麻烦,第二感觉好山寨。
这个网页另存为是浏览器功能, 它保存下来的文件实际上把里面的引用文件路径都修改了, 而且将这些资源文件全存起来了. 这是软件功能
---------------------------------------------------------------------------------------------------------
有没有可能有相对比较简单的方法实现类似功能?
如果模拟浏览器操作、保存的方法来实现第一麻烦,第二感觉好山寨。
我并不是要求一定要将这些资源整合成一个html文件,实际上即使没有整合,只要这些资源不缺失就行。有个东西要用到这方面的知识,以前从来没有弄过前端,感觉这个应该不是一个很困难的要求,但是google半天也没找到方法。
这个网页另存为是浏览器功能, 它保存下来的文件实际上把里面的引用文件路径都修改了, 而且将这些资源文件全存起来了. 这是软件功能
---------------------------------------------------------------------------------------------------------
有没有可能有相对比较简单的方法实现类似功能?
如果模拟浏览器操作、保存的方法来实现第一麻烦,第二感觉好山寨。
我并不是要求一定要将这些资源整合成一个html文件,实际上即使没有整合,只要这些资源不缺失就行。有个东西要用到这方面的知识,以前从来没有弄过前端,感觉这个应该不是一个很困难的要求,但是google半天也没找到方法。
这个没有做过呢, 感觉没有那么简单. 需要爬出来整个页面图片, js文件, css文件, 还要分析其中的路径引用, 比如在html中定义了一个图片路径, 和css中定义了图片路径到底哪个才是真实生效的之类分析.
Stellungnahme:Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn