如何从Java程序中获取和保存WordPress内容(html、css、图像、视频)?

时间:2015-07-24 作者:Clemzd

如果这不是问这个问题的好地方,我道歉。如果不能帮我找到我要问的地方,请告诉我。

这就是我的挑战。我需要从Java程序中获取并保存WordPress内容(HTML、CSS、图像和视频)。

          HTML, images, CSS
WordPress -----------------> File system
然后,我想解析这些内容,将这些页面集成到我现有的Spring web应用程序中。例如,它意味着

http://localhost/wp-content/image1.png
将需要更改为

http://localhost/spring/image1.png
加入我的Spring应用程序。

到目前为止,我已经考虑了很多可能性。我希望得到您的反馈,并可能建议其他我没有想到的解决方案。

用这个Java wget 程序,从WordPress站点获取所有内容,然后保存。Pros : 可以肯定的是,创建站点镜像将成为wget的目标。Cons : 链接在我的Spring应用程序中不起作用,无论如何我都需要解析html和css代码。

使用jsoup.Pros : 作为解析器,我可以直接更改URL以将其集成到Spring应用程序中。Cons : 无法确定是否可以将内容保存在硬盘上。

使用WordPress插件导出页面。Pros : 只有与当前更改相关的页面才会重新保存在硬盘上(可以指定文件夹)。Cons : 它不在Java中(我无法维护插件)。无论如何,我需要观察目标文件夹,每次文件更改时,我都需要重新分析它以更改链接,使其在我的spring应用程序中工作。

我没有找到其他解决方案,所有这些解决方案都很糟糕。你有没有想过其他方法?

谢谢你的帮助。

1 个回复
最合适的回答,由SO网友:Clemzd 整理而成

我可以回答我自己的问题。Jsoup可以满足我的需要:

提取内容(已测试)

  • 更改Spring的链接(已测试)
  • 保存HTML(已测试)、图像(已测试)、视频(尚未测试)
    结束

    相关推荐

    SQL database export-import

    我开发的网站包含WordPress博客以及我设计的其他PHP页面。当我在测试服务器上本地更改站点时,我使用myPHPAdmin进行SQL数据库转储。如何避免覆盖客户端WordPress日历条目和其他日历设置的内容?如果我只是在localhost db dump上取消选择日历表,那么在导入之后,客户端的db会维护远程服务器上表的这些客户端条目吗?提前感谢