从网站上搜集数据并将其发布到博客上

时间:2011-01-04 作者:Pennf0lio

这可能是在DocType中,但我正在寻找一种方法来刮取数据并自动发布它。

我想从网站上获取这些数据,并自动将其发布到我的博客上。它没有rss或API来获取这些数据,所以我需要手动一个接一个地复制和粘贴它,并将其发布到WordPress上。

您知道我的流程的替代方案吗?

1 个回复
SO网友:Rarst

虽然从机器可读格式(如RSS)导入非常简单,而且通常有大量的工具。。。这与任意HTML的情况截然不同。

如果您不能从头开始编写代码,那么我所知道的最接近的半自动工具是Dapper - 它可以处理HTML页面,并根据您在可视化界面中设置的规则将其转换为其他格式,包括XML和RSS。另一方面,我不确定它是否能够满足您的页面发现要求。

结束

相关推荐