将WordPress日志备份xml转换为html

很多人的博客是以WordPress做建站程序的,其中有自主博客,也有相当一部分是原MSN Space用户被强制转到wordpress.com的。众所周知,wordpress.com被GFW认证了,所以应该不少用户都有转移blog的需求,或者备份blog的需求。

wordpress的后台可以方便把数据库内容导出为xml格式的文件,大多数建站程序也支持再次导入,不再赘述。需要注意,上传的附件、图片等不含在xml格式中。

如果大部分内容是文字,想要离线备份,则可以用xls定义xml的输出格式,然后直接用浏览器打开,然后打印或者另存为需要的格式即可。

wordpress备份的xml文件中,每一篇日志的XPath为rss/channel/item,转换时注意CDATA的处理,我用的方法是 disable-output-escaping=”yes” ,否则正文中会出现各种html标签。

一个简单的例子,也就是我用的xsl: http://www.wangnan.me/blog.xsl .

如果需要,请打开你的xml文件,添加一行 <?xml-stylesheet type=”text/xsl” href=”http://www.wangnan.me/blog.xsl” ?> ,然后用浏览器打开即可~


Comments

2 responses to “将WordPress日志备份xml转换为html”

  1. 文中的xls应为xsl,抱歉笔误。

  2. 把文中提到的我的xsl文件 放到了gist上
    https://gist.github.com/4243714

Leave a Reply