基于SSM框架的office应用思路:众所周知Microsoft office系列已经很强大了,强大到已经成为企业、个人、组织关于文档需求首选。
最近我想搭建一个SSM框架,主要功能就是实现对word文档的解析极其提取。
word文档为一个一个的考试题目,题目中包含文字,图片,表格。
思路一:poi/jacob/java2word/RTF
思路二:将文档编译成html。图片、表格单独存在其他的数据库中,文字存在html中,html存在数据库中,且各自有编号。在生成word的时候去调用html(html调用图片数据库)然后生成word。
思路三:用XML做就很简单了。Word从2003开始支持XML格式,大致的思路是先用office2003或者2007编辑好word的样式,然后另存为xml,将xml翻译为FreeMarker模板。
最后用java来解析FreeMarker模板并输出Doc。经测试这样方式生成的word文档完全符合office标准,样式、内容控制非常便利,打印也不会变形,生成的文档和office中编辑文档完全一样。