• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    公众号

asp.net中Word转Html的办法(不需要WORD组件)

原作者: [db:作者] 来自: [db:来源] 收藏 邀请
基本思路:
把Word文件上传到服务器,读取其内容存储为Html,然后加载Html内容

1:使用Microsoft.Office.Interop.Word组件
     这是比较常用的一种方式,代码就不贴出了,网上大把的例子
     缺点:服务器需要装Word的组件,并且需要在服务器上设置Docm+对象的权限,如果一台服务器还好,如果项目应用到多台不同服务器,就比较繁琐了
2: OpenXml API
     可以将.docx(word 97-2003 不适用)转化为XML,有了XML,想转成HTML或是其他格式都不再是问题了,此Api需要 .net FreamWork3.5+ Office2007+
3:第三方:例如Aspose.Words(已测试,推荐)
   Aspose提供了各种格式的转换方案,有兴趣的可以进去仔细看一下,.NET Java方向的都有,采用其中Aspose.Words这个Dll,无需安装微软Office组件 即可转换Word(Converting DOC,DOCX to HTML without MS Office Word in .Net)
复制代码 代码如下:

Aspose.Words.Document d = new Aspose.Words.Document(wordPhysicalPath);
            d.Save("d:\\1.html", SaveFormat.Html);

即可存为HTML文档(注意Word里面的图片存储在和Html同级目录下,读取Html内容时需要替换<img src='https://www.ogeek.net/CWolf/archive/2011/09/30/为 <img src='+图片虚拟路径)
优点:不需要安装微软Office组件,只需要一个差不多2M的DLL 就可以完成此功能
缺点:Aspose并不是一个开源的组件,国内虽然有破解版,也可反编译后自己进行更改,但是版权问题确实是要考虑的因素

还有一些第三方的其他的项目,大部分是收费的,在此就不一一列举了

鲜花

握手

雷人

路过

鸡蛋
该文章已有0人参与评论

请发表评论

全部评论

专题导读
上一篇:
.NET图像界面按钮的clicked事件浅谈发布时间:2022-02-05
下一篇:
GridView自动增加序号(三种实现方式)发布时间:2022-02-05
热门推荐
热门话题
阅读排行榜

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

139-2527-9053

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:深圳市南山区西丽大学城创智工业园
电邮:jeky_zhao#qq.com
移动电话:139-2527-9053

Powered by 互联科技 X3.4© 2001-2213 极客世界.|Sitemap