在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
1、问题描述: 由为知笔记导出的文件导入Evernote的时候,有一些(新建的)HTML文件以<mate>标签开头,查阅Evernote的log可知因此文件不能被导入。 责任无论归于为知还是Evernote都不重要,总之几百篇日志不可能通过复制粘贴进行导入。
2、工具解决问题: 批量将某一文件夹内不合规范html文件规范化。
3、界面
4、主要代码 private void button2_Click(object sender, EventArgs e) { if (folderBrowserDialog1.ShowDialog() == DialogResult.OK) { DirectoryInfo dir = new DirectoryInfo(folderBrowserDialog1.SelectedPath); FileInfo[] files = dir.GetFiles("*.html"); for (int i = 0; i < files.Length; i++) { System.IO.StreamReader sr = new System.IO.StreamReader(files[i].DirectoryName+"\\"+files[i].ToString()); NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(sr.ReadToEnd()); try { sr.Dispose(); File.Delete(files[i].DirectoryName + "\\" + files[i].ToString()); using (StreamWriter sw = new StreamWriter(files[i].DirectoryName+"\\"+files[i].ToString(), false, System.Text.Encoding.GetEncoding("UTF-8"))) //保存地址 { sw.WriteLine(doc.ToString()); sw.Flush(); sw.Close(); } } catch { } } Application.Exit(); } } 5、源码: 环境:vs2008 组件:Nsoup.dll https://files.cnblogs.com/files/yixiaozi/NsoupApplication.zip
可执行程序:https://files.cnblogs.com/files/yixiaozi/FormatHtml.zip |
请发表评论