在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
一、问题点: 1、模拟登录后,如果带有嵌套的iframe嵌套,不好读取iframe内容,可以直接指定iframe抓取网址 2、C# 清除WebBrowser控件的Session和Cookie 参考文档:http://www.360doc.com/content/14/0810/12/9200790_400769010.shtml 代码如下: [DllImport("wininet.dll",SetLastError = true)] private static extern bool InternetSetOption(IntPtr hInternet, int dwOption, IntPtr lpBuffer, int lpdwBufferLength); private void timer_Tick(object sender, EventArgs e) { InternetSetOption(IntPtr.Zero,42,IntPtr.Zero,0); if (this.webBrowser.Document != null) { this.webBrowser.Document.Cookie.Remove(0, this.webBrowser.Document.Cookie.Count() - 1); } string[] cookies = System.IO.Directory.GetFiles(Environment.GetFolderPath(Environment.SpecialFolder.Cookies)); foreach (string currentFile in cookies) { try { System.IO.File.Delete(currentFile); } catch { } } this.webBrowser.Navigate(SysInfo.WEBURL); }
3、IHTMLDocument2 的引用 引用--COM--Microsoft HTML Object Library
二、模拟登录 模拟无验证码登录,用WebBrowser比较简单,为登录用户和密码赋值,然后模拟点击登录按钮即可 this.webBrowser.Document.GetElementById("user").SetAttribute("value", "user"); this.webBrowser.Document.GetElementById("password").SetAttribute("value", "password"); this.webBrowser.Document.InvokeScript("SetCookie"); for (int i = 0; i < 10; i++)//等待1秒,进行登录 { Thread.Sleep(100); } HtmlElement btnLogin = this.webBrowser.Document.GetElementById("login"); btnLogin.InvokeMember("Click"); for (int i = 0; i < 5; i++)//等待0.5秒,进行跳转 { Thread.Sleep(100); } this.webBrowser.Navigate(SysInfo.DATAURL);
三、抓取数据 指定抓取网址,载入之后,获取元素值 HtmlElement div = this.webBrowser.Document.GetElementById("style1");
参考博客:C#中的WebBrowser控件的使用 参考博客:C#中利用WebBrowser控件,获得HTML源码 |
2023-10-27
2022-08-15
2022-08-17
2022-09-23
2022-08-13
请发表评论