N年前的文章了,拿出来晒晒,哈哈。。。
一、概述
目前市面上有各式各样的翻译软件,在中国相对常见的是英汉互译类的软件,如金山词霸等,但是进行国际化的程序开发的时候,经常需要进行多个语言的翻译,比如英语译成俄文,中文译成西文等,但是市场上很少见到这么多的专业翻译软件,即便有,谁的机器装这么多的大型软件,在经济上和机器承受能力上都有一定的限制。后来发现网上有很多的在线翻译的网站,比如雅虎的“翻译鱼”,可以实现N多种语言的互译,对相关的工作能起到很大的帮助作用。但是由于浏览器固有的缺陷,使用起来还有一定的不方便性,根据本人的习惯,决定开发一个客户端程序,并把翻译鱼的功能嵌入到程序中,那样就会很方便了。
二、开发
说干就干,有了上述的想法后,本人利用两个小时的时间,成功的实现了自己的“梦想”,拥有了一套完全个性化的多语言翻译软件。
开发环境:VS2003
开发语言:C#
数据库:无
1. 系统初始化
为了简洁,程序只有一个主界面,没有任何的配置界面及配置文件。说到这里,也许您会问,没有配置文件,那么要如何设定系统能翻译哪些语言呢?这个很简单,我直接抓取了翻译鱼的网页,对其中的文本进行分析,找到了它所能处理的语言列表,直接放在我的界面上就可以了,这样无论它以后增加了什么语言,我都可以自动适应。
抓取网页使用了WebClient这个类,用法如下:
byte[] bytes = client.DownloadData("http://fanyi.cn.yahoo.com/translate_txt?more=1");
string content = System.Text.Encoding.UTF8.GetString(bytes);
int pos = content.IndexOf("<div class=\"tctrl\">");
int pos_ = pos;
while (pos > 0 && pos_ > 0)
{
pos = content.IndexOf("<option",pos_);
if (pos > 0)
{
pos_ = content.IndexOf("</option>",pos);
if (pos_ > 0)
{
string option = content.Substring(pos,pos_ - pos + 9);
System.Diagnostics.Debug.WriteLine(option);
FillSingleOption(option);
}
}
}
上述函数中引用了一个名为FillSingleOption的函数,它的作用是把每一行语言取出来,填充到界面上的语言选择框中,代码主要部分如下:
int pos = option.IndexOf(" value=\"");
int pos_ = option.IndexOf("\"",pos + 1);
string value = option.Substring(pos + 8,pos_ - pos -2);
pos = option.IndexOf(">");
pos_ = option.IndexOf("</");
string text = option.Substring(pos + 1,pos_ - pos -1 );
if (hash[value] == null)
{
hash[value] = text;
Lang lang = new Lang();
lang.Value = value;
lang.Text = text;
cobLang.Items.Add(lang,System.Windows.Forms.CheckState.Unchecked);
}
呀呀呀,真是一环套一环,上面这个小小的函数中,居然又出现了一个新的类,名字叫Lang,它是干什么的呢?它就是用来向CheckList中填充信息用的。为什么要向Items中加一个类呢,因为添加的时候,只能添加一个对象,而我需要记录的信息包括zh-en这样的代码和“中文-英文”这样的文字,所以没办法,只好麻烦一些,写了个类。这个类的代码只有几行,就是两个属性,记录两个值,不过有一点需要注意,必须重写ToString函数,否则添加到CheckList中的将显示为“Object”字样。
类的代码如下:
public class Lang
{
private string value_;
private string text;
public string Value
{
get{return value_;} set{value_ = value;}
}
public string Text
{
get{return text;} set{text = value;}
}
public override string ToString()
{
return text;
}
}
哇,真是有史以来最小的一个类了,不过它也算完成了它的史命了。
到目前为止,初始化结束!
2. 翻译
程序启动后,真正的工作就要开始了,我设定了两个文本框,一个用于输入源字符,另一个用于输出,与翻译鱼不同的是,我这里可以同时选择多种翻译条件,并且在输出的时候,拼在一起,特别方便。
如何实现翻译呢,经过对翻译鱼网页仔细分析,发现可以用GET方式来得到结果,如下:http://fanyi.cn.yahoo.com/translate_txt?more=1&trtext=China&lp=en_ru
上述URL中,有三个参数,分别说明如下:
Ø more=1 这个是好像必须要写,是它系统规定的
Ø trtext=China 这个指的是需要翻译的源内容
Ø lp=en_ru 这个指的是用何种规则来实现翻译,当前指的是英语翻译成俄文
那么它翻译的结果会以什么样的形式来返回呢?我们都希望这个页面直接返回一个结果就行了,可是我没能如愿,它实际上返回的还是一个页面,翻译结果被嵌入其中,没办法,只能用程序把翻译结果再深挖出来,好在有前面的网页抓取的经验,我们可以直接看一下相关的代码:
string result = "";
foreach(object o in cobLang.CheckedItems)
{
Lang lang = (Lang)o;
string src = txtSrc.Text.Trim();
if (src != "")
{
string url = "http://fanyi.cn.yahoo.com/translate_txt?more=1&trtext=" + src + "&lp=" + lang.Value;
byte[] bytes = client.DownloadData(url);
string content = System.Text.Encoding.UTF8.GetString(bytes);
int pos = content.IndexOf("<div id=\"pd\" class=\"pd\">");
if (pos > 0)
{
int pos_ = content.IndexOf("</div>",pos + 1);
if (pos_ > 0)
{
result += lang.Text + "\r\n" + content.Substring(pos + 24,pos_ - pos - 24).Trim() + "\r\n";
}
}
}
txtResult.Text = result;
}
哇,看起来挺乱,其实一点也不乱,就是取出网页的内容,找到相应的位置,并找到结束符号,取出相应内容即可,对了,别忘了对取出的结果做一下Trim。
仔细看一下上述代码,发现已经同时实现了多种翻译同时进行,并且把结果进行拼接。
三、结束
太抽象了,来个直观的,看一下界面吧:
对了,输出结果框的字体别忘了改成Arial,如果用默认的宋体,可能有些文字显示的不好看,但是如果有些国家的文字无法正确显示,那就不是本程序的问题了,需要你的系统自己去安装相应的语言包了。
界面及功能都非常简单,但是实用是最主要的,祝大家用着开心。