书城成功励志影响你一生的北大演讲大全集
7809200000037

第37章 重构现代操作系统(1)

RickRashid

非常高兴来到北京大学,其实我对这个大学的环境是很熟悉的。我今天主要想谈一谈一个跟大学非常有关的课题,那就是我想谈一谈科学技术怎样能够改变我们办教育的方式,改变了我们在大学里从事教育包括科研的方式,在硬件和软件里面现在发生的一些变化,这些变化正在改变电脑对我们生活的影响。如果我们看一看在处理器还有储蓄图像和网络方面变化的话,这些变化的迅速和变化的惊讶,程序处理的数据越来越快,而处理能力的增长比处理的能力还要快,这样的话我们有更多的用途,对我们的生活产生影响。我想举一个例子,那就是我们现在开始使用自然语言来改变我们现在使用的应用程序。在1997年的时候,微软研究院推出了微软办公室的自然语言,当时主要是用它为一个文件的制造者提供服务,来改变作者的书写能力,这样的话大家更容易看懂,也确保没有错误。同一个技术也同样应用于其他的方面,比如说总结案文,我们可以从一个文件中提取一些内容,从其他语言中也使用一些技术,在日语中也可以应用这个技术,这就是微软刚开始的程序。

从微软的XML层面,所以看到这一点,它的主要用途是告诉你怎么分析写这么一句话,可以对你这句话进行分析。这种技术可以来处理人类使用的文字,这不仅能够帮助我们写作,而且还能够帮助分析我们写的东西。我们在实验室正在研究一项问题,使我们能够阅读比如说字典或者百科全书,然后根据这些字典或者百科全书,不管是英文还是其他语言的,根据阅读的材料来建一个数据库,可以包括大量的信息。在这里面我举一个例子,这就是人脑脑部系统,向大家描述的这些信息,实际上是机动机器产生的,而且它通过一些在上面可以看到有脑类图。因为脑类有很多相关的词汇,比如说一个脑类是家禽或者是叫声,比如说鸭子的叫声,它实际上是自动产生的,而不是由人直接输入的信息。这实际上就是我们对知识产生自然的数据库,现在我们正在使用这种自动的从人类的来源产生的信息来做这种数据库。

我想人民往往想使用它做很多的事情,其中有一个事情叫自动问答系统。当然获得某些问题的时候,今天很多人使用搜索引擎,这样来回答他们的问题。我想它应该叫做文件获取,它实际上是通过获得一系列文件,这样可以根据你的查询或者要求获取信息,特别的案例中实际上问了一个问题,中国总理是谁?你可以获得一些有关的相关的文章,这其中最相关的反应实际上就是指向了一个网站,你查询中国总理是谁,它让你查询一个网站。实际上它与中国总理是谁这个问题没有太多的联系。我们想做的一个事情就是要建立一个系统,它能够充分利用因特网的趋势,这样能够充分地处理网上的信息,而且也能够自动回答我们的问题。这是建立一个自动系统,如果比如说你有这个问题,谁是中国总理这个问题的话,你会得到什么呢?你会得到一个正确的回答,那么你就像我们搜索引擎一样,这种系统实际上也是上了一个网。建立很多的文件,这个文件与你这个问题是相关的,但是与搜索引擎不同,它使用自然语言或者合成的技术来充分把你这个信息进行联系,而且充分找到最想像的最有可能对你问题的回答,实际上这也是最正确的回答。如果你问一问中国的主席是谁呢?而且这样你也会得到正确的回答。我想这个系统根本对中国的主席,中国没有太多的了解,它实际上做了一个事情就是把不同的网站上的信息能够充分联系在一起。我第一次看到这个的时候,它是不是知道我是谁呢,因此我就问了一下谁是微软研究院的头,好消息,他们的回答是很正确的,否则回答不正确,让它继续工作。当然还有其他很想像的回答,但是比如说微软研究院剑桥实验室的负责人,比如说在微软的研究院当中有一个首席科学家,也可以说首席科学家是微软研究院的头,可以有关时事的问题。这个系统的确在网络上有很多存储的信息,你可以充分挖掘这些信息,尽管系统不知道这个回答是什么样,可以做出相应的反应。林肯在美国内战的时候被刺杀,你问一下,林肯什么时候去世的呢?他回答是1865年4月15日,我想这的确是最正确的答案。而且大家也知道,我们还有一个日期就是4月14日,还有一些网站在4月14日去世的,实际上这个答案是不对的。问一下林肯什么时候被刺杀,4月14号遇刺,4月15日去世,实际上是系统把所有的信息联在一起这样给出一个正确的答案。如果问一问草的颜色是什么颜色的,他会说绿色的,很正确的,当然还有其他很多的颜色,同时给你相应的选择回答。如果问一问天空为什么是蓝的,这是很平常的问题,而且是一个小孩问家长的问题,我的小孩问,因为光线的原因。同时可以问一些具有哲理性的问题,你问一问生命的意义在哪儿呢?可能不止有一个意义,但是系统本身,他回答很对,生命的意义在于问题。我想大家也可以看到,在上面有上帝,有亲情,还有有42条生命的意义。如果我们看这些系统如何改变我们做工作的方式,就像我们作为学生、作为教授,受到影响一样。我想我们认识这个世界实际上正在发生转变,在新的世界中信息将会得到广泛的公布,而且它存储的方式也会有所改变,技术改变被我们充分理解和想像。我们建立非系统式的系统,他有很多的客户,很多的服务器,而且可以提供多种的服务。

在企业界来说,企业界人士往往会谈XML的网络服务。XML实际上是标准的方式来描述信息的标准方式,它实际上是对数据做一些标志,这样它能够把这个信息与其他信息进行相应的联系。在这种企业界在XML网络服务会发生什么事情呢?我们有对知识和交换开放的标准,有这种联系不太紧密的编程方式,它是在网络上任何地方都可以能够获取以XML方式存储的数据和信息,而且应用将是自我描述性的,数据也是自我描述性的。

当我在马里兰州大学做教授的时候,我们曾经建立这种系统,而且我们当时努力实现这种目标,进而我们现在实现了这种目标。这个图向大家展示的就是网络服务XML网络服务的基础架构(指屏幕),关键一点在基础层它实际上以因特网的技术建立起来的,HTTP与SMTP,它是信息交换的标准,在这上面有一系列的标准。通过这些标准,我们获取信息,可以找到服务,可以找到服务为你做的事情,和信息结构,进行信息的处理和数据的处理,其中关键的一点叫做松散式编程方式。它还看到通过这种方式能够允许双方的协议使用,而没有所谓权威存在。