随后又会对资料进行一番处理,才最终呈现在李言洪眼前。
用度娘搜索什么信息,会出来一大堆网页。
真正关键的信息,还要自己去寻找。
现在却不一样,李言洪先尝试简单的问题,比如搜索某个人物,他要看看夏为科技的搜索引擎到底掌握了多少数据。
一般而言,搜索引擎呈现的结果,都是网络爬虫在互联网上找到的网页快照,最后只能把所有网页快照呈现在用户眼前。
度娘的技术便是这样,当然通过多年积累,度娘有词条功能。
所有词条都是千千万万网友在度娘公司的引导下完善的。
最初阶段也非常简单,词条还和度娘的虚拟币挂钩,一些完善词条的用户能够得到虚拟币奖励。
后来把数据库建立起来以后,就自发形成了良好的知识分享环境。
大家都可以修改词条,最后把自己的名字挂在贡献榜上。
正是因为这个原因,其实度娘的词条也不是十分准确,存在大量被编造的信息。
这方面还闹出过不少笑话,有学者通过度娘百科写论文。
而且写的还是历史类论文。
他以为度娘百科是准确的资料,便没有多加验证便按照度娘百科的资料写好了论文。
最后导师看了以后,才发现问题。
原来度娘某些历史知识,竟然都是某网友编造的信息。
另外度娘也从外网的维基词条网站复制了很多内容,而维基网站其实也是网友自主上传的信息,大量虚假信息就从外转到内,某些人还以为国外找到的是史料,但其实就是编纂的信息。
曾经还有网友在维基上编纂了白熊国历史,足足写了百万字。
将白熊国古代某时期的史料,编纂得和真的一样,还虚构了某个银矿,甚至是发生的战争。
这些知识误导了不少人。
李言洪不知道对方的数据从哪里来,如果也是互联网上搜集,也许也有不少错漏的地方。
但很快让他震惊的事情发生,通过夏为搜索出来的结果,非常有条理性。
比如搜索某个历史人物,便可以简略地看完这个人一生的介绍,资料被详细规划出时间线,文字多达数十万字,简直就像是某个人的自传一样。
就连搜索李言洪自己名字,也会找到他的所有轨迹。
当然这些都是互联网上所有报道,被整合后弄成的简介介绍。
文字很多,如果想要知道更细节的内容,可以进行二次搜索,只要输入关键词,甚至是问句,夏为搜索都能给出答桉。
陆杨看见搜索结果,也是欣慰不已,小天也许在思维能力上,还没有达到成年人的思维能力。
可数据整合上,已经超过了所有人类。
李言洪搜索自己的名字,小天第一时间在后台利用度娘搜索,随后将数万个网页,包括里面的内容,在几毫秒内整合完毕。
这其中就包括媒体报道的时间线,最后李言洪便看到人工智能利用网络上无数数据,给它制作的数十万字简历介绍。
陆杨见李言洪十分震惊的脸色,笑道:“还可以试试搜索历史人物,某些冷僻知识,十万个为什么都可以搜索,它会给你答桉,因为我们的小天人工智能,数据库已经连接上国家电子图书馆,z-library全球最大的电子图书馆、谷歌电子书数据库等等,前者有近百万本图书数据,后者有945万多本图书数据。”
“不管是文字版,还是pdf图片版本,我们的人工智能都能识别,读取图书数据,并且在你输入关键词后,找到对应答桉。”
“这只是开始,目前国家图书馆的线下藏书达到了2亿册,几乎把人类所有通过正版出版的书籍都收纳了,我们接下来会将这2亿册书籍都电子化,接入人工智能数据库。”
陆杨前面说的是实话,他前段时间便打通了数据连接渠道,让国家图书馆线上图书和小天连接,当然因为版权原因,只能内部使用。
这是靠着他和官方良好关系才做到的。
至于z-library网站,这是国外的亚马逊搞出来的网站。