五角大楼开发了一种新的搜索引擎,可以深入到万维网的深处
一年多以来,美国国防高级研究计划局(DARPA)一直在研究Memex,这是一种搜索引擎,可以收集谷歌搜索爬虫无法到达的90%到95%的互联网信息。
这款搜索引擎的名字来源于“记忆”(memory)和“索引”(index)的组合,其设计初衷是为了探索互联网的未知领域,包括谷歌没有编入索引的信息数据库,以及网络中发生性交易和毒品交易等犯罪活动的黑暗部分。
“我们正在设想一种新的搜索范式,它将为个人用户和特定的主题领域定制内容、搜索结果和界面工具,而不是相反。”说DARPA项目经理Chris White在一份声明中表示。“通过发明更好的信息交互和共享方法,我们希望改善每个人的搜索和个性化的信息获取。对于非程序员来说,易用性是至关重要的。”
DARPA在一个由17名承包商组成的团队的帮助下,开发了Memex,该工具已经成为纽约市一名男子定罪的关键工具。这名男子是一个组织的成员,该组织绑架并性侵了一名28岁的女子,随后这名女子从她被关押的六层楼的窗户逃走了。曼哈顿地区检察官塞勒斯·万斯(Cyrus R. Vance)表示,他的办公室现在在处理每一起人口贩卖案件时都使用Memex,这是该搜索引擎的最初目的。
与谷歌、必应、雅虎等以广告为基础,根据搜索引擎算法线性显示的搜索结果不同,Memex可以找到谷歌上难以找到的信息,并以复杂的信息图表的形式显示信息之间的巨大关系网络。
例如,搜索性交易广告中突然出现的名字和电话号码,不会在网络上出现该名字和电话号码的其他地方的列表。取而代之的是,Memex将创建一个图表,其中的点代表包含姓名和数字的网页,从而绘制出一个更大的图像,这可能是一个在线运营的人口贩运团伙。
点击这些点就会显示出广告发布的地点和时间,这样刑事调查机构就可以追踪罪犯,否则使用基本的谷歌搜索就无法找到他们。
Memex的性质当然会引起隐私倡导者的质疑,但DARPA很快就强调,它“特别不感兴趣”访问在线上无法公开获取的信息,或识别匿名服务、服务器或IP地址。
DARPA表示,除了打击人口贩子、恐怖分子和其他犯罪分子外,Memex还可以特别有助于政府、军事和商业组织在互联网上查找和组织“关键任务”信息。例如,在发生自然灾害时,紧急救援人员可以迅速找到受灾最严重地区的信息。