日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

洛威爾會(huì)議——數(shù)據(jù)庫(kù)研究的自我評(píng)估(譯文)

系統(tǒng) 2346 0

原文:The Lowell Database Research Self Assessment 。轉(zhuǎn)載請(qǐng)注明原地址,謝謝!

? 概要

?????? 每隔幾年資深數(shù)據(jù)庫(kù)研究者們齊聚數(shù)據(jù)庫(kù)研究特設(shè)會(huì)議,評(píng)估數(shù)據(jù)庫(kù)研究的狀況,并指出需要特別注意的問(wèn)題。這份報(bào)告總結(jié)了這群研究者二零零三年五月四日到六日在美國(guó) Massachusetts?Lowell (以下稱(chēng)洛威爾)召開(kāi)的 第六屆特設(shè)會(huì)議的討論和結(jié)論。這份報(bào)告強(qiáng)調(diào)了信息管理依然是大多數(shù)復(fù)雜軟件系統(tǒng)的重要組成部分,并建議數(shù)據(jù)庫(kù)研究者將重點(diǎn)放在如下領(lǐng)域:文本、數(shù)據(jù)、代碼和流的整合,不同數(shù)據(jù)源的信息融合,不確定數(shù)據(jù)的推理,開(kāi)放數(shù)據(jù)的關(guān)系挖掘,信息隱私以及自適應(yīng)和修復(fù)。

1? 簡(jiǎn)介

每隔幾年資深數(shù)據(jù)庫(kù)研究者們齊聚數(shù)據(jù)庫(kù)研究特設(shè)會(huì)議,評(píng)估數(shù)據(jù)庫(kù)研究的狀況,并指出需要特別注意的問(wèn)題。跟隨著前人的腳步,這份報(bào)告與更早的幾份會(huì)議報(bào)告 [1] [2] [3] [4] [5] 目標(biāo)相似。沿襲著會(huì)議傳統(tǒng),在2003年五月上旬,25位代表著數(shù)據(jù)庫(kù)研究領(lǐng)域中在研究方向,聯(lián)系和地理位置上廣泛而交叉的資深數(shù)據(jù)庫(kù)研究者來(lái)到洛威爾,兩天內(nèi)集中討論了數(shù)據(jù)庫(kù)領(lǐng)域的定義和數(shù)據(jù)庫(kù)今后的發(fā)展方向。會(huì)議產(chǎn)生了幾個(gè)重要的觀察報(bào)告。

受到新應(yīng)用,技術(shù)潮流,新協(xié)同作用和數(shù)據(jù)庫(kù)領(lǐng)域本身的改革的驅(qū)動(dòng),我們把注意力放在了信息的存儲(chǔ),組織,管理和存取上。信息的性質(zhì)和來(lái)源每時(shí)每刻都在發(fā)生變化。每個(gè)人都意識(shí)到Internet,Web,科學(xué)和電子商務(wù)對(duì)信息和信息處理有著龐大的需求。同樣有此需求是即將到來(lái)的微傳感器技術(shù),這種廉價(jià)的技術(shù)能使大多數(shù)事物實(shí)時(shí)地報(bào)告他們的狀態(tài)。而這種每時(shí)每刻都可能在發(fā)生改變的信息正是某些監(jiān)測(cè)事物狀態(tài)和位置的應(yīng)用開(kāi)發(fā)的需要。傳感器信息處理會(huì)使很多數(shù)據(jù)庫(kù)熱點(diǎn)提升到一個(gè)新環(huán)境,與此同時(shí)帶來(lái)的是新約束和新機(jī)會(huì)。

如今Internet是應(yīng)用開(kāi)發(fā)的主要驅(qū)動(dòng)引擎,特別是使跨企業(yè)的應(yīng)用成為了可能。在歷史上,應(yīng)用功能是屬于企業(yè)內(nèi)部的,是可以在一個(gè)統(tǒng)一的管理下徹底地規(guī)定和優(yōu)化的。不過(guò),大多數(shù)企業(yè)熱衷于與它們的供應(yīng)商和客戶(hù)交流以共享信息,這樣就可以向用戶(hù)提供更優(yōu)質(zhì)的服務(wù)。這從根本上說(shuō)是跨企業(yè)的,并且需要對(duì)安全和信息進(jìn)行更有力地整合的設(shè)施。這也為數(shù)據(jù)庫(kù)管理系統(tǒng)(DBMS)社區(qū)帶來(lái)了新課題。

數(shù)據(jù)庫(kù)在科學(xué)領(lǐng)域的應(yīng)用的重要性正在不斷增加,特別是物理,生物,醫(yī)學(xué)和工程。這些科學(xué)領(lǐng)域需要更先進(jìn)的數(shù)據(jù)庫(kù)產(chǎn)品提供對(duì)龐大而復(fù)雜的數(shù)據(jù)集的支持,同時(shí)也需要信息集成的方法。此外,數(shù)據(jù)分析,存儲(chǔ)和已排序數(shù)據(jù)(包括時(shí)間序列,圖像分析,網(wǎng)狀結(jié)構(gòu)計(jì)算和地理信息)的查詢(xún)都會(huì)衍生一系列的數(shù)據(jù),并且與全球數(shù)據(jù)網(wǎng)格進(jìn)行整合。這些都是數(shù)據(jù)庫(kù)管理系統(tǒng)幫助科技人員做到的。

除了這些信息管理的新變化之外,在傳統(tǒng)數(shù)據(jù)庫(kù)管理系統(tǒng)領(lǐng)域,我們也面臨著重要的改變,比如數(shù)據(jù)模式,存取方法,查詢(xún)處理算法,并行控制,恢復(fù),查詢(xún)語(yǔ)言和DBMS的用戶(hù)接口。這些課題在以前已經(jīng)被很好地研究了,然而,技術(shù)一直在改變慣有的規(guī)則。例如,磁盤(pán)和RAM的性?xún)r(jià)比越來(lái)越高,存取時(shí)間和帶寬也在不斷提升,但是沒(méi)有容量和價(jià)格那么快。這種提升比率要求我們重新評(píng)估存儲(chǔ)管理和查詢(xún)處理算法。另外,由于處理器的緩存在大小和數(shù)量的規(guī)模上有了爆炸式的變化,這就要求數(shù)據(jù)庫(kù)管理系統(tǒng)的算法能夠自動(dòng)隨著緩存的變化做出相應(yīng)的調(diào)整。這就是新形勢(shì)下技術(shù)上的變化使得以往算法得到重新評(píng)估的兩個(gè)例子。

數(shù)據(jù)庫(kù)研究的另一個(gè)動(dòng)力來(lái)自相關(guān)技術(shù)的成熟。例如,在過(guò)去的十年里,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為數(shù)據(jù)庫(kù)系統(tǒng)的一個(gè)重要組成部分。信息檢索需要與傳統(tǒng)數(shù)據(jù)庫(kù)搜索技術(shù)相整合,然而Web搜索引擎已經(jīng)使得信息檢索走進(jìn)了千家萬(wàn)戶(hù)。人工智能的許多領(lǐng)域正在制造結(jié)合了數(shù)據(jù)庫(kù)技術(shù)的部件;例如,這些部件使我們能夠處理語(yǔ)音,自然語(yǔ)言,不確定性推理和機(jī)器學(xué)習(xí)。

與會(huì)者們指出,這幾天為計(jì)算機(jī)學(xué)科的不同領(lǐng)域提出“大挑戰(zhàn)”是一個(gè)流行的承諾。每個(gè)大挑戰(zhàn)都是不能被輕易解決的問(wèn)題,因此打算作為某一給定領(lǐng)域的使命,比如信息效用 [5] 和用數(shù)十億零件建造系統(tǒng) [6] 。我們認(rèn)為我們可以定義更多的大挑戰(zhàn)。事實(shí)上,我們討論過(guò)著名的個(gè)人信息管理器。個(gè)人信息管理器是一種為人的一生提供存儲(chǔ),組織和對(duì)數(shù)字編碼信息進(jìn)行存取的一種數(shù)據(jù)庫(kù)。最后,我們肯定地認(rèn)為由于信息管理技術(shù)是提出的大多數(shù)計(jì)算機(jī)科學(xué)大挑戰(zhàn)的關(guān)鍵部件,那么關(guān)注單個(gè)大挑戰(zhàn)是不合適的。此外,很多信息管理方面的挑戰(zhàn)都遠(yuǎn)遠(yuǎn)超出了目前工藝水平。由于原有的大挑戰(zhàn)已經(jīng)在數(shù)據(jù)庫(kù)社區(qū)充分飽和,所以我們決定不再增加新的大挑戰(zhàn)。

在會(huì)議進(jìn)行的這兩天里,我們注意到許多影響信息管理的新應(yīng)用,新技術(shù)潮流和新協(xié)同作用。從總體上看,這些熱點(diǎn)需要一個(gè)與現(xiàn)有的設(shè)施不同的新信息管理基礎(chǔ)設(shè)施。從此開(kāi)始,第二節(jié)研究了這一基礎(chǔ)設(shè)施的組件。第三節(jié)介紹了會(huì)議期間有爭(zhēng)論的話(huà)題的討論,和數(shù)據(jù)庫(kù)研究下一階段的工作。研究的下一階段將把新信息管理設(shè)施向現(xiàn)實(shí)推進(jìn)。

2? 下一代基礎(chǔ)設(shè)施

這一節(jié)討論了各種基礎(chǔ)架構(gòu)的部件,它們中有些需要新技術(shù),或者在一定程度還是設(shè)想。

2.1? 文本,數(shù)據(jù),代碼和數(shù)據(jù)流的整合

數(shù)據(jù)庫(kù)管理系統(tǒng)領(lǐng)域的研究一直集中在捕獲,組織,存儲(chǔ),分析和檢索結(jié)構(gòu)化的數(shù)據(jù)。直到最近,一些研究者開(kāi)始關(guān)注將DBMS所能管理的數(shù)據(jù)也擴(kuò)展到文本,暫時(shí)性數(shù)據(jù),空間性數(shù)據(jù),聲音,圖像或錄像。不過(guò),網(wǎng)絡(luò)已經(jīng)清楚地表明這些更復(fù)雜的數(shù)據(jù)類(lèi)型的重要性。但是普遍的問(wèn)題是,當(dāng)系統(tǒng)添加擴(kuò)展功能時(shí),很難使擴(kuò)展如慣有功能那樣干凈。 相反,有一種傾向 做必要 功能 的最低限度 以獲得希求的 新功能中最重要的 部分 結(jié)果是這些擴(kuò)展傾向于創(chuàng)建“二等公民”——無(wú)法用于傳統(tǒng)DBMS的“一等公民”出現(xiàn)的所有上下文的對(duì)象。這里有一些例子表明,反思我們處理特定元素的方法能改善一個(gè)系統(tǒng)的有效性。

面向?qū)ο螅∣O)和面向關(guān)系(OR)的DBMS展現(xiàn)了文本和其它數(shù)據(jù)類(lèi)型如何添加到一個(gè)DBMS中,以及如何擴(kuò)展查詢(xún)語(yǔ)言以使其能操作擴(kuò)展的數(shù)據(jù)類(lèi)型。當(dāng)前的數(shù)據(jù)庫(kù)系統(tǒng)已經(jīng)向支持跨文本和結(jié)構(gòu)化數(shù)據(jù)的查詢(xún)邁出了第一步,但是這樣還不足以使結(jié)構(gòu)化數(shù)據(jù)檢索具有信息檢索的概然推理的特點(diǎn)。為了做到更好,我們需要數(shù)據(jù)模型的全新表示。能存取文本和數(shù)據(jù)的查詢(xún)語(yǔ)言也是如此。至少不確定性的管理所需的概然推理和其它技術(shù)必需成為DBMS的一等公民。

同樣的,如今的數(shù)據(jù)庫(kù)管理系統(tǒng)上增加的功能主要是能將用戶(hù)定義的過(guò)程添加到查詢(xún)語(yǔ)言中。這一功能允許用戶(hù)向DBMS添加新數(shù)據(jù)類(lèi)型和它的行為(或方法)。不幸的是這一功能使過(guò)程成為了二等公民,我們更希望代碼也成為DBMS的一等公民。

觸發(fā)器和主動(dòng)數(shù)據(jù)庫(kù)是DBMS內(nèi)部可執(zhí)行代碼的另一個(gè)來(lái)源。當(dāng)滿(mǎn)足指定的數(shù)據(jù)庫(kù)環(huán)境狀態(tài)或一個(gè)確定的事件發(fā)生時(shí),用戶(hù)希望能收到DBMS的提醒。如果數(shù)據(jù)庫(kù)有數(shù)百萬(wàn)個(gè)環(huán)境狀態(tài),周期性地查詢(xún)數(shù)據(jù)庫(kù)的某一狀態(tài)是否為真是低效率,甚至是不可行的。相反,用戶(hù)想指定監(jiān)視的條件,然后當(dāng)指定的條件為真時(shí),由DBMS異步地提醒用戶(hù)。DBMS產(chǎn)商們已經(jīng)將觸發(fā)器和警報(bào)器添加到它們的產(chǎn)品中,而且關(guān)于如何使這類(lèi)工具變得可伸縮性已經(jīng)有相當(dāng)多的研究。無(wú)論以何方式,觸發(fā)器和警報(bào)器已經(jīng)被嫁接到原有的DBMS架構(gòu)中。盡管在通常情況下完全由代碼進(jìn)行推理是不可行的,但讓DBMS做簡(jiǎn)單的,或者可能只是合成的關(guān)于代碼對(duì)象的推理是有用的。例如,我們就可以指望發(fā)現(xiàn)所有依托數(shù)據(jù)庫(kù)對(duì)象的所有代碼。

我們預(yù)計(jì)若干正在出現(xiàn)的應(yīng)用類(lèi)型會(huì)迫使數(shù)據(jù)流也成為DBMS的重要組成部分。即將到來(lái)的低成本微傳感器將使能監(jiān)視DBMS的新應(yīng)用成為可能。用傳感器實(shí)時(shí)地報(bào)告每個(gè)重要對(duì)象的狀態(tài)將變成現(xiàn)實(shí)。例如,筆記本和放映機(jī)會(huì)附帶一個(gè)傳感器,而不是屬性標(biāo)簽。為了找到丟失或被偷竊的放映機(jī),用戶(hù)就可以在監(jiān)視系統(tǒng)上查詢(xún)放映機(jī)的位置。這類(lèi)監(jiān)視應(yīng)用需要被監(jiān)視的事物的傳感器信息流的支持。這些數(shù)據(jù)流將向DBMS提出新的要求,其中包括的方面有高性能數(shù)據(jù)輸入,時(shí)間序列功能,日志維護(hù)和有效的隊(duì)列處理。據(jù)推測(cè),商業(yè)DBMS試圖通過(guò)將數(shù)據(jù)流處理嫁接到傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)的架構(gòu)上的方法來(lái)支持監(jiān)視應(yīng)用。

最近,科學(xué)的一種新形式正在形成。每一個(gè)學(xué)科都在產(chǎn)生龐大的數(shù)據(jù)量,例如粒子加速器 (物理學(xué)) ,望遠(yuǎn)鏡 (天文學(xué)) ,遙測(cè)傳感器(地球科學(xué)) ,基因芯片(生物學(xué))。計(jì)算機(jī)模擬也在產(chǎn)生龐大的數(shù)據(jù)集。組織,分析和總結(jié)這些巨大的科學(xué)數(shù)據(jù)集是一個(gè)對(duì) DBMS 真實(shí)的挑戰(zhàn)。來(lái)自于分布在網(wǎng)格中的各種處理過(guò)程和分析程序的數(shù)據(jù)定位和傳輸也是如此,迎接這一挑戰(zhàn)需要了解處理結(jié)點(diǎn)的整體架構(gòu)與其中每個(gè)模塊的需求和行為。滿(mǎn)足以上需要的 DBMS 需要數(shù)據(jù)與過(guò)程的整合,這將把復(fù)雜數(shù)據(jù)和先進(jìn)的數(shù)據(jù)分析整合進(jìn) DBMS

在我們看來(lái),是時(shí)候停止將新結(jié)構(gòu)嫁接到過(guò)去傳統(tǒng)的架構(gòu)上。相反,我們應(yīng)該重新考慮 DBMS 基礎(chǔ) 架構(gòu)并著眼于支持

l? 結(jié)構(gòu)化數(shù)據(jù);

l? 文本,空間,時(shí)間,圖像和多媒體數(shù)據(jù);

l? 程序的數(shù)據(jù),就是數(shù)據(jù)類(lèi)型和封裝程序的方法

l? 觸發(fā)器

l? 數(shù)據(jù)流和隊(duì)列

作為DBMS架構(gòu)中平等且重要的部件。它們的接口及其實(shí)現(xiàn)也應(yīng)如此,而不是作為后來(lái)者嫁接到相關(guān)內(nèi)核中。

與會(huì)者們建議研究社團(tuán)從頭重新開(kāi)始研究,這在大多數(shù)情況下會(huì)更有利。往SQL,XML模式和XQuery中添加功能可能會(huì)導(dǎo)致系統(tǒng)缺乏一個(gè)連貫的核心而變得笨重。由于XML模式和XQuery過(guò)于依賴(lài)先前的標(biāo)準(zhǔn),我們堅(jiān)信它們已經(jīng)太復(fù)雜了,以致于不能成為DBMS新架構(gòu)的基礎(chǔ)。對(duì)信息交流來(lái)說(shuō),自我描述的記錄格式是一個(gè)偉大的想法,但對(duì)于我們所設(shè)想的那種在其中過(guò)程,文本和結(jié)構(gòu)化數(shù)據(jù)地位平等的DBMS來(lái)說(shuō),這種記錄格式并不是特別方便。最后一點(diǎn),一種新信息結(jié)構(gòu)是無(wú)法承受過(guò)去政治性的妥協(xié)的。我們相信DBMS產(chǎn)商將繼續(xù)奉行擴(kuò)展SQL和擴(kuò)展XML的策略,以逐步改善原有的產(chǎn)品。相比之下,研究界應(yīng)該探討這一問(wèn)題的重新概念化。

這一新結(jié)構(gòu)的研究是我們研究界未來(lái)五年內(nèi)的目標(biāo)。我們期待在下屆特設(shè)會(huì)議之前會(huì)有里程碑式的實(shí)質(zhì)性原型。

2.2? 信息融合

企業(yè)著手處理語(yǔ)義范疇上的信息集成已有十年多了。典型的做法是提取工作數(shù)據(jù),將產(chǎn)生的數(shù)據(jù)轉(zhuǎn)換為同一模式,然后加載到數(shù)據(jù)倉(cāng)庫(kù)中,這樣就可以進(jìn)行查詢(xún)了。在這一過(guò)程中,信息集成會(huì)提前進(jìn)行,并通常使用轉(zhuǎn)換—加載(ETL)工具建立數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)集市。這在由一個(gè)公司統(tǒng)一地控制幾十個(gè)業(yè)務(wù)系統(tǒng)的情況下是可行的。

然而,因特網(wǎng)完全打破了這種提取,轉(zhuǎn)換和加載的模式。如今我們需要跨企業(yè)的信息集成,而且信息集成的基礎(chǔ)通常是特設(shè)的。很少組織會(huì)允許外部對(duì)組織業(yè)務(wù)系統(tǒng)中所有數(shù)據(jù)的提取,所以數(shù)據(jù)肯定留在源頭,并且只能在查詢(xún)時(shí)被訪問(wèn)。這部分工作現(xiàn)在能由一些商業(yè)工具完成,但其數(shù)據(jù)源只能是一個(gè)企業(yè)里的數(shù)據(jù)源中相對(duì)較小,靜態(tài)的部分。

如前所述,傳感器網(wǎng)絡(luò)和科學(xué)研究會(huì)產(chǎn)生龐大的數(shù)據(jù)集。這些傳感器和數(shù)據(jù)集可以分布在世界各地,并且動(dòng)態(tài)的傳回和取出數(shù)據(jù)。這便打破了傳統(tǒng)信息集成模式,因?yàn)檫€沒(méi)有一種切實(shí)可行的方法能將ETL工具應(yīng)用于以上兩種場(chǎng)合中的一種。

為此,信息集成必須飛越數(shù)以百萬(wàn)計(jì)的信息資源。DBMS研究界已經(jīng)有好幾年在調(diào)查聯(lián)合數(shù)據(jù)系統(tǒng),并形成了多份調(diào)查報(bào)告。第一份 [1] 報(bào)告就這個(gè)問(wèn)題進(jìn)行了廣泛地討論。然而,令人棘手的語(yǔ)義異構(gòu)問(wèn)題仍然沒(méi)有解決。不同人設(shè)計(jì)的模式是不可能完全一樣的。模式可能會(huì)含有不同的單元(比如你的工資是以歐元為意為,而我的是美元),不同的語(yǔ)義解釋?zhuān)ㄎ业墓べY是包括了午飯的凈工資,而你的是毛額)和同一事物的不同稱(chēng)呼(你的數(shù)據(jù)庫(kù)叫 Samuel?Clemens ,而我的叫 Mark?Twain )。一個(gè)能部署在Web網(wǎng)絡(luò)上的語(yǔ)義異構(gòu)的解決方案仍然是難以捉摸的。我們研究界必須關(guān)注這個(gè)熱點(diǎn),并認(rèn)真研究之,否則跨企業(yè)的信息集成依然是白日夢(mèng)。同樣的問(wèn)題也發(fā)生Web語(yǔ)義中。無(wú)論是否從事數(shù)據(jù)庫(kù)研究,所有研究于語(yǔ)義異構(gòu)和其它相關(guān)問(wèn)題的工作組的合作是極其重要的。

當(dāng)然,要使有效的Web規(guī)模的信息集成成為現(xiàn)實(shí),還有很多其它困難的工作等著我們。比如,現(xiàn)有的聯(lián)合查詢(xún)執(zhí)行系統(tǒng)會(huì)將子查詢(xún)發(fā)送到所有可能與子查詢(xún)與關(guān)的數(shù)據(jù)站點(diǎn),以此求得對(duì)查詢(xún)的完整回答。然而在Web上,這便是不可行的,而且執(zhí)行的查詢(xún)是基于證據(jù)不斷累積的概然世界,因此查詢(xún)的結(jié)果也遠(yuǎn)不是正確答案。又比如,常規(guī)的信息集成默認(rèn)假定在每個(gè)數(shù)據(jù)庫(kù)中的信息可以被自由地共享。當(dāng)信息系統(tǒng)擴(kuò)充至其它自治企業(yè)時(shí),查詢(xún)過(guò)程必須處理諸如,每個(gè)數(shù)據(jù)庫(kù)只返回查詢(xún)所需的與其安全策略相一致的最少信息。再比如將信息集成技術(shù)整合到跨越多個(gè)數(shù)據(jù)源的監(jiān)視應(yīng)用中。例如當(dāng)我的駕車(chē)路線接近我出席的會(huì)議地點(diǎn)附近的住宿酒店通知我。

2.3? 傳感器的數(shù)據(jù)與網(wǎng)絡(luò)

傳感器網(wǎng)絡(luò)由數(shù)量龐大的低成本設(shè)備組成,每個(gè)設(shè)備都是一個(gè)數(shù)據(jù)源,因?yàn)槊總€(gè)設(shè)備都在檢測(cè)著一些屬性量,比如物體的位置或者環(huán)境溫度。如前所述,這類(lèi)網(wǎng)絡(luò)提供了重要的數(shù)據(jù)源并且對(duì)數(shù)據(jù)管理提出了新的要求。例如,這些傳感器設(shè)備通常都是自供電的無(wú)線設(shè)備。這類(lèi)設(shè)備在發(fā)送和接收信息消耗的電力比計(jì)算要大。故而,在查詢(xún)整個(gè)網(wǎng)絡(luò)的信息時(shí),傾向于將盡可能多的計(jì)算工作分配一個(gè)獨(dú)立的結(jié)點(diǎn)。事實(shí)上,傳感器網(wǎng)絡(luò)已經(jīng)成為了一種新的數(shù)據(jù)庫(kù)機(jī)器。越接近于數(shù)據(jù)運(yùn)算的操作越能傳感器網(wǎng)絡(luò)的使用達(dá)到最優(yōu)。

在傳感器網(wǎng)絡(luò)中的查詢(xún)需要能適應(yīng)快速變化的網(wǎng)絡(luò)布局,比如有些傳感器會(huì)從網(wǎng)絡(luò)退出或無(wú)法連接到網(wǎng)絡(luò)。查詢(xún)計(jì)劃必須隨著傳感器網(wǎng)絡(luò)的變化而變化,然而如今的數(shù)據(jù)庫(kù)系統(tǒng)卻不具備這種能力。

同時(shí),傳感器也暗示著要處理數(shù)據(jù)集成的新的復(fù)雜形式。一個(gè)普遍的例子就是傳感器并不是完全標(biāo)準(zhǔn)化的。解析從傳感器傳回的值需要指明是哪個(gè)傳感器。一個(gè)更復(fù)雜的工作是傳感器數(shù)據(jù)處理應(yīng)能從非常低水平的信號(hào)推導(dǎo)出非常高水準(zhǔn)的事實(shí)。例如,我們可能想通過(guò)結(jié)合熱傳感器,聲音傳感器和振動(dòng)傳感器來(lái)定位附近的一個(gè)人。

2.4? 多媒體查詢(xún)

顯而易見(jiàn),如今多媒體數(shù)據(jù)(圖像,視頻,音頻等)正在大幅增加。數(shù)據(jù)庫(kù)研究的一個(gè)挑戰(zhàn)就是為分析,匯總,搜索和查看某人的多媒體信息“電子鞋柜”尋找簡(jiǎn)單方法。課題研究從 Vannevar?Bush 的麥克斯存儲(chǔ)器 [8] 視覺(jué)到為伯母Betsy準(zhǔn)備關(guān)于兒童的多媒體演示之類(lèi)普通的工作。這些目標(biāo)的實(shí)現(xiàn)需要遠(yuǎn)遠(yuǎn)超過(guò)當(dāng)前工藝水平的設(shè)備來(lái)支持多媒體信息的管理。

2.5? 不確定數(shù)據(jù)的推理

用于商業(yè)數(shù)據(jù)處理的傳統(tǒng)DBMS通常把重點(diǎn)放在數(shù)字和字符串的處理上。在那些應(yīng)用領(lǐng)域,數(shù)據(jù)元素如地址,庫(kù)存數(shù)量,全額,職位和發(fā)送時(shí)間都是明確的量。正因?yàn)槿绱耍F(xiàn)在的DBMS對(duì)付近似數(shù)據(jù)和不準(zhǔn)確查詢(xún)毫無(wú)辦法。

除了商業(yè)數(shù)據(jù)處理,所有數(shù)據(jù)在本質(zhì)上都是不確定或不精確的。科學(xué)測(cè)量有標(biāo)準(zhǔn)誤差。運(yùn)動(dòng)物體在當(dāng)前位置的位置數(shù)據(jù)包含著不確定性。序列,圖像和文本的相似度都是近似度量。科學(xué)家為了分析不精密度,需要知道數(shù)據(jù)從何而來(lái)(儀器,儀器的設(shè)置)以及在數(shù)據(jù)被解析前進(jìn)行了何種清洗,重新調(diào)整和重新建模等,所以必須追蹤數(shù)據(jù)的“血統(tǒng)”(或者說(shuō)“起源”)。顯然DBMS需要內(nèi)置對(duì)數(shù)據(jù)不精確性的支持。

如前所述,查詢(xún)處理必須從每個(gè)查詢(xún)對(duì)應(yīng)一個(gè)確切答案的確定模式轉(zhuǎn)移到推測(cè)模式。在推測(cè)模式中,查詢(xún)處理器通過(guò)不斷積累查詢(xún)論據(jù)來(lái)為用戶(hù)查詢(xún)提供越來(lái)越好的查詢(xún)結(jié)果。 用戶(hù)還可以要求不精確的查詢(xún) 以及 處理引擎包括 更多這種 不確定性 來(lái)源。 當(dāng)然,由于存在不精確查詢(xún)結(jié)果,系統(tǒng)有義務(wù)描述所提供的查詢(xún)結(jié)果的準(zhǔn)確性,這樣用戶(hù)就可以明白近似結(jié)果是否滿(mǎn)足他們的需要。例如,信息檢索系統(tǒng)測(cè)量檢索結(jié)果的精度,并反饋給研究者,幫助他們了解結(jié)果是否令人滿(mǎn)意。

2.6? 個(gè)性化

某些與會(huì)者提出查詢(xún)結(jié)果應(yīng)根據(jù)用戶(hù)的個(gè)人資料給出。一位某領(lǐng)域的專(zhuān)家得到的查詢(xún)結(jié)果與一位新手得到的應(yīng)是不一樣。關(guān)聯(lián)和關(guān)聯(lián)反饋也應(yīng)取決于用戶(hù)和環(huán)境。這對(duì)于來(lái)自多個(gè)資源的數(shù)據(jù)是可能的。這些數(shù)據(jù)按照某一意圖進(jìn)行組織,并為其它應(yīng)用而服務(wù)。例如,健康信息應(yīng)針對(duì)某一單獨(dú)用戶(hù)的衛(wèi)生保健(例如醫(yī)院記錄,藥方,藥物療效,家庭醫(yī)史,免疫記錄,牙齒記錄和保險(xiǎn)索賠)。下一代信息系統(tǒng)應(yīng)實(shí)現(xiàn)大眾的個(gè)性化,而所需要是一個(gè)包含和開(kāi)發(fā)個(gè)性化所需的元數(shù)據(jù)的框架。

與會(huì)者同時(shí)指出個(gè)性化和不確定性使得人們需要核對(duì)信息系統(tǒng)是否在產(chǎn)生“正確”的結(jié)果。例如,如果信息系統(tǒng)有漏洞并且產(chǎn)生錯(cuò)誤的近似或個(gè)性化結(jié)果,那將是怎樣的災(zāi)難?

2.7? 數(shù)據(jù)挖掘

從數(shù)據(jù)挖掘的歷史來(lái)看,其一直關(guān)注于發(fā)現(xiàn)已有數(shù)據(jù)集的模式的有效方法。這些模式必須反映數(shù)據(jù)某些有用的方面,并隱藏對(duì)預(yù)期的應(yīng)用無(wú)用的細(xì)節(jié)。許多研究組都開(kāi)發(fā)了執(zhí)行諸如分類(lèi),聚合,關(guān)聯(lián)規(guī)則發(fā)現(xiàn)和歸納這些操作算法。這些技術(shù)現(xiàn)在都成為DBMS主要產(chǎn)商的主流產(chǎn)品的一部分。如今全球財(cái)富500強(qiáng)的公司和相似的小型應(yīng)用程序都在大量地使用數(shù)據(jù)挖掘和商業(yè)智能。現(xiàn)有數(shù)據(jù)挖掘工具的成功為下一代工具帶來(lái)了市場(chǎng)需求,例如全球財(cái)富500強(qiáng)的公司的數(shù)據(jù)倉(cāng)庫(kù)的使用者一直進(jìn)行著一個(gè)單一的數(shù)據(jù)挖掘的查詢(xún):“有什么令人感興趣的事情嗎?”他們很高興有當(dāng)前這些數(shù)據(jù)挖掘工具,但是他們希望能有擅長(zhǎng)于產(chǎn)生令人意想不到的“智慧珍珠”的工具。

找尋這類(lèi)“珍珠”是在數(shù)據(jù)庫(kù)后臺(tái)運(yùn)行,并且消耗了過(guò)多的數(shù)據(jù)庫(kù)資源。為此開(kāi)發(fā)出篩選所需的算法和結(jié)構(gòu)是數(shù)據(jù)挖掘的一個(gè)挑戰(zhàn)。另一個(gè)重要的課題是將數(shù)據(jù)挖掘與查詢(xún),優(yōu)化和觸發(fā)器這類(lèi)數(shù)據(jù)庫(kù)工具進(jìn)行整合。我們希望數(shù)據(jù)挖掘跳出基本操作的算法朝著這個(gè)方向前進(jìn)。我們也感到計(jì)算機(jī)科學(xué)和IT課程應(yīng)包含更多的數(shù)據(jù)挖掘工具的使用知識(shí)。

2.8? 自適應(yīng)

數(shù)據(jù)庫(kù)的廣泛使用帶來(lái)的一個(gè)結(jié)果是數(shù)據(jù)庫(kù)管理員(DBA)能力的下降。現(xiàn)代數(shù)據(jù)庫(kù)比之20年前更趨于復(fù)雜。如今,數(shù)據(jù)庫(kù)管理員必須了解硬盤(pán)分區(qū),查詢(xún)并行執(zhí)行,線程池和用戶(hù)定義數(shù)據(jù)類(lèi)型。這些概念在昔日的數(shù)據(jù)庫(kù)中從未出現(xiàn)。簡(jiǎn)而言之,現(xiàn)在的DBMS太難用了。為了彌補(bǔ)這一缺點(diǎn),主流DBMS供應(yīng)商開(kāi)始簡(jiǎn)化數(shù)據(jù)庫(kù)管理。

這類(lèi)簡(jiǎn)化至少有兩個(gè)方面。首先,如今的DBMS有一大堆“調(diào)諧旋鈕”。專(zhuān)家可以使用它們將數(shù)據(jù)庫(kù)系統(tǒng)調(diào)整至最優(yōu)狀態(tài)。然而,專(zhuān)家通常是DBMS供應(yīng)商的工程師,而且這類(lèi)調(diào)優(yōu)讓客戶(hù)花費(fèi)巨大。事實(shí)上,大多數(shù)做調(diào)優(yōu)的系統(tǒng)工程師并沒(méi)有深刻理解“按鈕”的含意。相反,他們已經(jīng)見(jiàn)過(guò)很多系統(tǒng)配置和系統(tǒng)負(fù)荷量,所以配置新環(huán)境時(shí),他們就拿著最接近新環(huán)境的其它系統(tǒng)的配置優(yōu)化參數(shù)來(lái)優(yōu)化新環(huán)境。

目前來(lái)看,將基于規(guī)則的系統(tǒng)和有屬性設(shè)置和配置數(shù)據(jù)的數(shù)據(jù)庫(kù)結(jié)合起來(lái)進(jìn)行調(diào)優(yōu)應(yīng)該是可能的。在這方向已經(jīng)有很多領(lǐng)域取得了巨大的進(jìn)展,比如動(dòng)態(tài)資源分配,物理結(jié)構(gòu)選擇,在一定程度上也包括物化視圖(由DBMS維護(hù)的用于加速特定查詢(xún)的冗余數(shù)據(jù))的選擇。這些進(jìn)展大都是由DBMS供應(yīng)商取得的。在我們看來(lái),最終目的是“無(wú)旋鈕”。系統(tǒng)可能根據(jù)默認(rèn)策略自動(dòng)配置,比如反應(yīng)時(shí)間和吞吐量的相對(duì)重要性,或者由用戶(hù)需求歸納得出的用戶(hù)概況。所以,更加復(fù)雜的用戶(hù)行為和工作負(fù)荷的模型是這領(lǐng)域取得進(jìn)展的前提。我們相信現(xiàn)實(shí)的“無(wú)旋鈕”操作是可以實(shí)現(xiàn)的,而且我們建議研究界將這一目標(biāo)作為研究重點(diǎn)。

許多使用DBMS的新應(yīng)用程序?qū)⒁笥凶詣?dòng)操作。除了“無(wú)旋鈕”調(diào)優(yōu)之外,DBMS還必須分辨內(nèi)部故障和通信部件故障,確認(rèn)數(shù)據(jù)是否損壞,偵測(cè)應(yīng)用程序失敗原因并且為此做一些事情。這些功能需要DBMS的自我意識(shí)更強(qiáng)并且為DBMS提供當(dāng)前所參與的信息系統(tǒng)的明確的模型

2.9? 隱私

網(wǎng)絡(luò)的廣泛應(yīng)用使得關(guān)于個(gè)人的信息激增。而且,現(xiàn)在有大量的引擎在探尋數(shù)據(jù)庫(kù)之間的相互關(guān)系。這種融合使得可以發(fā)現(xiàn)數(shù)量空前的個(gè)人信息。比如每個(gè)人曾經(jīng)住過(guò)的每個(gè)地址,這類(lèi)平實(shí)的數(shù)據(jù)可以很容易地獲得。找到曾經(jīng)住在某一地址的人也似乎很容易,這樣找到某人以前的一個(gè)鄰居也就簡(jiǎn)單了。也有人宣稱(chēng)搭乘同一航班的所有乘客的數(shù)據(jù)也能獲得。更進(jìn)一步,由于不難獲得一位死者的重要個(gè)人記錄,利用這些信息和假名就可以申請(qǐng)信用卡,故而身份盜竊成為令人不安的國(guó)家性問(wèn)題。

面向數(shù)據(jù)的安全性研究在19世紀(jì)80年代很熱門(mén),但在這之后就偃旗息鼓。我們了解現(xiàn)在有重振這一子領(lǐng)域的需要,但卻是面向明顯不同的方面。今天,我們需要存入業(yè)務(wù),策略和程序來(lái)支持多人對(duì)第三方數(shù)據(jù)的選擇和控制。這一系列的課題很可能與在Web網(wǎng)以前的單個(gè)組織的數(shù)據(jù)安全模型大不相同。盡管法律對(duì)處理信息隱私和相關(guān)安全問(wèn)題仍有重要作用,我們依然可以改變可選項(xiàng)的設(shè)置,并且通過(guò)推進(jìn)可實(shí)現(xiàn)的技術(shù)使得隱私安全權(quán)衡變得更好。

由于大多數(shù)信息關(guān)聯(lián)由DBMS執(zhí)行,安全系統(tǒng)應(yīng)包括處理未來(lái)如何使用數(shù)據(jù)的部件。我們社會(huì)也就能工作這樣的安全系統(tǒng)之上。存取命令不僅要依據(jù)請(qǐng)求數(shù)據(jù)的人做出,還要依據(jù)數(shù)據(jù)的使用目的。況且,由于我們已經(jīng)有在其它領(lǐng)域處理面向數(shù)據(jù)的聲明規(guī)范的經(jīng)驗(yàn)了,所以指明數(shù)據(jù)請(qǐng)求的目的的聲明系統(tǒng)是我們社會(huì)所擅長(zhǎng)的。

2.10? 可信賴(lài)系統(tǒng)

可依賴(lài)系統(tǒng)能安全地存儲(chǔ)數(shù)據(jù),保護(hù)數(shù)據(jù)免受未被授權(quán)的接觸,防止數(shù)據(jù)丟失并總是能提供相應(yīng)數(shù)據(jù)給授權(quán)用戶(hù)。隱私管理只是可依賴(lài)系統(tǒng)的更廣泛的課題的一方面。現(xiàn)在數(shù)字版權(quán)管理越來(lái)越受到關(guān)注。數(shù)字版權(quán)管理包括保護(hù)知識(shí)產(chǎn)權(quán)和允許私人談話(huà)。此外,保證查詢(xún)結(jié)果的正確性和數(shù)據(jù)密集型計(jì)算的熱度也在上升,特別是包括衛(wèi)生保健卡等其它醫(yī)療應(yīng)用的嵌入式系統(tǒng)。邏輯推理技術(shù)可能會(huì)在諸如定理證明和模型檢查等應(yīng)用的正確性驗(yàn)證上起作用。信息管理社區(qū)應(yīng)為滿(mǎn)足這類(lèi)需求起研究中心的作用,并且在DBMS增強(qiáng)支持這些功能的機(jī)制。

2.11? 新用戶(hù)接口

多年來(lái)人們一直感嘆數(shù)據(jù)庫(kù)研究界在用戶(hù)接口方面做的工作太少了。如今桌面系統(tǒng)可以支持非常復(fù)雜的視覺(jué)系統(tǒng)。然而,對(duì)于DBMS中的某一信息類(lèi)型來(lái)說(shuō),如何最好地呈現(xiàn)結(jié)果是不清楚。19世紀(jì)80年代時(shí),提出過(guò)一些面向信息展示的平滑可視化系統(tǒng),比如著名的QBE和VisiCalc。在最后的15年時(shí),它們并沒(méi)有什么可圈可點(diǎn)的進(jìn)展,所以在這一領(lǐng)域急切地需要更好的點(diǎn)子。

三十年來(lái)查詢(xún)語(yǔ)言的研究可以歸結(jié)為:“我們已經(jīng)從SQL遷移到XQuery”。充其量,我們從一種聲明性語(yǔ)言轉(zhuǎn)移到第二種表達(dá)性與第一種大致相同的聲明性語(yǔ)言。終端用戶(hù)將不需要學(xué)習(xí)SQL是有據(jù)可查的;相反,SQL是專(zhuān)業(yè)程序員使用的符號(hào)。在其它研究領(lǐng)域,我們看到一些可能影響在接口上影響面向數(shù)據(jù)庫(kù)的研究的想法。信息檢索使用關(guān)鍵詞進(jìn)行查詢(xún)已經(jīng)有十年了。而在很多領(lǐng)域,監(jiān)視已經(jīng)變得越來(lái)越熱門(mén)了。

也許“語(yǔ)義Web”所帶來(lái)的研究契機(jī)是最令人感興趣的。盡管不知道這一概念真正帶來(lái)的是什么,現(xiàn)在大部分工作的重心集中在“實(shí)體論”上。概念和概念之間的關(guān)系通常存在于形式化語(yǔ)言中。一個(gè)實(shí)體通過(guò)識(shí)別它們來(lái)描述話(huà)語(yǔ)的域。在2.2節(jié),我們提到這一工作如何支持信息集成。這一領(lǐng)域的基本問(wèn)題是如何將對(duì)在深層次上其實(shí)是一樣的事情采用不同術(shù)語(yǔ)進(jìn)行描述的數(shù)據(jù)庫(kù)融合起來(lái)。實(shí)體論的工作也許同樣可以讓數(shù)據(jù)庫(kù)或其它資源的用戶(hù)使用他們自己的術(shù)語(yǔ)來(lái)查詢(xún)。數(shù)據(jù)庫(kù)研究界應(yīng)尋找機(jī)會(huì)開(kāi)發(fā)未來(lái)數(shù)據(jù)庫(kù)管理系統(tǒng)的這些技術(shù)。

2.12? 一百年存儲(chǔ)

隨著世界信息的增長(zhǎng),數(shù)字化存儲(chǔ)也在增長(zhǎng),這就帶來(lái)了信息的無(wú)限電子容量的需要。然而,即使是歸檔的信息也在消失,這是由于信息存儲(chǔ)在正在變質(zhì)的媒介(如膠片和磁帶),需要過(guò)時(shí)的設(shè)備進(jìn)行解析的媒介(特殊存儲(chǔ)設(shè)備)或者由于解析信息的應(yīng)用程序不再使用的原因。避免這種信息流失的需要信息遷移和模擬。信息遷移可以使信息從正在變質(zhì)或過(guò)時(shí)的媒介中拷貝出來(lái)。模擬可獲取解析長(zhǎng)時(shí)間存儲(chǔ)的信息的方法。

元數(shù)據(jù)也扮演著重要角色。例如,科學(xué)數(shù)據(jù)的采集要求數(shù)據(jù)的“血統(tǒng)”和存取數(shù)據(jù)的任何讀程序。描述背景的元數(shù)據(jù)可能也很重要。例如,盡管2003年的表是以歐元為單位,或者說(shuō)1983年的表只有西德的狀況,德國(guó)多年來(lái)的社會(huì)服務(wù)開(kāi)支表也不一定明確地表明1983年的表是以馬克為單位的。沒(méi)有這些不明確的背景,即使這些數(shù)據(jù)可以被使用,也是沒(méi)有意義的。當(dāng)我們信息管理研究界建造無(wú)限量存取的數(shù)據(jù)倉(cāng)庫(kù)時(shí),社會(huì)通常會(huì)獲得巨大的利益。在一定的可能范圍內(nèi),這一倉(cāng)庫(kù)會(huì)自動(dòng)執(zhí)行不同格式間的數(shù)據(jù)遷移,或者修復(fù)每個(gè)文檔都需要使用的硬件和軟件。它還將管理存儲(chǔ)的文件的元數(shù)據(jù)。

2.13? 查詢(xún)優(yōu)化

很多與會(huì)者將查詢(xún)優(yōu)化視為以上討論的一個(gè)重要元素,或者另一個(gè)重要元素。當(dāng)處理海量數(shù)據(jù)時(shí),我們更傾向于用常規(guī)的辦法來(lái)操縱數(shù)據(jù)。這一普遍原則使得諸如SQL和XQuery這類(lèi)非常高層次的語(yǔ)言成功地使用在數(shù)據(jù)庫(kù)世界,然而其它地方就幾乎不行了。但是,高層次的語(yǔ)言需要優(yōu)良的優(yōu)化器。與會(huì)者們提出我們?cè)谛畔⒓傻膬?yōu)化上的研究需要更進(jìn)一步。優(yōu)化的內(nèi)容包括半結(jié)構(gòu)化語(yǔ)言如XQuery,流處理器,傳感器網(wǎng)絡(luò)和其它可能的領(lǐng)域。

?????? 我們也發(fā)現(xiàn)SQL系統(tǒng)的許多應(yīng)用都有相對(duì)簡(jiǎn)單的查詢(xún)序列。這些查詢(xún)序列嵌入在宿主語(yǔ)言中與宿主語(yǔ)言一起執(zhí)行程序。這讓我們了解到有必要考慮包含大量查詢(xún)的嵌入式查詢(xún)的優(yōu)化,即使這種嵌入式查詢(xún)的設(shè)置是傳統(tǒng)的,純關(guān)系的。

3? 下一階段和討論

在報(bào)告主體中提出的許多研究方向都是長(zhǎng)期目標(biāo)。然而,對(duì)數(shù)據(jù)庫(kù)研究的下一階段,出席洛威爾會(huì)議的與會(huì)者有著若干提議。這些提議到下一次會(huì)議舉辦前應(yīng)是可實(shí)現(xiàn)。一些提議已經(jīng)在上文中提到,比如反思能處理新數(shù)據(jù)類(lèi)型的DBMS架構(gòu),近似推理與過(guò)程和數(shù)據(jù)的平等。在這一節(jié),我們討論其它的提議。

我們認(rèn)為生成測(cè)試臺(tái)和集成作業(yè)集會(huì)使信息集成研究得到很好的支持,這樣做可以使任何想做數(shù)據(jù)集成的人方便地使用測(cè)試臺(tái)。測(cè)試臺(tái)使得研究人員以一種控制方式來(lái)比較解決方案,這包括如果某種解決方案在集成作業(yè)中的這一個(gè)或另一個(gè)表現(xiàn)最好的話(huà),此種解決方案就有機(jī)會(huì)吹牛。因而也會(huì)使研究者對(duì)研究產(chǎn)生興趣。一些研究者指出在信息檢索研究界TREC [7] 正起著相同的作用。

關(guān)于如何建立這一測(cè)試臺(tái)有著相當(dāng)多的討論。對(duì)照實(shí)驗(yàn)的實(shí)現(xiàn)有很多設(shè)計(jì)問(wèn)題,最緊迫的問(wèn)題是獲取合適的數(shù)據(jù)集。一種可能會(huì)實(shí)現(xiàn)的提議是10到20個(gè)計(jì)算機(jī)科學(xué)系開(kāi)放一些他們非專(zhuān)利的課堂調(diào)度或者其它數(shù)據(jù)。計(jì)算機(jī)科學(xué)系中任何一個(gè)可以獲取這一數(shù)據(jù)集的成員都被催促著去聯(lián)系 Mike?Stonebraker ,而他會(huì)協(xié)調(diào)測(cè)試臺(tái)的建設(shè)。也許我們可以提出一個(gè)擁有更龐大數(shù)據(jù)集的測(cè)試臺(tái)。

如今傳統(tǒng)的亟待解決的研究課題(如ACID屬性)已經(jīng)有了相當(dāng)多的支持。有人反對(duì)說(shuō)相關(guān)技術(shù)的巨大改變可能要求我們重新審視這些傳統(tǒng)問(wèn)題,而且發(fā)現(xiàn)更易于實(shí)現(xiàn)的更簡(jiǎn)單的方法或者更能廣泛適用的更強(qiáng)大的方法總是會(huì)有潛力的。會(huì)議也就流處理系統(tǒng)是否需要新的DBMS引擎或者現(xiàn)在的流處理系統(tǒng)是否能成功地適應(yīng)新要求展開(kāi)了熱烈的討論。

會(huì)議也集中討論了信息集成應(yīng)該發(fā)生在哪一層次上。雖然很多人認(rèn)為DBMS是執(zhí)行信息集成的最好場(chǎng)所,但其它人認(rèn)為在應(yīng)用程序(例如Web服務(wù))上執(zhí)行會(huì)更自然,更普遍。關(guān)于Web服務(wù)是否會(huì)在處理語(yǔ)義異質(zhì)性的問(wèn)題上取得進(jìn)展也開(kāi)展了相當(dāng)多的討論。某些人認(rèn)為這類(lèi)服務(wù)的實(shí)際標(biāo)準(zhǔn)會(huì)產(chǎn)生,然而其它人反對(duì)說(shuō)電子元件社區(qū)多年來(lái)一直在努力標(biāo)準(zhǔn)化一組服務(wù)(Rosette網(wǎng)),但只獲得了有限的成功。

作為結(jié)語(yǔ),我們講述兩個(gè)普遍認(rèn)同的意見(jiàn)。首先,數(shù)據(jù)庫(kù)研究界應(yīng)該避免將自己的研究范圍過(guò)于狹窄。我們需要探尋數(shù)據(jù)庫(kù)與相關(guān)技術(shù)的結(jié)合之道。這些技術(shù)能改善信息利用,比如信息可視化技術(shù),這項(xiàng)技術(shù)通常被擱置在其它研究社區(qū)的領(lǐng)域內(nèi)。為了擴(kuò)充數(shù)據(jù)庫(kù)研究者能使用的技術(shù),研究者們需要擴(kuò)展他們能力的廣度。這讓人想起許多年以前成立的泥水工聯(lián)盟。當(dāng)時(shí)墻板正在走進(jìn)人們的生活,然后這卻并不在泥水工們的能力范圍之內(nèi)。當(dāng)泥水工被墻板取代時(shí),聯(lián)盟也解散了。如果DBMS的研究者們不接受將相關(guān)技術(shù)整合進(jìn)信息管理的挑戰(zhàn),那么上一事實(shí)就可能會(huì)發(fā)生在DBMS社區(qū)。

?????? 第二,我們注意到這幾次會(huì)議的與會(huì)者的平均年齡正在增加。在另一方面,年輕的數(shù)據(jù)庫(kù)研究者們也在加入到社區(qū)中,而且比以往任何時(shí)候都要多,這可以從數(shù)據(jù)庫(kù)的初級(jí)教師的龐大數(shù)量中看出。我們建議下一屆會(huì)議應(yīng)更廣泛地邀請(qǐng)數(shù)據(jù)庫(kù)研究界不同的年齡群體。

4? 參考文獻(xiàn)

[1] Philip?A.?Bernstein,?Umeshwar?Dayal,?David?J.?DeWitt,?Dieter?Gawlick,?Jim?Gray,?Matthias?Jarke,?Bruce?G.?Lindsay, ? Pete?C.?Lockemann,? David?Maier,?Erich?J.?Neuhold,?Andreas?Reuter,?Lawrence?A.?Rowe,?Hans-J?rg?Schek,?Joachim?W. ? Schmidt,?Michael?Schrefl,? and?Michael?Stonebraker:?Future?Directions?in?DBMS?Research?-?The?Laguna?Beach ? Participants.?SIGMOD?Record?18(1):?17-26?(1989)

[2]? Abraham?Silberschatz,?Michael?Stonebraker,?and?Jeffrey?D.?Ullman:?Database?Systems:???Achievements?and ? Opportunities.? CACM?34(10):?110-120?(1991)

[3]? Abraham?Silberschatz,?Michael?Stonebraker,?and?Jeffrey?D.?Ullman:?Database?Research; Achievements?and ? Opportunities?into?the?21st?Century.?SIGMOD?Record?25(1):?52-63?(1996)

[4]? Abraham?Silberschatz,?Stanley?B.?Zdonik,?et?al:?Strategic?Directions?in?Database?Systems Breaking Out of?the?Box. ? ACM?Computing?Surveys?28(4): 764-778 (Dec. 1996).

[5]? Philip?A.?Bernstein,?Michael?L.?Brodie,?Stefano?Ceri,?David?J.?DeWitt,?Michael?J.?Franklin,?Hector?Garcia-Molina,?Jim ? Gray,?Gerald?Held,? Joseph?M.Hellerstein,?H.?V.?Jagadish,?Michael?Lesk,?David?Maier,Jeffrey?F.?Naughton,?Hamid ? Pirahesh,?Michael?Stonebraker,? and?Jeffrey?D.?Ullman:?The?Asilomar?Report?on?Database?Research.?SIGMOD?Record ? 27(4):?74-80?(1998)

[6]? CRA?Conference?on?"Grand?Research?Challenges"?in?Computer?Science?and Engineering, ? http://www.cra.org/Activities/grand.challenges/.

[7]? TREC?Data?home?page,? http://trec.nist.gov/data.html .

[8]? Vannevar?Bush.?"As?We?May?Think."?Atlantic?Monthly?(July?1945),?pp.?101-108.

[9]? Serge?Abiteboul,?Rakesh?Agrawal,?Phil?Bernstein,?Mike?Carey,?Stefano?Ceri,?Bruce?Croft,David?DeWitt,?Mike?Franklin, ? Hector?Garcia?Molina,? Dieter?Gawlick,?Jim?Gray,?Laura?Haas,?Alon?Halevy,?Joe?Hellerstein,?Yannis?Ioannidis, ? Martin?Kersten,?Michael?Pazzani,?Mike?Lesk, ? David?Maier,? Jeff?Naughton, ? Hans?Schek,?Timos?Sellis,?Avi?Silberschatz,?Mike?Stonebraker,?Rick?Snodgrass,?Jeff?Ullman, ? Gerhard?Weikum,?Jennifer?Widom,? and?Stan?Zdonik ,?The?Lowall?Database?Research?Self-assessment.? Communications?of?the?ACM ?48,5(May?2005),?111-118

?

洛威爾會(huì)議——數(shù)據(jù)庫(kù)研究的自我評(píng)估(譯文)


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號(hào)聯(lián)系: 360901061

您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長(zhǎng)非常感激您!手機(jī)微信長(zhǎng)按不能支付解決辦法:請(qǐng)將微信支付二維碼保存到相冊(cè),切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對(duì)您有幫助就好】

您的支持是博主寫(xiě)作最大的動(dòng)力,如果您喜歡我的文章,感覺(jué)我的文章對(duì)您有幫助,請(qǐng)用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長(zhǎng)會(huì)非常 感謝您的哦!!!

發(fā)表我的評(píng)論
最新評(píng)論 總共0條評(píng)論
主站蜘蛛池模板: 蓝田县| 乌兰浩特市| 江北区| 惠来县| 五家渠市| 洪雅县| 务川| 响水县| 德清县| 龙泉市| 义马市| 个旧市| 安多县| 互助| 嘉兴市| 阳东县| 青铜峡市| 大邑县| 宁远县| 景泰县| 荆门市| 黔西县| 临洮县| 太白县| 桦甸市| 理塘县| 郑州市| 北票市| 茌平县| 永福县| 上思县| 全州县| 中牟县| 依安县| 玛纳斯县| 巴塘县| 稻城县| 茶陵县| 上杭县| 田东县| 虎林市|