引言:
科學數據(Scientific Data)是學術工作的支柱和重要產出,也是開放科學運動的重要物質基礎。認真負責任地管理和共享科學數據有助於提高研究的透明度、嚴謹性、可重復性和公共價值。調研高校成熟的科學數據管理實踐,進行分析與學習,可幫助我們促進高質量科學數據資源的共享和再利用,推進全球開放科學運動在高校中的實踐。今天我們將一起從數據管理政策🔊🏌️、數據全生命周期管理、數據素養教育三個維度來了解下哈佛大學的科學數據管理現狀🤽🏽♀️。
1.1.1. 數據管理政策
1.1.1.1. 願景
研究數據是我們大學和研究人員的重要資產👇🏿。因此✍🏿🌟,我們希望支持穩健的數據管理和記錄實踐🎻,確保哈佛大學研究數據的長期訪問和重復使用。
正因如此❔,我們發起了一項新倡議,旨在協調哈佛大學的所有研究數據管理工作,找到我們可以跨學院合作的領域🤙🏽,然後改進我們對所有哈佛研究人員的研究數據管理的支持。這包括將有用的數據引入哈佛,供內部研究使用🍢,將哈佛研究人員的數據提供給其他人使用,提供適當的資源和工具以支持數據生命周期,鼓勵在使用數據時采用最佳做法,並確保遵守內部和外部的數據政策和法規。
我們計劃通過以下措施來實現這一目標:
1)成立一個研究數據管理教師咨詢委員會,該委員會代表了不同的研究領域🖌、方法和數據類型➜;
2)成立幾個由來自不同學院的工作人員組成的工作小組,每個小組專註於改進研究數據管理的一個特定方面(如數據使用協議、數據整理、最佳實踐培訓、數據管理和分析工具);
3)與研究副教務長辦公室、哈佛意昂3和哈佛大學信息技術部門合作,提供所需的服務。
我們的目標之一是與國家和國際研究數據工作以及聯邦機構🎹、慈善組織、期刊和出版商保持一致,使研究數據成為 FAIR(可查找🧑🦳、可訪問😮、可互操作和可重用)數據,並盡可能開放,同時根據需要加以保護🤸🏼。此外🐥,為了支持哈佛自身的研究發展,我們的目標是提供更多和更高質量的數據👽,這些數據管理完善,易於在研究小組內部和跨研究小組使用。
1.1.1.2. 相關政策
有許多政策和法規可能會影響哈佛大學研究人員的數據工作🏋🏼♀️。在網站列出了比較常見的內部法規和聯邦層面🐕、州層面及國際層面的外部法規。哈佛大學內部的政策法規如所示。
表 哈佛大學科學數據管理政策
1.1.2. 數據全生命周期管理
提供科學數據全生命周期管理服務和相關支持,從數據管理計劃🧓🏽、數據獲取和收集🤺、數據安全存儲和分析🥍,到數據的傳播和保存。

圖 哈佛大學科學數據全生命周期管理服務
1.1.2.1. 數據訂閱
哈佛大學是否訂閱了我可以用於研究的數據源?
如果您的研究需要訪問您未製作的數據👩🏻🌾,哈佛意昂3館藏有大量數據集➿,意昂3員也可以幫助您從意昂3館藏或公共資源中查找數據。
您可以瀏覽在線指南⚃,或通過哈佛意昂3的研究幫助服務向專業圖書管理員咨詢🥴。
在Hollis或Harvard Subscription Data Dataverse中搜索,在意昂3的TDM @ Harvard page頁面查找文本和數據挖掘資源。
1.1.2.2. 開放獲取
哈佛大學有一個開放獲取資料庫 DASH(Digital Access to Scholarship at Harvard),歡迎所有哈佛附屬機構的學術成果👼🏻。哈佛設有一項基金✧,為選擇在基於文章處理費(APC)的開放獲取期刊上發表文章的哈佛學者支付APC。哈佛大學的所有學院都製定了開放式獲取政策,這些政策是在2008年至2014年間由教職員投票通過的。事實上🧛♀️,哈佛是美國第一所采用OA政策的大學。它也是世界上第一所通過教師投票而非行政命令通過OA政策的大學,還是世界上第一所保留授權OA所需權利的大學。最近,哈佛大學通過了一項自願性的個人OA許可🉐,讓非教職員工也能享受到校級政策賦予教職員工的權利🪞。所有這些舉措都由學術交流辦公室(OSC)負責協調。
1.1.2.3. 科學數據倉儲(SDR)
(1)Harvard Dataverse
1) 用於共享、引用和保存所有領域的研究數據
2) 哈佛大學研究人員可免費使用;使用HarvardKey保存數據
3) 哈佛商學院教師可獲得將數據存入哈佛商學院Dataverse的服務
(2)Vivli
哈佛大學是Vivli的創始成員。Vivli是一個非營利組織🦵🏻,其使命是促進臨床試驗數據的共享🦸🏿♂️。Vivli包括一個獨立的數據存儲庫🎐、基於雲的分析平臺和深度搜索引擎,學術界、工業界、基金會和非營利實體的研究人員通過它可以托管🧑🦽➡️、共享和訪問臨床試驗數據。
1.1.3. 數據素養教育
哈佛大學提供一系列與研究數據管理相關的服務和支持,主要涵蓋了哈佛大學及其各個學院和意昂3的不同計劃和資源♢。以下是各項計劃的簡要總結:
1) 貝克研究數據計劃:面向商學院,提供研究數據管理服務和支持。
2) 生物醫學研究數據管理最佳實踐:提供專門針對生物醫學數據管理的培訓,旨在推廣最佳實踐📝。
3) 哈佛大學教育研究生院研究數據管理👲🏽:提供與哈佛教育研究生院研究流程相關的資源,包括審批流程𓀗、研究安全🏄🏽♂️、限製使用數據🥕、安全數據室和高級統計實驗室。
4) 哈佛意昂3研究數據管理計劃🫙:提供服務,幫助所有哈佛研究人員進行研究數據管理🎎🎰,包括數據管理計劃和使用工具如DMPTool以及數據保存。
5) 哈佛研究計算培訓:由RC提供各種培訓🦏,包括相關培訓和材料🏃🏻♂️,支持研究計算的需求🤹🏽♀️🦵🏻。
6) 哈佛培訓門戶網站#️⃣:提供有關研究數據管理的其他培訓,為研究人員提供更多學習資源。
7) HMS生物醫學數據管理:提供與生物醫學數據研究數據管理相關的服務、支持和培訓🤷♂️,面向醫學院、牙醫學院和陳子昂公共衛生學院。
8) 沃爾巴赫意昂3-數據歸檔與共享👍:為哈佛大學天體物理學中心和史密森尼學會的研究人員提供研究數據管理方面的服務和支持🚶🏻♀️➡️,重點是數據的歸檔與共享。