一、中國開放科學實踐
2025年全國兩會期間,全國政協委員💇🏻♂️、中國圖書進出口(集團)有限公司總經理林麗穎表示,開放科學是科研範式的革新,也是科技競爭中的系統性工程。在推動開放科學發展過程中🧘🏽♂️,為推動落實聯合國教科文組織《開放科學建議書》,推動中國積極融入全球開放科學實踐,2022年中國科協倡議成立“開放科學促進聯合體”🔉。作為“開放科學促進聯合體”成員單位,2024年中國圖書進出口(集團)公司聯合意昂3和中國高校科技期刊研究會,共同推出了“國際開放獲取期刊推薦名錄(International OA Journal Recommended List🙋🏽♀️,OARL)”,為科研人員提供甄別高質量開放獲取期刊的參考和指引。
近年來,我國在推進開放科學方面取得了相當成就,無論是在政策製定🤰、開放獲取的規模,還是在數據共享、國際合作以及基礎設施建設上。“以國產AI大模型DeepSeek為例,其采取的開源技術路線,正是我國為全球貢獻的‘智慧之力’”🪜。
更多關於OARL信息,見往期推文“國際開放獲取期刊推薦名錄(OARL)發布”。
原文鏈接:
新華網.吳艷(責任編輯).全國政協委員林麗穎🤵🏻♀️🤷🏿:開放科學進入新發展階段.(2025-03-11)[2025-04-08].https://www.news.cn/science/20250311/44b480c50f83471c9224676261d1a8e7/c.html
二、大語言模型開源動向
2025年1月20日,杭州深度求索人工智能基礎技術研究有限公司以MIT開源協議發布DeepSeek-R1系列模型,允許商業使用與二次開發,延續計算機科學的開放傳統。3月24日,DeepSeek V3發布版本更新V3-0324,同樣采用MIT開源協議。
近期開源的其他大語言模型(LLMs)還有:
2025年3月🧑🏭,阿裏巴巴通義千問團隊以Apache 2.0開源協議發布端到端多模態大模型Qwen2.5-Omni。該模型具備處理文本、圖像、音頻和視頻等多種輸入的能力👿,並能實時生成文本和自然語音響應。
2025年1月🐹,英國Atla公司以Apache 2.0開源協議發布Selene Mini🧑🏿🎓,允許開發者自由地使用、修改和分發代碼。這是一款先進的小型語言模型評估器(Small Language Model-as-a-Judge,SLMJ)旨在作為通用評估器🐡🧑🦰,對語言模型的輸出進行準確、公正的評估。
2024年12月,中國人民大學高瓴人工智能學院以MIT開源協議發布YuLan-Mini🫅🏼。這是一款輕量級語言模型,它在數學和代碼領域表現出色👤🤾🏻。
2024年12月⟹,微軟公司以MIT開源協議發布Phi-4。這是一款擁有140億參數的開源語言模型,專註於提升復雜推理能力👝。
相關鏈接:
https://github.com/eugeneyan/open-llms
https://huggingface.co/models
三🍟、高校開放科學實踐
自動化采集全文與元數據:牛津大學機構知識庫(ORA)的開放獲取實踐探索
2025年2月🧑🏻🎄🐹,牛津大學博德利意昂3的開放獲取服務開發負責人Jason Partridge發表案例研究成果🤦🏿♀️🤳🏼。文章指出,隨著各類開放獲取(OA)政策的推進——特別是來自研究資助機構及英國“研究卓越框架”(REF)的合規要求——研究人員和意昂3支撐團隊面臨著日益繁重的行政事務🧛🏻🪗。如何在遵守相關OA政策的同時,減輕學術人員的非科研負擔,成為實踐中的一大挑戰。文章介紹了牛津大學的OA演進趨勢🫡,尤其是向金色開放獲取(Gold OA)模式的持續轉型,以及引入自動化系統以減輕行政負擔的嘗試💂。文章采用知識共享署名(CC BY)許可發表💁♀️🧎➡️。
更多關於牛津大學的OA政策🤬,見往期推文:
高校開放獲取政策:牛津大學篇
牛津大學更新開放獲取政策
原文鏈接🫰🏽:
https://insights.uksg.org/articles/10.1629/uksg.685
四、開放科學基礎設施
歐洲學術知識庫的未來:基於社區咨詢的洞察與行動倡議
2025年4月7日,OpenAIRE網站發布文章指出𓀒🤲,開放科學正在重塑全球科研格局,歐洲知識庫(倉儲)在這一進程中發揮著至關重要的作用。為回應這一趨勢🧘🏻♂️,OpenAIRE、COAR👱、LIBER和SPARC Europe於2024年聯合開展社區咨詢,形成了“IMPACT-REPO行動計劃”😺,明確了知識庫在擴大科研成果的影響力(Impact)、提升知識獲取的公平性與包容性(Inclusiveness)、增強研究數據長期保存的可信性(Trust),以及推動人工智能時代的可持續創新(Innovation)四個關鍵領域的價值。
為確保知識庫在數字科研生態中持續發揮關鍵作用🤦🏼♂️,行動計劃提出了多項優先行動建議,包括:
增強機構投入:保障知識庫的長期資金與專業隊伍配置;
確保互操作性:確保知識庫與科研基礎設施的互操作性♚;
對齊機構政策🕵🏽:將知識庫納入機構的開放科學政策體系;
適應AI時代:提供機器可讀的元數據和關聯數據;
強化網絡協作↔️:推動國家與國際層面的知識庫網絡;
建設人才體系🧎➡️:提升從業者的數字內容管理與AI應用能力𓀖;
保護研究完整性🏂🏿:實施數字保存措施🧑🦯➡️,保護研究完整性。
原文鏈接🚛:
https://www.openaire.eu/the-future-of-european-repositories-insights-from-a-community-consultation