首頁  >  文章  >  科技週邊  >  獲1000萬美元捐款,用於程式碼重構、上雲,論文預印版平台arXiv「好起來了」

獲1000萬美元捐款,用於程式碼重構、上雲,論文預印版平台arXiv「好起來了」

WBOY
WBOY轉載
2023-10-20 19:33:15457瀏覽

上雲、程式碼重構一起來。

對於節奏越來越快的學術研究領域而言,arXiv 是非常重要的論文預印版平台。和維基百科一樣,它是個非營利組織。

當地時間本週四,康乃爾大學科技校區(Cornell Tech)宣布了 arXiv 獲得巨額捐款的好消息。

獲1000萬美元捐款,用於程式碼重構、上雲,論文預印版平台arXiv「好起來了」

作為一個非營利資料庫,arXiv 是所有人均可以免費存取的,長期以來一直依賴人們的捐贈。康乃爾科技校區宣布,西蒙斯基金會和美國國家科學基金會(NSF)已提供了總額超過 1000 萬美元的補助金以支持 arXiv。

據介紹,這筆資金將使這個擁有超過200 萬篇論文的研究儲存庫遷移到雲端,並對其程式碼進行現代化改造,以確保更高水準的可靠性、容錯性和可訪問性。

應該過不了幾天,我們載入 arXiv 上 PDF 的速度就會加快,或許可以直接在網頁上就能看論文了。

「我非常感謝西蒙斯基金會和美國國家科學基金會的巨大支持,」康乃爾科技校區傑克和里拉・尼夫西院長兼副教務長 Greg Morrisett 說道。 「這項投資可以確保arXiv 服務繼續擴大規模,為更廣泛的受眾提供服務,並更好地為科學界服務。」

康奈爾科技校區電腦科學教授Ramin Zabih 表示:「透過對程式碼庫進行現代化改造並過渡到雲端,我們正在加強arXiv 的基礎設施建設,並確保它持續成為學術出版物共享方面的創新源泉。」

arXiv(發音為「archive」)於1991 年由當時的洛斯阿拉莫斯國家實驗室物理學家Paul Ginsparg 博士創立,他當時希望對大約100 篇研究論文進行分類。當論文如潮水般湧來之後,他嘗試借助電腦程式來解決問題,據說他「透過參加十多年的機器學習研討會」學會如何編寫該程式。

獲1000萬美元捐款,用於程式碼重構、上雲,論文預印版平台arXiv「好起來了」

                           Ginsparg 現在為康乃爾大學的物理與資訊科學中教授。

該論文平台現在由康奈爾大學圖書館負責維護和運營,是一個巨大的學術論文預印本存儲庫,收集了已發表和大量尚未經過同行評審過程,或不打算在參考期刊上發表的文章。

目前 arXiv 涵蓋的分支學科已包括自然科學和社會科學的多個領域,包括物理、數學、電腦科學、量化生物學、量化金融、統計學、電氣工程和經濟學。截止到 2022 年底,在 arXiv 的投稿已經超過了 220 萬篇。

獲1000萬美元捐款,用於程式碼重構、上雲,論文預印版平台arXiv「好起來了」

由於arXiv 的吸引力很大,很多領域的研究人員會在學術頂會或期刊沒有錄用之前,就把自己的最新研究成果「提前發表」到這個平台上。一般人認為這樣做的好處在於「佔坑」和宣傳:既可以保護自己的 idea,又能擴大宣傳提升學者自身的影響力。同時,這種做法也大大加快了學界資訊傳播的速度。

相比之下,即使在今天節奏較快的AI 領域,無論會議或期刊論文從投稿到最終可見都需要數月時間的等待,有時在此期間甚至已經出現了新的方向。

因此,arXiv 逐漸成為了許多學術領域,如數學和電腦科學的首選「投稿」地點。時至今日,經常刷 arXiv 成為了不少學者的習慣。在人工智慧領域內,許多被 NeurIPS、CVPR、AAAI 等頂會收錄的文章曾被提前投放在 arXiv 上獲得曝光。另一方面,由於其沒有非常有效的篩選機制,平台上也有很多品質較低的論文,這或許會是獲得新註資後 arXiv 嘗試改變的方向。

大多時候,是否被重要期刊會議接收是評估論文品質的重要標準。不過在 arXiv 出現後,也有很多被頂會遺漏的論文在學界發揮了重要的影響力,收穫了許多引用。在人工智慧領域裡,我們可以輕易列舉一些在 arXiv 上出現且家喻戶曉,但曾被 AI 頂會拒稿的文章,例如 YOLO、transformer XL、Dropout 的研究。

计算机视觉领域里著名的目标检测算法 YOLO,其论文至今被引用数已经超过 4 万,不过当初它曾被 NIPS 拒稿,修改后转投 CVPR 2016 获得了接收。

獲1000萬美元捐款,用於程式碼重構、上雲,論文預印版平台arXiv「好起來了」

2012 年,后来的图灵奖获得者 Geoffrey Hinton 在论文《Improving neural networks by preventing co-adaptation of feature detectors》中提出了 Dropout。同年,AlexNet 的出现开启了深度学习的新纪元。AlexNet 使用 Dropout 显著降低了过拟合,并对其在 ILSVRC 2012 竞赛中的胜利起到了关键作用。可以认为如果没有 Dropout,深度学习的大发展可能会被推迟数年。

不过这篇论文被 NIPS 2012 拒绝,现在还是 arXiv 上的预印版状态。

獲1000萬美元捐款,用於程式碼重構、上雲,論文預印版平台arXiv「好起來了」

承载了先进科学希望的 arXiv 平台,未来会发展成什么样?

康奈尔大学表示,arXiv 开发的下一阶段将包括雇用更多软件开发人员来支持现代化工作。与此同时,计算机科学系的教职员工将在 NSF 的资助下开发新的搜索和推荐技术,这些技术计划用于支撑 arXiv 的大型用户社区,且会得到最先进的隐私保证的支持。此外,arXiv 将通过生成 HTML 和 PDF 版本的内容,为视障人士提供更好的访问。

1000 万美元的资金将很大程度上增加 arXiv 的实力。相比之下,arXiv 在 2021 年的总花费为 242 万美元。

在收获捐赠新闻发出后,人们纷纷叫好,并期待预印版平台未来的进化。

獲1000萬美元捐款,用於程式碼重構、上雲,論文預印版平台arXiv「好起來了」

参考内容:

https://news.cornell.edu/stories/2023/10/research-repository-arxiv-receives-10m-upgrades

https://news.ycombinator.com/item?id=37949656

https://medium.com/nautilus-magazine/what-counts-as-science-76ebd1f5d403

以上是獲1000萬美元捐款,用於程式碼重構、上雲,論文預印版平台arXiv「好起來了」的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:jiqizhixin.com。如有侵權,請聯絡admin@php.cn刪除