利用智能工具進行數學證明,還算是數學嗎?加州大學洛杉磯分校純數學與(yu) 應用數學研究所舉(ju) 行了一次關(guan) 於(yu) “機器輔助證明”(machine-assisted proofs)的研討會(hui) ,聚集眾(zhong) 多數學家和計算機科學家。AI可能深刻改變數學的發展:算力會(hui) 推動數學推理前進,但AI將對數學美感與(yu) 數學家的身份帶來潛在威脅。
在美國洛杉磯蓋蒂博物館(the Getty museum)的藏品中,有一幅17世紀古希臘數學家歐幾裏得(Euclid)的肖像:他蓬頭垢麵,用充滿汙垢的雙手舉(ju) 著他的幾何學著作《幾何原本》(Elements)。
兩(liang) 千多年以來,歐幾裏得的理論成為(wei) 數學論證和推理的典範。卡耐基梅隆大學(Carnegie Mellon University)的邏輯學家傑裏米·阿維加德(Jeremy Avigad)認為(wei) :“歐幾裏得從(cong) ‘定義(yi) ’開始的著名論證,就像詩詞一樣優(you) 美。”
隨後,歐幾裏得在此基礎上建立了當時的數學體(ti) 係,通過基本概念、定義(yi) 和先驗定理,讓每一步論證之間都有清晰的邏輯關(guan) 係。有人抱怨歐幾裏得的一些“明顯”步驟並不明了,但這一套推理論證方式仍是奏效的。 但到了20世紀,數學家不再願意將數學拘泥於(yu) 這些直觀的幾何基礎之上。
相反,他們(men) 發展出了通用的數學係統——精確的符號表達和機械的規則。逐漸地,這套形式化模式讓數學得以被翻譯為(wei) 計算機代碼。 1976年,四色定理(the four-color theorem,即可以僅(jin) 用四種顏色來標注地圖,相鄰的兩(liang) 個(ge) 地區都是不同顏色)成為(wei) 第一個(ge) 被計算機粗暴驗證的重要理論。 如今,數學家正努力應對一個(ge) 最新的變革力量——人工智能。
克裏斯蒂安·塞格迪(Christian Szegedy)是一名計算科學家,曾任職於(yu) 穀歌,現就職於(yu) 舊金山的一家初創公司。2019年,他預測在10年內(nei) ,計算機係統的問題解決(jue) 能力將相當或超過最優(you) 秀的人類數學家。去年,他將預測時間縮短至2026年。
阿克沙伊·文卡特什(Akshay Venkatesh)是普林斯頓高等研究院(Advanced Study in Princeton)的數學家,並在2018年獲得了菲爾茲(zi) 獎(the Fields Medal,數學界的諾貝爾獎)。阿克沙伊目前對AI並不感興(xing) 趣,但熱衷於(yu) 談論相關(guan) 話題。
在去年的一次采訪中,他表示:“我希望我的學生能夠意識到,自己所在的領域將會(hui) 為(wei) 世界帶來很多改變。”他並不反對使用AI技術來幫助人類提高理解力,但關(guan) 鍵在於(yu) 要對技術的應用方式進行深思熟慮。
2月,阿維加德參加了在加州大學洛杉磯分校(the University of California, Los Angeles)純數學與(yu) 應用數學研究所舉(ju) 行的關(guan) 於(yu) “機器輔助證明”(machine-assisted proofs)的研討會(hui) 。這次討論會(hui) 不同以往,聚集了許多數學家和計算機科學家。
該校數學係的任教老師陶哲軒(Terence Tao)在2006年獲得了菲爾茲(zi) 獎,也是這次會(hui) 議的組織者。他認為(wei) 這次會(hui) 議具有重要意義(yi) 。 陶哲軒指出,直到最近幾年,數學家才開始擔憂AI對於(yu) 數學美學和自身的潛在威脅。會(hui) 議中聚集的傑出學者正在討論相關(guan) 問題,並探索“打破禁忌”的可能策略。
會(hui) 議中,有一位居於(yu) 前排的參與(yu) 者有些引人注目:這是一個(ge) 名為(wei) “舉(ju) 手機器人”的梯形盒子,每當參會(hui) 者提出問題時,它會(hui) 發出機器低語並舉(ju) 起手。“如果機器人外表可愛且沒有威脅性,那麽(me) 就會(hui) 有所幫助,”陶哲軒說道。
成為(wei) “證明抱怨者”的AI
現在有許多能改善我們(men) 飲食、睡眠、鍛煉等生活方式的科技產(chan) 品。威斯康星大學麥迪遜分校(the University of Wisconsin-Madison)數學家喬(qiao) 丹·艾倫(lun) 伯格(Jordan Ellenberg)在研討會(hui) 茶歇時提出:“我們(men) 喜歡使用一些產(chan) 品,讓生活變得更加便利。” AI產(chan) 品也可能為(wei) 數學提供便利,他補充道:“很顯然,問題在於(yu) 機器能為(wei) 我們(men) 做什麽(me) ,而非機器將會(hui) 對我們(men) 做什麽(me) 。”
其中一個(ge) 數學工具叫做證明助手或交互式定理證明器(數學輔助工具在1960年代早期就有所應用)。數學家逐步將證明轉化為(wei) 代碼,然後通過軟件程序檢查證明是否正確。程序的數據庫不斷積累證明的相關(guan) 數據並動態更新,以供其他使用者查閱。
霍斯金森形式數學中心(the Hoskinson Center for Formal Mathematics)主任阿維加德(Avigad)表示:“這樣的形式為(wei) 今天的數學奠定了基礎,就像歐幾裏得當年所做的那樣。” 最近,開源證明助手係統Lean引起了關(guan) 注。Lean係統由微軟計算機科學家萊昂納多·德·莫拉(Leonardo de Moura)開發,他現在在亞(ya) 馬遜工作。
在GOFAI(Good Old-Fashioned Artificial Intelligence,即符號人工智能)的支持下,Lean能夠進行自動推理。 到目前為(wei) 止,Lean社區已經驗證了有關(guan) 將球體(ti) 翻轉的有趣定理、數學統一性中的關(guan) 鍵定理等。 但證明助手也有缺點。它常常抱怨自己無法理解數學家輸入的定義(yi) 、公理或證明步驟,因此被稱為(wei) “證明抱怨者”。
所有這些抱怨都會(hui) 增加研究的困難。 但福特漢姆大學(Fordham University)的數學家希瑟·麥克白(Heather Macbeth)認為(wei) ,該係統提供了逐行反饋,這也有助於(yu) 教學。
在春季,麥克白設計了一個(ge) “雙語言”課程,她將學生提出的問題在講義(yi) 中翻譯為(wei) Lean代碼,並讓學生通過Lean尋找解決(jue) 方案。
她表示:“這增加了學生的信心,因為(wei) 他們(men) 能得到證明完成時間和正確性的及時反饋。” 自參加研討會(hui) 以來,約翰霍普金斯大學(Johns Hopkins University)的數學家艾米麗(li) ·裏爾(Emily Riehl)使用實驗證明助手驗證之前與(yu) 合著者發表的證明。
驗證結束後,她表示自己對證明的理解更加深入了,思路也更加清晰,甚至能對一台傻瓜電腦解釋自己的證明過程。
粗暴式推理,但這是數學嗎?
卡內(nei) 基梅隆大學計算機科學家、亞(ya) 馬遜學者瑪麗(li) 恩·赫勒(Marijn Heule)使用了另一款自動推理工具,並將其稱為(wei) “粗暴式推理”(或用技術語言來說是SAT求解器)。通過精心編寫(xie) 的編碼來表達自己想要論證的問題,隨後超級計算機網絡就會(hui) 進行推理論證。
在研討會(hui) 之前,赫勒和自己的博士生伯納德·蘇伯卡索(Bernardo Subercaseaux)針對一個(ge) 長期性問題完成了一個(ge) 大小為(wei) 50TB的論證方案。然而,這個(ge) 方案無法與(yu) 赫勒及其合作者在2016年的產(chan) 出相提並論——《自然》的一篇頭條文章指出,這是一個(ge) 有史以來最大的達到200TB的數學證明。
但文章接著提出,利用這些智能工具進行數學證明,真的算是數學嗎?
在赫勒看來,智能輔助工具對於(yu) 超出人類能力範圍的問題來說仍是必需的。
其他一些工具采用了機器學習(xi) 模型,能夠梳理大量數據並檢測相應的論證模式,但這些工具並不擅長邏輯的逐步推理。例如,穀歌的DeepMind設計了機器學習(xi) 算法來解決(jue) 蛋白質折疊(AlphaFold)和國際象棋(AlphaZero)等問題。
2021年,在《自然》的一篇論文中,研究團隊將自己的產(chan) 出描述為(wei) “在人工智能輔助下,提高人類的推理能力,進而推進數學發展”。 吳宇懷(Yuhuai Tony Wu)是一位計算機科學家,曾任職於(yu) 穀歌,現在舊金山創立了一家初創公司。
他提出了一個(ge) 更宏大的機器學習(xi) 目標:解決(jue) 數學問題。
在穀歌,吳宇懷探索了大型語言模型支持下的聊天機器人如何幫助解決(jue) 數學問題。該團隊收集互聯網數據進行模型訓練,並通過豐(feng) 富的數學、科學論文等數據庫進行調整,最終研發了專(zhuan) 業(ye) 聊天機器人Minerva。
被問及數學問題時,Minerva能夠像人類一樣進行解答。吳宇懷在研討會(hui) 上表示,該模型在高中數學考試中的表現優(you) 於(yu) 平均年齡為(wei) 16歲的人類學生。 最終,吳宇懷提出了自己的設想,設計一個(ge) 有能力論證數學定理的“自動化數學家”。
數學是機器學習(xi) 能力的試金石
對此,數學家表達了不同程度的關(guan) 注。
哥倫(lun) 比亞(ya) 大學(Columbia University)的邁克爾·哈裏斯(Michael Harris)對於(yu) 缺乏有關(guan) 人工智能對數學研究影響的討論而感到遺憾,特別是與(yu) 如今人工智能無處不在的熱議話題相比。 悉尼大學的喬(qiao) 迪·威廉姆森(Geordie Williamson)是DeepMind的合作者,他鼓勵數學家和計算機科學家更多地參與(yu) 此類對話。
在研討會(hui) 上,他以改編自喬(qiao) 治·奧威爾(George Orwell)1945年發表的文章《你和原子彈》(You and the Atom Bomb)中的一句話來開始演講:“鑒於(yu) 在未來五年,我們(men) 可能會(hui) 受到人工智能的深刻影響,深度學習(xi) 還未引發足夠的討論。” 威廉姆森認為(wei) 數學是機器學習(xi) 能力的試金石。
推理是數學的精髓所在,而這也是機器學習(xi) 尚未達到的能力。 在威廉姆森與(yu) DeepMind合作的早期,團隊發現了一個(ge) 能夠準確預測數學問題的簡單神經網絡。威廉姆森嚐試理解定理的論證過程,但團隊都一無所獲。就像古代幾何學家歐幾裏得一樣,神經網絡以某種方式揭示了一個(ge) 數學真理,卻無法進行邏輯論證。
研討會(hui) 的一個(ge) 主要議題是如何結合直覺和邏輯,如果人工智能能夠同時做到這兩(liang) 件事,那麽(me) 將對未來產(chan) 生難以估量的影響。 但威廉姆森發現人們(men) 缺乏打開機器學習(xi) 黑箱的動力,“這是科技界的黑客文化,如果這能推廣到數學上當然很好”,但這不是數學家想看到的。
他補充道,探索神經網絡的奧秘引發了“有趣的數學問題”,而這也為(wei) 數學家提供了一個(ge) “為(wei) 世界做出有價(jia) 值貢獻”的機會(hui) 。
評論已經被關(guan) 閉。