現在,AI小白甚至不需要看教程,僅憑ChatGPT就可以創建模型。
它不僅幫你找資料集、訓練模型寫程式碼,還能評估準確性、創建程式一步到位。
就有這麼一個25歲小哥,讓ChatGPT幫他創建了個地理位置辨識程序,最後準確率最高達99.7%。
而且各種細節步驟全在,一邊工作還一邊教你學習。
這一波,被ChatGPT感動到了。
更貼心的是,在每次答疑解惑完,ChatGPT都會說上一句:如果你有任何疑問,請告訴我。
專案一開始,這位小哥開宗明義:我不想努力了,你可以幫我創建一個AI程式嗎?
以兩個座標為輸入,並預測他們在哪個國家。
而ChatGPT「欣然」接受挑戰,也提醒這位小哥,需要對應資料集,否則模型無法訓練。另外要是還有更多信息,就更好了。
首先,需要找到合適的資料集。
小哥再問ChatGPT,結果它到是二話不說直接丟出了三個供其選擇,介紹連結都有。
從三個資料集來看,自然地球資料集顯然更好,而且還有「邊界」、海岸線等信息,這也意味著要向模型解釋「邊界」概念,分隔標籤。但作為新人而言,第一個資料集與任務相關的資料更多,模型更容易實現,作者最終選擇了第一個資料集。
將這個決定告訴ChatGPT之後,緊接著它就來教你創建DataFrame(資料框架),並給了範例程式碼。
執行成功後,就來到了第二階段:模型訓練。 ChatGPT也二話不說地給了份代碼,甚至還附上了詳細解釋。
程式碼將使用k-NN演算法根據給定的座標來預測國家。 KNN 演算法是一種簡單的演算法,它根據輸入的 k 個最近鄰的大多數類別對輸入進行分類。
在這個例子中,資料被分成訓練集和測試集,比例為80-20。然後用訓練集對 KNN 分類器進行訓練,並用測試集對模型的精確度進行測試。
請記住,這是一個簡單的範例,模型的準確性可能不高。您可以嘗試使用不同的演算法和k的不同值進行實驗,看看是否可以提高模型的準確性.
#在丟棄一些空白資料(沒有座標的國家)之後,首次執行k -NN訓練成功,並有99.7%的準確率。
不過這個結果並不是那麼滿意,作者歸結了這幾個面向的原因:不同國家之間的資料分佈不均;存在一些資料錯誤;偏見等問題。
這樣也來到了第三步:重新評估。
在這段程式碼中,我使用 OpenCage 地理編碼 API 從座標中取得國家資訊。您需要使用API金鑰取代 YORBAPI _ KEY 以獲得對 API 的存取權。你可以在 OpenCage 網站上註冊一個免費的API金鑰。
依照說明,作者修改了程式碼,結果顯示出現了很多NA錯誤,相當於只剩下30%資料。不過這個地球確實大部分都是水。 (也沒毛病,Doge)
最終模型準確性下降了一些,有98.6%,但這個結果作者表示很滿意,畢竟只有7個對話回合就幫忙造出來一個AI模型來。
不過這不是小哥的第一次嘗試。第一次談話時,他用了相同來源的較小資料集,需要更多資料集校正,而ChatGPT提供的第一個模型訓練程式碼是邏輯迴歸,只有51%的準確度。
而後它又嘗試了不同的「求解器」(準確率約為65%),以及其他演算法,包括隨機森林和k-NN,準確率分別為93%和92%。
這位25歲小哥在SentinelOne 擔任資深安全研究員,研究和開發惡意軟體偵測邏輯。
他因為對機器學習很有興趣開始自學有一定基礎,在本次對話中其實他特意以小白的身份與ChatGPT對話,結果被強大的效果驚艷到。
最後他也表示,真的在考慮用「他們」而不是「它」來稱呼ChatGPT。
所以AI小白們,ChatGPT快用起來吧。 (Doge)
完整對話:https://sharegpt.com/c/7zLivmp
參考連結:https://xrl1.sh/posts/coordinates-model-with-ChatGPT/
以上是ChatGPT教你寫AI包教包會,七段對話寫個辨識模型,準確度最高達99.7%的詳細內容。更多資訊請關注PHP中文網其他相關文章!