IT之家10 月9 日消息,AI 大模型是近年來人工智慧領域的熱門話題,它們可以實現各種令人驚嘆的功能,如生成逼真的文字和圖像,或與人類進行流暢的對話。但這些大模型的背後,卻有著一群默默無聞的資料標註員,他們每天為了給原始資料添加標籤而辛苦工作,為 AI 技術提供訓練所需的大量資料。
圖源 Pixabay
數據標註員們的工作並不容易,他們需要面對乏味的任務、低收入、長期的不穩定性和隨時可能被替代的風險。他們是人工智慧技術發展的基石,卻很少受到關注和尊重
根據《Tech 星球》的報道,數據標註員們採用最原始的計件製度來計算工資,大部分從業者每個月的收入都不超過5000元。其中有些人是專科畢業生,有些人是寶媽,有些人是轉行者。他們在三、四線城市的小格子間處理圖片、文字、語音等數據,為網路巨頭和汽車公司提供服務
IT之家注意到,數據標註產業也經歷了起伏。 2017 年,AI 技術期望爆棚時,數據標註員可以賺到高額收入,一個 2D 拉框就有 5 毛錢。但隨著產業競爭加劇和技術發展不順利,數據標註的單價越來越低,現在最低只有 4 分錢。
數據標註產業面臨巨大壓力。公司需要有一定規模和資金儲備,才能獲得訂單,並應對回款週期長、員工流動性大、品質和週期不穩定等問題。海天瑞聲是該產業首家在主機板上市的公司,去年的利潤率剛超過10%,但今年上半年已經陷入虧損
數據標註員們越來越擔心的是,他們可能很快就會被他們自己參與創造的人工智慧所取代。國內外一些公司正在開發能夠自動標註資料的工具,利用市面上主流的大模型對資料集進行標註。這些工具聲稱可以提高標註效率、降低成本,並且達到與人工相近甚至超過人工的準確率
當然,並不是所有的資料標註都可以被 AI 取代。一些需要專業知識和邏輯分析能力的數據標註仍需要人工參與,例如醫療、金融、自動駕駛等領域。但這也意味著產業的門檻將會不斷提高,對於數據標註員而言,要想在這個產業生存下去,可能需要更多的學習和努力。
以上是AI 大模型資料標註「民工」月入不過 5,000 元,單價從5毛降到4分的詳細內容。更多資訊請關注PHP中文網其他相關文章!